欧美一级特黄大片做受成人-亚洲成人一区二区电影-激情熟女一区二区三区-日韩专区欧美专区国产专区

簡單的介紹一下大數(shù)據(jù)中最重要的MapReduce

2021-02-06    分類: 網(wǎng)站建設(shè)

簡單的介紹一下大數(shù)據(jù)中最重要的MapReduce
MapReduce執(zhí)行流程圖

概述

MapReduce是一種分布式計算模型,由Google提出,主要用于搜索領(lǐng)域,解決海量數(shù)據(jù)的計算問題。

MapReduce是分布式運行的,由兩個階段組成:Map和Reduce,Map階段是一個獨立的程序,有很多個節(jié)點同時運行,每個節(jié)點處理一部分數(shù)據(jù)。

Reduce階段是一個獨立的程序,有很多個節(jié)點同時運行,每個節(jié)點處理一部分數(shù)據(jù)。

使用

MapReduce框架都有默認實現(xiàn),用戶只需要覆蓋map()和reduce()兩個函數(shù),即可實現(xiàn)分布式計算,非常簡單。

這兩個函數(shù)的形參和返回值都是,使用的時候一定要注意構(gòu)造。

簡單的介紹一下大數(shù)據(jù)中最重要的MapReduce

執(zhí)行流程(此處舉例說明)

  1. 一個文本(在HDFS上面保存,兩個block)中每一個單詞的出現(xiàn)的次數(shù): 
  2.     hello you hello marry 
  3.     hello me really 
  4.             ----->block-1 
  5.              
  6.     hello kate ready 
  7.     xiao wang hello tomcat 
  8.             ----->block-2 

1.獲取每一個block塊中的文本,遍歷所有,回去其中的一行str

因為要統(tǒng)計的是每一個單詞i的次數(shù),所以還需要直到文本中有哪些單詞,可以根據(jù)字符串的特點,使用split()進行切割。

  1. String[] words=str.split(""); 

根據(jù)要求,需將每一個單詞i轉(zhuǎn)換為的形式,k為單詞本身,v為單詞出現(xiàn)的次數(shù)。

2.因為mr的計算是分布式的 ,每一個map(稱之為一個mapper task)計算其中的一個block塊數(shù)據(jù)。

  1. map階段: 
  2.     輸入 
  3.         k1,偏移量,v1,當(dāng)前行文本內(nèi)容 
  4.         map()函數(shù)操作 
  5.     輸出 
  6.         k2,具體單詞,v2,單詞對應(yīng)的統(tǒng)計項,比如次數(shù) 
  7.     輸出 
  1. shuffle階段 
  2. 研究后發(fā)現(xiàn),如果按照這種方式向reduce輸出數(shù)據(jù)的時候,會有 
  3. 大量的冗余數(shù)據(jù)。 
  4. 比如map階段之后有5個hello,則輸出,,
  5. ,5次,實際上會對網(wǎng)絡(luò)造成一定的壓力,能不能對 
  6. 這5個進行一個進入reduce之前的本地組合?比如成為 
  7. 或者
  8. 這個過程成為shuffle,洗牌重組階段,達到上述的結(jié)果,稱之為規(guī)約。 
  9. >>>shuffle階段,也就是對map的輸出進行重新洗牌: 
  10. 分區(qū)、分組、排序 
  11. ...===> 
  1. reduce階段 
  2. 接收map的輸出結(jié)果 
  3. 對這個結(jié)果進行匯總統(tǒng)計,針對values,進行簡單的累加,計算得出key 
  4. 對應(yīng)的次數(shù) 
  5. reduce針對一個key調(diào)用一次reduce()函數(shù) 
  6. =====>reduce 階段 
  7. 輸入 
  8.     K2,就是map的輸出的K2,V2s是map經(jīng)過shuffle之后的結(jié)果集 
  9.     reduce()函數(shù)操作 
  10. 轉(zhuǎn)化為   

經(jīng)過上述操作之后,系統(tǒng)會將計算結(jié)果輸出給用戶,一般會先存儲(落地)到hdfs,然后反饋給用戶。

到此為止,MapReduce執(zhí)行完畢,接下來就可以進行大數(shù)據(jù)的其他一系列操作了。

當(dāng)前題目:簡單的介紹一下大數(shù)據(jù)中最重要的MapReduce
鏈接URL:http://aaarwkj.com/news/99489.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站維護、標(biāo)簽優(yōu)化、App開發(fā)域名注冊、手機網(wǎng)站建設(shè)、網(wǎng)站制作

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

成都網(wǎng)頁設(shè)計公司
欧美日韩国产福利在线观看| 日韩国产精品激情一区| 日韩一区二区三区av| 人妻久久一区二区三区精品99| 福利午夜福利在线观看| 国产青青草成人在线视频| 中出亚洲精品日韩在线视频| 日日躁夜夜躁狠狠躁欧美| 国产精品—色哟哟视频| 国产日韩精品专区一区| 男男啪啪猛进猛出无遮挡| 欧美黄片视频在线免费看| 99精品人妻一区二区三区蜜桃| 亚洲三区久久婷婷激情| 日韩中文字幕欧美国产| 日韩一区二区中文字幕| av资源网大全手机在线观看| 亚洲少妇午夜福利视频| 在线免费观看午夜视频| 色哟哟网站在线精品视频| 国产欧美色日韩综合在线 | 欧美日韩精品偷拍一区二区| 亚洲国产成人精品女人久久久′| 97在线资源视频播放| 精品久久少妇激情视频| 国产极品嫩模91精品| 欧美日本精品在线观看| 永久免费观看黄色录像| 国产经典三级在线观看| 一区二区视频精品在线观看| 人妻久久久久久精品99| 丰满熟妇久久人妻同堂av| 欧美精品色精品免费观看| 国产精品大全中文字幕| 国家成人午夜在线观看| 亚洲国产熟对白剧情一区二区| 国产免费av剧情演绎| 国产高潮呻吟久久av| 国产中文字幕精品在线| 欧美亚洲另类国产精品| 国产午夜视频在线观看一区|