欧美一级特黄大片做受成人-亚洲成人一区二区电影-激情熟女一区二区三区-日韩专区欧美专区国产专区

MapReduce計(jì)算框架高級特性程序運(yùn)行并發(fā)度-創(chuàng)新互聯(lián)

2019/2/19 星期二

MapReduce計(jì)算框架高級特性程序運(yùn)行并發(fā)度

陽高ssl適用于網(wǎng)站、小程序/APP、API接口等需要進(jìn)行數(shù)據(jù)傳輸應(yīng)用場景,ssl證書未來市場廣闊!成為創(chuàng)新互聯(lián)建站的ssl證書銷售渠道,可以享受市場價(jià)格4-6折優(yōu)惠!如果有意向歡迎電話聯(lián)系或者加微信:13518219792(備注:SSL證書合作)期待與您的合作!

所謂的并發(fā)度,就是在MapReduce執(zhí)行程序的過程中有多少個(gè)map task進(jìn)程和reduce task進(jìn)程,來一起完成程序的處理。

MapReduce就是把業(yè)務(wù)處理邏輯變成分布式來處理。

reduce task 數(shù)量的決定機(jī)制 //全局的聚合操作 由業(yè)務(wù)場景決定
1、業(yè)務(wù)邏輯需要
2、數(shù)據(jù)量大小
設(shè)置方法:
job.setNumReduceTasks(5)

//reduce task的數(shù)量不能夠任意的指定,比如:我們在一大堆的英文文件中,我們要去統(tǒng)計(jì)有多少個(gè)單詞,這個(gè)時(shí)候reduce task在全局 程序執(zhí)行的過程中只能有1個(gè),為什么呢?因?yàn)椋盒枰屗械膍ap task 把所有的結(jié)果給到一個(gè)reduce task 這樣reduce task 就會把所有的結(jié)果統(tǒng)計(jì)出來。在這種情況下reduce task就沒辦法用多個(gè)。
比如:在wordcount中,我們統(tǒng)計(jì)每一個(gè)單詞出現(xiàn)的總次數(shù),在這種情況下,reduce task就 可以由任意多個(gè)。因?yàn)?,maptask處理的結(jié)果經(jīng)過shuffle階段之后,相同的單詞只會出現(xiàn)在同一個(gè)reduce task中。我們可能會得到5個(gè)文件,但這5個(gè)文件中統(tǒng)計(jì)的單詞數(shù)量是全局唯一的。

map task 數(shù)量的決定機(jī)制:
由于map task 之間沒有協(xié)作關(guān)系,每一個(gè)map task 都是各自為政,在map task 的處理中沒法做“全局”性的聚合操作,所以map task 的數(shù)量完全取決于所處理的數(shù)據(jù)量的大小

決定機(jī)制:
對待處理數(shù)據(jù)進(jìn)行“切片”
每一個(gè)切片分配一個(gè)map task 來處理

Mapreduce 框架中默認(rèn)的切片機(jī)制:
TextInputFormat.getSplits()繼承自FileInputFormat.getSplits()

數(shù)據(jù)切片的思考
1:定義一個(gè)切片大?。嚎梢酝ㄟ^參數(shù)來調(diào)節(jié),默認(rèn)情況下等于“hdfs 中設(shè)置的blocksize”,通常是128M //一定程度上會減少網(wǎng)絡(luò)傳輸數(shù)據(jù),但并不是絕對的。
2:獲取輸入數(shù)據(jù)目錄下所有待處理文件List
3:遍歷文件List,逐個(gè)逐個(gè)文件進(jìn)行切片
for(file:List)
對file 從0 偏移量開始切,每到128M 就構(gòu)成一個(gè)切片,比如a.txt(200M),就會被切成兩個(gè)切片: a.txt: 0-128M, a.txt :128M-256M 再比如b.txt(80M),就會切成一個(gè)切片, b.txt :0-80M

如果要處理的數(shù)據(jù)是大量的小文件,使用上述這種默認(rèn)切片機(jī)制,就會導(dǎo)致大量的切片,從而maptask 進(jìn)程數(shù)特別多,但是每一個(gè)切片又非常小,每個(gè)maptask 的處理數(shù)據(jù)量就很小,從而,整體的效率會很低。通用解決方案:就是將多個(gè)小文件劃分成一個(gè)切片;實(shí)現(xiàn)辦法就是自定義一個(gè)Inputformat 子類重寫里面的getSplits 方法;
Mapreduce 框架中自帶了一個(gè)用于此場景的Inputformat 實(shí)現(xiàn)類:CombineFileInputformat

另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。

分享題目:MapReduce計(jì)算框架高級特性程序運(yùn)行并發(fā)度-創(chuàng)新互聯(lián)
網(wǎng)站鏈接:http://aaarwkj.com/article8/dohpip.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供自適應(yīng)網(wǎng)站、域名注冊、企業(yè)網(wǎng)站制作、響應(yīng)式網(wǎng)站、用戶體驗(yàn)、定制開發(fā)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

成都定制網(wǎng)站網(wǎng)頁設(shè)計(jì)
免费人成在线观看网站免费观看| 日本成人高清一区二区| 国产精品一区二区三区播放| 日本一区二区三区日本| 日韩中文字幕在线乱码| 夫妻性生活免费看视频| 五月婷婷亚洲激情综合网| 欧美高清在线观看视频| 蜜臀av网站在线播放| 久久精品无人区乱码一区二区| 99中文字幕国产精品| 一本色桃子精品久久中文字幕| 亚洲热久久国产经典视频| 曰本真人性做爰视频免费| 手机蜜臀av在线播放| 在线观看成人激情视频| 亚洲视频在线的视频在| 久久国产亚洲精品赲碰热| 成人久久精品一区二区| 亚洲乱人伦一区二区三区| 亚洲av污精品一区二区三区| 人妻系列日本在线播放| 人妻少妇性色精品专区av| 国产久精品热看久品热久热| 亚洲精品女同专区视频| 精品人妻av区久久久| 亚洲av乱码专区国产乱码| 日日添夜夜躁欧美一区二区| 91国产性感美女视频| 亚洲精品国产第一区第二区| 国产一级成人免费视频| 国产女人高潮流白丝视频| 日韩精品视频性色首页| av熟女一区二区三区| 国产欧美日韩精品av| 真实国产熟女一区二区三区| 中文字幕人妻久久一区| 在线观看国产自拍精品| 日日爱欧美精品亚洲成| 日韩黄色一级片在线观看| 欧美日韩免费高清视视频|