欧美一级特黄大片做受成人-亚洲成人一区二区电影-激情熟女一区二区三区-日韩专区欧美专区国产专区

hashshuffle發(fā)展階段有哪些

這篇文章主要介紹“hash shuffle發(fā)展階段有哪些”,在日常操作中,相信很多人在hash shuffle發(fā)展階段有哪些問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”hash shuffle發(fā)展階段有哪些”的疑惑有所幫助!接下來,請跟著小編一起來學(xué)習(xí)吧!

創(chuàng)新互聯(lián)公司服務(wù)項(xiàng)目包括盧氏網(wǎng)站建設(shè)、盧氏網(wǎng)站制作、盧氏網(wǎng)頁制作以及盧氏網(wǎng)絡(luò)營銷策劃等。多年來,我們專注于互聯(lián)網(wǎng)行業(yè),利用自身積累的技術(shù)優(yōu)勢、行業(yè)經(jīng)驗(yàn)、深度合作伙伴關(guān)系等,向廣大中小型企業(yè)、政府機(jī)構(gòu)等提供互聯(lián)網(wǎng)行業(yè)的解決方案,盧氏網(wǎng)站推廣取得了明顯的社會效益與經(jīng)濟(jì)效益。目前,我們服務(wù)的客戶以成都為中心已經(jīng)輻射到盧氏省份的部分城市,未來相信會繼續(xù)擴(kuò)大服務(wù)區(qū)域并繼續(xù)獲得客戶的支持與信任!

spark實(shí)現(xiàn)了多種shuffle方法,通過 spark.shuffle.manager來確定。暫時總共有三種:hash shuffle、sort shuffle和tungsten-sort shuffle,從1.2.0開始默認(rèn)為sort shuffle。

spark在1.2前默認(rèn)為hash shuffle(spark.shuffle.manager = hash),但hash shuffle也經(jīng)歷了兩個發(fā)展階段。

 ##第一階段

hash shuffle發(fā)展階段有哪些

上圖有 4 個 ShuffleMapTask 要在同一個 worker node 上運(yùn)行,CPU core 數(shù)為 2,可以同時運(yùn)行兩個 task。每個 task 的執(zhí)行結(jié)果(該 stage 的 finalRDD 中某個 partition 包含的 records)被逐一寫到本地磁盤上。每個 task 包含 R 個緩沖區(qū),R = reducer 個數(shù)(也就是下一個 stage 中 task 的個數(shù)),緩沖區(qū)被稱為 bucket,其大小為spark.shuffle.file.buffer.kb ,默認(rèn)是 32KB(Spark 1.1 版本以前是 100KB)。

##第二階段 這樣的實(shí)現(xiàn)很簡單,但有幾個問題:

1 產(chǎn)生的 FileSegment 過多。每個 ShuffleMapTask 產(chǎn)生 R(reducer 個數(shù))個 FileSegment,M 個 ShuffleMapTask 就會產(chǎn)生 M * R 個文件。一般 Spark job 的 M 和 R 都很大,因此磁盤上會存在大量的數(shù)據(jù)文件。

2 緩沖區(qū)占用內(nèi)存空間大。每個 ShuffleMapTask 需要開 R 個 bucket,M 個 ShuffleMapTask 就會產(chǎn)生 M * R 個 bucket。雖然一個 ShuffleMapTask 結(jié)束后,對應(yīng)的緩沖區(qū)可以被回收,但一個 worker node 上同時存在的 bucket 個數(shù)可以達(dá)到 cores R 個(一般 worker 同時可以運(yùn)行 cores 個 ShuffleMapTask),占用的內(nèi)存空間也就達(dá)到了cores * R * 32 KB。對于 8 核 1000 個 reducer 來說,占用內(nèi)存就是 256MB。

spark.shuffle.consolidateFiles默認(rèn)為false,如果為true,shuffleMapTask輸出文件可以被合并。如圖

hash shuffle發(fā)展階段有哪些

可以明顯看出,在一個 core 上連續(xù)執(zhí)行的 ShuffleMapTasks 可以共用一個輸出文件 ShuffleFile。先執(zhí)行完的 ShuffleMapTask 形成 ShuffleBlock i,后執(zhí)行的 ShuffleMapTask 可以將輸出數(shù)據(jù)直接追加到 ShuffleBlock i 后面,形成 ShuffleBlock i',每個 ShuffleBlock 被稱為 FileSegment。下一個 stage 的 reducer 只需要 fetch 整個 ShuffleFile 就行了。這樣,每個 worker 持有的文件數(shù)降為 cores * R。但是緩存空間占用大還沒有解決

到此,關(guān)于“hash shuffle發(fā)展階段有哪些”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識,請繼續(xù)關(guān)注創(chuàng)新互聯(lián)網(wǎng)站,小編會繼續(xù)努力為大家?guī)砀鄬?shí)用的文章!

當(dāng)前名稱:hashshuffle發(fā)展階段有哪些
瀏覽地址:http://aaarwkj.com/article18/jjpegp.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站制作、全網(wǎng)營銷推廣、靜態(tài)網(wǎng)站、商城網(wǎng)站、做網(wǎng)站營銷型網(wǎng)站建設(shè)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

外貿(mào)網(wǎng)站制作
久久成人免费在线电影| 日韩精品电影一二三| 性生活自制视频网站麻豆| 欧美日韩国产这里只有精品| 黑寡妇精品欧美一区二区毛| 四虎在线观看免费资源| 日本国产在线一区二区| 亚洲性感人妻系列网站| 久久热这里只有视频精品| 日韩成人中文字幕电影| 欧美一区二区三区高清正版| 91福利免费在线看| 午夜福利大片在线观看视频| 日产一区二区三区网站| 熟女另类视频在线观看| 亚洲一区二区三区不卡伦理| 青青草老司机在线视频| 国产成人免费公开视频| 中日韩一二三四区在线看| 国产亚洲精品一区二区三在线观看| 中文字幕日韩欧美第一页| 日韩亚洲欧美国产另类| 琪琪精品免费一区二区三区| 国产精品一区在线播放| 亚洲伦理av在线观看| 亚洲精品中文字幕日本乱码| 日韩欧美国产精品福利| 99久久免费看国产精品| 久久综合午夜福利视频| 最新国产精品欧美激情| 国产成人在线观看av| 日韩国产亚洲欧美国产| 国产精品天干天综合网| 久久免费少妇高潮99精品| 毛片一区二区三区免费看| 日本顶级片一区二区三区| 国产精品久久综合网| 欧美日韩中文国产天堂| 亚洲一区二区日韩在线| 国产在线精彩视频自拍| 欧美经典三级一区二区三区|