欧美一级特黄大片做受成人-亚洲成人一区二区电影-激情熟女一区二区三区-日韩专区欧美专区国产专区

深度研究hbase的熱點(diǎn)問(wèn)題,和hbase表rk的設(shè)計(jì)和手動(dòng)分區(qū)region

2019/2/20 星期三

深度研究hbase的熱點(diǎn)問(wèn)題,和hbase 表rk的設(shè)計(jì) 和手動(dòng)分區(qū)region
在2019/1/25 星期五記錄
hbase的熱點(diǎn)問(wèn)題:
hbase熱點(diǎn)問(wèn)題解決(預(yù)分區(qū)) https://blog.csdn.net/qq_31289187/article/details/80869906
Hbase split的三種方式和split的過(guò)程 https://www.cnblogs.com/niurougan/p/3976519.html

十多年的華寧網(wǎng)站建設(shè)經(jīng)驗(yàn),針對(duì)設(shè)計(jì)、前端、開(kāi)發(fā)、售后、文案、推廣等六對(duì)一服務(wù),響應(yīng)快,48小時(shí)及時(shí)工作處理。全網(wǎng)整合營(yíng)銷(xiāo)推廣的優(yōu)勢(shì)是能夠根據(jù)用戶設(shè)備顯示端的尺寸不同,自動(dòng)調(diào)整華寧建站的顯示方式,使網(wǎng)站能夠適用不同顯示終端,在瀏覽器中調(diào)整網(wǎng)站的寬度,無(wú)論在任何一種瀏覽器上瀏覽網(wǎng)站,都能展現(xiàn)優(yōu)雅布局與設(shè)計(jì),從而大程度地提升瀏覽體驗(yàn)。成都創(chuàng)新互聯(lián)從事“華寧網(wǎng)站設(shè)計(jì)”,“華寧網(wǎng)站推廣”以來(lái),每個(gè)客戶項(xiàng)目都認(rèn)真落實(shí)執(zhí)行。

082 HBase的幾種調(diào)優(yōu)(GC策略,flush,compact,split)http://www.cnblogs.com/juncaoit/p/6170642.html
這上面講解了這些,hbase 命令的使用
081 Region的預(yù)分區(qū) https://www.cnblogs.com/juncaoit/p/6170510.html 的4中方法

—————————————————————————————————————————————————
什么是hbase的熱點(diǎn)問(wèn)題
出現(xiàn)熱點(diǎn)問(wèn)題原因
1、hbase的中的數(shù)據(jù)是按照字典序排序的,當(dāng)大量連續(xù)的rowkey集中寫(xiě)在個(gè)別的region,各個(gè)region之間數(shù)據(jù)分布不均衡;
2、創(chuàng)建表時(shí)沒(méi)有提前預(yù)分區(qū),創(chuàng)建的表默認(rèn)只有一個(gè)region,大量的數(shù)據(jù)寫(xiě)入當(dāng)前region;
3、創(chuàng)建表已經(jīng)提前預(yù)分區(qū),但是設(shè)計(jì)的rowkey沒(méi)有規(guī)律可循,設(shè)計(jì)的rowkey應(yīng)該由regionNo+messageId組成。

如何解決熱點(diǎn)問(wèn)題
解決這個(gè)問(wèn)題,關(guān)鍵是要設(shè)計(jì)出可以讓數(shù)據(jù)分布均勻的rowkey,與關(guān)系型數(shù)據(jù)庫(kù)一樣,rowkey是用來(lái)檢索記錄的主鍵。訪問(wèn)hbase table中的行,rowkey 可以是任意字符串(最大長(zhǎng)度 是 64KB,實(shí)際應(yīng)用中長(zhǎng)度一般為 10-100bytes),在hbase內(nèi)部,rowkey保存為字節(jié)數(shù)組,存儲(chǔ)時(shí),數(shù)據(jù)按照rowkey的字典序排序存儲(chǔ)。

創(chuàng)建表命令:
create 'testTable',{NAME => 'cf', DATA_BLOCK_ENCODING => 'NONE', BLOOMFILTER => 'ROW', REPLICATION_SCOPE=> '0', VERSIONS => '1', COMPRESSION => 'snappy', MIN_VERSIONS =>'0', TTL => '15552000', KEEP_DELETED_CELLS => 'false', BLOCKSIZE =>'65536', IN_MEMORY => 'false', BLOCKCACHE => 'true', METADATA =>{'ENCODE_ON_DISK' => 'true'}},{SPLITS_FILE=>'/app/soft/test/region.txt'}

https://blog.csdn.net/weixin_41279060/article/details/78855679 hbase系列-Hbase熱點(diǎn)問(wèn)題、數(shù)據(jù)傾斜和rowkey的散列設(shè)計(jì)

預(yù)分區(qū)和rowkey的散列設(shè)計(jì)——解決數(shù)據(jù)傾斜和熱點(diǎn)問(wèn)題
預(yù)分區(qū),讓表的數(shù)據(jù)可以均衡的分散在集群中,而不是默認(rèn)只有一個(gè)region分布在集群的一個(gè)節(jié)點(diǎn)上。(預(yù)分區(qū)個(gè)數(shù)=節(jié)點(diǎn)的倍數(shù),看數(shù)據(jù)量估算,region不足了會(huì)被分列,預(yù)分區(qū)后每個(gè)region的rowkey還是有序的)

如何給hbase表預(yù)分區(qū)
HBase預(yù)分區(qū)方法 https://www.cnblogs.com/quchunhui/p/7543385.html *****
Hbase 表的設(shè)計(jì)原則 ————總結(jié) https://blog.csdn.net/m0_37138008/article/details/78985946

行鍵(RowKey)設(shè)計(jì)

HBase的行由行鍵按字典順序排序,這樣的設(shè)計(jì)優(yōu)化了掃描,允許存儲(chǔ)相關(guān)的行或者那些將被一起讀的鄰近的行。
然而,設(shè)計(jì)不好的行鍵是導(dǎo)致hots potting(熱點(diǎn)問(wèn)題)的常見(jiàn)原因。當(dāng)大量的客戶端流量( traffic )被定向在集群上的一個(gè)或幾個(gè)節(jié)點(diǎn)時(shí),就會(huì)發(fā)生hots potting。這些流量可能代表著讀、寫(xiě)或其他操作。流量超過(guò)了承載該region的單個(gè)機(jī)器所能負(fù)荷的量,這就會(huì)導(dǎo)致性能下降并有可能造成region的不可用。在同一RegionServer上的其他region也可能會(huì)受到其不良影響,因?yàn)橹鳈C(jī)無(wú)法提供服務(wù)所請(qǐng)求的負(fù)載。設(shè)計(jì)使集群能被充分均勻地使用的數(shù)據(jù)訪問(wèn)模式是至關(guān)重要的。


預(yù)分區(qū)和rowkey的散列設(shè)計(jì)——解決數(shù)據(jù)傾斜和熱點(diǎn)問(wèn)題
預(yù)分區(qū)
預(yù)分區(qū),讓表的數(shù)據(jù)可以均衡的分散在集群中,而不是默認(rèn)只有一個(gè)region分布在集群的一個(gè)節(jié)點(diǎn)上。(預(yù)分區(qū)個(gè)數(shù)=節(jié)點(diǎn)的倍數(shù),看數(shù)據(jù)量估算,region不足了會(huì)被分列,預(yù)分區(qū)后每個(gè)region的rowkey還是有序的)
一個(gè)RegionServer能管理10-1000個(gè)Region,0.92.x版本后,默認(rèn)的Region大小為10G,向下可以支持256MB,向上可以支持到20G,也就是說(shuō),每個(gè)RegionServer能管理的數(shù)據(jù)量為2.5GB-20TB。
如果有5個(gè)節(jié)點(diǎn),3年內(nèi)數(shù)據(jù)量為5T,那么分區(qū)數(shù)可以預(yù)設(shè)為:
5000G/10G=500個(gè)region
這500個(gè)Region就會(huì)被均衡的分布在集群各個(gè)節(jié)點(diǎn)上(具體分布看機(jī)器的性能和存儲(chǔ)空間而定),機(jī)器硬盤(pán)不足可以添加硬盤(pán),性能不足可以添加新節(jié)點(diǎn)(添加新機(jī)器)。
Rowkey長(zhǎng)度原則(最好不超過(guò)16字節(jié))
Rowkey是一個(gè)二進(jìn)制碼流,Rowkey的長(zhǎng)度被很多開(kāi)發(fā)者建議說(shuō)設(shè)計(jì)在10~100個(gè)字節(jié),不過(guò)建議是越短越好,不要超過(guò)16個(gè)字節(jié)。
原因如下:
(1)數(shù)據(jù)的持久化文件HFile中是按照KeyValue存儲(chǔ)的,如果Rowkey過(guò)長(zhǎng)比如100個(gè)字節(jié),1000萬(wàn)列數(shù)據(jù)光Rowkey就要占用100*1000萬(wàn)=10億個(gè)字節(jié),將近1G數(shù)據(jù),這會(huì)極大影響HFile的存儲(chǔ)效率;
(2)MemStore將緩存部分?jǐn)?shù)據(jù)到內(nèi)存,如果Rowkey字段過(guò)長(zhǎng)內(nèi)存的有效利用率會(huì)降低,系統(tǒng)將無(wú)法緩存更多的數(shù)據(jù),這會(huì)降低檢索效率。因此Rowkey的字節(jié)長(zhǎng)度越短越好。
(3)目前操作系統(tǒng)是都是64位系統(tǒng),內(nèi)存8字節(jié)對(duì)齊。控制在16個(gè)字節(jié),8字節(jié)的整數(shù)倍利用操作系統(tǒng)的最佳特性。

rowkey散列原則
把主鍵哈希后當(dāng)成rowkey的頭部

rowkey唯一原則
必須在設(shè)計(jì)上保證其唯一性,rowkey是按照字典順序排序存儲(chǔ)的,因此,設(shè)計(jì)rowkey的時(shí)候,要充分利用這個(gè)排序的特點(diǎn),將經(jīng)常讀取的數(shù)據(jù)存儲(chǔ)到一塊,將最近可能會(huì)被訪問(wèn)的數(shù)據(jù)放到一塊。
時(shí)間戳反轉(zhuǎn)
如果數(shù)據(jù)需要保留多個(gè)版本,可以使用反轉(zhuǎn)的時(shí)間戳作為rowkey的一部分,用 Long.Max_Value - timestamp 追加到key的末尾,例如 [key][reverse_timestamp] , [key] 的最新值可以通過(guò)scan [key]獲得[key]的第一條記錄,因?yàn)镠Base中rowkey是有序的,第一條記錄是最后錄入的數(shù)據(jù)。

整個(gè)rowkey(timestamp并不是必要的,視業(yè)務(wù)而定)
rowkey=哈希(主鍵<遞增的id\手機(jī)號(hào)碼等>)+Long.Max_Value - timestamp


作者:boat824109722
來(lái)源:CSDN
原文:https://blog.csdn.net/weixin_41279060/article/details/78855679
版權(quán)聲明:本文為博主原創(chuàng)文章,轉(zhuǎn)載請(qǐng)附上博文鏈接!

rk設(shè)計(jì)小結(jié)1:
1、首先先規(guī)劃hbase表的大小,計(jì)算規(guī)劃出合理的region數(shù)
2、rk長(zhǎng)度設(shè)計(jì)(最好不超過(guò)16字節(jié))
3、rk散列原則(把主鍵哈希后當(dāng)成rk的頭部,這里的散列理解為前綴指派的隨機(jī)數(shù)添加到rk前面)
4、rk唯一原則(將經(jīng)常讀取的數(shù)據(jù)放在一起,將最近可能被訪問(wèn)的數(shù)據(jù)放在一個(gè)塊)
5、版本數(shù)為3合理,如果過(guò)期數(shù)據(jù)不是很重要的話。

行鍵rk的設(shè)計(jì)小結(jié)2:
設(shè)計(jì)行鍵時(shí)應(yīng)該使得數(shù)據(jù)盡量同時(shí)往多個(gè)region上寫(xiě),而避免只向一個(gè)region寫(xiě)(避免hbase的熱點(diǎn)問(wèn)題),可用用前綴指派的隨機(jī)數(shù)添加到rk的前面,這樣就可以分散到不同的region中(salting),使用了順序的key會(huì)將本沒(méi)有順序的數(shù)據(jù)變得有順序,把負(fù)載壓在一臺(tái)機(jī)器上。所以要盡量避免時(shí)間戳或者序列(e.g. 1, 2, 3)這樣的行鍵。(減少單調(diào)遞增行鍵/時(shí)序數(shù)據(jù))。

表模式經(jīng)驗(yàn)法則
1、region規(guī)模大小在10到50GB之間;
2、單元的大小不要超過(guò)10MB,如果使用 Object Store(在下面介紹) ,可放寬到50MB;不然,可以考慮將單元數(shù)據(jù)存在HDFS中,或者在HBase中存一個(gè)指向這些數(shù)據(jù)的指針;
3、一個(gè)典型的模式每個(gè)表中含有1~3個(gè)列族
4、對(duì)于只有1~2個(gè)列族的表,50到100個(gè)region是一個(gè)比較合適的數(shù)量。需要提醒的是,每個(gè)region都是列族的一個(gè)連續(xù)段;
5、列族的名字越短越好,因?yàn)閷?duì)每個(gè)值(忽略前綴編碼, prefix encoding ),列族名都會(huì)存一次。它們不應(yīng)當(dāng)像典型RDNMS一樣自記錄( self-documenting ) 和描述。
6、如果在基于時(shí)間的機(jī)器上存儲(chǔ)數(shù)據(jù)或日志信息,行鍵(Row Key)是由設(shè)備ID或服務(wù)器ID加上時(shí)間得到的,那最后能得到這樣的模式:除了某個(gè)特定的時(shí)間段,舊的數(shù)據(jù)region沒(méi)有額外的寫(xiě)。在這種情況下,得到的是少量的活躍region和大量的沒(méi)有新寫(xiě)入的舊region。這時(shí)由于資源消耗僅來(lái)自于活躍的region,大量的region能被容納接受;

大部分時(shí)候,細(xì)微的低效不會(huì)影響很大。但不幸的是,在這里卻不能忽略。無(wú)論是列族、屬性和行鍵都會(huì)在數(shù)據(jù)中重復(fù)上億次。
1、列族:盡量使列族名小,最好一個(gè)字符。(如 "d" 表示 data/default).
2、屬性:詳細(xì)屬性名 (如, "myVeryImportantAttribute") 易讀,最好還是用短屬性名 (e.g., "via") 保存到HBase.
3、行鍵長(zhǎng)度:讓行鍵短到可讀即可,這樣對(duì)獲取數(shù)據(jù)有幫助(e.g., Get vs. Scan)。短鍵對(duì)訪問(wèn)數(shù)據(jù)無(wú)用,并不比長(zhǎng)鍵對(duì)get/scan更好。設(shè)計(jì)行鍵需要權(quán)衡。
4、字節(jié)模式:long類(lèi)型有8字節(jié)。8字節(jié)內(nèi)可以保存無(wú)符號(hào)數(shù)字到18,446,744,073,709,551,615。 如果用字符串保存——假設(shè)一個(gè)字節(jié)一個(gè)字符——需要將近3倍的字節(jié)數(shù)。

行鍵永遠(yuǎn)不變:行鍵不能改變。唯一可以“改變”的方式是刪除然后再插入。這是一個(gè)常問(wèn)問(wèn)題,所以要注意開(kāi)始就要讓行鍵正確(且/或在插入很多數(shù)據(jù)之前)。

網(wǎng)頁(yè)名稱:深度研究hbase的熱點(diǎn)問(wèn)題,和hbase表rk的設(shè)計(jì)和手動(dòng)分區(qū)region
當(dāng)前路徑:http://aaarwkj.com/article22/jpoocc.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供品牌網(wǎng)站設(shè)計(jì)搜索引擎優(yōu)化、網(wǎng)站維護(hù)、品牌網(wǎng)站制作定制網(wǎng)站、網(wǎng)站收錄

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

營(yíng)銷(xiāo)型網(wǎng)站建設(shè)
日本少妇人妻一区二区| 日韩欧美国产精品一区二区| 羞涩插射视频网站在线观看| 日韩激情av中文字幕 | 久久精品二区亚洲w码| 日韩在线视频观看一区二区三区| 日韩欧美亚洲制服丝袜| 亚洲av毛片一区二区三区网| av资源中文字幕在线天堂| 久久婷婷激情亚洲综合色| 亚洲精品一区二区激情| 日韩国产一区二区三区精品| 色中文字幕人妻诱惑制服| 精品欧美自拍偷拍三区| 日韩美女搞黄色的网站| 亚洲国产在线一区二区| 日韩av一区二区免费在线观看| 一区二区三区欧美小黄片| 欧美一区二区男人天堂| 欧美成人精品高清在线| 久久亚洲av电影网站| 国产在线精品不卡一区| 中国毛片一区二区三区 | 国产亚洲一区二区自拍视频| 国产女主播在线观看视频| 日韩一级久久精品理论| 手机在线观看av大片| 亚洲精品欧美日韩久久| 国产一级二级三级黄色| 人妻精品中文字幕一区二区在线| 日日嗨av特一级黄淫片| 久久99热这里只频精品| 久久精品国产亚洲成人av| 亚洲高清中文字幕专区| 精品熟女少妇av免费久久野外| 国外男女性生活在线视频| 91女厕偷拍女厕偷拍| 91免费人成网站在线观看| 午夜国产精品福利一二| 日本亚洲一级中文字幕| 欧美亚洲成人免费电影|