這篇文章主要介紹HBase如何實現(xiàn)性能調(diào)優(yōu),文中介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們一定要看完!
成都創(chuàng)新互聯(lián)公司成立與2013年,是專業(yè)互聯(lián)網(wǎng)技術(shù)服務(wù)公司,擁有項目成都網(wǎng)站制作、成都做網(wǎng)站網(wǎng)站策劃,項目實施與項目整合能力。我們以讓每一個夢想脫穎而出為使命,1280元赤城做網(wǎng)站,已為上家服務(wù),為赤城各地企業(yè)和個人服務(wù),聯(lián)系電話:13518219792
節(jié)點下線
你可以在HBase的特定的節(jié)點上運行下面的腳本來停止RegionServer:
$ ./bin/hbase-daemon.sh stop regionserver
RegionServer會首先關(guān)閉所有的region然后把它自己關(guān)閉,在停止的過程中,RegionServer的會向Zookeeper報告說他已經(jīng)過期了。master會發(fā)現(xiàn)RegionServer已經(jīng)死了,會把它當作崩潰的server來處理。他會將region分配到其他的節(jié)點上去。
在下線節(jié)點之前要停止Load Balancer
如果在運行l(wèi)oad balancer的時候,一個節(jié)點要關(guān)閉, 則Load Balancer和Master的recovery可能會爭奪這個要下線的Regionserver。為了避免這個問題,先將load balancer停止,參見下面的 Load Balancer.
RegionServer下線有一個缺點就是其中的Region會有好一會離線。Regions是被按順序關(guān)閉的。如果一個server上有很多region,從第一個region會被下線,到最后一個region被關(guān)閉,并且Master確認他已經(jīng)死了,該region才可以上線,整個過程要花很長時間。在HBase 0.90.2中,我們加入了一個功能,可以讓節(jié)點逐漸的擺脫他的負載,最后關(guān)閉。HBase 0.90.2加入了 graceful_stop.sh腳本,可以這樣用,
$ ./bin/graceful_stop.sh Usage: graceful_stop.sh [--config &conf-dir>] [--restart] [--reload] [--thrift] [--rest] &hostname> thrift If we should stop/start thrift before/after the hbase stop/start rest If we should stop/start rest before/after the hbase stop/start restart If we should restart after graceful stop reload Move offloaded regions back on to the stopped server debug Move offloaded regions back on to the stopped server hostname Hostname of server we are to stop
要下線一臺RegionServer可以這樣做
$ ./bin/graceful_stop.sh HOSTNAME
這里的HOSTNAME是你想要下線的RegionServer的host.
關(guān)于HOSTNAME 傳遞到graceful_stop.sh的HOSTNAME必須和hbase使用的hostname一致,hbase用它來區(qū)分RegionServers??梢杂胢aster的UI來檢查RegionServers的id。通常是hostname,也可能是FQDN。不管HBase使用的哪一個,你可以將它傳到 graceful_stop.sh腳本中去,目前他還不支持使用IP地址來推斷hostname。所以使用IP就會發(fā)現(xiàn)server不在運行,也沒有辦法下線了。
graceful_stop.sh 腳本會一個一個將region從RegionServer中移除出去,以減少改RegionServer的負載。他會先移除一個region,然后再將這個region安置到一個新的地方,再移除下一個,直到全部移除。最后graceful_stop.sh腳本會讓RegionServer stop.,Master會注意到RegionServer已經(jīng)下線了,這個時候所有的region已經(jīng)重新部署好。RegionServer就可以干干凈凈的結(jié)束,沒有WAL日志需要分割。
Load Balancer當執(zhí)行g(shù)raceful_stop腳本的時候,要將Region Load Balancer關(guān)掉(否則balancer和下線腳本會在region部署的問題上存在沖突):
hbase(main):001:0> balance_switch false true 0 row(s) in 0.3590 seconds
上面是將balancer關(guān)掉,要想開啟:
hbase(main):001:0> balance_switch true false 0 row(s) in 0.3590 seconds
14.3.2. 依次重啟 你還可以讓這個腳本重啟一個RegionServer,不改變上面的Region的位置。要想保留數(shù)據(jù)的位置,你可以依次重啟(Rolling Restart),就像這樣:
$ for i in `cat conf/regionservers|sort`; do ./bin/graceful_stop.sh --restart --reload --debug $i; done &> /tmp/log.txt &
Tail /tmp/log.txt來看腳本的運行過程.上面的腳本只對RegionServer進行操作。要確認load balancer已經(jīng)關(guān)掉。還需要在之前更新master。下面是一段依次重啟的偽腳本,你可以借鑒它:
確認你的版本,保證配置已經(jīng)rsync到整個集群中。如果版本是0.90.2,需要打上HBASE-3744 和 HBASE-3756兩個補丁。
運行hbck確保你的集群是一致的
$ ./bin/hbase hbck
當發(fā)現(xiàn)不一致的時候,可以修復(fù)參考http://my.oschina.net/drl/blog/683885。
重啟Master:
$ ./bin/hbase-daemon.sh stop master; ./bin/hbase-daemon.sh start master
關(guān)閉region balancer:
$ echo "balance_switch false" | ./bin/hbase
在每個RegionServer上運行g(shù)raceful_stop.sh:
$ for i in `cat conf/regionservers|sort`; do ./bin/graceful_stop.sh --restart --reload --debug $i; done &> /tmp/log.txt &
如果你在RegionServer還開起來thrift和rest server。還需要加上--thrift or --rest 選項 (參見 graceful_stop.sh 腳本的用法).
再次重啟Master.這會把已經(jīng)死亡的server列表清空,重新開啟balancer.
運行 hbck 保證集群是一致的
zookeeper.session.timeout
默認值:3分鐘(180000ms)
說明:RegionServer與Zookeeper間的連接超時時間。當超時時間到后,ReigonServer會被Zookeeper從RS集群清單中移除,HMaster收到移除通知后,會對這臺server負責(zé)的regions重新balance,讓其他存活的RegionServer接管.
調(diào)優(yōu):這個timeout決定了RegionServer是否能夠及時的failover。設(shè)置成1分鐘或更低,可以減少因等待超時而被延長的failover時間。 不過需要注意的是,對于一些Online應(yīng)用,RegionServer從宕機到恢復(fù)時間本身就很短的(網(wǎng)絡(luò)閃斷,crash等故障,運維可快速介入),如果調(diào)低timeout時間,反而會得不償失。因為當ReigonServer被正式從RS集群中移除時,HMaster就開始做balance了(讓其他RS根據(jù)故障機器記錄的WAL日志進行恢復(fù))。當故障的RS在人工介入恢復(fù)后,這個balance動作是毫無意義的,反而會使負載不均勻,給RS帶來更多負擔(dān)。特別是那些固定分配regions的場景。
hbase.regionserver.handler.count
默認值:10
說明:RegionServer的請求處理IO線程數(shù)。
調(diào)優(yōu):這個參數(shù)的調(diào)優(yōu)與內(nèi)存息息相關(guān)。 較少的IO線程,適用于處理單次請求內(nèi)存消耗較高的Big PUT場景(大容量單次PUT或設(shè)置了較大cache的scan,均屬于Big PUT)或ReigonServer的內(nèi)存比較緊張的場景。 較多的IO線程,適用于單次請求內(nèi)存消耗低,TPS要求非常高的場景。設(shè)置該值的時候,以監(jiān)控內(nèi)存為主要參考。 這里需要注意的是如果server的region數(shù)量很少,大量的請求都落在一個region上,因快速充滿memstore觸發(fā)flush導(dǎo)致的讀寫鎖會影響全局TPS,不是IO線程數(shù)越高越好。 壓測時,開啟Enabling RPC-level logging,可以同時監(jiān)控每次請求的內(nèi)存消耗和GC的狀況,最后通過多次壓測結(jié)果來合理調(diào)節(jié)IO線程數(shù)。 這里是一個案例?Hadoop and HBase Optimization for Read Intensive Search Applications,作者在SSD的機器上設(shè)置IO線程數(shù)為100,僅供參考。
hbase.hregion.max.filesize
默認值:256M
說明:在當前ReigonServer上單個Reigon的最大存儲空間,單個Region超過該值時,這個Region會被自動split成更小的region。
調(diào)優(yōu): 小region對split和compaction友好,因為拆分region或compact小region里的storefile速度很快,內(nèi)存占用低。缺點是split和compaction會很頻繁。 特別是數(shù)量較多的小region不停地split, compaction,會導(dǎo)致集群響應(yīng)時間波動很大,region數(shù)量太多不僅給管理上帶來麻煩,甚至?xí)l(fā)一些Hbase的bug。 一般512以下的都算小region。
大region,則不太適合經(jīng)常split和compaction,因為做一次compact和split會產(chǎn)生較長時間的停頓,對應(yīng)用的讀寫性能沖擊非常大。此外,大region意味著較大的storefile,compaction時對內(nèi)存也是一個挑戰(zhàn)。 當然,大region也有其用武之地。如果你的應(yīng)用場景中,某個時間點的訪問量較低,那么在此時做compact和split,既能順利完成split和compaction,又能保證絕大多數(shù)時間平穩(wěn)的讀寫性能。
既然split和compaction如此影響性能,有沒有辦法去掉? compaction是無法避免的,split倒是可以從自動調(diào)整為手動。 只要通過將這個參數(shù)值調(diào)大到某個很難達到的值,比如100G,就可以間接禁用自動split(RegionServer不會對未到達100G的region做split)。 再配合RegionSplitter這個工具,在需要split時,手動split。 手動split在靈活性和穩(wěn)定性上比起自動split要高很多,相反,管理成本增加不多,比較推薦online實時系統(tǒng)使用。
內(nèi)存方面,小region在設(shè)置memstore的大小值上比較靈活,大region則過大過小都不行,過大會導(dǎo)致flush時app的IO wait增高,過小則因store file過多影響讀性能。
hbase.regionserver.global.memstore.upperLimit/lowerLimit
默認值:0.4/0.35
upperlimit說明:hbase.hregion.memstore.flush.size 這個參數(shù)的作用是當單個Region內(nèi)所有的memstore大小總和超過指定值時,flush該region的所有memstore。RegionServer的flush是通過將請求添加一個隊列,模擬生產(chǎn)消費模式來異步處理的。那這里就有一個問題,當隊列來不及消費,產(chǎn)生大量積壓請求時,可能會導(dǎo)致內(nèi)存陡增,最壞的情況是觸發(fā)OOM。 這個參數(shù)的作用是防止內(nèi)存占用過大,當ReigonServer內(nèi)所有region的memstores所占用內(nèi)存總和達到heap的40%時,HBase會強制block所有的更新并flush這些region以釋放所有memstore占用的內(nèi)存。
lowerLimit說明: 同upperLimit,只不過lowerLimit在所有region的memstores所占用內(nèi)存達到Heap的35%時,不flush所有的memstore。它會找一個memstore內(nèi)存占用最大的region,做個別flush,此時寫更新還是會被block。lowerLimit算是一個在所有region強制flush導(dǎo)致性能降低前的補救措施。在日志中,表現(xiàn)為 “** Flush thread woke up with memory above low water.”
調(diào)優(yōu):這是一個Heap內(nèi)存保護參數(shù),默認值已經(jīng)能適用大多數(shù)場景。 參數(shù)調(diào)整會影響讀寫,如果寫的壓力大導(dǎo)致經(jīng)常超過這個閥值,則調(diào)小讀緩存hfile.block.cache.size增大該閥值,或者Heap余量較多時,不修改讀緩存大小。 如果在高壓情況下,也沒超過這個閥值,那么建議你適當調(diào)小這個閥值再做壓測,確保觸發(fā)次數(shù)不要太多,然后還有較多Heap余量的時候,調(diào)大hfile.block.cache.size提高讀性能。 還有一種可能性是?hbase.hregion.memstore.flush.size保持不變,但RS維護了過多的region,要知道 region數(shù)量直接影響占用內(nèi)存的大小。
hfile.block.cache.size
默認值:0.2
說明:storefile的讀緩存占用Heap的大小百分比,0.2表示20%。該值直接影響數(shù)據(jù)讀的性能。
調(diào)優(yōu):當然是越大越好,如果寫比讀少很多,開到0.4-0.5也沒問題。如果讀寫較均衡,0.3左右。如果寫比讀多,果斷默認吧。設(shè)置這個值的時候,你同時要參考?hbase.regionserver.global.memstore.upperLimit?,該值是memstore占heap的最大百分比,兩個參數(shù)一個影響讀,一個影響寫。如果兩值加起來超過80-90%,會有OOM的風(fēng)險,謹慎設(shè)置。
hbase.hstore.blockingStoreFiles
默認值:7
說明:在flush時,當一個region中的Store(Coulmn Family)內(nèi)有超過7個storefile時,則block所有的寫請求進行compaction,以減少storefile數(shù)量。 調(diào)優(yōu):block寫請求會嚴重影響當前regionServer的響應(yīng)時間,但過多的storefile也會影響讀性能。從實際應(yīng)用來看,為了獲取較平滑的響應(yīng)時間,可將值設(shè)為無限大。如果能容忍響應(yīng)時間出現(xiàn)較大的波峰波谷,那么默認或根據(jù)自身場景調(diào)整即可。
hbase.hregion.memstore.block.multiplier
默認值:2
說明:當一個region里的memstore占用內(nèi)存大小超過hbase.hregion.memstore.flush.size兩倍的大小時,block該region的所有請求,進行flush,釋放內(nèi)存。 雖然我們設(shè)置了region所占用的memstores總內(nèi)存大小,比如64M,但想象一下,在最后63.9M的時候,我Put了一個200M的數(shù)據(jù),此時memstore的大小會瞬間暴漲到超過預(yù)期的hbase.hregion.memstore.flush.size的幾倍。這個參數(shù)的作用是當memstore的大小增至超過hbase.hregion.memstore.flush.size 2倍時,block所有請求,遏制風(fēng)險進一步擴大。
調(diào)優(yōu): 這個參數(shù)的默認值還是比較靠譜的。如果你預(yù)估你的正常應(yīng)用場景(不包括異常)不會出現(xiàn)突發(fā)寫或?qū)懙牧靠煽兀敲幢3帜J值即可。如果正常情況下,你的寫請求量就會經(jīng)常暴長到正常的幾倍,那么你應(yīng)該調(diào)大這個倍數(shù)并調(diào)整其他參數(shù)值,比如hfile.block.cache.size和hbase.regionserver.global.memstore.upperLimit/lowerLimit,以預(yù)留更多內(nèi)存,防止HBase server OOM。
hbase.hregion.memstore.mslab.enabled
默認值:true
說明:減少因內(nèi)存碎片導(dǎo)致的Full GC,提高整體性能。
調(diào)優(yōu):詳見 http://kenwublog.com/avoid-full-gc-in-hbase-using-arena-allocation
啟用LZO壓縮
LZO對比Hbase默認的GZip,前者性能較高,后者壓縮比較高,具體參見?Using LZO Compression 。對于想提高HBase讀寫性能的開發(fā)者,采用LZO是比較好的選擇。對于非常在乎存儲空間的開發(fā)者,則建議保持默認。
不要在一張表里定義太多的Column Family
Hbase目前不能良好的處理超過包含2-3個CF的表。因為某個CF在flush發(fā)生時,它鄰近的CF也會因關(guān)聯(lián)效應(yīng)被觸發(fā)flush,最終導(dǎo)致系統(tǒng)產(chǎn)生更多IO。
批量導(dǎo)入
在批量導(dǎo)入數(shù)據(jù)到Hbase前,你可以通過預(yù)先創(chuàng)建regions,來平衡數(shù)據(jù)的負載。詳見?Table Creation: Pre-Creating Regions
避免CMS concurrent mode failure
HBase使用CMS GC。默認觸發(fā)GC的時機是當年老代內(nèi)存達到90%的時候,這個百分比由 -XX:CMSInitiatingOccupancyFraction=N 這個參數(shù)來設(shè)置。concurrent mode failed發(fā)生在這樣一個場景: 當年老代內(nèi)存達到90%的時候,CMS開始進行并發(fā)垃圾收集,于此同時,新生代還在迅速不斷地晉升對象到年老代。當年老代CMS還未完成并發(fā)標記時,年老代滿了,悲劇就發(fā)生了。CMS因為沒內(nèi)存可用不得不暫停mark,并觸發(fā)一次stop the world(掛起所有jvm線程),然后采用單線程拷貝方式清理所有垃圾對象。這個過程會非常漫長。為了避免出現(xiàn)concurrent mode failed,建議讓GC在未到90%時,就觸發(fā)。
通過設(shè)置-XX:CMSInitiatingOccupancyFraction=N
這個百分比, 可以簡單的這么計算。如果你的hfile.block.cache.size 和hbase.regionserver.global.memstore.upperLimit 加起來有60%(默認),那么你可以設(shè)置 70-80,一般高10%左右差不多。
Hbase客戶端優(yōu)化
AutoFlush
將HTable的setAutoFlush設(shè)為false,可以支持客戶端批量更新。即當Put填滿客戶端flush緩存時,才發(fā)送到服務(wù)端。 默認是true。
Scan Caching
scanner一次緩存多少數(shù)據(jù)來scan(從服務(wù)端一次抓多少數(shù)據(jù)回來scan)。 默認值是 1,一次只取一條。
Scan Attribute Selection
scan時建議指定需要的Column Family,減少通信量,否則scan操作默認會返回整個row的所有數(shù)據(jù)(所有Coulmn Family)。
Close ResultScanners
通過scan取完數(shù)據(jù)后,記得要關(guān)閉ResultScanner,否則RegionServer可能會出現(xiàn)問題(對應(yīng)的Server資源無法釋放)。
Optimal Loading of Row Keys
當你scan一張表的時候,返回結(jié)果只需要row key(不需要CF, qualifier,values,timestaps)時,你可以在scan實例中添加一個filterList,并設(shè)置 MUST_PASS_ALL操作,filterList中add?FirstKeyOnlyFilter或KeyOnlyFilter。這樣可以減少網(wǎng)絡(luò)通信量。
Turn off WAL on Puts
當Put某些非重要數(shù)據(jù)時,你可以設(shè)置writeToWAL(false),來進一步提高寫性能。writeToWAL(false)會在Put時放棄寫WAL log。風(fēng)險是,當RegionServer宕機時,可能你剛才Put的那些數(shù)據(jù)會丟失,且無法恢復(fù)。
啟用Bloom Filter
Bloom Filter通過空間換時間,提高讀操作性能。
major_compact 'testtable'
通常生產(chǎn)環(huán)境會關(guān)閉自動major_compact(配置文件中hbase.hregion.majorcompaction設(shè) 為0),選擇一個晚上用戶少的時間窗口手工major_compact,如果hbase更新不是太頻繁,可以一個星期對所有表做一次 major_compact,這個可以在做完一次major_compact后,觀看所有的storefile數(shù)量,如果storefile數(shù)量增加到 major_compact后的storefile的近二倍時,可以對所有表做一次major_compact,時間比較長,操作盡量避免高鋒期。
1,copytable方式
bin/hbase org.apache.hadoop.hbase.mapreduce.CopyTable --peer.adr=zookeeper1,zookeeper2,zookeeper3:/hbase 'testtable'
目前0.92之前的版本的不支持多版本的復(fù)制,0.94已經(jīng)支持多個版本的復(fù)制。當然這個操作需要添加hbase目錄里的conf/mapred-site.xml,可以復(fù)制hadoop的過來。 2,Export/Import
bin/hbase org.apache.hadoop.hbase.mapreduce.Export testtable /user/testtable [versions] [starttime] [stoptime] bin/hbase org.apache.hadoop.hbase.mapreduce.Import testtable /user/testtable
跨版本的遷移,我覺得是一個不錯的選擇,而且copytable不支持多版本,而export支持多版本,比copytable更實用一些。 3,直接拷貝hdfs對應(yīng)的文件
首先拷貝hdfs文件,如bin/hadoop distcp hdfs://srcnamenode:9000/hbase/testtable/ hdfs://distnamenode:9000/hbase/testtable/ 然后在目的hbase上執(zhí)行bin/hbase org.jruby.Main bin/add_table.rb /hbase/testtable
生成meta信息后,重啟hbase 這個操作是簡單的方式,操作之前可以關(guān)閉hbase的寫入,執(zhí)行flush所有表(上面有介紹),再distcp拷貝,如果hadoop版本不一致,可以用hftp接口的方式,我推薦使用這種方式,成本低
a、內(nèi)存大?。?master默認為1G,可增加到2G,regionserver默認1G,可調(diào)大到10G,或者更大,zk并不耗資源,可以不用調(diào)整,需要注意的是,調(diào)整了rs的內(nèi)存大小后,需調(diào)整hbase.regionserver.maxlogs和hbase.regionserver.hlog.blocksize這兩個參數(shù),WAL的最大值由hbase.regionserver.maxlogs * hbase.regionserver.hlog.blocksize決定(默認32*32M~=1G),一旦達到這個值,就會被觸發(fā)flush memstore,如果memstore的內(nèi)存增大了,但是沒有調(diào)整這兩個參數(shù),實際上對大量小文件沒有任何改進,調(diào)整策略:hbase.regionserver.hlog.blocksize * hbase.regionserver.maxlogs 設(shè)置為略大于hbase.regionserver.global.memstore.lowerLimit * HBASE_HEAPSIZE。
b、垃圾回收: export HBASE_OPTS="$HBASE_OPTS -Xms30720m -Xmx30720m -XX:NewSize=512m -XX:MaxPermSize=128m -XX:PermSize=128m -XX:+UseParNewGC -XX:+UseConcMarkSweepGC -XX:CMSInitiatingOccupancyFraction=70 -XX:+UseCMSCompactAtFullCollection -XX:+ExplicitGCInvokesConcurrent -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -Xloggc:/usr/local/hbase-0.94.0/logs/gc-hbase.log"。
1)列族、rowkey要盡量短,每個cell值均會存儲一次列族名稱和rowkey,甚至列名稱也要盡量短
2)RS的region數(shù)量:一般每個RegionServer不要過1000,過多的region會導(dǎo)致產(chǎn)生較多的小文件,從而導(dǎo)致更多的compact,當有大量的超過5G的region并且RS總region數(shù)達到1000時,應(yīng)該考慮擴容。
3)建表時: a、如果不需要多版本,則應(yīng)設(shè)置version=1; b、 開啟lzo或者snappy壓縮,壓縮會消耗一定的CPU,但是,磁盤IO和網(wǎng)絡(luò)IO將獲得極大的改善,大致可以壓縮4~5倍; c、合理的設(shè)計rowkey,在設(shè)計rowkey時需充分的理解現(xiàn)有業(yè)務(wù)并合理預(yù)見未來業(yè)務(wù),不合理的rowkey設(shè)計將導(dǎo)致極差的hbase操作性能; d、合理的規(guī)劃數(shù)據(jù)量,進行預(yù)分區(qū),避免在表使用過程中的不斷split,并把數(shù)據(jù)的讀寫分散到不同的RS,充分的發(fā)揮集群的作用; e、列族名稱盡量短,比如:“f”,并且盡量只有一個列族; f、視場景開啟bloomfilter,優(yōu)化讀性能。
1、hbase.client.write.buffer:寫緩存大小,默認為2M,推薦設(shè)置為6M,單位是字節(jié),當然不是越大越好,如果太大,則占用的內(nèi)存太多;
2、hbase.client.scanner.caching:scan緩存,默認為1,太小,可根據(jù)具體的業(yè)務(wù)特征進行配置,原則上不可太大,避免占用過多的client和rs的內(nèi)存,一般最大幾百,如果一條數(shù)據(jù)太大,則應(yīng)該設(shè)置一個較小的值,通常是設(shè)置業(yè)務(wù)需求的一次查詢的數(shù)據(jù)條數(shù),比如:業(yè)務(wù)特點決定了一次最多50條,則可以設(shè)置為50
3、設(shè)置合理的超時時間和重試次數(shù),具體的內(nèi)容會在后續(xù)的blog中詳細講解。
4、client應(yīng)用讀寫分離 讀和寫分離,位于不同的tomcat實例,數(shù)據(jù)先寫入redis隊列,再異步寫入hbase,如果寫失敗再回存redis隊列,先讀redis緩存的數(shù)據(jù)(如果有緩存,需要注意這里的redis緩存不是redis隊列),如果沒有讀到再讀hbase。 當hbase集群不可用,或者某個RS不可用時,因為HBase的重試次數(shù)和超時時間均比較大(為保證正常的業(yè)務(wù)訪問,不可能調(diào)整到比較小的值,如果一個RS掛了,一次讀或者寫,經(jīng)過若干重試和超時可能會持續(xù)幾十秒,或者幾分鐘),所以一次操作可能會持續(xù)很長時間,導(dǎo)致tomcat線程被一個請求長時間占用,tomcat的線程數(shù)有限,會被快速占完,導(dǎo)致沒有空余線程做其它操作,讀寫分離后,寫由于采用先寫redis隊列,再異步寫hbase,因此不會出現(xiàn)tomcat線程被占滿的問題, 應(yīng)用還可以提供寫服務(wù),如果是充值等業(yè)務(wù),則不會損失收入,并且讀服務(wù)出現(xiàn)tomcat線程被占滿的時間也會變長一些,如果運維介入及時,則讀服務(wù)影響也比較有限。
5、如果把org.apache.hadoop.hbase.client.HBaseAdmin配置為spring的bean,則需配置為懶加載,避免在啟動時鏈接hbase的Master失敗導(dǎo)致啟動失敗,從而無法進行一些降級操作。
6、Scan查詢編程優(yōu)化:
1)調(diào)整caching; 2)如果是類似全表掃描這種查詢,或者定期的任務(wù),則可以設(shè)置scan的setCacheBlocks為false,避免無用緩存; 3)關(guān)閉scanner,避免浪費客戶端和服務(wù)器的內(nèi)存; 4)限定掃描范圍:指定列簇或者指定要查詢的列; 5)、如果只查詢rowkey時,則使用KeyOnlyFilter可大量減少網(wǎng)絡(luò)消耗;
7、對響應(yīng)時間有嚴格要求的在線實時系統(tǒng),可以通過封裝hbase client api,通過線程池執(zhí)行g(shù)et等操作,通過Future.get()設(shè)置超時時間,超過時間沒有返回則執(zhí)行其它邏輯,實現(xiàn)快速失敗的效果。
作為hbase依賴的狀態(tài)協(xié)調(diào)者ZK和數(shù)據(jù)的存儲則HDFS,也需要調(diào)優(yōu):
1、zookeeper.session.timeout:默認值3分鐘,不可配置太短,避免session超時,hbase停止服務(wù),線上生產(chǎn)環(huán)境由于配置為1分鐘,出現(xiàn)過2次該原因?qū)е碌膆base停止服務(wù),也不可配置太長,如果太長,當rs掛掉,zk不能快速知道,從而導(dǎo)致master不能及時對region進行遷移。
2、zookeeper數(shù)量:至少5個節(jié)點。給每個zookeeper 1G左右的內(nèi)存,最好有獨立的磁盤。 (獨立磁盤可以確保zookeeper不受影響).如果集群負載很重,不要把Zookeeper和RegionServer運行在同一臺機器上面。就像DataNodes 和 TaskTrackers一樣,只有超過半數(shù)的zk存在才會提供服務(wù),比如:共5臺,則最多只運行掛2臺,配置4臺與3臺一樣,最多只運行掛1臺。
3、hbase.zookeeper.property.maxClientCnxns:zk的最大連接數(shù),默認為300,應(yīng)根據(jù)集群規(guī)模進行調(diào)整。
dfs.name.dir: namenode的數(shù)據(jù)存放地址,可以配置多個,位于不同的磁盤并配置一個NFS遠程文件系統(tǒng),這樣nn的數(shù)據(jù)可以有多個備份
dfs.data.dir:dn數(shù)據(jù)存放地址,每個磁盤配置一個路徑,這樣可以大大提高并行讀寫的能力
dfs.namenode.handler.count:nn節(jié)點RPC的處理線程數(shù),默認為10,需提高,比如:60
dfs.datanode.handler.count:dn節(jié)點RPC的處理線程數(shù),默認為3,需提高,比如:20
dfs.datanode.max.xcievers:dn同時處理文件的上限,默認為256,需提高,比如:8192
dfs.block.size:dn數(shù)據(jù)塊的大小,默認為64M,如果存儲的文件均是比較大的文件則可以考慮調(diào)大,比如,在使用hbase時,可以設(shè)置為128M,注意單位是字節(jié)
dfs.balance.bandwidthPerSec:在通過start-balancer.sh做負載均衡時控制傳輸文件的速度,默認為1M/s,可配置為幾十M/s,比如:20M/s
dfs.datanode.du.reserved:每塊磁盤保留的空余空間,應(yīng)預(yù)留一些給非hdfs文件使用,默認值為0
dfs.datanode.failed.volumes.tolerated:在啟動時會導(dǎo)致dn掛掉的壞磁盤數(shù)量,默認為0,即有一個磁盤壞了,就掛掉dn,可以不調(diào)整。
以上是“HBase如何實現(xiàn)性能調(diào)優(yōu)”這篇文章的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對大家有幫助,更多相關(guān)知識,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!
分享名稱:HBase如何實現(xiàn)性能調(diào)優(yōu)
地址分享:http://aaarwkj.com/article46/gjgdhg.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站排名、服務(wù)器托管、網(wǎng)站改版、、微信小程序、小程序開發(fā)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)