云MongoDB怎么優(yōu)化讓LBS服務(wù)性提升十倍,針對這個問題,這篇文章詳細介紹了相對應(yīng)的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。
成都創(chuàng)新互聯(lián)公司是一家專注于網(wǎng)站建設(shè)、成都做網(wǎng)站與策劃設(shè)計,和田縣網(wǎng)站建設(shè)哪家好?成都創(chuàng)新互聯(lián)公司做網(wǎng)站,專注于網(wǎng)站建設(shè)十多年,網(wǎng)設(shè)計領(lǐng)域的專業(yè)建站公司;建站業(yè)務(wù)涵蓋:和田縣等地區(qū)。和田縣做網(wǎng)站價格咨詢:18980820575
隨著國內(nèi)服務(wù)共享化的熱潮普及,共享單車,共享雨傘,共享充電寶等各種服務(wù)如雨后春筍,隨之而來的LBS服務(wù)定位問題成為了后端服務(wù)的一個挑戰(zhàn)。MongoDB對LBS查詢的支持較為友好,也是各大LBS服務(wù)商的首選數(shù)據(jù)庫。騰訊云MongoDB團隊在運營中發(fā)現(xiàn),原生MongoDB在LBS服務(wù)場景下有較大的性能瓶頸,經(jīng)騰訊云團隊專業(yè)的定位分析與優(yōu)化后,云MongoDB在LBS服務(wù)的綜合性能上,有10倍以上的提升。
騰訊云MongoDB提供的優(yōu)異綜合性能,為國內(nèi)各大LBS服務(wù)商,例如摩拜單車等,提供了強有力的保障。
LBS業(yè)務(wù)特點
以共享單車服務(wù)為例,LBS業(yè)務(wù)具有2個特點,分別是時間周期性和坐標(biāo)分布不均勻。
高峰期與低谷期的QPS量相差明顯,并且高峰期和低峰期的時間點相對固定。
坐地鐵的上班族,如果留意可能會發(fā)現(xiàn),在上班早高峰時,地鐵周圍擺滿了共享單車,而下班 時段,地鐵周圍的共享單車數(shù)量非常少。如下圖,經(jīng)緯度(121,31.44)附近集中了99%以上 的坐標(biāo)。此外,一些特殊事件也會造成點的分布不均勻,例如深圳灣公園在特殊家假日涌入大量的客戶,同時這個地域也會投放大量的單車。部分地域單車量非常集中,而其他地域就非常稀疏。
MongoDB中使用2d_index 或2d_sphere_index來創(chuàng)建地理位置索引(geoIndex),兩者差別不大,下面我們以2d_index為例來介紹。
一.2D索引的創(chuàng)建與使用
db.coll.createIndex({"lag":"2d"}, {"bits":int}))通過上述命令來創(chuàng)建一個2d索引,索引的精度通過bits來指定,bits越大,索引的精度就越高。更大的bits帶來的插入的overhead可以忽略不計 db.runCommand({geoNear: tableName,maxDistance: 0.0001567855942887398,distanceMultiplier: 6378137.0,num: 30,near: [ 113.8679388183982, 22.58905429302385 ],spherical: true|false})
通過上述命令來查詢一個索引,其中spherical:true|false 表示應(yīng)該如何理解創(chuàng)建的2d索引,false表示將索引理解為平面2d索引,true表示將索引理解為球面經(jīng)緯度索引。這一點比較有意思,一個2d索引可以表達兩種含義,而不同的含義是在查詢時被理解的,而不是在索引創(chuàng)建時。
二.2D索引的理論MongoDB 使用GeoHash的技術(shù)來構(gòu)建2d索引(見wiki geohash 文字鏈 https://en.wikipedia.org/wiki/Geohash )。MongoDB使用平面四叉樹劃分的方式來生成GeoHashId,每條記錄有一個GeoHashId,通過GeoHashId->RecordId的索引映射方式存儲在Btree中
很顯然的,一個2bits的精度能把平面分為4個grid,一個4bits的精度能把平面分為16個grid。 2d索引的默認精度是長寬各為26,索引把地球分為(2^26)(2^26)塊,每一塊的邊長估算為2PI6371000/(1<<
26) = 0.57 米 mongodb的官網(wǎng)上說的60cm的精度就是這么估算出來的 By default, a 2d index on legacy coordinate pairs uses 26 bits of precision, which isroughly equivalent to 2 feet or 60 centimeters of precision using the default range of-180 to 180
三.2D索引在Mongodb中的存儲
上面我們講到Mongodb使用平面四叉樹的方式計算Geohash。事實上,平面四叉樹僅存在于運算的過程中,在實際存儲中并不會被使用到。
插入對于一個經(jīng)緯度坐標(biāo)[x,y],MongoDb計算出該坐標(biāo)在2d平面內(nèi)的grid編號,該編號為是一個52bit的int64類型,該類型被用作btree的key,因此實際數(shù)據(jù)是按照 {GeoHashId->RecordValue}的方式被插入到btree中的。
查詢對于geo2D索引的查詢,常用的有g(shù)eoNear和geoWithin兩種。geoNear查找距離某個點最近的N個點的坐標(biāo)并返回,該需求可以說是構(gòu)成了LBS服務(wù)的基礎(chǔ)(陌陌,滴滴,摩拜),geoWithin是查詢一個多邊形內(nèi)的所有點并返回。我們著重介紹使用最廣泛的geoNear查詢。
geoNear的查詢過程,查詢語句如下
db.runCommand({geoNear: "places", //table Namenear: [ -73.9667, 40.78 ] , // central pointspherical: true, // treat the index as a spherical indexquery: { category: "public" } // filtersmaxDistance: 0.0001531 // distance in about one kilometer}
geoNear可以理解為一個從起始點開始的不斷向外擴散的環(huán)形搜索過程。如下圖所示: 由于圓自身的性質(zhì),外環(huán)的任意點到圓心的距離一定大于內(nèi)環(huán)任意點到圓心的距離,所以以圓 環(huán)進行擴張迭代的好處是:1)減少需要排序比較的點的個數(shù)2)能夠盡早發(fā)現(xiàn)滿足條件的點從而返回,避免不必要的搜索MongoDB在實現(xiàn)的細節(jié)中,如果內(nèi)環(huán)搜索到的點數(shù)過少,圓環(huán)每次擴張的步長會倍增
部分大客戶在使用MongoDB的geoNear功能查找附近的對象時,經(jīng)常會發(fā)生慢查詢較多的問題,早高峰壓力是低谷時段的10-20倍,坐標(biāo)不均勻的情況慢查詢嚴重,瀕臨雪崩。初步分析發(fā)現(xiàn),這些查詢掃描了過多的點集。 如下圖,查找500米范圍內(nèi),距離最近的10條記錄,花費了500ms,掃描了24000+的記錄。類似的慢查詢占據(jù)了高峰期5%左右的查詢量
測試環(huán)境復(fù)現(xiàn)與定位排查數(shù)據(jù)庫的性能問題,主要從鎖等待,IO等待,CPU消耗三封面分析。上面的截圖掃描了過多的記錄,直覺上是CPU或者IO消耗性的瓶頸。為了嚴謹起見,我們在測試環(huán)境復(fù)現(xiàn)后,發(fā)現(xiàn)慢日志中無明顯的timeAcquiringMicroseconds項排除了MongoDB執(zhí)行層面的鎖競爭問題,并選用較大內(nèi)存的機器使得數(shù)據(jù)常駐內(nèi)存,發(fā)現(xiàn)上述用例依舊需要200ms以上的執(zhí)行時間。10核的CPU資源針對截圖中的case,只能支持50QPS。
為何掃描集如此大上面我們說過,MongoDB搜索距離最近的點的過程是一個環(huán)形擴張的過程,如果內(nèi)環(huán)滿足條件的點不夠多,每次的擴張半徑都會倍增。因此在遇到內(nèi)環(huán)點稀少,外環(huán)有密集點的場景時,容易陷入BadCase。如下圖,我們希望找到離中心點距離最近的三個點。由于圓環(huán)擴張?zhí)欤猸h(huán)做了很多的無用掃描與排序。 這樣的用例很符合實際場景,早高峰車輛聚集在地鐵周圍,你從家出發(fā)一路向地鐵,邊走邊找,共享單車軟件上動態(tài)搜索距你最近的10輛車,附近只有三兩輛,于是擴大搜索半徑到地鐵周圍,將地鐵周圍的所有幾千輛車都掃描計算一遍,返回距離你最近的其余的七八輛
問題我們已經(jīng)知道了,我們對此的優(yōu)化方式是控制每一圈的搜索量,為此我們?yōu)間eoNear命令增加了兩個參數(shù),將其傳入NearStage中。hintCorrectNum可以控制結(jié)果品質(zhì)的下限,返回的前N個一定是最靠近中心點的N個點。hintScan用以控制掃描集的大小的上限。
hintScan: 已經(jīng)掃描的點集大小大于hintScan后,做模糊處理。 hintCorrectNum:已經(jīng)返回的結(jié)果數(shù)大于hintCorrectNum后,做模糊處理。
該優(yōu)化本質(zhì)上是通過犧牲品質(zhì)來盡快返回結(jié)果。對于國內(nèi)大部分LBS服務(wù)來說,完全的嚴格最近并不是必要的。且可以通過控制參數(shù)獲得嚴格最近的效果。在搜索過程中,密集的點落到一個環(huán)內(nèi),本身距離相差也不會不大。該優(yōu)化在上線后,將部分大客戶的MongoDB性能上限從單機1000QPS提升了10倍到10000QPS以上。
MongoDB原生的geoNear接口是國內(nèi)各大LBS應(yīng)用的主流選擇。原生MongoDB在點集稠密的情況下,geoNear接口效率會急劇下降,單機甚至不到1000QPS。騰訊云MongoDB團隊對此進行了持續(xù)的優(yōu)化,在不影響效果的前提下,geoNear的效率有10倍以上的提升,為我們的客戶如摩拜提供了強力的支持,同時相比Redis3.2也有較大的性能優(yōu)勢。
關(guān)于云MongoDB怎么優(yōu)化讓LBS服務(wù)性提升十倍問題的解答就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道了解更多相關(guān)知識。
分享文章:云MongoDB怎么優(yōu)化讓LBS服務(wù)性提升十倍
網(wǎng)站URL:http://aaarwkj.com/article36/gihcsg.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供外貿(mào)建站、電子商務(wù)、動態(tài)網(wǎng)站、靜態(tài)網(wǎng)站、網(wǎng)站導(dǎo)航、網(wǎng)站設(shè)計
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)