如何進(jìn)行基于spark之上的卓越性能分析,相信很多沒有經(jīng)驗(yàn)的人對(duì)此束手無策,為此本文總結(jié)了問題出現(xiàn)的原因和解決方法,通過這篇文章希望你能解決這個(gè)問題。
成都創(chuàng)新互聯(lián)公司堅(jiān)持“要么做到,要么別承諾”的工作理念,服務(wù)領(lǐng)域包括:成都網(wǎng)站設(shè)計(jì)、網(wǎng)站建設(shè)、企業(yè)官網(wǎng)、英文網(wǎng)站、手機(jī)端網(wǎng)站、網(wǎng)站推廣等服務(wù),滿足客戶于互聯(lián)網(wǎng)時(shí)代的揚(yáng)中網(wǎng)站設(shè)計(jì)、移動(dòng)媒體設(shè)計(jì)的需求,幫助企業(yè)找到有效的互聯(lián)網(wǎng)解決方案。努力成為您成熟可靠的網(wǎng)絡(luò)建設(shè)合作伙伴!
為探索性分析與即席分析而設(shè)計(jì)
YDB全稱延云YDB:是一個(gè)基于Hadoop分布式架構(gòu)下的實(shí)時(shí)的、多維的、交互式的查詢、統(tǒng)計(jì)、分析引擎,具有萬億數(shù)據(jù)規(guī)模下的秒級(jí)性能表現(xiàn),并具備企業(yè)級(jí)的穩(wěn)定可靠表現(xiàn)。
YDB是一個(gè)細(xì)粒度的索引:精確粒度的索引。數(shù)據(jù)即時(shí)導(dǎo)入,索引即時(shí)生成,通過索引高效定位到相關(guān)數(shù)據(jù)。YDB與Spark深度集成,Spark直接對(duì)YDB檢索結(jié)果集分析計(jì)算,同樣場景讓Spark性能加快百倍。
按照時(shí)間逆序排序可以說是很多日志系統(tǒng)的硬指標(biāo)。在延云 YDB 系統(tǒng)中,我們改變了傳統(tǒng)的暴力排序方式,通過索引技術(shù),可以超快對(duì)數(shù)據(jù)進(jìn)行單列排序,不需要全表暴力掃描,這個(gè)技術(shù)我們稱之為 BlockSort,目前支持 tlong、 tdouble、 tint、 tfloat 四種數(shù)據(jù)類型。
由于 BlockSort 是借助搜索的索引來實(shí)現(xiàn)的,所以采用 BlockSort 的排序,不需要暴力掃描,性能有大幅度的提升。
BlockSort 的排序,并非是預(yù)計(jì)算的方式,可以進(jìn)行全表進(jìn)行排序,也可以基于任意的過濾篩選條件進(jìn)行過濾排序。
詳細(xì)測試地址: http://blog.csdn.net/qq_33160722/article/details/54447022
300億條數(shù)據(jù)的排序演示視頻 http://blog.csdn.net/qq_33160722/article/details/54834896
看完上述內(nèi)容,你們掌握如何進(jìn)行基于spark之上的卓越性能分析的方法了嗎?如果還想學(xué)到更多技能或想了解更多相關(guān)內(nèi)容,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝各位的閱讀!
分享文章:如何進(jìn)行基于spark之上的卓越性能分析
鏈接分享:http://aaarwkj.com/article12/pjcdgc.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供定制網(wǎng)站、建站公司、網(wǎng)站內(nèi)鏈、App設(shè)計(jì)、網(wǎng)站設(shè)計(jì)、外貿(mào)建站
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)