這幾年的大數(shù)據(jù)熱潮帶動(dòng)了一激活了一大批hadoop學(xué)習(xí)愛好者。有自學(xué)hadoop的,有報(bào)名培訓(xùn)班學(xué)習(xí)的。所有接觸過hadoop的人都知道,單獨(dú)搭建hadoop里每個(gè)組建都需要運(yùn)行環(huán)境、修改配置文件測(cè)試等過程。對(duì)于我們這些入門級(jí)新手來說簡(jiǎn)直每個(gè)都是坑。國(guó)內(nèi)的發(fā)行版hadoop那么多,似乎都沒有來填這樣的坑?不知道是沒法解決,還是沒有想到?
安裝運(yùn)行環(huán)境這樣的坑,那些做國(guó)產(chǎn)大數(shù)據(jù)底層開發(fā)的,如果不能解決這個(gè)問題的話,我覺得不是一個(gè)合格的大數(shù)據(jù)底層開發(fā)機(jī)構(gòu)。不過比較幸運(yùn)的是,三月的時(shí)候申請(qǐng)拿到了一個(gè)DKHadoop的三節(jié)點(diǎn)發(fā)行版,大快開源的發(fā)行版hadoop。這個(gè)國(guó)產(chǎn)發(fā)行版就把各種常用的組建比如:HDFS,Hbase,Storm,Flume,Kafka,Mahout,Es等集成到了一起,終于不需要絞盡腦汁去折騰底層平臺(tái)的搭建與配置了,簡(jiǎn)單的完成安裝即可。這對(duì)于hadoop初學(xué)者來說,可謂是福音了。
扯的稍微多了點(diǎn),后面在給家分享DKHadoop的安裝以及使用,今天想給大家分享的是大數(shù)據(jù)基礎(chǔ)內(nèi)容中的數(shù)據(jù)庫(kù):SQL與NOSQL。理解這兩種數(shù)據(jù),只需要搞清楚二者的概念以及有何不同即可。
二者概念:
1、SQL數(shù)據(jù)庫(kù),指關(guān)系型數(shù)據(jù)庫(kù)。主要代表:SQL?Server,Oracle,MySQL(開源),PostgreSQL(開源)。
2、NoSQL泛指非關(guān)系型數(shù)據(jù)庫(kù)。主要代表:MongoDB,Redis,CouchDB。
二者區(qū)別:
SQL數(shù)據(jù)與NOSQL數(shù)據(jù)的區(qū)別其實(shí)還是比較大的,總結(jié)起來基本可以從以下幾個(gè)方面進(jìn)行對(duì)比分析:
(1)使用場(chǎng)景:SQL 是數(shù)字,它最適合明確的定義,精確規(guī)范的獨(dú)立項(xiàng)目。典型的使用案例是在線商城和銀行系統(tǒng); NoSQL 是模擬,它最適合無固定要求的組織數(shù)據(jù)。典型的使用案例是社交網(wǎng)絡(luò),客戶管理和網(wǎng)絡(luò)分析系統(tǒng)。
(2)存儲(chǔ)方式:SQL數(shù)據(jù)存在特定結(jié)構(gòu)的表中,SQL通常以數(shù)據(jù)庫(kù)表形式存儲(chǔ)數(shù)據(jù)。舉個(gè)例子,存?zhèn)€學(xué)生借書數(shù)據(jù):
NoSQL存儲(chǔ)方式比較靈活,存儲(chǔ)方式可以是JSON文檔、哈希表或者其他方式。比如使用類JSON文件存儲(chǔ)上表中熊大的借閱數(shù)據(jù):
(3)SQL中如果需要增加外部關(guān)聯(lián)數(shù)據(jù)的話,規(guī)范化做法是在原表中增加一個(gè)外鍵關(guān)聯(lián)外部數(shù)據(jù)表。例如需要在借閱表中增加審核人信息,先建立一個(gè)審核人表:
再在原來的借閱人表中增加審核人外鍵,這樣如果我們需要更新審核人個(gè)人信息的時(shí)候只需要更新審核人表而不需要對(duì)借閱人表做更新。
而在NoSQL中除了這種規(guī)范化的外部數(shù)據(jù)表做法以外,我們還能用如下的非規(guī)范化方式把外部數(shù)據(jù)直接放到原數(shù)據(jù)集中,以提高查詢效率。缺點(diǎn)也比較明顯,更新審核人數(shù)據(jù)的時(shí)候?qū)?huì)比較麻煩。
(4)數(shù)據(jù)耦合性?:SQL中不允許刪除已經(jīng)被使用的外部數(shù)據(jù),例如審核人表中的"熊三"已經(jīng)被分配給了借閱人熊大,那么在審核人表中將不允許刪除熊三這條數(shù)據(jù),以保證數(shù)據(jù)完整性;而NoSQL中則沒有這種強(qiáng)耦合的概念,可以隨時(shí)刪除任何數(shù)據(jù)。?
(5)查詢性能:在相同水平的系統(tǒng)設(shè)計(jì)的前提下,因?yàn)镹oSQL中省略了JOIN查詢的消耗,故理論上性能上是優(yōu)于SQL的。
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)cdcxhl.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國(guó)服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡(jiǎn)單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場(chǎng)景需求。
網(wǎng)頁題目:大數(shù)據(jù)入門級(jí)學(xué)習(xí):SQL與NOSQL數(shù)據(jù)庫(kù)-創(chuàng)新互聯(lián)
文章路徑:http://aaarwkj.com/article48/iejep.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站建設(shè)、手機(jī)網(wǎng)站建設(shè)、App設(shè)計(jì)、網(wǎng)站制作、定制網(wǎng)站、標(biāo)簽優(yōu)化
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容