8月5日是個(gè)特殊的日子,為了推動(dòng)大數(shù)據(jù)技術(shù)在中國(guó)大范圍應(yīng)用,同時(shí)將本土技術(shù)回饋到國(guó)際開(kāi)源社區(qū),Cloudera與清華大學(xué)合作達(dá)成儀式。說(shuō)到Cloudera,相信業(yè)內(nèi)人士并不陌生,大數(shù)據(jù)市場(chǎng)的飛速發(fā)展使得Hadoop深受歡迎,許多公司都推出了各自版本的Hadoop,也有一些公司則圍繞Hadoop開(kāi)發(fā)產(chǎn)品。而在Hadoop生態(tài)系統(tǒng)中,規(guī)模大、知名度最高的公司則是Cloudera。
成都創(chuàng)新互聯(lián)公司成立于2013年,先為改則等服務(wù)建站,改則等地企業(yè),進(jìn)行企業(yè)商務(wù)咨詢服務(wù)。為改則企業(yè)網(wǎng)站制作PC+手機(jī)+微官網(wǎng)三網(wǎng)同步一站式服務(wù)解決您的所有建站問(wèn)題。儀式結(jié)束后,Hadoop之父、Cloudera首席架構(gòu)師、Apache軟件基金會(huì)理事Doug Cutting應(yīng)邀接受了互聯(lián)網(wǎng)IDC圈記者的采訪,談及了Hadoop在安全方面的措施,Spark與Hadoop之間的微妙關(guān)系以及Hadoop未來(lái)的發(fā)展等一系列問(wèn)題。
Hadoop之父、Cloudera首席架構(gòu)師、Apache軟件基金會(huì)理事Doug Cutting
Hadoop已成為非常安全的平臺(tái)
當(dāng)今時(shí)代,社交媒體、網(wǎng)絡(luò)、移動(dòng)定位等諸多技術(shù)的廣泛應(yīng)用使得數(shù)據(jù)急速增長(zhǎng)。Hadoop作為大數(shù)據(jù)利器,一直被大肆宣傳。憶往昔,Hadoop為搜索引擎建立的網(wǎng)頁(yè)索引,并不是處理信用卡號(hào),所以其安全問(wèn)題被擱置。如此一來(lái),許多企業(yè)對(duì)其態(tài)度也從原來(lái)的淺嘗輒止變成了望而卻步。
關(guān)于安全方面,Doug Cutting指出,在Hadoop創(chuàng)立的時(shí)候是沒(méi)有做安全這塊的,但是我們后來(lái)不斷的加強(qiáng)對(duì)安全模塊的研發(fā),現(xiàn)在Hadoop也成為了非常安全的平臺(tái)。在安全方面有:身份識(shí)別—保登錄的人群是被合法認(rèn)證的;用戶授權(quán)—控制用戶能夠讀取的信息;審計(jì)—提供滿足監(jiān)管需求的文檔支持,查看是否有違規(guī)操作靜態(tài)數(shù)據(jù)以及動(dòng)態(tài)數(shù)據(jù)的加密。
Spark與Hadoop相輔相成、互補(bǔ)共生
Hadoop主要包括三方面的功能:以HDFS為主的存儲(chǔ)功能,以MapReduce為代表的Batch處理功能以及以YARN為代表的scheduling功能。
說(shuō)到Hadoop自然而然會(huì)讓人聯(lián)想到Spark,作為實(shí)時(shí)處理工具Spark在batch processing和streaming代表著下一代技術(shù),并且在某些方面優(yōu)于MapReduce。那么,假以時(shí)日Spark會(huì)不會(huì)有取代Hadoop的可能,Doug Cutting給出的答案當(dāng)然是否定的:“我覺(jué)得Spark不可能取代Hadoop,它能夠取代部分Hadoop的功能,比如說(shuō)取代MapReduce,二者之間更多的是互補(bǔ)的關(guān)系而不是競(jìng)爭(zhēng)的關(guān)系。在存儲(chǔ)和scheduling不可能取代Hadoop,Hadoop在batch或streaming處理方面比Spark更強(qiáng)大;在搜索方面很多又是Spark搜不到的,所以Spark只是相當(dāng)于開(kāi)源集群計(jì)算的框架,它并不能完全取代Hadoop。Cloudera不光是支持Hadoop,也支持Spark,我們是Hadoop+Spark這樣的公司。”
Cloudera現(xiàn)在參與的項(xiàng)目有20多個(gè),包括Hadoop、Spark、HBace等生態(tài)系統(tǒng)內(nèi)的項(xiàng)目,也擁有超過(guò)100個(gè)對(duì)于技術(shù)和系統(tǒng)都非常資深的技術(shù)開(kāi)發(fā)者。其實(shí)用戶特別希望開(kāi)源社區(qū)以開(kāi)源形式開(kāi)發(fā)軟件,開(kāi)源社區(qū)要進(jìn)一步發(fā)展需要這些廠商來(lái)提供支持。作為開(kāi)源廠商,到底是不是一個(gè)商業(yè)模式放之四海皆準(zhǔn),現(xiàn)在整個(gè)行業(yè)都在探索這個(gè)問(wèn)題。Doug Cutting指出:“Cloudera的核心平臺(tái)是開(kāi)源的,但是我們可以賣一些加載在核心平臺(tái)上的軟件,這種軟件可以讓客戶更好的管理他的數(shù)據(jù),更多地對(duì)管理工具進(jìn)行優(yōu)化,包括優(yōu)化、監(jiān)控?cái)?shù)據(jù)的管理工具,以收費(fèi)的方式可以進(jìn)行出售,我相信是比較成功的。”
中國(guó)企業(yè)為整個(gè)Hadoop的開(kāi)源社區(qū)做了大量的貢獻(xiàn)
Doug Cutting不僅任職于Cloudera,同時(shí)也是Apache軟件基金會(huì)的理事。在基金會(huì)里,有很多企業(yè)參與Hadoop的研發(fā),整個(gè)Hadoop版本發(fā)布速度非???。當(dāng)然,這其中的也不乏來(lái)自中國(guó)的代碼貢獻(xiàn)者,Doug Cutting表示:“中國(guó)的企業(yè)為整個(gè)Hadoop的開(kāi)源社區(qū)做了大量的貢獻(xiàn),例如華為、阿里巴巴、騰訊等企業(yè)不但是Hadoop的使用者,同時(shí)也是Hadoop技術(shù)的貢獻(xiàn)者。”目前,90%的Hadoop軟件運(yùn)行于Hadoop系統(tǒng)平臺(tái)上,其中很多軟件都是基于Hadoop平臺(tái)之外的開(kāi)發(fā)。Doug Cutting強(qiáng)調(diào):“在整個(gè)生態(tài)系統(tǒng)環(huán)境內(nèi)我們會(huì)打造一個(gè)非常豐富的生態(tài)系統(tǒng),讓更多的參與者能夠進(jìn)行開(kāi)發(fā)。”
Cloudera除了與清華大學(xué)合作之外,在海外也跟其他大學(xué)展開(kāi)了合作,其中包括美國(guó)、新加坡等地的大學(xué),也包括歐洲的一些大學(xué)和研究機(jī)構(gòu)。Doug Cutting表示:“我們合作的主要形式就是提供免費(fèi)的課程,這些全套免費(fèi)的課程我們開(kāi)發(fā)了很多年,免費(fèi)提供給這樣的大學(xué)共同展開(kāi)合作。我們?cè)谥袊?guó)選取的第一個(gè)合作方是清華大學(xué),今后將會(huì)與更多的中國(guó)大學(xué)展開(kāi)合作。”
本文標(biāo)題:對(duì)話Hadoop之父DougCutting:Spark與Hadoop互補(bǔ)共生
文章網(wǎng)址:http://aaarwkj.com/article20/socpjo.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供服務(wù)器托管、App設(shè)計(jì)、企業(yè)建站、品牌網(wǎng)站建設(shè)、網(wǎng)站建設(shè)、網(wǎng)站營(yíng)銷
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)