欧美一级特黄大片做受成人-亚洲成人一区二区电影-激情熟女一区二区三区-日韩专区欧美专区国产专区

管理大數(shù)據(jù)之初探Hadoop發(fā)行版

互聯(lián)網(wǎng)IDC圈2月22日報道:Hadoop是一項開源技術,它是當今與大數(shù)據(jù)應用最為息息相關的數(shù)據(jù)管理平臺。該分布式處理框架主要由Yahoo創(chuàng)建于2006年,部分是基于由Google在一些技術論文中所闡述的思想;很快,諸如Facebook,Linkedln以及Twitter之類的互聯(lián)網(wǎng)公司采用該技術并開始對其發(fā)展貢獻力量。在過去幾年,Hadoop已經(jīng)演變成一種有著基礎設施組件和相關工具的復雜生態(tài)系統(tǒng),而且它被各家供應商打包在一起成為商業(yè)Hadoop發(fā)行版本。

目前創(chuàng)新互聯(lián)已為成百上千的企業(yè)提供了網(wǎng)站建設、域名、虛擬主機、網(wǎng)站托管、服務器托管、企業(yè)網(wǎng)站設計、秀嶼網(wǎng)站維護等服務,公司將堅持客戶導向、應用為本的策略,正道將秉承"和諧、參與、激情"的文化,與客戶和合作伙伴齊心協(xié)力一起成長,共同發(fā)展。

對于高級分析活動來說,在集群服務器上運行的Hadoop為建立一個高性能,低成本的大數(shù)據(jù)管理架構提供了途徑。隨著人們逐漸意識到其能力的提升,Hadoop的應用蔓延到了其他行業(yè),包括對混合有傳統(tǒng)結構化數(shù)據(jù)和新型非結構以及半結構化數(shù)據(jù)的應用程序的報告和分析。這包括網(wǎng)絡點擊流數(shù)據(jù),在線廣告信息,社交媒體數(shù)據(jù),醫(yī)療記錄,以及來自制造設備的傳感器數(shù)據(jù)和源自互聯(lián)網(wǎng)設備的數(shù)據(jù)。

Hadoop為何物

Hadoop框架包含了大量開源軟件組件,這些組件擁有用于計算,處理,管理和分析大量數(shù)據(jù)的核心模型,而這些數(shù)據(jù)則由各種各樣的支撐技術所包圍。這些核心組件包括: Hadoop Distributed File System(HDFS Hadoop分布式文件系統(tǒng)),它支持傳統(tǒng)的分級目錄和文件系統(tǒng),而他們則是將文件分布于Hadoop集群中的存儲節(jié)點上(例如:DataNodes數(shù)據(jù)節(jié)點)。

MapReduce是可以對批量應用程序進行并行處理的編程模型和執(zhí)行框架。

YARN(這是對Yet Another Resource Negotiator的簡稱)負責管理任務調(diào)度,為運行中的應用程序分配集群資源,并在可用資源出現(xiàn)爭用時進行仲裁。它同時還對正在處理中任務的進展進行追蹤和監(jiān)控。

Hadoop Common是由不同組件使用的一組庫和工具。

在Hadoop集群中,那些核心部分和其他軟件模型是分層于計算和數(shù)據(jù)存儲硬件節(jié)點集合之上的。這些節(jié)點通過高速內(nèi)網(wǎng)連接以形成高性能并行分布式處理系統(tǒng)。

作為一個開源技術的集合,Hadoop并不受控于任何一個單獨的供應商;相反的是,它的開發(fā)是由Apache Software Foundation進行管理的。Apache為用戶提供Hadoop使用許可,基本上可以讓用戶免費,無版稅的使用該軟件。開發(fā)人員可以直接從Apache的網(wǎng)站下載并自行構建Hadoop環(huán)境。但是,Hadoop供應商提供帶有基本功能的預構建社區(qū)版本,該版本同樣是免費下載并能在各種硬件平臺上進行安裝的。同時還有市場商業(yè)版和企業(yè)版——Hadoop發(fā)行版根據(jù)維護和支持服務的不同等級來打包軟件。

在某些情況下,供應商也會基于Apache的技術提供性能和功能方面的增強——例如,通過提供附加的軟件工具來簡化集群配置和管理,或是與外部平臺的數(shù)據(jù)整合。這些商業(yè)產(chǎn)品讓各種規(guī)模的公司對Hadoop的接納度越來越高。這是非常有價值的,尤其是當商業(yè)公司供應商的支持服務團隊可以啟動一家公司Hadoop基礎設施的設計和開發(fā),并且能夠引導工具的選擇和高級功能的集成以快速部署高性能分析解決方案來滿足新興業(yè)務需求的時候。

典型Hadoop軟件棧組件

當你拿到一份商業(yè)版本的Hadoop時,你能從中真正獲得什么呢?除了核心組件,典型的Hadoop發(fā)布版本會包含(但不限于)以下內(nèi)容:

諸如Tez和Spark之類的替代數(shù)據(jù)處理和應用程序執(zhí)行管理器,它們可以在YARN之上運行或是與YARN并行以提供集群管理;緩存數(shù)據(jù)管理;以及其他改善處理性能的方法。

Apache HBase是一款列式數(shù)據(jù)庫管理系統(tǒng),它模仿的是運行在HDFS之上Google的Big Table項目。

諸如Hive,Impala,Stinger,Drill以及Spark SQL之類的SQL-on-Hadoop工具,這些工具為直接查詢存儲在HDFS中的數(shù)據(jù)提供了與SQL標準不同程度的兼容性。 諸如Pig之類的開發(fā)工具可以幫助開發(fā)人員構建MapReduce項目。

諸如ZooKeeper或是Ambari之類的配置管理工具可以用來進行監(jiān)控和管理。

諸如Mahout之類的分析環(huán)境可以為機器學習,數(shù)據(jù)挖掘和預測分析提供分析模型。

由于該軟件是開源的,因此對于Hadoop發(fā)行版你無需付費。相反的是,供應商則售賣有不同水平服務協(xié)議(SLAs)的年度支持訂閱版本。雖然每家供應商都會對自家的附加組件進行提升,如此一來也作為Hadoop發(fā)布版的一部分為Hadoop社區(qū)做出了貢獻,所有的供應商都會積極參與到Apache Hadoop社區(qū)中來。

誰在管理Hadoop大數(shù)據(jù)管理環(huán)境

在Hadoop系統(tǒng)之外獲得所需性能需要一個熟悉IT專業(yè)的協(xié)調(diào)團隊,該團隊致力于架構計劃,設計,開發(fā),測試,部署,運行中操作和維護方面的工作以確保最佳性能,而意識到這一點是非常重要的。這樣的IT團隊通常會要求:

需求分析師基于運行于Hadoop環(huán)境中的應用程序類型來評估系統(tǒng)性能需求。

系統(tǒng)架構師評估性能需求并設計硬件配置。

系統(tǒng)工程師對Hadoop軟件棧進行安裝,配置和調(diào)優(yōu)。

應用程序開發(fā)人員設計并實現(xiàn)應用程序。 數(shù)據(jù)管理專家做數(shù)據(jù)整合,創(chuàng)建數(shù)據(jù)布局并執(zhí)行其他管理任務。

系統(tǒng)管理員進行操作管理和維護。

項目管理人員監(jiān)督各級棧和應用程序開發(fā)工作的實現(xiàn)。

項目經(jīng)理負責Hadoop環(huán)境和優(yōu)先級,應用程序開發(fā)和部署的實現(xiàn)。

Hadoop軟件平臺市場

從本質上講,作為一個可行的大規(guī)模數(shù)據(jù)管理生態(tài)系統(tǒng),Hadoop的演化已經(jīng)創(chuàng)造了一個新的軟件市場,它正在轉變商業(yè)智能和分析行業(yè)。這已經(jīng)從兩方面進行了擴展,即用戶企業(yè)可以運行的分析應用程序以及可以作為這些應用程序一部分加以收集并進行分析的數(shù)據(jù)類型。在Hadoop中,該市場包括三個獨立的專業(yè)供應商——Cloudera Inc., Hortonworks Inc. 和MapR Technologies Inc。其他提供Hadoop發(fā)行版或功能的公司包括Pivotal Software Inc., IBM,Amazon Web Services和Microsoft。

對那些提供Hadoop發(fā)行版本的供應商進行評估需要理解所供產(chǎn)品兩個方面的異同。首先是技術本身:發(fā)行版中包含有哪些不同之處;它們支持什么樣的平臺;而且,最為重要的是,個體供應商集成了什么樣的特定組件?其次是服務和支持模型:對于每類訂閱級別都提供什么樣的支持和SLAs,以及不同的訂閱費用如何?

要理解這些方面是如何與你特定的業(yè)務產(chǎn)生關聯(lián),需要將那些對于一個供應商關系來說非常重要的特征突出出來。本系列的下一篇文章將研究幾個Hadoop大數(shù)據(jù)管理平臺的業(yè)務用例,如此一來你就可以確定你所在企業(yè)的需求了。

文章題目:管理大數(shù)據(jù)之初探Hadoop發(fā)行版
網(wǎng)頁鏈接:http://aaarwkj.com/article34/sdhhse.html

成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供App開發(fā)、網(wǎng)站策劃、品牌網(wǎng)站設計網(wǎng)站導航、域名注冊、網(wǎng)站建設

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉載內(nèi)容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)

小程序開發(fā)
一区二区三区高清av在线| 蜜桃精品人妻一区二区三区 | 在线午夜免费视频观看| 国产一区二区三区不卡视频| 夫妻的世界电影完整版| 免费在线观看污污污网站| 天堂网一区二区三区四区| 高清一区二区三区不卡视频| 99精品人妻一区二区三区蜜桃| 激情视频一区二区三区| 麻豆蜜桃精品视频在线观看| 91久久精品人妻一区二区| 免费精品99久久久国产| 天堂av在线观看播放| 国产超大超粗超爽视频| 亚洲美女国产精选999| 国产美女被狂操到高潮| 中文字幕乱码在线观看一区| 精品偷拍污视频一区二区| 中文字幕精品一区二区三| 国产一区二区黄色录像| 成年人性生活一级视品| 欧美色精品人妻在线最新| 在线免费观看欧美黄片| 日日夜夜精品天天综合| 亚洲国产精品中文字幕久久 | 久草福利资源在线观看视频 | 欧美激情在线精品一区二区| 亚洲天堂日韩欧美在线一区| 一区二区在线日韩欧美| 丰满人妻的诱惑中文字幕| 激情五月开心五月麻豆| 少妇太爽高潮在线播放| 日本国产一区二区三区在线| 伊人久久大香线蕉av色婷婷色| 久久精品人妻一区二区| 中文字幕人妻熟女人妻| 亚洲欧美日韩国产在线一区 | 欧美国内日本一区二区| jvid视频在线观看免费| 亚洲精品国产精品乱码|