互聯(lián)網(wǎng)IDC圈1月15日報道:基于云的應用程序處理大數(shù)據(jù)時,被處理的大數(shù)據(jù)不僅具有高容量、高速度、多類型的3V特性,還必須輔以第四個V:準確性。尤其在處理屬于他人的數(shù)據(jù)的時候。
在波士頓大數(shù)據(jù)創(chuàng)新會議上的一個對話會上,IBM云數(shù)據(jù)服務事業(yè)部產(chǎn)品開發(fā)副總裁邁克·奧羅克(Mike O’Rourke)表示,所有四個特性,包括在論證中的數(shù)據(jù)所有權的問題,在推動業(yè)務敏捷性上都各自扮演著一個重要角色。大部分現(xiàn)代云應用處理的數(shù)據(jù)都來自外部資源,在使用前必須清理。
“開發(fā)團隊必須敏捷,這樣他們才能迅速反應,提供應用程序的快速更新。”他說。“這意味著,在處理大數(shù)據(jù)時,你必須有不同的思考方式。”雖然奧羅克(O’Rourke)并沒有過于發(fā)揮到引用阿甘的“生活就像一盒巧克力”的格言,但他明確表示,當應用程序收集、處理和存儲大數(shù)據(jù)時,你永遠不知道會得到什么。因此,基于云的應用程序的設計必須足夠靈活,以保證無論遇到何種數(shù)據(jù),運行不間斷。
奧羅克解釋4個V的概念。他說,首先,高容量是最主要的。因為云和移動應用需要處理交互的數(shù)據(jù)量,不論是事務型數(shù)據(jù)還是流數(shù)據(jù),正從TB級到PB級飛漲。
多類型是說,應用程序必須能處理結構化和非結構化的多種形式的數(shù)據(jù)。視頻數(shù)據(jù)是非結構化的,但應用程序必須了解其內容。奧羅克解釋,“如果你是一個廣播公司,你不希望在有許多人喪生的嚴重車禍的影片后,廣告出現(xiàn)說,買一輛雪佛蘭車吧。這兩者放在一起違和。”
高速度,或者說動態(tài)數(shù)據(jù),正變得越來越重要,尤其是在數(shù)據(jù)容量突飛猛進的現(xiàn)實情況下。奧羅克說,“物聯(lián)網(wǎng)通過傳感器收集的和社會化的海量數(shù)據(jù),正向我們涌來,你的應用程序必須能夠提供實時決策。” 收集數(shù)據(jù)供以后分析或處理的概念已經(jīng)過時了,他補充道。
準確性是指在處理的數(shù)據(jù)的可靠性各異的情況下(這被稱為數(shù)據(jù)的不確定性),應用程序需表現(xiàn)出靈活性。奧羅克舉例,電池沒電或突然失去通訊聯(lián)系時,健身設備和手機傳來的數(shù)據(jù)可能突然中斷。“你的應用程序能處理這樣的突發(fā)情況嗎?”
傳統(tǒng)上,無論是零售交易、工廠車間的工藝控制,或是保險的保費和效益跟蹤的案例,企業(yè)都是自己收集數(shù)據(jù)、自己處理。但云時代世界不一樣了。奧羅克說,“當構建應用程序或做應用分析時,可能遇到的情況是,不論你在哪間公司,大部分需要處理的數(shù)據(jù)都不是公司自己擁有的。
他舉了一個批大學工程專業(yè)學生夏天在IBM實習的例子。這些學生為紐約市搭建了一個應用程序,用來精確定位不安全道路的位置。學生們利用的數(shù)據(jù)包括機動車交通事故、天氣、日出、日落、空氣的濕度、道路是否濕滑、道路指示牌和道路標志的地理空間信息等。所有的數(shù)據(jù)都是公共數(shù)據(jù),來自公共領域。
在幾個星期內,這組學生創(chuàng)建了一個應用程序,標識了需要維修或重新設計具體道路的地點,司機可能會受益于更早展示警告標志的地方,和交通信號需要改變的十字路口。
“因為大部分需要處理的數(shù)據(jù)不是你自己擁有的,所以我可以提供給開發(fā)人員的最好建議是:在檢視和分析數(shù)據(jù)之前,必須有必要對數(shù)據(jù)進行清理、標記和儲存。” 奧羅克總結說。
標題名稱:基于云應用處理大數(shù)據(jù)的4V特征
文章路徑:http://aaarwkj.com/article24/sdjice.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供微信公眾號、品牌網(wǎng)站設計、網(wǎng)站維護、定制網(wǎng)站、營銷型網(wǎng)站建設、Google
聲明:本網(wǎng)站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)