互聯(lián)網(wǎng)IDC圈4月28日報道:據(jù)悉,IDC今年在數(shù)據(jù)存儲上的增長速度將達到53.4%,無線數(shù)據(jù)的流量在過去的5年內(nèi)增長200倍。如果你著眼自己通信渠道的話,將毫無疑問的發(fā)現(xiàn)互聯(lián)網(wǎng)內(nèi)容、電子郵件、應用通知、社交消息以及每天自動接收的消息都在顯著的增長,這也是McKinsey、Facebook、Walmart都對大數(shù)據(jù)很重視的原因。
為門頭溝等地區(qū)用戶提供了全套網(wǎng)頁設計制作服務,及門頭溝網(wǎng)站建設行業(yè)解決方案。主營業(yè)務為網(wǎng)站設計、成都網(wǎng)站制作、門頭溝網(wǎng)站設計,以傳統(tǒng)方式定制建設網(wǎng)站,并提供域名空間備案等一條龍服務,秉承以專業(yè)、用心的態(tài)度為用戶提供真誠的服務。我們深信只要達到每一位用戶的要求,就會得到認可,從而選擇與我們長期合作。這樣,我們也可以走得更遠!隨著時代的發(fā)展,科技信息技術的發(fā)展也越來越成俗,而數(shù)據(jù)額體積和數(shù)據(jù)使用也在以驚人的速度增長,這一點從分析師的分析中不難獲得。Hadoop,這一神奇的開源傳奇,在它的身旁也出現(xiàn)了不少流言蜚語,而這言語可能會讓IT高管們帶著樂觀的心態(tài)去制定策略。
Hadoop是公司為了解決大數(shù)據(jù)需求的主要投資領域之一,而類似Facebook這些在大體積數(shù)據(jù)處理上有所建樹的公司都公開的吹捧過在Hadoop上取得的成功,同樣初入大數(shù)據(jù)領域的公司也必先著眼這些成功的典型。通過Hadoop的炒作,我們可以避免功能固著這種認知偏差。Hadoop是一個多維的解決方案,可以通過不同的方式進行部署和使用。下面就看一下在開始Hadoop項目之前必須了解的一些關于Hadoop和大數(shù)據(jù)的預先構想的錯誤理念:
傳統(tǒng)SQL不可以在Hadoop上使用
當Facebook、Twitter、Yahoo!在Hadoop上豪賭時,他們同樣知道HDFS和MapReduce受限于處理類似SQL語言的能力,這也是Hive、Pig和Sqoop最終得以孵化的原因?;谌蛏洗罅康臄?shù)據(jù)都是通過SQL來管理,一些公司和項目都在Hadoop和SQL的兼容上狠下功夫。
大數(shù)據(jù)只關系到體積
在體積之外,許多工業(yè)先鋒還經(jīng)常提到variety(多樣)、variability(可變)、velocity(速度)和value(價值)。撇開所有單詞都押頭韻,關鍵點在于大數(shù)據(jù)并不是體積上的增長——它正在向著實時分析、結構化和非結構化來源方向發(fā)展,并被用于嘗試和制定更好的決策。綜上所述,不是只有分析大體積數(shù)據(jù)才會獲得價值。
Hadoop只可以在數(shù)據(jù)中心運行
首先,存在SaaS云服務解決方案。許多云服務允許你云端運行Hadoop、SQL,這無疑可以幫助你省下數(shù)據(jù)中心建造投資的時間和金錢。對于一個公有云運行時,Java開發(fā)者可以從SpringDataforHadoop以及一些其它的GitHub中的用例獲益。
取代大型機!Hadoop是唯一的新IT數(shù)據(jù)平臺
在IT投資組合里有很多一直長期存在的投資,而大型機就是這么一個例子,與ERP、CRM和SCM這些系統(tǒng)一樣演變至今。而如果大型機不想被公司或者架構遺棄,它就必須展示在現(xiàn)有投資環(huán)境中的價值。而VMware的許多客戶在使用大型機上都遇到了速度、規(guī)模和開銷的問題,但是并不是沒有途徑去解決這些問題,比如像vFabricSQLFire這樣的內(nèi)存大數(shù)據(jù)網(wǎng)絡就可以被嵌入或者使用分布式緩存途徑去解決類似隊列的高速攝取、促進大型機的批處理或實時分析報告這些問題。
Hadoop不可以在SAN或NAS上運行
Hadoop在本地磁盤上運行,對于中小型集群它同樣可以在一個共享的SAN環(huán)境下運行良好。而高帶寬比如10GBEthernet、PoE以及iSCSI對性能同樣有很好的支持。
虛擬化會導致性能下降
Hadoop最初的設計只是在實體服務器上運行,然而隨著越來越多機構的采用,許多公司都希望它能作為數(shù)據(jù)中心服務在云中運行。為什么這么多的公司都希望虛擬化Hadoop?首先要考慮管理基礎設施的擴展性,VMware快速的認識到擴展計算資源,比如虛擬Hadoop節(jié)點,當數(shù)據(jù)和計算分開時會對性能有所幫助,否則如果你關閉某個Hadoop節(jié)點將丟失上面的所有數(shù)據(jù)或者添加一個沒有數(shù)據(jù)的空節(jié)點。
Hadoop對虛擬化毫無經(jīng)濟價值
Hadoop通常解釋在一堆商用服務器上運行,這樣就會有人認為添加一個虛擬層在帶來額外支出的同時并不會有額外的價值收益。用這個觀點看是存在缺陷的,你并沒有考慮到數(shù)據(jù)和數(shù)據(jù)分析事實上都是動態(tài)的。想成為一個利用Hadoop能量去成長、創(chuàng)新及創(chuàng)造效率的公司,你必須改變數(shù)據(jù)的來源、分析的速度等等。虛擬化基礎設施同樣可以減少物理硬件的封裝,讓CAPEX直接等于純粹的商用硬件,而通過自動以及更搞笑的利用共享基礎設施同樣可以減少OPEX.
那些肆意的宣傳只能是作為接受新事物的一個參考,這并不代表著抉擇,在你做決定之前進行一些必要的了解和分析是非常重要的。而如果你受了這些漂亮謊言的蠱惑的話,將會讓你的投資陷入不符之地。
網(wǎng)站標題:簡析關于大數(shù)據(jù)的幾大流言
轉載注明:http://jinyejixie.com/article48/chgiep.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站排名、用戶體驗、商城網(wǎng)站、小程序開發(fā)、全網(wǎng)營銷推廣、軟件開發(fā)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉載內(nèi)容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)