云計算的應用,更快的數(shù)據(jù)處理速度,以及從物聯(lián)網(wǎng)輸入大量的數(shù)據(jù),這些意味著,企業(yè)現(xiàn)在正在收集前所未見的數(shù)據(jù)量?,F(xiàn)在大數(shù)據(jù)比以往任何時候都大。但是如何組織、處理和理解數(shù)據(jù)仍然是許多組織面臨的一個主要挑戰(zhàn)。
創(chuàng)新互聯(lián)建站主營蒙自網(wǎng)站建設的網(wǎng)絡公司,主營網(wǎng)站建設方案,App定制開發(fā),蒙自h5重慶小程序開發(fā)搭建,蒙自網(wǎng)站營銷推廣歡迎蒙自等地區(qū)企業(yè)咨詢你的公司是否仍然在努力理解大數(shù)據(jù)是什么,以及如何管理嗎?這里有6個關于大數(shù)據(jù)的誤區(qū),行業(yè)專家將幫助你把真相從虛構的大數(shù)據(jù)領域中分離出來。
1.大數(shù)據(jù)意味著“很多”數(shù)據(jù)
目前,大數(shù)據(jù)已經(jīng)成為一個流行詞。但人們通常對它真正的含義還是不清楚。有些人將大數(shù)據(jù)簡單地認為是大量的數(shù)據(jù)。但是,這并不完全正確,它比這稍微復雜一些。大數(shù)據(jù)是指一個數(shù)據(jù)集,無論是結(jié)構(如數(shù)據(jù)表)或非結(jié)構化(如元數(shù)據(jù)從電子郵件)結(jié)合的數(shù)據(jù),如社會媒體分析或物聯(lián)網(wǎng)數(shù)據(jù),形成一個更大的故事。大數(shù)據(jù)故事說明組織很難用傳統(tǒng)的分析技術來捕獲發(fā)生的趨勢。
豐田研究院的數(shù)據(jù)研究總監(jiān)吉姆•阿德勒表達了一個很好的觀點:“數(shù)據(jù)也有質(zhì)量。這就像水一樣:玻璃容器中的水是非常易于管理。但是,如果混雜在洪水中,這將是壓倒性的災害。”他說,“在數(shù)據(jù)分析系統(tǒng)中,工作在一臺機器的的數(shù)據(jù)將被沖走時,其數(shù)據(jù)規(guī)模將增長100或1000倍。所以,當然,原型雖小,但其架構卻很大。”
2.數(shù)據(jù)需要清潔
“大的誤區(qū)就是你必須要有干凈的數(shù)據(jù)進行分析。”BeyondCore公司首席執(zhí)行官阿里吉特•森古普塔說,“沒有人有干凈的數(shù)據(jù),必須將數(shù)據(jù)進行清理,否則分析是行不通的。這是一個瘋狂的想法。你要做的就是進行一個足夠好的分析。你要分析所有的數(shù)據(jù),盡管這些數(shù)據(jù)是骯臟的,這只說明你有數(shù)據(jù)質(zhì)量問題。我可以告訴你一些模式,盡管數(shù)據(jù)存在質(zhì)量問題,但完全可以進行正常分析?,F(xiàn)在,你可以集中進行數(shù)據(jù)質(zhì)量工作,只是提高數(shù)據(jù)可以得到稍微好一點的洞察力。”
InOutsource商業(yè)智能和分析總監(jiān)梅根•布茨梅因?qū)Υ吮硎举澩?ldquo;很多時候,企業(yè)就會將這些工作能拖就拖,因為他們認為數(shù)據(jù)是不干凈的,這是沒有必要的。部署的分析應用程序?qū)⒖梢哉业綌?shù)據(jù)的薄弱環(huán)節(jié),”她說。“一旦這些問題已經(jīng)確定,清理計劃可以投入到位。然后,分析應用程序可以利用一種機制,加大清理力度,并監(jiān)測進展情況。”
布茨梅因說。“一旦你把這些數(shù)據(jù)整合在一起,你將在一個應用程序中賦予它生命的視覺,你可以看到這些匯集在一起的數(shù)據(jù)的關聯(lián),你會很快看到你的資料不足。”她說,“你可以看到數(shù)據(jù)的問題在于要提供一個清理數(shù)據(jù)的基準。”
3.等待,讓你的數(shù)據(jù)完美
你不應該等待清理你的數(shù)據(jù),這里還有一個原因,森古普塔說,“在你完全清除數(shù)據(jù)之后,這可能需要三個月的時間,然而三個月后,這些數(shù)據(jù)已經(jīng)陳舊過時了。”因此,這些信息將不再適用。
森古普塔表示,第一州際銀行的喬希•巴特曼在會議提出了一個重要觀點。喬希展示了他是如何運行分析,發(fā)現(xiàn)問題,分析變化,重新運行分析的。他說,“你看,我的分析時間只有大約四到五分鐘。所以,如果我可以運行分析,發(fā)現(xiàn)問題,解決問題,再重新進行分析,并在四、五分鐘后查看報告,改變?nèi)绾翁幚矸治龅姆椒ā?rdquo;
森古普塔用編碼來比喻那些舊方式。“我的一切都是正確的,然后我進行編碼。但現(xiàn)在,每個人進行編碼都不太靈活。”他說。“你寫好程序之后,你必須要測試它,并查看如何能使它更好,那么等它變得更好之后。世界發(fā)生了變化,人們?nèi)匀徊捎玫氖桥f的做事方法。”
4.數(shù)據(jù)湖
數(shù)據(jù)湖是持有大量的原始結(jié)構化和結(jié)構化數(shù)據(jù)的松散的存儲庫,經(jīng)常在大數(shù)據(jù)的背景下提到。
唯一的問題是,盡管他們是如何經(jīng)常被引用,但它們卻不存在,阿德勒說,“一個組織的數(shù)據(jù)不被倒入一個數(shù)據(jù)湖中。這是精心策劃的一個部門的數(shù)據(jù)庫。鼓勵集中使用專業(yè)知識。他們還提供了良好的數(shù)據(jù)治理和合規(guī)性所需的問責性和透明度。”
5.分析數(shù)據(jù)是昂貴的
如果假定在數(shù)據(jù)分析工具涉及一些費用的話,你可能會害怕獲得數(shù)據(jù)。而可以告訴你的有好消息是,如今有許多免費的數(shù)據(jù)工具,任何人都可以開始使用這些工具來分析大數(shù)據(jù)。
同時,森古普塔表示,當今云計算的低成本意味著“你真的可以做那些以前從來不可能實現(xiàn)的的事情。”
6.機器算法將取代人類分析
森古普塔認為在分析大數(shù)據(jù)方法有一個有趣的二分法。“有人說,解決這個問題需要成千上萬的數(shù)據(jù)科學家來分析解決,隨后,又有人說,采用機器學習就可以做到這一切。這將是完全自動的。”
但是,桑古塔并不認為這些都是合適的解決方案。“沒有足夠的數(shù)據(jù)科學家,成本將快速上升。”他說,“此外,企業(yè)用戶有多年的域名登錄經(jīng)驗,并有著對他們業(yè)務的直覺。當你請來一個數(shù)據(jù)科學家,并認為他會搞定這些工作,并告訴你該怎么做。這實際上創(chuàng)造了一個確切的錯誤,數(shù)據(jù)科學家們往往無法無法足夠了解企業(yè)的業(yè)務。”
“完美”的數(shù)據(jù)科學家,是那些準確理解具體業(yè)務如何運作,以及其數(shù)據(jù)是如何工作的,這是一個誤區(qū)。森古普塔說,“這樣的人根本不存在。”
在現(xiàn)實中,森古普塔說,“大多數(shù)數(shù)據(jù)科學項目實際上沒有得到實施,因為它是如此艱難,需要幾個月得到完成,而當它完成的時候,你所關心的問題是已經(jīng)陳舊過時了。”
但是,也有過于依賴機器學習問題。“機器學習只是給出一個答案,但并沒有解釋。它告訴人們該怎么做,而不是為什么要那樣做,”他說。“人們不喜歡別人告訴他該怎么做,尤其是神奇的機器。”他說,其關鍵是不只是答案,而是其解釋和建議。
一方面,他說,數(shù)據(jù)科學家將變得越來越專業(yè)化,而這是真正困難的問題。“想一想各機構和企業(yè)開始建設了數(shù)據(jù)處理部門和一些處理部門。世界500強企業(yè)也有數(shù)據(jù)處理部門“或數(shù)字加工部門。但他們基本上變成了Excel,Word和PowerPoint。”盡管如此,人們?nèi)匀皇菙?shù)據(jù)和數(shù)字處理方面的專家。
“如果我去摩根士丹利,相信我,那些數(shù)據(jù)處理和數(shù)字處理方面的專家仍然存在。他們只是有著不同的名稱和不同的工作,但在真正的情況下,這些人仍然存在,但80%-90%的專家已經(jīng)轉(zhuǎn)移到Excel,Word和PowerPoint方面,這是全球在大數(shù)據(jù)方面應該發(fā)展的主要原因。”
網(wǎng)站名稱:關于大數(shù)據(jù),你不知道的幾點
網(wǎng)址分享:http://jinyejixie.com/article16/chjddg.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站排名、手機網(wǎng)站建設、網(wǎng)站營銷、自適應網(wǎng)站、網(wǎng)站改版、網(wǎng)站維護
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)