2021-02-05 分類: 網(wǎng)站建設(shè)
近年來,數(shù)據(jù)生成水平激增,其特點(diǎn)是工業(yè)領(lǐng)域中很多企業(yè)進(jìn)行了巨大的數(shù)字化轉(zhuǎn)型。全球范圍內(nèi)生成的數(shù)據(jù)量正在快速增長。實(shí)際上,行業(yè)媒體Gigabit Magazine的研究表明,全球2020年生成的數(shù)據(jù)量將比10年前增長25倍以上。此外,據(jù)估計(jì),到2025年,生成的累積數(shù)據(jù)將增加三倍,達(dá)到近175ZB。
目前,業(yè)務(wù)決策者對(duì)實(shí)時(shí)數(shù)據(jù)訪問的需求也在以前所未有的速度增長,以便于進(jìn)行明智的業(yè)務(wù)決策。
為了使數(shù)據(jù)對(duì)他們的業(yè)務(wù)有用、可行和可擴(kuò)展,企業(yè)需要一種有效且經(jīng)濟(jì)高效的方式來存儲(chǔ)、標(biāo)記和解釋這些數(shù)據(jù)。實(shí)現(xiàn)這種目的最有利可圖的方法之一就是采用數(shù)據(jù)倉庫。
這一概念可以追溯到上世紀(jì)70年代,當(dāng)計(jì)算機(jī)科學(xué)家Bill Inmon首次提出“數(shù)據(jù)倉庫”一詞時(shí),就出現(xiàn)了數(shù)據(jù)倉庫市場(chǎng)。早期的數(shù)據(jù)倉庫創(chuàng)建為本地服務(wù)器,其構(gòu)建能力僅為千兆字節(jié)。從那時(shí)起,它們經(jīng)歷了重大的變革,現(xiàn)代化的倉庫可容納更大的容量。
數(shù)據(jù)倉庫,也稱為決策支持?jǐn)?shù)據(jù)庫,是指一個(gè)中央存儲(chǔ)庫,用于保存從一個(gè)或多個(gè)數(shù)據(jù)源(例如事務(wù)系統(tǒng)和關(guān)系數(shù)據(jù)庫)衍生的信息。系統(tǒng)中收集的數(shù)據(jù)可以采用非結(jié)構(gòu)化、半結(jié)構(gòu)化或結(jié)構(gòu)化數(shù)據(jù)的形式。然后對(duì)這些數(shù)據(jù)進(jìn)行處理、轉(zhuǎn)換和使用,以使用戶可以更輕松地通過SQL客戶端,電子表格和商業(yè)智能工具對(duì)其進(jìn)行訪問。
數(shù)據(jù)倉庫還促進(jìn)了更輕松的數(shù)據(jù)挖掘,這是對(duì)數(shù)據(jù)中的模式進(jìn)行標(biāo)識(shí),然后可以用來推動(dòng)更高的利潤和銷售量。數(shù)據(jù)倉庫行業(yè)的應(yīng)用范圍跨越了與分析乃至云計(jì)算相關(guān)的多個(gè)領(lǐng)域,在某些情況下,其中包括醫(yī)療保健、制造業(yè)、電信與IT、零售和政府等。
在技術(shù)領(lǐng)域,有幾家公司在推進(jìn)數(shù)據(jù)倉庫技術(shù)方面取得了長足的進(jìn)步。最著名的公司之一是Teradata公司,這是一家行業(yè)的數(shù)據(jù)倉庫公司,在該領(lǐng)域擁有30多年的經(jīng)驗(yàn)。Teradata軟件被廣泛用于許多行業(yè)的各種數(shù)據(jù)倉庫活動(dòng),尤其是在銀行業(yè)。該公司一直致力于通過創(chuàng)新的新技術(shù)(包括基于Hadoop的服務(wù))來增強(qiáng)其商業(yè)智能解決方案。
大數(shù)據(jù)和數(shù)據(jù)倉庫
在現(xiàn)代時(shí)代,大數(shù)據(jù)和數(shù)據(jù)科學(xué)正在極大地顛覆企業(yè)開展業(yè)務(wù)以及決策流程的方式??缧袠I(yè)擁有如此大量的數(shù)據(jù),對(duì)高效大數(shù)據(jù)分析的需求變得至關(guān)重要。大數(shù)據(jù)最早是在上世紀(jì)90年代出現(xiàn)的,但是這個(gè)概念可以追溯到術(shù)語創(chuàng)造之前,直到計(jì)算機(jī)時(shí)代的曙光,那時(shí)企業(yè)將使用大型電子表格分析數(shù)字和研究趨勢(shì)。
隨著1990年代末和2000年代初出現(xiàn)新的數(shù)據(jù)源,它們開始推動(dòng)了海量數(shù)據(jù)的產(chǎn)生。隨著移動(dòng)設(shè)備和搜索引擎的興起,這種趨勢(shì)尤其激增,搜索引擎比以往任何時(shí)候都可以輸出更多的數(shù)據(jù)。表征大數(shù)據(jù)出現(xiàn)的另一個(gè)因素是速度。數(shù)據(jù)生成速度越快,所需的處理就越多。因此,在2005年,Gartner公司將大數(shù)據(jù)的概念描述為數(shù)據(jù)的3V,也就是數(shù)量,速度和種類。
隨著數(shù)據(jù)量持續(xù)快速增長,傳統(tǒng)的關(guān)系數(shù)據(jù)庫和數(shù)據(jù)倉庫無法處理這些數(shù)據(jù)。為了規(guī)避此問題并確保更高效的大數(shù)據(jù)分析系統(tǒng),雅虎等公司的工程師于2006年創(chuàng)建了Hadoop,這是一個(gè)Apache開放源項(xiàng)目,它具有分布式處理框架,即使在集群平臺(tái)上也可以運(yùn)行大數(shù)據(jù)應(yīng)用程序。
人工智能,機(jī)器學(xué)習(xí)和基于云的解決方案可能會(huì)推動(dòng)數(shù)據(jù)倉庫市場(chǎng)的未來前景
考慮到現(xiàn)代產(chǎn)生的數(shù)據(jù)量以及處理數(shù)據(jù)所需的高級(jí)基礎(chǔ)設(shè)施,決策支持?jǐn)?shù)據(jù)庫在技術(shù)和體系結(jié)構(gòu)方面都面臨著巨大的發(fā)展壓力。除了幾種新的數(shù)據(jù)倉庫架構(gòu)方法之外,還出現(xiàn)了許多技術(shù),成為現(xiàn)代商業(yè)智能解決方案的主要貢獻(xiàn)者,從云計(jì)算服務(wù)到數(shù)據(jù)虛擬化再到自動(dòng)化和機(jī)器學(xué)習(xí)等。
基于云計(jì)算的解決方案是數(shù)據(jù)倉庫市場(chǎng)的未來。隨著眾多企業(yè)轉(zhuǎn)向云平臺(tái)來支持和存儲(chǔ)其數(shù)據(jù)倉庫解決方案,像亞馬遜和谷歌這樣的互聯(lián)網(wǎng)公司不知疲倦地致力于開發(fā)和托管創(chuàng)新的基于云計(jì)算的數(shù)據(jù)倉庫。
未來幾年將推動(dòng)數(shù)據(jù)倉庫行業(yè)前景的另一趨勢(shì)是機(jī)器學(xué)習(xí)和人工智能支持。新的數(shù)據(jù)倉庫架構(gòu)將成為人工智能數(shù)據(jù)集的基礎(chǔ),而人工智能和機(jī)器學(xué)習(xí)將改善這些商業(yè)智能解決方案的功能和運(yùn)營。這種趨勢(shì)的一個(gè)例子是谷歌將機(jī)器學(xué)習(xí)整合到BigQuery數(shù)據(jù)倉庫中。
名稱欄目:云計(jì)算將如何影響數(shù)據(jù)倉庫技術(shù)?
當(dāng)前鏈接:http://jinyejixie.com/news37/99237.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站策劃、面包屑導(dǎo)航、虛擬主機(jī)、網(wǎng)站收錄、軟件開發(fā)、營銷型網(wǎng)站建設(shè)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容