成人午夜视频全免费观看高清-秋霞福利视频一区二区三区-国产精品久久久久电影小说-亚洲不卡区三一区三区一区

什么是流式計(jì)算?

一、流式計(jì)算的背景

在日常生活中,我們通常會(huì)先把數(shù)據(jù)存儲(chǔ)在一張表中,然后再進(jìn)行加工、分析,這里就涉及到一個(gè)時(shí)效性的問(wèn)題。如果我們處理以年、月為單位的級(jí)別的數(shù)據(jù),那么多數(shù)據(jù)的實(shí)時(shí)性要求并不高;但如果我們處理的是以天、小時(shí),甚至分鐘為單位的數(shù)據(jù),那么對(duì)數(shù)據(jù)的時(shí)效性要求就比較高。在第二種場(chǎng)景下,如果我們?nèi)耘f采用傳統(tǒng)的數(shù)據(jù)處理方式,統(tǒng)一收集數(shù)據(jù),存儲(chǔ)到數(shù)據(jù)庫(kù)中,之后在進(jìn)行分析,就可能無(wú)法滿(mǎn)足時(shí)效性的要求。

成都創(chuàng)新互聯(lián)是一家從事企業(yè)網(wǎng)站建設(shè)、網(wǎng)站設(shè)計(jì)、成都網(wǎng)站建設(shè)、行業(yè)門(mén)戶(hù)網(wǎng)站建設(shè)、網(wǎng)頁(yè)設(shè)計(jì)制作的專(zhuān)業(yè)網(wǎng)站設(shè)計(jì)公司,擁有經(jīng)驗(yàn)豐富的網(wǎng)站建設(shè)工程師和網(wǎng)頁(yè)設(shè)計(jì)人員,具備各種規(guī)模與類(lèi)型網(wǎng)站建設(shè)的實(shí)力,在網(wǎng)站建設(shè)領(lǐng)域樹(shù)立了自己獨(dú)特的設(shè)計(jì)風(fēng)格。自公司成立以來(lái)曾獨(dú)立設(shè)計(jì)制作的站點(diǎn)數(shù)千家。

二、流式計(jì)算與批量計(jì)算

大數(shù)據(jù)的計(jì)算模式主要分為批量計(jì)算(batch computing)、流式計(jì)算(stream computing)、交互計(jì)算(interactive computing)、圖計(jì)算(graph computing)等。其中,流式計(jì)算和批量計(jì)算是兩種主要的大數(shù)據(jù)計(jì)算模式,分別適用于不同的大數(shù)據(jù)應(yīng)用場(chǎng)景。
流數(shù)據(jù)(或數(shù)據(jù)流)是指在時(shí)間分布和數(shù)量上無(wú)限的一系列動(dòng)態(tài)數(shù)據(jù)集合體,數(shù)據(jù)的價(jià)值隨著時(shí)間的流逝而降低,因此必須實(shí)時(shí)計(jì)算給出秒級(jí)響應(yīng)。流式計(jì)算,顧名思義,就是對(duì)數(shù)據(jù)流進(jìn)行處理,是實(shí)時(shí)計(jì)算。批量計(jì)算則統(tǒng)一收集數(shù)據(jù),存儲(chǔ)到數(shù)據(jù)庫(kù)中,然后對(duì)數(shù)據(jù)進(jìn)行批量處理的數(shù)據(jù)計(jì)算方式。主要體現(xiàn)在以下幾個(gè)方面:
1、數(shù)據(jù)時(shí)效性不同:流式計(jì)算實(shí)時(shí)、低延遲, 批量計(jì)算非實(shí)時(shí)、高延遲。
2、數(shù)據(jù)特征不同:流式計(jì)算的數(shù)據(jù)一般是動(dòng)態(tài)的、沒(méi)有邊界的,而批處理的數(shù)據(jù)一般則是靜態(tài)數(shù)據(jù)。
3、應(yīng)用場(chǎng)景不同:流式計(jì)算應(yīng)用在實(shí)時(shí)場(chǎng)景,時(shí)效性要求比較高的場(chǎng)景,如實(shí)時(shí)推薦、業(yè)務(wù)監(jiān)控...批量計(jì)算一般說(shuō)批處理,應(yīng)用在實(shí)時(shí)性要求不高、離線(xiàn)計(jì)算的場(chǎng)景下,數(shù)據(jù)分析、離線(xiàn)報(bào)表等。
4、運(yùn)行方式不同,流式計(jì)算的任務(wù)持續(xù)進(jìn)行的,批量計(jì)算的任務(wù)則一次性完成。

三、流式計(jì)算框架、平臺(tái)與相關(guān)產(chǎn)品

第一類(lèi),商業(yè)級(jí)流式計(jì)算平臺(tái)(IBM InfoSphere Streams、IBM StreamBase等);
第二類(lèi),開(kāi)源流式計(jì)算框架(Twitter Storm、S4等);
第三類(lèi),公司為支持自身業(yè)務(wù)開(kāi)發(fā)的流式計(jì)算框架。
Strom:Twitter 開(kāi)發(fā)的第一代流處理系統(tǒng)。
Heron:Twitter 開(kāi)發(fā)的第二代流處理系統(tǒng)。
Spark streaming:是Spark核心API的一個(gè)擴(kuò)展,可以實(shí)現(xiàn)高吞吐量的、具備容錯(cuò)機(jī)制的實(shí)時(shí)流數(shù)據(jù)的處理。
Flink:是一個(gè)針對(duì)流數(shù)據(jù)和批數(shù)據(jù)的分布式處理引擎。
Apache Kafka:由Scala寫(xiě)成。該項(xiàng)目的目標(biāo)是為處理實(shí)時(shí)數(shù)據(jù)提供一個(gè)統(tǒng)一、高通量、低等待的平臺(tái)。

四、流式計(jì)算主要應(yīng)用場(chǎng)景

流式處理可以用于兩種不同場(chǎng)景: 事件流和持續(xù)計(jì)算。
1、事件流
事件流具能夠持續(xù)產(chǎn)生大量的數(shù)據(jù),這類(lèi)數(shù)據(jù)最早出現(xiàn)與傳統(tǒng)的銀行和股票交易領(lǐng)域,也在互聯(lián)網(wǎng)監(jiān)控、無(wú)線(xiàn)通信網(wǎng)等領(lǐng)域出現(xiàn)、需要以近實(shí)時(shí)的方式對(duì)更新數(shù)據(jù)流進(jìn)行復(fù)雜分析如趨勢(shì)分析、預(yù)測(cè)、監(jiān)控等。簡(jiǎn)單來(lái)說(shuō),事件流采用的是查詢(xún)保持靜態(tài),語(yǔ)句是固定的,數(shù)據(jù)不斷變化的方式。
2、持續(xù)計(jì)算
比如對(duì)于大型網(wǎng)站的流式數(shù)據(jù):網(wǎng)站的訪(fǎng)問(wèn)PV/UV、用戶(hù)訪(fǎng)問(wèn)了什么內(nèi)容、搜索了什么內(nèi)容等,實(shí)時(shí)的數(shù)據(jù)計(jì)算和分析可以動(dòng)態(tài)實(shí)時(shí)地刷新用戶(hù)訪(fǎng)問(wèn)數(shù)據(jù),展示網(wǎng)站實(shí)時(shí)流量的變化情況,分析每天各小時(shí)的流量和用戶(hù)分布情況;
比如金融行業(yè),毫秒級(jí)延遲的需求至關(guān)重要。一些需要實(shí)時(shí)處理數(shù)據(jù)的場(chǎng)景也可以應(yīng)用Storm,比如根據(jù)用戶(hù)行為產(chǎn)生的日志文件進(jìn)行實(shí)時(shí)分析,對(duì)用戶(hù)進(jìn)行商品的實(shí)時(shí)推薦等。

五、流式計(jì)算的價(jià)值

通過(guò)大數(shù)據(jù)處理我們獲取了數(shù)據(jù)的價(jià)值,但是數(shù)據(jù)的價(jià)值是恒定不變的嗎?顯然不是,一些數(shù)據(jù)在事情發(fā)生后不久就有了更高的價(jià)值,而且這種價(jià)值會(huì)隨著時(shí)間的推移而迅速減少。流處理的關(guān)鍵優(yōu)勢(shì)在于它能夠更快地提供洞察力,通常在毫秒到秒之間。
流式計(jì)算的價(jià)值在于業(yè)務(wù)方可在更短的時(shí)間內(nèi)挖掘業(yè)務(wù)數(shù)據(jù)中的價(jià)值,并將這種低延遲轉(zhuǎn)化為競(jìng)爭(zhēng)優(yōu)勢(shì)。比方說(shuō),在使用流式計(jì)算的推薦引擎中,用戶(hù)的行為偏好可以在更短的時(shí)間內(nèi)反映在推薦模型中,推薦模型能夠以更低的延遲捕捉用戶(hù)的行為偏好以提供更精準(zhǔn)、及時(shí)的推薦。
流式計(jì)算能做到這一點(diǎn)的原因在于,傳統(tǒng)的批量計(jì)算需要進(jìn)行數(shù)據(jù)積累,在積累到一定量的數(shù)據(jù)后再進(jìn)行批量處理;而流式計(jì)算能做到數(shù)據(jù)隨到隨處理,有效降低了處理延時(shí)。

本文題目:什么是流式計(jì)算?
文章路徑:http://jinyejixie.com/article26/iehdjg.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供服務(wù)器托管、網(wǎng)站制作網(wǎng)站排名、自適應(yīng)網(wǎng)站、全網(wǎng)營(yíng)銷(xiāo)推廣、用戶(hù)體驗(yàn)

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶(hù)投稿、用戶(hù)轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀(guān)點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話(huà):028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

搜索引擎優(yōu)化
康平县| 五家渠市| 建始县| 平定县| 高雄市| 莆田市| 唐海县| 卢氏县| 汝城县| 景洪市| 平果县| 施甸县| 梧州市| 舞钢市| 沈阳市| 临泽县| 高要市| 安乡县| 平乡县| 大同市| 兴义市| 红原县| 锦州市| 临澧县| 皮山县| 含山县| 五指山市| 宝应县| 全州县| 扎鲁特旗| 囊谦县| 托克逊县| 漳州市| 百色市| 怀仁县| 娄烦县| 读书| 白银市| 昌乐县| 洪洞县| 鸡泽县|