SIDDHI 是一款功能強(qiáng)大的CEP 引擎,具有自己的DSL,豐富的模式匹配功能和可擴(kuò)展性, 感謝陳浩同學(xué)提供了SIDDHI和FLINK的整合功能 https://github.com/haoch/flink-siddhi 本文主要介紹了這個(gè)ADDON的一些實(shí)現(xiàn)思路
??用法: SiddhiCEP.registerStream(streamName, FlinkDataStream, fieldNames)
??通過(guò) FlinkDataStream.getType 獲得流對(duì)象的類(lèi)型定義.registerStream方法會(huì)構(gòu)造一個(gè) SiddhiStreamSchema 對(duì)象,根據(jù)流對(duì)象的類(lèi)型定義,自動(dòng)獲取每個(gè)field對(duì)應(yīng)的數(shù)據(jù)類(lèi)型存在內(nèi)部的fieldTypes數(shù)組中.
??SiddhiStreamSchema 內(nèi)部會(huì)創(chuàng)建一個(gè)Siddhi StreamDefinition對(duì)象, StreamDefinition的attribute的定義根據(jù)fieldNames + fieldTypes 來(lái)添加.SiddhiTypeFactory.getAttributeType 負(fù)責(zé)將Flink 的數(shù)據(jù)類(lèi)型映射為Siddhi的數(shù)據(jù)類(lèi)型, 并可自動(dòng)生成一段Define Stream的定義(見(jiàn) SiddhiStreamSchema.getStreamDefinitionExpression 方法) define stream [streamName] ([fieldName 1] [fieldType 1], ...[fieldName n] [fieldType n])
??SiddhiStreamSchema 包括一個(gè)StreamSerializer: 用于將DataStream 中的對(duì)象轉(zhuǎn)化為 Siddhi Stream 的輸入(Object Array):
????如果流對(duì)象是一個(gè)簡(jiǎn)單類(lèi)型 Atomic Type 直接將流對(duì)象放到 ARRAY中
????如果流對(duì)象是Tuple 類(lèi)型,直接將Tuple 中前N個(gè)值放到ARRAY中
????如果流對(duì)象是Pojo或者CaseClass類(lèi)型,直接根據(jù)每個(gè)fieldName 獲取Class對(duì)應(yīng)的屬性放到ARRAY中
??SiddhiStream: 抽象的Stream基類(lèi)
??convertDataStream 將原始的FLINK流轉(zhuǎn)化為T(mén)uple類(lèi)型的流,Tuple的第一個(gè)元素為StreamId, 第二個(gè)元素為原來(lái)流中的數(shù)據(jù),支持普通Stream 和 KeyedStream
??ExecutionSiddhiStream: 構(gòu)建 SiddhiOperatorContext 并調(diào)用SiddhiStreamFactory.createDataStream 創(chuàng)建了集成Siddhi的 DataStream. DataStream的類(lèi)型為T(mén)uple的子類(lèi).SiddhiTypeFactory.getTupleTypeInformation: 其核心思路是通過(guò)Siddhi輸出Stream的StreamDefinition獲得其Attribute的定義,再通過(guò) TypeInfoParser.parse構(gòu)造Flink Tuple 類(lèi)型的定義
??ExecutableStream 根據(jù)Siddhi query 創(chuàng)建ExecutionSiddhiStream對(duì)象
??SingleSiddhiStream, UnionSiddhiStream: ExecutableStream 的子類(lèi),支持Fluent Style的鏈?zhǔn)秸{(diào)用. UnionSiddhiStream 調(diào)用了DataStream.union 方法
??SiddhiStreamFactory.createDataStream 通過(guò) FLINK DataStream的transform方法使用了自定義的StreamOperator: SiddhiStreamOperator. 在 AbstractSiddhiOperator 的 setup 方法中創(chuàng)建SiddhiManager 和 SiddhiAppRuntime 并注冊(cè)了 InputHandler 和 OutputCallback (StreamOutputHandler)
??SiddhiStreamOperator.processElement 需要處理兩種場(chǎng)景:
????Flink TimeCharacteristic = ProcessingTime: 先調(diào)用StreamSerializer將數(shù)據(jù)轉(zhuǎn)化為Object Array, 再直接調(diào)用InputHandler.send將數(shù)據(jù)發(fā)送給Siddhi處理
????Flink TimeCharacteristic = EventTime: 緩存接收到的StreamRecord 到內(nèi)部的priorityQueue中,直到收到Watermark, 將priorityQueue中小于watermark的StreamRecord一次發(fā)送給Siddhi處理
StreamOutputHandler:根據(jù)Output的TypeInfo將Siddhi Event 轉(zhuǎn)化為 Flink StreamRecord. 再轉(zhuǎn)發(fā)到SiddhiStreamOperator的Output
??SiddhiStreamOperator中保留了兩種State信息,一種是priorityQueue中保存的由于watermark未發(fā)送給Siddhi的消息. 另一種是Siddhi本身的State, 通過(guò)SiddhiAppRuntime.snapshot() 獲得
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無(wú)理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國(guó)服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡(jiǎn)單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專(zhuān)為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場(chǎng)景需求。
分享標(biāo)題:FLINKSIDDHIADDON學(xué)習(xí)筆記-創(chuàng)新互聯(lián)
轉(zhuǎn)載來(lái)于:http://jinyejixie.com/article34/coedse.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站制作、服務(wù)器托管、動(dòng)態(tài)網(wǎng)站、外貿(mào)網(wǎng)站建設(shè)、外貿(mào)建站、云服務(wù)器
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容