可擴展超快OLAP引擎Kylin怎么用,相信很多沒有經(jīng)驗的人對此束手無策,為此本文總結了問題出現(xiàn)的原因和解決方法,通過這篇文章希望你能解決這個問題。
創(chuàng)新互聯(lián)服務緊隨時代發(fā)展步伐,進行技術革新和技術進步,經(jīng)過10年的發(fā)展和積累,已經(jīng)匯集了一批資深網(wǎng)站策劃師、設計師、專業(yè)的網(wǎng)站實施團隊以及高素質售后服務人員,并且完全形成了一套成熟的業(yè)務流程,能夠完全依照客戶要求對網(wǎng)站進行做網(wǎng)站、網(wǎng)站設計、建設、維護、更新和改版,實現(xiàn)客戶網(wǎng)站對外宣傳展示的首要目的,并為客戶企業(yè)品牌互聯(lián)網(wǎng)化提供全面的解決方案。
Kylin沿用了原來的數(shù)據(jù)倉庫技術中的Cube概念,把無限數(shù)據(jù)按有限的維度進行“預處理”,然后將結果(Cube)加載到Hbase里,供用戶查詢使用。
Kylin是通過空間換時間的方式,實現(xiàn)在亞秒級別延遲的情況下,對Hadoop上的大規(guī)模數(shù)據(jù)集進行交互式查詢,Kylin通過預計算,把計算結果集保存到Hbase中,原有的基于行的關系模型被轉化為基于鍵值對的列式存儲,通過維度組合作為HBase的RowKey,在查詢訪問時不再需要昂貴的表掃描,這為高速高并發(fā)分析帶來了可能;Kylin提供了標準SQL查詢接口,支撐大多數(shù)的SQL函數(shù),同時也支持ODBC/JDBC的方式和主流的BI產(chǎn)品無縫集成。
Kylin的工作原理
1、指定數(shù)據(jù)模型,定義維度和度量
2、預計算Cube,計算所有Cuboid并保存為物化視圖
3、執(zhí)行查詢時,讀取Cuboid,運算,產(chǎn)生查詢結果
Kylin的的主要特點
1、標準SQL接口
2、支持超大數(shù)據(jù)集
3、亞秒級響應
4、可伸縮性和高吞吐率
5、BI及可視化工具集成
幾個核心概念
數(shù)據(jù)倉庫:(Data Warehouse):大量歷史性資料數(shù)據(jù)。
OLAP:聯(lián)機分析處理,以多維度的方式分析數(shù)據(jù),而且能夠彈性的提供上卷、下鉆和透視分析等操作。區(qū)別于聯(lián)機交易處理(OLTP):更側重于日常事務處理,增刪改查。
BI:商業(yè)智能
維度與度量:維度是指審視數(shù)據(jù)的角度,通常是數(shù)據(jù)記錄的一個屬性,eg:時間、地點等,度量是基于數(shù)據(jù)所計算出來的考量值。eg:銷售額,用戶數(shù)等
事實表和維度表:事實表存儲有事實記錄的表,eg:系統(tǒng)日志、銷售記錄等,事實表不斷動態(tài)增長。維度表保存了維度的屬性值,eg:日期表、地點表等
Cube、Cuboid和Cube Segment
Cube:數(shù)據(jù)立方體,常用于數(shù)據(jù)分析和索引的技術,他可以對原始數(shù)據(jù)建立多維度索引,通過Cube對數(shù)據(jù)進行數(shù)據(jù)進行分析,大大加快數(shù)據(jù)的查詢效率。
Cuboid:在Kylin中特制某一中維度組合下所計算的數(shù)據(jù)
Cube Segment:是指針對源數(shù)據(jù)中的某一片段,計算出來的Cube數(shù)據(jù)。通常數(shù)據(jù)倉庫中的數(shù)據(jù)會隨著時間的增長而增長,而Cube Segment也是按時間順序來構建的。
Apache Kylin的主要使用過程:
1、數(shù)據(jù)準備:符合星型模型、維度表設計(Kylin將維度表加載到內存中處理,所有維度表不能太大)、Hive表分區(qū) 。
2、設計Cube:導入Hive表定義、創(chuàng)建數(shù)據(jù)模型
3、創(chuàng)建Cube:Kylin是以Key-Value的方式將Cube存儲到Hbase中,Hbase的Key也就是RowKey是由各個維度的值拼接而成的。
4、構建Cube:增量構建和全量構建
5、歷史數(shù)據(jù)刷新、合并(Segment)
6、查詢Cube,標準的SQL的select語句。
支持構建方式:
增量構建:分全量和增量
流式構建:實現(xiàn)實時數(shù)據(jù)更新,對接Kafka實現(xiàn),目前存在丟失數(shù)據(jù)的風險
支持對接方式:
1、WEB GUI --- Insight頁面
2、Rest API
3、ODBC/JDBC
4、通過Tableau(BI)訪問Kylin。
看完上述內容,你們掌握可擴展超快OLAP引擎Kylin怎么用的方法了嗎?如果還想學到更多技能或想了解更多相關內容,歡迎關注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝各位的閱讀!
名稱欄目:可擴展超快OLAP引擎Kylin怎么用
網(wǎng)頁路徑:http://jinyejixie.com/article0/ipjhoo.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供響應式網(wǎng)站、服務器托管、靜態(tài)網(wǎng)站、網(wǎng)站設計、網(wǎng)站策劃、外貿建站
聲明:本網(wǎng)站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)