這篇文章主要介紹“HBase與Hive的區(qū)別是什么”,在日常操作中,相信很多人在HBase與Hive的區(qū)別是什么問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”HBase與Hive的區(qū)別是什么”的疑惑有所幫助!接下來,請跟著小編一起來學習吧!
創(chuàng)新互聯(lián)建站長期為千余家客戶提供的網站建設服務,團隊從業(yè)經驗10年,關注不同地域、不同群體,并針對不同對象提供差異化的產品和服務;打造開放共贏平臺,與合作伙伴共同營造健康的互聯(lián)網生態(tài)環(huán)境。為格爾木企業(yè)提供專業(yè)的網站建設、網站設計,格爾木網站改版等技術服務。擁有十載豐富建站經驗和眾多成功案例,為您定制開發(fā)。1. 兩者分別是什么?
Apache Hive是一個構建在Hadoop基礎設施之上的數(shù)據倉庫。通過Hive可以使用HQL語言查詢存放在HDFS上的數(shù)據。HQL是一種類SQL語言,這種語言最終被轉化為Map/Reduce. 雖然Hive提供了SQL查詢功能,但是Hive不能夠進行交互查詢--因為它只能夠在Haoop上批量的執(zhí)行Hadoop。
Apache HBase是一種Key/Value系統(tǒng),它運行在HDFS之上。和Hive不一樣,Hbase的能夠在它的數(shù)據庫上實時運行,而不是運行MapReduce任務。Hive被分區(qū)為表格,表格又被進一步分割為列簇。列簇必須使用schema定義,列簇將某一類型列集合起來(列不要求schema定義)。例如,“message”列簇可能包含:“to”, ”from” “date”, “subject”, 和”body”. 每一個 key/value對在Hbase中被定義為一個cell,每一個key由row-key,列簇、列和時間戳。在Hbase中,行是key/value映射的集合,這個映射通過row-key來唯一標識。Hbase利用Hadoop的基礎設施,可以利用通用的設備進行水平的擴展。
2. 兩者的特點
Hive幫助熟悉SQL的人運行MapReduce任務。因為它是JDBC兼容的,同時,它也能夠和現(xiàn)存的SQL工具整合在一起。運行Hive查詢會花費很長時間,因為它會默認遍歷表中所有的數(shù)據。雖然有這樣的缺點,一次遍歷的數(shù)據量可以通過Hive的分區(qū)機制來控制。分區(qū)允許在數(shù)據集上運行過濾查詢,這些數(shù)據集存儲在不同的文件夾內,查詢的時候只遍歷指定文件夾(分區(qū))中的數(shù)據。這種機制可以用來,例如,只處理在某一個時間范圍內的文件,只要這些文件名中包括了時間格式。
HBase通過存儲key/value來工作。它支持四種主要的操作:增加或者更新行,查看一個范圍內的cell,獲取指定的行,刪除指定的行、列或者是列的版本。版本信息用來獲取歷史數(shù)據(每一行的歷史數(shù)據可以被刪除,然后通過Hbase compactions就可以釋放出空間)。雖然HBase包括表格,但是schema僅僅被表格和列簇所要求,列不需要schema。Hbase的表格包括增加/計數(shù)功能。
3. 限制
Hive目前不支持更新操作。另外,由于hive在hadoop上運行批量操作,它需要花費很長的時間,通常是幾分鐘到幾個小時才可以獲取到查詢的結果。Hive必須提供預先定義好的schema將文件和目錄映射到列,并且Hive與ACID不兼容。
HBase查詢是通過特定的語言來編寫的,這種語言需要重新學習。類SQL的功能可以通過Apache Phonenix實現(xiàn),但這是以必須提供schema為代價的。另外,Hbase也并不是兼容所有的ACID特性,雖然它支持某些特性。最后但不是最重要的--為了運行Hbase,Zookeeper是必須的,zookeeper是一個用來進行分布式協(xié)調的服務,這些服務包括配置服務,維護元信息和命名空間服務。
4. 應用場景
Hive適合用來對一段時間內的數(shù)據進行分析查詢,例如,用來計算趨勢或者網站的日志。Hive不應該用來進行實時的查詢。因為它需要很長時間才可以返回結果。
Hbase非常適合用來進行大數(shù)據的實時查詢。Facebook用Hbase進行消息和實時的分析。它也可以用來統(tǒng)計Facebook的連接數(shù)。
到此,關于“HBase與Hive的區(qū)別是什么”的學習就結束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習,快去試試吧!若想繼續(xù)學習更多相關知識,請繼續(xù)關注創(chuàng)新互聯(lián)-成都網站建設公司網站,小編會繼續(xù)努力為大家?guī)砀鄬嵱玫奈恼拢?/p>
網頁題目:HBase與Hive的區(qū)別是什么-創(chuàng)新互聯(lián)
轉載源于:http://jinyejixie.com/article38/ceoopp.html
成都網站建設公司_創(chuàng)新互聯(lián),為您提供微信公眾號、外貿建站、網站導航、域名注冊、移動網站建設、虛擬主機
聲明:本網站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內容