Hadoop3.x中增強(qiáng)了很多特性,并且也改進(jìn)了很多地方,是Hadoop2.x的升級(這不是廢話嗎)。需要注意的是,在Hadoop3.x中,不能再使用jdk1.7,而是需要升級到j(luò)dk1.8以上版本。這是因?yàn)镠adoop 2.0是基于JDK 1.7開發(fā)的,而JDK 1.7在2015年4月已停止更新,這直接迫使Hadoop社區(qū)基于JDK 1.8重新發(fā)布一個新的Hadoop版本,而這正是Hadoop3.x。Hadoop3.x以后將會調(diào)整方案架構(gòu),將Mapreduce 基于內(nèi)存+io+磁盤,共同處理數(shù)據(jù)。
在建平等地區(qū),都構(gòu)建了全面的區(qū)域性戰(zhàn)略布局,加強(qiáng)發(fā)展的系統(tǒng)性、市場前瞻性、產(chǎn)品創(chuàng)新能力,以專注、極致的服務(wù)理念,為客戶提供成都網(wǎng)站設(shè)計(jì)、成都網(wǎng)站制作 網(wǎng)站設(shè)計(jì)制作按需求定制開發(fā),公司網(wǎng)站建設(shè),企業(yè)網(wǎng)站建設(shè),成都品牌網(wǎng)站建設(shè),網(wǎng)絡(luò)營銷推廣,外貿(mào)網(wǎng)站制作,建平網(wǎng)站建設(shè)費(fèi)用合理。Hadoop 3.x中引入了一些重要的功能和優(yōu)化,包括HDFS 可擦除編碼、多Namenode支持、MR Native Task優(yōu)化、YARN基于cgroup的內(nèi)存和磁盤IO隔離、YARN container resizing等。
Hadoop3.x官方文檔地址如下:
http://hadoop.apache.org/docs/r3.0.1/
Hadoop Common改進(jìn):
精簡Hadoop內(nèi)核,包括剔除過期的API和實(shí)現(xiàn),將默認(rèn)組件實(shí)現(xiàn)替換成最高效的實(shí)現(xiàn)(比如將FileOutputCommitter缺省實(shí)現(xiàn)換為v2版本,廢除hftp轉(zhuǎn)由webhdfs替代,移除Hadoop子實(shí)現(xiàn)序列化庫org.apache.hadoop.Records
lasspath isolation以防止不同版本jar包沖突,比如google Guava在混合使用Hadoop、HBase和Spark時(shí),很容易產(chǎn)生沖突。(https://issues.apache.org/jira/browse/HADOOP-11656)
Hadoop3.x中大改變的是HDFS,HDFS通過最近black塊計(jì)算,根據(jù)最近計(jì)算原則,本地black塊,加入到內(nèi)存,先計(jì)算,通過IO,共享內(nèi)存計(jì)算區(qū)域,最后快速形成計(jì)算結(jié)果。
HDFS支持?jǐn)?shù)據(jù)的擦除編碼,這使得HDFS在不降低可靠性的前提下,節(jié)省一半存儲空間。(https://issues.apache.org/jira/browse/HDFS-7285)
關(guān)于這兩個特性的官方文檔地址:
http://hadoop.apache.org/docs/r3.0.1/hadoop-project-dist/hadoop-hdfs/HDFSErasureCoding.html
http://hadoop.apache.org/docs/r3.0.1/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWithQJM.html
官方文檔地址:
http://hadoop.apache.org/docs/r3.0.1/hadoop-yarn/hadoop-yarn-site/TimelineServiceV2.html
Tasknative優(yōu)化。為MapReduce增加了C/C++的map output collector實(shí)現(xiàn)(包括Spill,Sort和IFile等),通過作業(yè)級別參數(shù)調(diào)整就可切換到該實(shí)現(xiàn)上。對于shuffle密集型應(yīng)用,其性能可提高約30%。(https://issues.apache.org/jira/browse/MAPREDUCE-2841)
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。
網(wǎng)頁名稱:Hadoop3.x新特性-創(chuàng)新互聯(lián)
分享路徑:http://jinyejixie.com/article26/dhdhcg.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供企業(yè)建站、ChatGPT、建站公司、標(biāo)簽優(yōu)化、做網(wǎng)站、網(wǎng)站設(shè)計(jì)公司
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容