在yarn模式下,會(huì)上傳jar包到y(tǒng)arn來執(zhí)行spark程序,如果每次都上傳,很耗時(shí)間,而且如果是阿里云的機(jī)器,上傳很慢,180m的jar要上傳十幾分鐘,所以要提前上傳到hdfs中去。
spark支持如下幾個(gè)參數(shù)
spark.yarn.jars:只能指定具體jar包,在spark1.6.2(包括)以前,從官網(wǎng)上可以下載一個(gè)大的jar包,寫上這個(gè)jar包即可,但是在2.0過后,就成為了一大堆小包
spark.yarn.archive:這個(gè)支持文件夾,但是有一點(diǎn)要注意,
.set("spark.yarn.archive","hdfs://node2:8020/user/xiaokan/assembly/target/scala-2.11/jars")
.set("spark.yarn.archive","hdfs://node2:8020/user/xiaokan/assembly/target/scala-2.11/jars/")
只有第一種寫法正確,第二種錯(cuò)誤,第二種寫法不會(huì)讀取任何jar包。
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡(jiǎn)單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場(chǎng)景需求。
網(wǎng)頁標(biāo)題:spark-yarn模式j(luò)ar包優(yōu)化-創(chuàng)新互聯(lián)
網(wǎng)頁網(wǎng)址:http://jinyejixie.com/article8/dijdip.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供建站公司、App開發(fā)、移動(dòng)網(wǎng)站建設(shè)、網(wǎng)站營銷、Google、電子商務(wù)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容