這篇文章給大家介紹如何進(jìn)行MooseFS使用問(wèn)題分析,內(nèi)容非常詳細(xì),感興趣的小伙伴們可以參考借鑒,希望對(duì)大家能有所幫助。
公司專(zhuān)注于為企業(yè)提供成都網(wǎng)站設(shè)計(jì)、成都做網(wǎng)站、外貿(mào)網(wǎng)站建設(shè)、微信公眾號(hào)開(kāi)發(fā)、成都做商城網(wǎng)站,成都小程序開(kāi)發(fā),軟件定制網(wǎng)站開(kāi)發(fā)等一站式互聯(lián)網(wǎng)企業(yè)服務(wù)。憑借多年豐富的經(jīng)驗(yàn),我們會(huì)仔細(xì)了解各客戶(hù)的需求而做出多方面的分析、設(shè)計(jì)、整合,為客戶(hù)設(shè)計(jì)出具風(fēng)格及創(chuàng)意性的商業(yè)解決方案,創(chuàng)新互聯(lián)公司更提供一系列網(wǎng)站制作和網(wǎng)站推廣的服務(wù)。
隨著數(shù)據(jù)量越來(lái)越大,MFS的使用中也出現(xiàn)過(guò)一些問(wèn)題,這里做了一些分析和總結(jié),下面和大家分享一下:
先提一下MFS出問(wèn)題時(shí)出現(xiàn)比較頻繁的兩個(gè)信息:
連接中斷
壞塊問(wèn)題
連接中斷問(wèn)題在Master端會(huì)出現(xiàn)如下錯(cuò)誤:
mfsmaster[15861]: connection with client(ip:10.11.18.175) has been closed by peer 表示客戶(hù)端和master的連接中斷 mfsmaster[15861]: connection with ML(10.11.19.76) has been closed by peer 表示Metalogger和Master的連接中斷 mfsmaster[15861]: connection with CS(10.11.18.199) has been closed by peer 表示ChunkServer和Master的連接中斷
原因分析可能如下:
網(wǎng)絡(luò)閃斷 - 正?,F(xiàn)象,MFS本身可自動(dòng)重連,不會(huì)造成問(wèn)題
Clinet或ChunkServer主動(dòng)斷開(kāi)連接,如Kill進(jìn)程,也會(huì)引起這種錯(cuò)誤
ChunkServer或Client到Master的連接超時(shí),也會(huì)斷開(kāi)連接,引起超時(shí)可能有兩個(gè)原因:
Client請(qǐng)求過(guò)多,引起Master請(qǐng)求隊(duì)列已滿(mǎn),導(dǎo)致的連接超時(shí)
網(wǎng)絡(luò)響應(yīng)慢引起的超時(shí)(和網(wǎng)絡(luò)閃斷區(qū)分)
解決辦法:
對(duì)于1、3出現(xiàn)引起的中斷可不加理會(huì),重點(diǎn)需關(guān)注2引起的問(wèn)題:
針對(duì)2-a:Client控制請(qǐng)求,如超高并發(fā)的讀寫(xiě)刪除,另需注意的操作是ls,大家知道Linux系統(tǒng)本身對(duì)一個(gè)目錄下文件個(gè)數(shù)的顯示是有限制的(如10W,那么涉及到的需遍歷指令就會(huì)報(bào)錯(cuò),list too long),同樣,我們MFS中遍歷目錄下文件時(shí)也要注意,要遍歷的文件數(shù)過(guò)多會(huì)導(dǎo)致超時(shí)引起連接被中斷等問(wèn)題。
針對(duì)2-b: 合理分配帶寬資源,優(yōu)化網(wǎng)絡(luò)環(huán)境解決。
備注:
Client或Chunk到Master的連接中斷之后,會(huì)由Client或Chunk自動(dòng)發(fā)出重連(Reconnection)和注冊(cè)(Register)操作。
壞塊問(wèn)題在Master端會(huì)出現(xiàn)如下錯(cuò)誤:
mfsmaster[3250]: chunkserver has nonexistent chunk (000000000002139F_00000001), so create it for future deletion mfsmaster[3250]: (10.11.18.199:9422) chunk: 000000000002139F creation status: 20 mfsmaster[3250]: chunk 000000000002139F has only invalid copies (1) – please repair it manually mfsmaster[3250]: chunk 000000000002139F_00000001 – invalid copy on (10.11.18.199 – ver:00000000) mfsmaster[3250]: currently unavailable chunk 000000000002139F (inode: 135845 ; index: 23)
上述日志的意思是:有一個(gè)塊在Master中有元數(shù)據(jù)信息,但ChunkServer中沒(méi)有這個(gè)塊,系統(tǒng)會(huì)自動(dòng)在ChunkServer上創(chuàng)建此塊為了后續(xù)刪除,因?yàn)闆](méi)有內(nèi)容,所以是非法的copy,我們也無(wú)法訪(fǎng)問(wèn)到此塊。
出現(xiàn)的原因可能有很多,如:
Client端大文件傳輸過(guò)程中,強(qiáng)制拔下master主機(jī)電源,造成master非法關(guān)閉,使用mfsmetarestore -a修復(fù)后,master日志報(bào)告有壞塊
ChunkServer的csstats.mfs存放位置空間不足,導(dǎo)致文件塊無(wú)法寫(xiě)入,也會(huì)引起塊錯(cuò)誤
手動(dòng)刪除ChunkServer上的塊文件
刪除文件后,Master非正常結(jié)束后重啟,但沒(méi)有結(jié)果changelog.mfs進(jìn)行恢復(fù),也會(huì)引起壞塊
原因應(yīng)該還有很多,后續(xù)有遇到再補(bǔ)充。
解決辦法:
Client端使用mfsfilerepair對(duì)文件進(jìn)行修復(fù)。
我理解壞塊分為兩種:
一種是沒(méi)有任何一個(gè)trunk節(jié)點(diǎn)有數(shù)據(jù)(修復(fù)工作其實(shí)就是生成chunk,在需要補(bǔ)充內(nèi)容的地方填充0,這種塊事后要?jiǎng)h除)
另一種是存在有數(shù)據(jù)塊的節(jié)點(diǎn)(從存在的數(shù)據(jù)塊copy,這里的塊不需要?jiǎng)h除)
修復(fù)之后可能出現(xiàn)如下日志信息:
mfsmaster[3250]: chunk hasn’t been deleted since previous loop – retry mfsmaster[3250]: (10.11.18.199:9422) chunk: 000000000002139F deletion status: 13
Client端執(zhí)行一個(gè)mv或rm 操作,master將不會(huì)再顯示此信息,如:
mv 80499644316259743_s.jpg 80499644316259743_s_1.jpg
關(guān)于如何進(jìn)行MooseFS使用問(wèn)題分析就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,可以學(xué)到更多知識(shí)。如果覺(jué)得文章不錯(cuò),可以把它分享出去讓更多的人看到。
本文名稱(chēng):如何進(jìn)行MooseFS使用問(wèn)題分析
瀏覽地址:http://jinyejixie.com/article30/pspgpo.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站內(nèi)鏈、品牌網(wǎng)站設(shè)計(jì)、虛擬主機(jī)、微信公眾號(hào)、網(wǎng)站策劃、搜索引擎優(yōu)化
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶(hù)投稿、用戶(hù)轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話(huà):028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)