在zip標(biāo)準(zhǔn)中,對(duì)文件名的 encoding 用的不是 unicode,而可能是各種軟件根據(jù)系統(tǒng)的默認(rèn)字符集來采用(此為猜測),因此zipfile中根據(jù)文件 flag 檢測的時(shí)候,只支持 cp437 和 utf-8。
具體就是查找 zipfile.py 源代碼找到下面的代碼:
1: if flags & 0x800:
2: # UTF-8 file names extension
3: filename = filename.decode('utf-8')
4: else:
5: # Historical ZIP filename encoding
6: filename = filename.decode('cp437')
可見編碼被正確識(shí)別為utf8時(shí)的情況外,都會(huì)被識(shí)別并decode為cp437編碼,但如果實(shí)際是gbk等其他編碼時(shí)就變?yōu)閬y碼了。所以解決的方法在于被decode為cp437后重新再手動(dòng)轉(zhuǎn)為正確的編碼。
具體代碼如下:
#修改代碼 if flags & 0x800: # UTF-8 file names extension filename = filename.decode('utf-8') else: # Historical ZIP filename encoding filename = filename.decode('cp437') #修改 filename = filename.encode("cp437").decode('gbk')
網(wǎng)站題目:解決python3中解壓zip文件是文件名亂碼的問題-創(chuàng)新互聯(lián)
標(biāo)題來源:http://jinyejixie.com/article18/dciigp.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供企業(yè)建站、定制開發(fā)、虛擬主機(jī)、商城網(wǎng)站、外貿(mào)網(wǎng)站建設(shè)、App開發(fā)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容