本文實例為大家分享了python實現(xiàn)遞歸查找某個路徑下所有文件中的中文字符,供大家參考,具體內(nèi)容如下
目前創(chuàng)新互聯(lián)公司已為近千家的企業(yè)提供了網(wǎng)站建設(shè)、域名、網(wǎng)頁空間、網(wǎng)站托管、企業(yè)網(wǎng)站設(shè)計、龍湖網(wǎng)站維護等服務(wù),公司將堅持客戶導向、應(yīng)用為本的策略,正道將秉承"和諧、參與、激情"的文化,與客戶和合作伙伴齊心協(xié)力一起成長,共同發(fā)展。# -*- coding: utf-8 -*- # @ description: # @ author: # @ created: 2018/7/21 import re import sys import os reload(sys) sys.setdefaultencoding("utf8") def translate(str): out = set() line = str.strip().decode('utf-8', 'ignore') # 處理前進行相關(guān)的處理,包括轉(zhuǎn)換成Unicode等 p2 = re.compile(ur'[^\u4e00-\u9fa5]') # 中文的編碼范圍是:\u4e00到\u9fa5 zh = " ".join(p2.split(line)).strip() # zh = "\n".join(zh.split()) #dsds經(jīng)過相關(guān)處理后得到中文的文本 for s in zh.split(): out.add(s) # 經(jīng)過相關(guān)處理后得到中文的文本 return out def extract_file(path): result = set() try: f = open(path) # 打開文件 lines = f.readlines() for line in lines: string = translate(line) if string: result.update(string) except Exception as e: pass return result def extract(path): result = set() files = os.listdir(path) for file in files: if not file.startswith("."): if not os.path.isdir(path + "/" + file): # 判斷是否是文件夾,不是文件夾才打開ssgsg判斷是否是文件夾,不是文件夾才打開 sub_file = extract_file(path + "/" + file) if sub_file: result.update(sub_file) else: print file child = extract(path + "/" + file) if child: result.update(child) return result if __name__ == '__main__': path = "/Users/common" result = extract(path) res_file = open("result.txt", "w") for s in result: res_file.write(s + "\n")
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機、免備案服務(wù)器”等云主機租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。
網(wǎng)站名稱:python實現(xiàn)遞歸查找某個路徑下所有文件中的中文字符-創(chuàng)新互聯(lián)
當前網(wǎng)址:http://jinyejixie.com/article0/csdeio.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站設(shè)計、企業(yè)網(wǎng)站制作、營銷型網(wǎng)站建設(shè)、網(wǎng)站排名、網(wǎng)站維護、響應(yīng)式網(wǎng)站
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)