本文研究的主要問題時(shí)Python讀取word文本操作,分享了相關(guān)概念和實(shí)現(xiàn)代碼,具體如下。
綿陽網(wǎng)站建設(shè)公司創(chuàng)新互聯(lián),綿陽網(wǎng)站設(shè)計(jì)制作,有大型網(wǎng)站制作公司豐富經(jīng)驗(yàn)。已為綿陽上千余家提供企業(yè)網(wǎng)站建設(shè)服務(wù)。企業(yè)網(wǎng)站搭建\外貿(mào)網(wǎng)站建設(shè)要多少錢,請(qǐng)找那個(gè)售后服務(wù)好的綿陽做網(wǎng)站的公司定做!Python可以利用python-docx模塊處理word文檔,處理方式是面向?qū)ο蟮?。也就是說python-docx模塊會(huì)把word文檔,文檔中的段落、文本、字體等都看做對(duì)象,對(duì)對(duì)象進(jìn)行處理就是對(duì)word文檔的內(nèi)容處理。
如果需要讀取word文檔中的文字(一般來說,程序也只需要認(rèn)識(shí)word文檔中的文字信息),需要先了解python-docx模塊的幾個(gè)概念。
1,Document對(duì)象,表示一個(gè)word文檔。
2,Paragraph對(duì)象,表示word文檔中的一個(gè)段落
3,Paragraph對(duì)象的text屬性,表示段落中的文本內(nèi)容。
需要注意,python-docx模塊安裝需要在cmd命令行中輸入pip install python-docx,如下圖表示安裝成功(最后那句英文Successfully installed,成功地安裝完成,十分考驗(yàn)英文水平。)
注意在導(dǎo)入模塊時(shí),用的是import docx。
也真是奇了怪了,怎么安裝和導(dǎo)入模塊時(shí),很多都不用一個(gè)名字,看來是很有必要出一個(gè)python版本的模塊管理程序python-maven了,本段純屬PS。
在了解了上面的信息之后,就很簡(jiǎn)單了,下面先創(chuàng)建一個(gè)D:\temp\word.docx文件,并在其中輸入如下內(nèi)容。
然后寫一段程序,代碼及輸出結(jié)果如下:
#讀取docx中的文本代碼示例 import docx #獲取文檔對(duì)象 file=docx.Document("D:\\temp\\word.docx") print("段落數(shù):"+str(len(file.paragraphs)))#段落數(shù)為13,每個(gè)回車隔離一段 #輸出每一段的內(nèi)容 for para in file.paragraphs: print(para.text) #輸出段落編號(hào)及段落內(nèi)容 for i in range(len(file.paragraphs)): print("第"+str(i)+"段的內(nèi)容是:"+file.paragraphs[i].text)
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡(jiǎn)單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場(chǎng)景需求。
當(dāng)前名稱:Python讀取word文本操作詳解-創(chuàng)新互聯(lián)
分享URL:http://jinyejixie.com/article12/dsicgc.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供響應(yīng)式網(wǎng)站、建站公司、企業(yè)網(wǎng)站制作、自適應(yīng)網(wǎng)站、App設(shè)計(jì)、網(wǎng)站設(shè)計(jì)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)