本篇內(nèi)容主要講解“如何使用pdfbox實(shí)現(xiàn)pdf文本提取和合并功能”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實(shí)用性強(qiáng)。下面就讓小編來帶大家學(xué)習(xí)“如何使用pdfbox實(shí)現(xiàn)pdf文本提取和合并功能”吧!
創(chuàng)新互聯(lián)建站是一家集網(wǎng)站建設(shè),北碚企業(yè)網(wǎng)站建設(shè),北碚品牌網(wǎng)站建設(shè),網(wǎng)站定制,北碚網(wǎng)站建設(shè)報(bào)價(jià),網(wǎng)絡(luò)營銷,網(wǎng)絡(luò)優(yōu)化,北碚網(wǎng)站推廣為一體的創(chuàng)新建站企業(yè),幫助傳統(tǒng)企業(yè)提升企業(yè)形象加強(qiáng)企業(yè)競爭力??沙浞譂M足這一群體相比中小企業(yè)更為豐富、高端、多元的互聯(lián)網(wǎng)需求。同時(shí)我們時(shí)刻保持專業(yè)、時(shí)尚、前沿,時(shí)刻以成就客戶成長自我,堅(jiān)持不斷學(xué)習(xí)、思考、沉淀、凈化自己,讓我們?yōu)楦嗟钠髽I(yè)打造出實(shí)用型網(wǎng)站。有時(shí)我們需要對PDF文件進(jìn)行一些處理,提取文本、合并等。以前我們使用A-PDF Text Extractor免費(fèi)工具,為什么不自己寫一個(gè)呢?
現(xiàn)在我們可以使用PDFBox-0.7.3這個(gè)開源類庫. 下載解包后引用:
復(fù)制代碼 代碼如下:
PDFBox-0.7.3.dll
IKVM.GNU.Classpath.dll
新建一個(gè)項(xiàng)目,代碼很簡單:
復(fù)制代碼 代碼如下:
public static string ParseToTxtStringUsingPDFBox(string filename){
PDDocument doc = PDDocument.load(filename);
PDFTextStripper stripper = new PDFTextStripper();
return stripper.getText(doc);
}
獲得這個(gè)textString,再把它們寫成磁盤文件就可以了, 像這樣的方法:
復(fù)制代碼 代碼如下:
public static void WriteToTextFile(string str,string txtpath)
{
if (string.IsNullOrEmpty(txtpath))
throw new ArgumentNullException("Output file path should not be Null");
using (var txtWriter = new StreamWriter(txtpath))
{
txtWriter.Write(str);
txtWriter.Close();
}
}
其它的功能您可以自行發(fā)揮了. 這個(gè)類庫目前支持:
PDF to text extraction
Merge PDF Documents
PDF Document Encryption/Decryption
Lucene Search Engine Integration
Fill in form data FDF and XFDF
Create a PDF from a text file
Create images from PDF pages
Print a PDF
到此,相信大家對“如何使用pdfbox實(shí)現(xiàn)pdf文本提取和合并功能”有了更深的了解,不妨來實(shí)際操作一番吧!這里是創(chuàng)新互聯(lián)建站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!
當(dāng)前名稱:如何使用pdfbox實(shí)現(xiàn)pdf文本提取和合并功能-創(chuàng)新互聯(lián)
當(dāng)前URL:http://jinyejixie.com/article16/dcphgg.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供品牌網(wǎng)站建設(shè)、Google、App開發(fā)、定制網(wǎng)站、微信公眾號、App設(shè)計(jì)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容