小編給大家分享一下如何解決Python采集網(wǎng)頁時(shí)正則表達(dá)式匹配換行符的問題,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!
成都創(chuàng)新互聯(lián)公司專注于新沂企業(yè)網(wǎng)站建設(shè),成都響應(yīng)式網(wǎng)站建設(shè)公司,電子商務(wù)商城網(wǎng)站建設(shè)。新沂網(wǎng)站建設(shè)公司,為新沂等地區(qū)提供建站服務(wù)。全流程按需策劃設(shè)計(jì),專業(yè)設(shè)計(jì),全程項(xiàng)目跟蹤,成都創(chuàng)新互聯(lián)公司專業(yè)和態(tài)度為您提供的服務(wù)如下所示:
p1 = r'(?<=<div class="ds_cr">)(.*?)(?=<div id="pageurl">)' #這樣采集html時(shí)出錯(cuò),采集不到數(shù)據(jù),正則中 . 是不能匹配換行符,改成如下: p1 = r'(?<=<div class="ds_cr">)([\s\S]*?)(?=<div id="pageurl">)' # 這是我們寫的正則表達(dá)式規(guī)則,你現(xiàn)在可以不理解啥意思
[\s\S]
\s
匹配任何空白字符,包括空格、制表符、換頁符等等。等價(jià)于[ \f\n\r\t\v]。
\S
匹配任何非空白字符。等價(jià)于[^ \f\n\r\t\v]。
看完了這篇文章,相信你對(duì)“如何解決Python采集網(wǎng)頁時(shí)正則表達(dá)式匹配換行符的問題”有了一定的了解,如果想了解更多相關(guān)知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝各位的閱讀!
分享題目:如何解決Python采集網(wǎng)頁時(shí)正則表達(dá)式匹配換行符的問題-創(chuàng)新互聯(lián)
地址分享:http://jinyejixie.com/article28/jejcp.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供微信小程序、網(wǎng)站維護(hù)、網(wǎng)站建設(shè)、網(wǎng)頁設(shè)計(jì)公司、外貿(mào)建站、云服務(wù)器
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)