今天就跟大家聊聊有關(guān)Python中怎么實(shí)現(xiàn)一個(gè)爬蟲(chóng)功能,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結(jié)了以下內(nèi)容,希望大家根據(jù)這篇文章可以有所收獲。
創(chuàng)新互聯(lián)是專業(yè)的北海街道網(wǎng)站建設(shè)公司,北海街道接單;提供網(wǎng)站設(shè)計(jì)制作、成都網(wǎng)站設(shè)計(jì),網(wǎng)頁(yè)設(shè)計(jì),網(wǎng)站設(shè)計(jì),建網(wǎng)站,PHP網(wǎng)站建設(shè)等專業(yè)做網(wǎng)站服務(wù);采用PHP框架,可快速的進(jìn)行北海街道網(wǎng)站開(kāi)發(fā)網(wǎng)頁(yè)制作和功能擴(kuò)展;專業(yè)做搜索引擎喜愛(ài)的網(wǎng)站,專業(yè)的做網(wǎng)站團(tuán)隊(duì),希望更多企業(yè)前來(lái)合作!
運(yùn)行結(jié)果
Python 2.6.6 (r266:84292, Jun 20 2019, 14:14:55) [GCC 4.4.7 20120313 (Red Hat 4.4.7-23)] on linux2Type "help", "copyright", "credits" or "license" for more information.>>> import requestsTraceback (most recent call last): File "<stdin>", line 1, in <module> File "/usr/lib/python2.6/site-packages/requests/__init__.py", line 43, in <module> import urllib3 File "/usr/lib/python2.6/site-packages/urllib3/__init__.py", line 7, in <module> from .connectionpool import HTTPConnectionPool, HTTPSConnectionPool, connection_from_url File "/usr/lib/python2.6/site-packages/urllib3/connectionpool.py", line 100 _blocking_errnos = {errno.EAGAIN, errno.EWOULDBLOCK} ^SyntaxError: invalid syntax
由于Linux服務(wù)器上的Python版本為2.6.6,import requests就已經(jīng)報(bào)錯(cuò)了,這個(gè)庫(kù)是沒(méi)法用了。這個(gè)錯(cuò)誤我試了幾種辦法,都宣告失敗。之前文章是在windows環(huán)境Python2.7下完成的。
你可能會(huì)說(shuō)升級(jí)Python版本吧?我有過(guò)升級(jí)glibc把服務(wù)器搞死的慘痛教訓(xùn),不敢再亂升級(jí)了,而且我試驗(yàn)的機(jī)器是24小時(shí)運(yùn)行著其它系統(tǒng)的生產(chǎn)服務(wù)器,一旦升級(jí)出問(wèn)題,會(huì)釀成生產(chǎn)事故的。所以我只能在2.6的Python下開(kāi)發(fā)爬蟲(chóng)。使用urllib2庫(kù)代替requests庫(kù),實(shí)現(xiàn)過(guò)程基本是一樣的簡(jiǎn)單明了。代碼如下
#coding=utf-8import urllib2exact_url='https://news.qq.com/zt2020/page/feiyan.htm'try: r=urllib2.urlopen(exact_url) #抓取設(shè)定url的數(shù)據(jù),可以改成你想獲取的任意地址except urllib2.URLError,e: print e.code exit() r.encoding='utf8'html=r.read() print html #打印抓取的結(jié)果
所以如果你的服務(wù)器Python版本是2.6或者更低,嘗試使用urllib2庫(kù)吧!
低版本的Python還會(huì)出現(xiàn)無(wú)法安裝MongoDB的驅(qū)動(dòng)包pymongo的情況,如下
這種情況可以選擇MySQL的Python驅(qū)動(dòng)包代替,pip安裝MySQL的Python驅(qū)動(dòng)包也不一定成功,我最后用yum安裝成功的。
更奇葩的是2.6下,django也無(wú)法安裝成功,
看完上述內(nèi)容,你們對(duì)Python中怎么實(shí)現(xiàn)一個(gè)爬蟲(chóng)功能有進(jìn)一步的了解嗎?如果還想了解更多知識(shí)或者相關(guān)內(nèi)容,請(qǐng)關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝大家的支持。
文章題目:Python中怎么實(shí)現(xiàn)一個(gè)爬蟲(chóng)功能
本文網(wǎng)址:http://jinyejixie.com/article42/jjgchc.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站改版、小程序開(kāi)發(fā)、搜索引擎優(yōu)化、網(wǎng)站排名、微信小程序、自適應(yīng)網(wǎng)站
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)