成人午夜视频全免费观看高清-秋霞福利视频一区二区三区-国产精品久久久久电影小说-亚洲不卡区三一区三区一区

Python3爬蟲中Ajax的簡介-創(chuàng)新互聯(lián)

創(chuàng)新互聯(lián)www.cdcxhl.cn八線動態(tài)BGP香港云服務(wù)器提供商,新人活動買多久送多久,劃算不套路!

創(chuàng)新互聯(lián)專注于赤坎企業(yè)網(wǎng)站建設(shè),響應(yīng)式網(wǎng)站建設(shè),商城系統(tǒng)網(wǎng)站開發(fā)。赤坎網(wǎng)站建設(shè)公司,為赤坎等地區(qū)提供建站服務(wù)。全流程按需求定制網(wǎng)站,專業(yè)設(shè)計,全程項目跟蹤,創(chuàng)新互聯(lián)專業(yè)和態(tài)度為您提供的服務(wù)

這篇文章將為大家詳細(xì)講解有關(guān)Python3爬蟲中Ajax的簡介,小編覺得挺實(shí)用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。

1. 查看請求

這里還需要借助瀏覽器的開發(fā)者工具,下面以Chrome瀏覽器為例來介紹。

首先,用Chrome瀏覽器打開微博的鏈接https://m.weibo.cn/u/2830678474,隨后在頁面中點(diǎn)擊鼠標(biāo)右鍵,從彈出的快捷菜單中選擇“檢查”選項,此時便會彈出開發(fā)者工具,如圖6-2所示:

Python3爬蟲中Ajax的簡介

此時在Elements選項卡中便會觀察到網(wǎng)頁的源代碼,右側(cè)便是節(jié)點(diǎn)的樣式。

不過這不是我們想要尋找的內(nèi)容。切換到Network選項卡,隨后重新刷新頁面,可以發(fā)現(xiàn)這里出現(xiàn)了非常多的條目,如圖6-3所示。

Python3爬蟲中Ajax的簡介

前面也提到過,這里其實(shí)就是在頁面加載過程中瀏覽器與服務(wù)器之間發(fā)送請求和接收響應(yīng)的所有記錄。

Ajax其實(shí)有其特殊的請求類型,它叫作xhr。在圖6-3中,我們可以發(fā)現(xiàn)一個名稱以getIndex開頭的請求,其Type為xhr,這就是一個Ajax請求。用鼠標(biāo)點(diǎn)擊這個請求,可以查看這個請求的詳細(xì)信息,如圖6-4所示。

Python3爬蟲中Ajax的簡介

在右側(cè)可以觀察到其Request Headers、URL和Response Headers等信息。其中Request Headers中有一個信息為X-Requested-With:XMLHttpRequest,這就標(biāo)記了此請求是Ajax請求,如圖6-5所示。

Python3爬蟲中Ajax的簡介

隨后點(diǎn)擊一下Preview,即可看到響應(yīng)的內(nèi)容,它是JSON格式的。這里Chrome為我們自動做了解析,點(diǎn)擊箭頭即可展開和收起相應(yīng)內(nèi)容,如圖6-6所示。

Python3爬蟲中Ajax的簡介

觀察可以發(fā)現(xiàn),這里的返回結(jié)果是我的個人信息,如昵稱、簡介、頭像等,這也是用來渲染個人主頁所使用的數(shù)據(jù)。JavaScript接收到這些數(shù)據(jù)之后,再執(zhí)行相應(yīng)的渲染方法,整個頁面就渲染出來了。

另外,也可以切換到Response選項卡,從中觀察到真實(shí)的返回數(shù)據(jù),如圖6-7所示。

Python3爬蟲中Ajax的簡介

接下來,切回到第一個請求,觀察一下它的Response是什么,如圖6-8所示。

Python3爬蟲中Ajax的簡介

這是最原始的鏈接https://m.weibo.cn/u/2830678474返回的結(jié)果,其代碼只有不到50行,結(jié)構(gòu)也非常簡單,只是執(zhí)行了一些JavaScript。

所以說,我們看到的微博頁面的真實(shí)數(shù)據(jù)并不是最原始的頁面返回的,而是后來執(zhí)行JavaScript后再次向后臺發(fā)送了Ajax請求,瀏覽器拿到數(shù)據(jù)后再進(jìn)一步渲染出來的。

2. 過濾請求

接下來,再利用Chrome開發(fā)者工具的篩選功能篩選出所有的Ajax請求。在請求的上方有一層篩選欄,直接點(diǎn)擊XHR,此時在下方顯示的所有請求便都是Ajax請求了,如圖6-9所示。

Python3爬蟲中Ajax的簡介

接下來,不斷滑動頁面,可以看到頁面底部有一條條新的微博被刷出,而開發(fā)者工具下方也一個個地出現(xiàn)Ajax請求,這樣我們就可以捕獲到所有的Ajax請求了。

隨意點(diǎn)開一個條目,都可以清楚地看到其Request URL、Request Headers、Response Headers、Response Body等內(nèi)容,此時想要模擬請求和提取就非常簡單了。

圖6-10所示的內(nèi)容便是我的某一頁微博的列表信息。

Python3爬蟲中Ajax的簡介

到現(xiàn)在為止,我們已經(jīng)可以分析出來Ajax請求的一些詳細(xì)信息了,接下來只需要用程序模擬這些Ajax請求,就可以輕松提取我們所需要的信息了。

關(guān)于Python3爬蟲中Ajax的簡介就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,可以學(xué)到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。

分享標(biāo)題:Python3爬蟲中Ajax的簡介-創(chuàng)新互聯(lián)
網(wǎng)站網(wǎng)址:http://jinyejixie.com/article46/jspeg.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供靜態(tài)網(wǎng)站定制開發(fā)、網(wǎng)站收錄、響應(yīng)式網(wǎng)站用戶體驗、網(wǎng)站設(shè)計公司

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

微信小程序開發(fā)
繁峙县| 张家口市| 定州市| 怀化市| 淄博市| 金昌市| 沅江市| 开平市| 永城市| 土默特左旗| 巨野县| 伊春市| 嵊州市| 德惠市| 芦山县| 宁晋县| 潜江市| 麻阳| 高阳县| 镇巴县| 台南市| 明光市| 天等县| 湟中县| 烟台市| 南雄市| 理塘县| 南澳县| 鄢陵县| 集贤县| 保德县| 改则县| 泰和县| 梨树县| 斗六市| 麻江县| 宜章县| 全南县| 张掖市| 金溪县| 花莲县|