用python寫爬蟲難嗎-創(chuàng)新互聯(lián)

這篇文章主要講解了用python寫爬蟲難嗎，內(nèi)容清晰明了，對此有興趣的小伙伴可以學習一下，相信大家閱讀完之后會有幫助。

創(chuàng)新互聯(lián)是一家集網(wǎng)站建設(shè),荊門企業(yè)網(wǎng)站建設(shè),荊門品牌網(wǎng)站建設(shè),網(wǎng)站定制,荊門網(wǎng)站建設(shè)報價,網(wǎng)絡(luò)營銷,網(wǎng)絡(luò)優(yōu)化,荊門網(wǎng)站推廣為一體的創(chuàng)新建站企業(yè)，幫助傳統(tǒng)企業(yè)提升企業(yè)形象加強企業(yè)競爭力?？沙浞譂M足這一群體相比中小企業(yè)更為豐富、高端、多元的互聯(lián)網(wǎng)需求。同時我們時刻保持專業(yè)、時尚、前沿，時刻以成就客戶成長自我，堅持不斷學習、思考、沉淀、凈化自己，讓我們?yōu)楦嗟钠髽I(yè)打造出實用型網(wǎng)站。

所謂網(wǎng)絡(luò)爬蟲，通俗的講，就是通過向我們需要的URL發(fā)出http請求，獲取該URL對應(yīng)的http報文主體內(nèi)容，之后提取該報文主體中我們所需要的信息。

下面是一個簡單的爬蟲程序

http基本知識

當我們通過瀏覽器訪問指定的URL時，需要遵守http協(xié)議。本節(jié)將介紹一些關(guān)于http的基礎(chǔ)知識。

http基本流程

我們打開一個網(wǎng)頁的過程，就是一次http請求的過程。這個過程中，我們自己的主機充當著客戶機的作用，而充當客戶端的是瀏覽器。我們輸入的URL對應(yīng)著網(wǎng)絡(luò)中某臺服務(wù)器上面的資源，服務(wù)器接收到客戶端發(fā)出的http請求之后，會給客戶端一個響應(yīng)，響應(yīng)的內(nèi)容就是請求的URL對應(yīng)的內(nèi)容，當客戶端接收到服務(wù)器的響應(yīng)時，我們就可以在瀏覽器上看見請求的信息了。

我們可以通過python的requests模塊很方便的發(fā)起http請求。requests模塊是第三方模塊，安裝完成之后直接import就能使用。下面介紹一些簡單的用法

發(fā)起請求

import requests
# 請求的首部信息
headers = {
  'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) 
  Chrome/65.0.3325.146 Safari/537.36'
}
# 例子的url
url = 'https://voice.hupu.com/nba' # 虎撲nba新聞
# 利用requests對象的get方法，對指定的url發(fā)起請求
# 該方法會返回一個Response對象
res = requests.get(url, headers=headers)
# 通過Response對象的text方法獲取網(wǎng)頁的文本信息
print(res.text)

網(wǎng)站名稱：用python寫爬蟲難嗎-創(chuàng)新互聯(lián)
瀏覽地址：http://jinyejixie.com/article24/dchoje.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供服務(wù)器托管、靜態(tài)網(wǎng)站、網(wǎng)站建設(shè)、定制網(wǎng)站、網(wǎng)站改版、企業(yè)建站

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請盡快告知，我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場，如需處理請聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容

成人午夜视频全免费观看高清-秋霞福利视频一区二区三区-国产精品久久久久电影小说-亚洲不卡区三一区三区一区

用python寫爬蟲難嗎-創(chuàng)新互聯(lián)