這篇文章將為大家詳細講解有關python爬蟲中cookie的操作示例,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。
創(chuàng)新互聯(lián)建站專注于古冶網(wǎng)站建設服務及定制,我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗。 熱誠為您提供古冶營銷型網(wǎng)站建設,古冶網(wǎng)站制作、古冶網(wǎng)頁設計、古冶網(wǎng)站官網(wǎng)定制、小程序定制開發(fā)服務,打造古冶網(wǎng)絡公司原創(chuàng)品牌,更為您提供古冶網(wǎng)站排名全網(wǎng)營銷落地服務。
Python是一種跨平臺的、具有解釋性、編譯性、互動性和面向?qū)ο蟮哪_本語言,其最初的設計是用于編寫自動化腳本,隨著版本的不斷更新和新功能的添加,常用于用于開發(fā)獨立的項目和大型項目。
python爬蟲在客戶端訪問Web服務器時,服務器可以根據(jù)Cookie來跟蹤客戶狀態(tài),這對于需要區(qū)別客戶的場合(如電子商務)特別有用。cookie存在與緩存中或者硬盤中,在硬盤中的是一些文本文件,當你訪問該網(wǎng)站時,就會讀取對應的網(wǎng)站的cookie信息。
1、cookie的格式:
Set-Cookie: NAME=VALUE;Expires/Max-age=DATE;Path=PATH;Domain=DOMAIN_NAME;SECURE
參數(shù)意義:
NAME:cookie的名字。
VALUE:cookie的值。
Expires:cookie的過期時間。
Path:cookie作用的路徑。該 Cookie 是在當前的哪個路徑下生成的,如 path=/wp-admin/。
Domain:cookie作用的域名。
SECURE:是否只在https協(xié)議下起作用。如果設置了這個屬性,那么只會在 SSH 連接時才會回傳該 Cookie
2、cookie機制
當用戶第一次訪問并登陸一個網(wǎng)站的時候,cookie的設置以及發(fā)送會經(jīng)歷以下4個步驟:
客戶端發(fā)送一個請求到服務器 --》 服務器發(fā)送一個HttpResponse響應到客戶端,其中包含Set-Cookie的頭部 --》 客戶端保存cookie,之后向服務器發(fā)送請求時,HttpRequest請求中會包含一個Cookie的頭部 --》服務器返回響應數(shù)據(jù)。
3、cookie實例:從本地加載cookie
從本地加載cookie,需要使用cookiejar的load方法,并且也需要指定方法:
from urllib import request,parse from http.cookiejar import MozillaCookieJar #加載本地cookie #保存cookie到本地文件 cookiejar1=MozillaCookieJar('cookie.txt') cookiejar1.load(ignore_discard=True) handler=request.HTTPCookieProcessor(cookiejar) opener=request.build_opener(handler) resp=opener.open('http://httpbin.org/cookies') for cookie in cookiejar1: #將cookie打印到控制臺 print(cookie)
關于“python爬蟲中cookie的操作示例”這篇文章就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,使各位可以學到更多知識,如果覺得文章不錯,請把它分享出去讓更多的人看到。
網(wǎng)站名稱:python爬蟲中cookie的操作示例
網(wǎng)站鏈接:http://jinyejixie.com/article36/pgedpg.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供域名注冊、面包屑導航、關鍵詞優(yōu)化、動態(tài)網(wǎng)站、網(wǎng)站排名、ChatGPT
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)