這篇文章將為大家詳細(xì)講解有關(guān)爬蟲中cookies是什么意思,小編覺得挺實(shí)用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。
為開平等地區(qū)用戶提供了全套網(wǎng)頁設(shè)計(jì)制作服務(wù),及開平網(wǎng)站建設(shè)行業(yè)解決方案。主營業(yè)務(wù)為成都做網(wǎng)站、成都網(wǎng)站建設(shè)、開平網(wǎng)站設(shè)計(jì),以傳統(tǒng)方式定制建設(shè)網(wǎng)站,并提供域名空間備案等一條龍服務(wù),秉承以專業(yè)、用心的態(tài)度為用戶提供真誠的服務(wù)。我們深信只要達(dá)到每一位用戶的要求,就會得到認(rèn)可,從而選擇與我們長期合作。這樣,我們也可以走得更遠(yuǎn)!
Cookie,有時(shí)也用其復(fù)數(shù)形式 Cookies,指某些網(wǎng)站為了辨別用戶身份、進(jìn)行 session 跟蹤而儲存在用戶本地終端上的數(shù)據(jù)(通常經(jīng)過加密)。定義于 RFC2109 和 2965 中的都已廢棄,最新取代的規(guī)范是 RFC6265[1]。Cookie其實(shí)就是瀏覽器緩存。
會話cookie:沒有設(shè)置expires(是個時(shí)間戳)的,瀏覽器(session)關(guān)閉后,就自動失效
持久cookie:設(shè)置了expires的,根據(jù)設(shè)置的失效時(shí)間決定(expires時(shí)間是可以進(jìn)行修改的, 但是很多網(wǎng)站會做防止修改的設(shè)置)
name:為一個cookie的名稱。
value:為一個cookie的值。
domain:為可以訪問此cookie的域名,譬如www.baidu.com:baidu.com就是頂級域名
域名的劃分:http://aaa.bbb.secode.first.com,每一個點(diǎn)劃分為一個域名,域名從后向前一次為頂級、一級、二級等。
非頂級域名,如二級域名或者三級域名,設(shè)置的cookie的domain只能為頂級域名或者二級域名或者三級域名本身,不能設(shè)置其他二級域名的cookie,否則cookie無法生成。
頂級域名只能設(shè)置domain為頂級域名,不能設(shè)置為二級域名或者三級域名,否則cookie無法生成。
二級域名能讀取設(shè)置了domain為頂級域名或者自身的cookie,不能讀取其他二級域名domain的cookie。所以要想cookie在多個二級域名中共享,需要設(shè)置domain為頂級域名,這樣就可以在所有二級域名里面或者到這個cookie的值了。
頂級域名只能獲取到domain設(shè)置為頂級域名的cookie,其他domain設(shè)置為二級域名的無法獲取。
總結(jié)一下:域名具有繼承性,只能使用其自身或其父輩的域名,不能使用其子域名或者兄弟域名。例如:
a.b.c.d.com
a.b.x.d.com
c可以使用domain為d.com或者c.d.com的域名cookie,不能使用x.d.com的域名或者b.c.d.com,這里大家做好了解就行了,碰到這種情況知道有這么個情況就行,一般我們需要關(guān)注的很少。
path:為可以訪問此cookie的頁面路徑。 比如www.jianshu.com/u/680e0e38ddc9,path就是/u/680e0e38ddc9,那么只有/u/680e0e38ddc9路徑下的頁面可以讀取此cookie。
expires/Max-Age :為此cookie超時(shí)時(shí)間。若設(shè)置其值為一個時(shí)間(一個時(shí)間戳),那么當(dāng)?shù)竭_(dá)此時(shí)間后,此cookie失效。
不設(shè)置的話默認(rèn)值是Session,意思是cookie會和session一起失效。
當(dāng)瀏覽器關(guān)閉(不是瀏覽器標(biāo)簽頁,而是整個瀏覽器) 后,此cookie失效。
Size: 此cookie大小。
http: cookie的httponly屬性。若此屬性為true,則只有在http請求頭中會帶有此cookie的信息,
而不能通過document.cookie來訪問此cookie。
secure : boolean型,默認(rèn)為false,設(shè)置是否只能通過https來傳遞此cookie
我們做爬蟲重點(diǎn)關(guān)注name和value。
以任何方式,如瀏覽器、selenium、封包方式等,獲得對應(yīng)的cookies
將cookies保存,可以是在內(nèi)存、文件、數(shù)據(jù)庫等
在你想要應(yīng)用已有的cookie的 項(xiàng)目 中,已各種方式:文件、數(shù)據(jù)庫、網(wǎng)絡(luò)等,獲取到對應(yīng)的cookie,然后進(jìn)行設(shè)置,接著就可以訪問對應(yīng)的資源了
實(shí)際應(yīng)用:
有幾臺專門的服務(wù)器,進(jìn)行登錄操作,所有賬號保存在數(shù)據(jù)庫,由這些專門登錄的服務(wù)器進(jìn)行登錄操作,登錄成功后,保存cookies到數(shù)據(jù)庫
有專門的應(yīng)用服務(wù)器,從數(shù)據(jù)庫讀取cookies,進(jìn)行相應(yīng)的業(yè)務(wù)操作,這種服務(wù)器不處理登錄操作
關(guān)于“爬蟲中cookies是什么意思”這篇文章就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,使各位可以學(xué)到更多知識,如果覺得文章不錯,請把它分享出去讓更多的人看到。
名稱欄目:爬蟲中cookies是什么意思
標(biāo)題網(wǎng)址:http://jinyejixie.com/article8/igoeop.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供做網(wǎng)站、網(wǎng)站設(shè)計(jì)公司、網(wǎng)站改版、全網(wǎng)營銷推廣、網(wǎng)站設(shè)計(jì)、網(wǎng)站維護(hù)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)