2021-02-03 分類(lèi): 網(wǎng)站建設(shè)
對(duì)于百度搜索引擎來(lái)說(shuō),蜘蛛黑洞特指網(wǎng)站通過(guò)極低的成本制造出大量參數(shù)過(guò)多,及內(nèi)容雷同但具體參數(shù)不同的動(dòng)態(tài)URL ,就像一個(gè)無(wú)限循環(huán)的“黑洞”將spider困住,Baiduspider浪費(fèi)了大量資源抓取的卻是無(wú)效網(wǎng)頁(yè)。
比如很多網(wǎng)站都有篩選功能,通過(guò)篩選功能產(chǎn)生的網(wǎng)頁(yè)經(jīng)常會(huì)被搜索引擎大量抓取,而這其中很大一部分檢索價(jià)值不高,如“500-1000之間價(jià)格的租房”,首先網(wǎng)站(包括現(xiàn)實(shí)中)上基本沒(méi)有相關(guān)資源,其次站內(nèi)用戶和搜索引擎用戶都沒(méi)有這種檢索習(xí)慣。這種網(wǎng)頁(yè)被搜索引擎大量抓取,只能是占用網(wǎng)站寶貴的抓取配額。那么該如何避免這種情況呢?
我們以北京某團(tuán)購(gòu)網(wǎng)站為例,看看該網(wǎng)站是如何利用robots巧妙避免這種蜘蛛黑洞的:
對(duì)于普通的篩選結(jié)果頁(yè),該網(wǎng)站選擇使用靜態(tài)鏈接,如:http://bj.XXXXX.com/category/zizhucan/weigongcun
同樣是條件篩選結(jié)果頁(yè),當(dāng)用戶選擇不同排序條件后,會(huì)生成帶有不同參數(shù)的動(dòng)態(tài)鏈接,而且即使是同一種排序條件(如:都是按銷(xiāo)量降序排列),生成的參數(shù)也都是不同的。如:http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqhek
http://bj.XXXXX.com/category/zizhucan/weigongcun/hot?mtt=1.index%2Fpoi.0.0.i1afqi5c
對(duì)于該團(tuán)購(gòu)網(wǎng)來(lái)說(shuō),只讓搜索引擎抓取篩選結(jié)果頁(yè)就可以了,而各種帶參數(shù)的結(jié)果排序頁(yè)面則通過(guò)robots規(guī)則拒絕提供給搜索引擎。
robots.txt的文件用法中有這樣一條規(guī)則:Disallow: /*?* ,即禁止搜索引擎訪問(wèn)網(wǎng)站中所有的動(dòng)態(tài)頁(yè)面。該網(wǎng)站恰是通過(guò)這種方式,對(duì)Baiduspider優(yōu)先展示高質(zhì)量頁(yè)面、屏蔽了低質(zhì)量頁(yè)面,為Baiduspider提供了更友好的網(wǎng)站結(jié)構(gòu),避免了黑洞的形成。
新聞標(biāo)題:如何巧用robots避免蜘蛛黑洞?
標(biāo)題路徑:http://jinyejixie.com/news/98973.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供品牌網(wǎng)站設(shè)計(jì)、云服務(wù)器、虛擬主機(jī)、電子商務(wù)、全網(wǎng)營(yíng)銷(xiāo)推廣、企業(yè)建站
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容