2023-05-03 分類: 網(wǎng)站建設(shè)
一、站內(nèi)優(yōu)化
Robot.txt用法詳解及robot.txt問題匯總
(1)為什么設(shè)置Robots.txt?
在進(jìn)行SEO操作的時(shí)候,我們需要告訴搜索引擎哪些頁(yè)面重要哪些頁(yè)面不重要,重要的頁(yè)面讓蜘蛛進(jìn)行抓取,不重要的頁(yè)面進(jìn)行屏蔽可以減少網(wǎng)站服務(wù)器的負(fù)擔(dān)。
(2)一些常見的問題和知識(shí)點(diǎn)
蜘蛛在發(fā)現(xiàn)一個(gè)網(wǎng)站的時(shí)候,是抓取網(wǎng)站的Robots.txt文件(當(dāng)然官方上是這么說(shuō)的,有時(shí)候也會(huì)出現(xiàn)不遵守的情況);
建議所有的網(wǎng)站都要設(shè)置Robots.txt文件,如果你認(rèn)為網(wǎng)站上所有內(nèi)容都是重要的,你可以建立一個(gè)空的robots.txt文件;
(3)在robots.txt文件中設(shè)置網(wǎng)站地圖
你可以在robots.txt中添加網(wǎng)站的地圖,告訴蜘蛛網(wǎng)站地圖所在的地址。
(4)Robots.txt的順序
在蜘蛛?yún)f(xié)議中,Disallow與Allow是有順序的,這是一個(gè)非常重要的問題,如果設(shè)置錯(cuò)誤可能會(huì)導(dǎo)致抓取錯(cuò)誤。
引擎蜘蛛程序會(huì)根據(jù)個(gè)匹配成功的Allow或Disallow行確定是否訪問某個(gè)URL,一個(gè)例子可以讓你更清楚明白:
User-agent:*2.Allow:/seojc/bbs3.Disallow:/seojc/這個(gè)情況下,蜘蛛/seojc/bbs目錄可以正常抓取,但/seojc/目錄的文件無(wú)法抓取。通過(guò)這種方式可以允許蜘蛛訪問特定目錄中的部分url。
我們對(duì)調(diào)下位置觀察一下。
User-agent:*2.Disallow:/根目錄下的文件夾/3.Allow:/seojc/bbs/seojc/目錄出現(xiàn)在行,禁止抓取目錄下的所有文件,那么第二行的Allow就無(wú)效,因?yàn)樾兄幸呀?jīng)禁止抓取seojc目錄下的所有文件,而bbs目錄正好位于seowhy目錄下。因此匹配不成功。
(5)Robots.txt路徑問題
在蜘蛛?yún)f(xié)議中,Allow和Disallow后面可以跟兩種路徑形式,即鏈接、相對(duì)鏈接。鏈接就是完整的URL形式,而相對(duì)鏈接只針對(duì)根目錄。這是記住。
(6)斜杠問題
Disallow:/seojc表示禁止抓取seoic這個(gè)目錄下的所有文件,如:seojc.1.html、seojc/rmjc.php都不允許抓取;
Disallow:/seojc/表示禁止抓取seojc這個(gè)目錄下的文件,即允許抓取seojc.1.html,但是不允許抓取seojc/rmjc.php。
文章題目:Robot.txt用法詳解及robot.txt問題匯總
分享URL:http://jinyejixie.com/news/257867.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供面包屑導(dǎo)航、響應(yīng)式網(wǎng)站、手機(jī)網(wǎng)站建設(shè)、企業(yè)網(wǎng)站制作、網(wǎng)站導(dǎo)航、ChatGPT
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容