robots文件是一個純文本文件,在這個文件中網(wǎng)站管理者可以聲明該網(wǎng)站中不想被robots訪問的部分,或者指定搜索引擎只收錄指定的內(nèi)容。因此,robots的優(yōu)化會直接影響到搜索引擎對網(wǎng)站的收錄情況。
在浙江等地區(qū),都構(gòu)建了全面的區(qū)域性戰(zhàn)略布局,加強發(fā)展的系統(tǒng)性、市場前瞻性、產(chǎn)品創(chuàng)新能力,以專注、極致的服務(wù)理念,為客戶提供成都做網(wǎng)站、成都網(wǎng)站制作、成都外貿(mào)網(wǎng)站建設(shè) 網(wǎng)站設(shè)計制作按需網(wǎng)站策劃,公司網(wǎng)站建設(shè),企業(yè)網(wǎng)站建設(shè),高端網(wǎng)站設(shè)計,網(wǎng)絡(luò)營銷推廣,成都外貿(mào)網(wǎng)站建設(shè)公司,浙江網(wǎng)站建設(shè)費用合理。
1、robots介紹:
搜索引擎機器人又叫搜索蜘蛛,在訪問一個網(wǎng)站時,它會首先檢查該站點根目錄下是否存在robots.txt文件。如果存在,搜索引擎機器人就會按照該文件中的內(nèi)容來確定訪問范圍;如果該文件不存在,那么搜索引擎機器人就會沿著鏈接去抓取。
robots.txt必須放在一個網(wǎng)站的根目錄下,而且文件名必須全部小寫。如:fuwei.cdcxhl.com/robots.txt。
只有在需要禁止抓取某些內(nèi)容時,寫robots.txt才有意義。有的服務(wù)器設(shè)置有問題,robots文件不存在時會返回200狀態(tài)碼及一些錯誤信息,而不是404狀態(tài)碼,這有可能是搜索機器人錯誤解讀robots文件信息,所以建議就算允許抓取所有內(nèi)容,也要建一個空的robots文件。
2、robots寫作語法:
首先我們來看一個范例:fuwei.cdcxhl.com/robots.txt/
user-agent后面為搜索機器人名稱,如果是“*”號,則泛指所有的搜索引擎機器人;Disallow 后面是不允許訪問文件目錄,如果目錄為空則不起任何禁止作用。
下面例舉一些robots.txt的具體用法。
允許所有的搜索機器人訪問,格式如下:
user-agent: *
Disallow:
或者也可以創(chuàng)建一個空的robots.txt文件。
禁止所有搜索引擎訪問網(wǎng)站的任何部分,格式如下:
user-agent: *
Disallow: /
禁止所有搜索引擎訪問網(wǎng)站的某幾個部分,比如需要禁止訪問a、b、c、目錄:
user-agent: *
Disallow: /a/
Disallow: /b/
Disallow: /c/
禁止某個搜索引擎的訪問,如禁止百度訪問:
user-agent: Baiduspider
Disallow: /
只允許某個搜索引擎的訪問,如只對百度訪問
user-agent:?Baiduspider
Disallow:
user-agent: *
Disallow: /
3、robots meta寫法:
另外,有必要進行拓展說明,對robots meta進行一些介紹:
robots meta標簽中沒有大小寫之分,mame=”robots”表示所有搜索引擎,可以針對某個具體搜索引擎寫為:mame=”baiduspider”。content部分有四個指令選項:index、noidex、follow、nofollow,指令間以“,”分離。
index指令告訴搜索引擎機器人抓取該頁面
follow指令表示搜索機器人可以沿著該頁面上的鏈接繼續(xù)抓取下去;
robots meta 標簽的缺省值是index和follow,只有inktomi(早期出現(xiàn)的搜索引擎)除外,對于它,缺省值是index,nofollow。
具體寫法為以下4種:
1、<meta name=”robots”? content=”index,follow”>
2、<meta name=”robots”? content=”noindex,follow”>
3、<meta name=”robots”? content=”index,follow”>
4、<meta name=”robots”? content=”noindex,follow”>
其中<meta name=”robots”? content=”index,follow”>
可以寫成:
<meta name=”robots”? content=”all”>
而:
<meta name=”robots”? content=”noindex,follow”>
可以寫成
<meta name=”robots”? content=”none”>
目前看來,絕大多數(shù)的搜索引擎機器人都遵守robots.txt的規(guī)則,而對于robots meta標簽,目前支持的并不多,但是正在逐漸增加。Googie是完全遵守的。
名稱欄目:robts文件的介紹、寫作語法及robotsmeat標簽的寫法
本文來源:http://jinyejixie.com/article42/chcec.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供小程序開發(fā)、虛擬主機、移動網(wǎng)站建設(shè)、網(wǎng)站改版、響應(yīng)式網(wǎng)站、品牌網(wǎng)站建設(shè)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)