搜索引擎都有自己的“搜索機(jī)器人”(ROBOTS),并通過(guò)這些ROBOTS在網(wǎng)絡(luò)上沿著網(wǎng)頁(yè)上的鏈接(一般是http和src鏈接)不斷抓取資料建立自己的數(shù)據(jù)庫(kù)。 對(duì)于網(wǎng)站管理者和內(nèi)容提供者來(lái)說(shuō),有時(shí)候會(huì)有一些站點(diǎn)內(nèi)容,不希望被ROBOTS抓取而公開(kāi)。為了解決這個(gè)問(wèn)題,ROBOTS開(kāi)發(fā)界提供了兩個(gè)辦法:一個(gè)是robots.txt,另一個(gè)是The Robots META標(biāo)簽。
一、robots.txt 1、什么是robots.txt? robots.txt是一個(gè)純文本文件,通過(guò)在這個(gè)文件中聲明該網(wǎng)站中不想被robots訪(fǎng)問(wèn)的部分,這樣,該網(wǎng)站的部分或全部?jī)?nèi)容就可以不被搜索引擎收錄了,或者指定搜索引擎只收錄指定的內(nèi)容。 當(dāng)一個(gè)搜索機(jī)器人訪(fǎng)問(wèn)一個(gè)站點(diǎn)時(shí),它會(huì)首先檢查該站點(diǎn)根目錄下是否存在robots.txt,如果找到,搜索機(jī)器人就會(huì)按照該文件中的內(nèi)容來(lái)確定訪(fǎng)問(wèn)的范圍,如果該文件不存在,那么搜索機(jī)器人就沿著鏈接抓取。 robots.txt必須放置在一個(gè)站點(diǎn)的根目錄下,而且文件名必須全部小寫(xiě)。 網(wǎng)站 URL 相應(yīng)的 robots.txt的 URL http://www.w3.org/ http://www.w3.org/robots.txt http://www.w3.org:80/ http://www.w3.org:80/robots.txt http://www.w3.org:1234/ http://www.w3.org:1234/robots.txt http://w3.org/ http://w3.org/robots.txt
2、robots.txt的語(yǔ)法 "robots.txt"文件包含一條或更多的記錄,這些記錄通過(guò)空行分開(kāi)(以CR,CR/NL, or NL作為結(jié)束符),每一條記錄的格式如下所示: ":"。 在該文件中可以使用#進(jìn)行注解,具體使用方法和UNIX中的慣例一樣。該文件中的記錄通常以一行或多行User-agent開(kāi)始,后面加上若干Disallow行,詳細(xì)情況如下: User-agent: 該項(xiàng)的值用于描述搜索引擎robot的名字,在"robots.txt"文件中,如果有多條User-agent記錄說(shuō)明有多個(gè)robot會(huì)受到該協(xié)議的限制,對(duì)該文件來(lái)說(shuō),至少要有一條User-agent記錄。如果該項(xiàng)的值設(shè)為*,則該協(xié)議對(duì)任何機(jī)器人均有效,在"robots.txt"文件中, "User-agent:*"這樣的記錄只能有一條。 Disallow : 該項(xiàng)的值用于描述不希望被訪(fǎng)問(wèn)到的一個(gè)URL,這個(gè)URL可以是一條完整的路徑,也可以是部分的,任何以Disallow 開(kāi)頭的URL均不會(huì)被robot訪(fǎng)問(wèn)到。例如"Disallow: /help"對(duì)/help.html 和/help/index.html都不允許搜索引擎訪(fǎng)問(wèn),而"Disallow: /help/"則允許robot訪(fǎng)問(wèn)/help.html,而不能訪(fǎng)問(wèn)/help/index.html。 任何一條Disallow記錄為空,說(shuō)明該網(wǎng)站的所有部
網(wǎng)站建設(shè)中遇到的問(wèn)題,以及“Web標(biāo)準(zhǔn)”思想的產(chǎn)生、發(fā)展和推廣。讓你明白為什么要采用和推廣Web 標(biāo)準(zhǔn)。
第二部分從技術(shù)細(xì)節(jié)上講解了網(wǎng)站實(shí)際制作開(kāi)發(fā)過(guò)程中如何向Web標(biāo)準(zhǔn)過(guò)渡,如何采用和符合Web標(biāo)準(zhǔn)。通過(guò)閱讀本書(shū),你可以清楚一些基本問(wèn)題: Web標(biāo)準(zhǔn)是什么? 網(wǎng)站一定要用標(biāo)準(zhǔn)嗎? 用標(biāo)準(zhǔn)和不用標(biāo)準(zhǔn)的區(qū)別? 如何采用標(biāo)準(zhǔn)? 如何向標(biāo)準(zhǔn)過(guò)渡? 適合什么樣的人看這本書(shū)適合的讀者是:所有的
網(wǎng)站設(shè)計(jì)者、開(kāi)發(fā)者和所有者。 這不是廣告詞。不論對(duì)這一行業(yè)的新手還是資深人士,本書(shū)都將對(duì)你產(chǎn)生深刻影響。它告訴我們?cè)鯓幼鍪钦_的,以及應(yīng)該如何做。也許本書(shū)介紹的思想和技術(shù)你可能不會(huì)馬上接受或貫徹到工作中,但它是Web發(fā)展的趨勢(shì),是阻擋不了的發(fā)展趨勢(shì)。它的重要性已經(jīng)并將繼續(xù)在Web領(lǐng)域體現(xiàn)。 對(duì)我們有什么好處如果你是Web設(shè)計(jì)師、開(kāi)發(fā)者或所有者,如果你正在困惑自己應(yīng)該學(xué)習(xí)什么,怎么做,如果你正在猶豫自己網(wǎng)站的發(fā)展方向,如果你正在想如何把自己提高一個(gè)層次,如果你正在頭疼不斷的網(wǎng)站升級(jí)問(wèn)題,本書(shū)正是你需要的! 它告訴你Web開(kāi)發(fā)的技術(shù)將如何發(fā)展,未來(lái)的Web將是怎樣的??辞宄诉@些,如何發(fā)展網(wǎng)站,自己如何定位就容易得多。
任何書(shū)都有它的價(jià)值所在。如果需要一個(gè)理由購(gòu)買(mǎi)這本書(shū),那么我會(huì)這樣說(shuō):你可以不買(mǎi)這本書(shū),但是本書(shū)的思想和技術(shù)你一定要了解,總有一天你會(huì)需要它,這一點(diǎn)是百分之百肯定的。與其被動(dòng)地、等到迫不得已的時(shí)候再來(lái)了解和學(xué)習(xí),為什么不現(xiàn)在就行動(dòng)? 譯者的感受對(duì)于本書(shū)的作者Jeffrey Zeldman,國(guó)內(nèi)設(shè)計(jì)師和開(kāi)發(fā)者可能并不熟悉,但在國(guó)外,同行無(wú)人不知。他領(lǐng)導(dǎo)的Web標(biāo)準(zhǔn)組織(www.Webstandards.org)幫助終止了Microso ft 與Netscape之間的瀏覽器之戰(zhàn),使得我們不再需要考慮瀏覽器不同版本問(wèn)題。他也是資深的設(shè)計(jì)師,對(duì)網(wǎng)站技術(shù)的歷史和發(fā)展了如指掌。通過(guò)翻譯本書(shū),我們對(duì)Web標(biāo)準(zhǔn)的發(fā)展歷史、Web標(biāo)準(zhǔn)技術(shù)的應(yīng)用進(jìn)行了系統(tǒng)而全面的了解。特別是許多技術(shù)細(xì)節(jié)的來(lái)龍去脈,常常讓我們頓悟:原來(lái)如此! 本書(shū)不像Flash或者Photoshop教程那么有趣,也不像程序語(yǔ)言教材那樣立竿見(jiàn)影,但我們還是決定翻 Disallow: /cgi-bin/
本文題目:網(wǎng)站結(jié)構(gòu)合理的重要性
當(dāng)前URL:http://jinyejixie.com/news14/59364.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供外貿(mào)網(wǎng)站建設(shè)、全網(wǎng)營(yíng)銷(xiāo)推廣、品牌網(wǎng)站制作、做網(wǎng)站、關(guān)鍵詞優(yōu)化、小程序開(kāi)發(fā)
廣告
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶(hù)投稿、用戶(hù)轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀(guān)點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話(huà):028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源:
創(chuàng)新互聯(lián)