說不清楚SEO的爬取收錄和索引？

2014-01-16 分類：網站收錄

你是怎么去學習做seo優(yōu)化的呢?入門第一步是什么還記得嗎?是不是去買一本關于“seo優(yōu)化”的書籍去看，發(fā)現(xiàn)一開端就會講到的根底概念，讓你云里霧里，想要強記下來發(fā)現(xiàn)徹底不能理解?

說不清楚SEO的爬取收錄和索引？

大多數(shù)沒人帶想自學的朋友都會有這樣一個苦楚的開端。而來佛系站長的新人，咱們一般都是安排這些新人從寫文章開端，先寫再講概念，培訓的時候也會多次說到這些概念結合優(yōu)化技巧來講。再翻根底書籍的時候，才會清楚里邊講的究竟是些什么，并且你會發(fā)現(xiàn)，不同的階段看同一本書，感觸會徹底不相同，這就是“溫故而知新”了。

但在這期間也會有新人不按常理出牌，覺得我會這些技巧就行了，為什么還要去理解概念呢?

原因很簡單，概念是技巧描繪的總結和濃縮，它的一個字或兩個字就會代表一個操作。現(xiàn)在您問身邊的優(yōu)化人員，爬行是什么?抓取是什么?索引是什么?收錄是什么?他能描繪的清楚嗎?

當然，并不是說說不清楚就代表他優(yōu)化能力不行，而是他的“輸出”能力不行，也就是不會總結。總結的越精辟也代表他對這塊業(yè)務的理解更深刻。那么今天，佛系站長就帶你來重溫這些根底概念，希望能給初學者和沒有“輸出”主意的朋友提個醒。

爬行是什么?

爬行指的是搜索引擎蜘蛛從已知頁面上解析出鏈接指向的URL，然后沿著鏈接發(fā)現(xiàn)新頁面(也就是鏈接指向的URL)的過程。當然，蜘蛛并不是發(fā)現(xiàn)新URL馬上就爬曩昔抓取新頁面，而是把發(fā)現(xiàn)的URL存放到待抓地址庫中，蜘蛛依照一定順序從地址庫中提取要抓取的URL。

抓取是什么?

抓取是搜索引擎蜘蛛從待抓地址庫中提取要抓的URL，拜訪這個URL，把讀取的HTML代碼存入數(shù)據(jù)庫。蜘蛛的抓取就是像瀏覽器相同打開這個頁面，和用戶瀏覽器拜訪相同，也會在服務器原始日志中留下記載。

索引是什么?

索引指的是將一個URL的信息進行收拾，存入數(shù)據(jù)庫，也就是索引庫，用戶搜索時，搜索引擎從索引庫中提取URL信息并排序展示出來。

收錄是什么?

從搜索引擎視點看，URL被收錄了，也就是這個URL的信息在索引庫中存在。

沒有被抓取的頁面是能夠被索引的

也就是說，蜘蛛沒有拜訪和抓取這個頁面(比方被robots文件制止抓取)，這個頁面卻有信息存在索引庫中，用戶搜索時還能看到。

比方，淘寶整個網站用robots文件制止百度蜘蛛抓取，但沒有用noindex制止索引，所以即便百度沒有拜訪和抓取淘寶頁面，但淘寶許多頁面是被百度索引的，用戶能夠搜到的：

百度從網上那么多鏈接知道淘寶主頁的存在，通過鏈接的錨文字也知道這個頁面標題大概是淘寶之類的，當然更知道百度口碑里的點評數(shù)。所以即便百度蜘蛛沒有抓取淘寶主頁，用戶還是能搜到，并且顯現(xiàn)一些百度知道的信息。

要想百度不能回來淘寶主頁該怎么辦呢?撤銷robots文件的制止抓取，頁面上用noindex制止索引。

被抓取的頁面是能夠不被索引的

最常見的就是上面說過的，頁面頭信息運用noindex制止索引，頁面被抓取，讀到noindex后，不被索引，不會在搜索成果中回來。老頁面新加noindex也不是馬上刪除索引，還會保留索引一段時刻，但不會回來在搜索成果中。

加了noindex的頁面上的鏈接是能夠被跟蹤一段時刻的，但時刻長了，有noindex的頁面搜索引擎或許就不再抓取和索引了，上面的鏈接也就無效了。

還有或許是因為頁面內容是抄襲、轉載、低質量的，搜索引擎雖然抓取了頁面，索引過程中檢測出這些內容問題，被丟棄，沒有被索引。所以頁面沒有被收錄，一般要先查看原始日志，看看是否被抓取過，假如被抓取過，或許是內容質量問題，假如底子沒被抓取，主張先看看網站結構是否有問題。

說了這么多，是不是暈了?別暈別暈，這些對于你做seo優(yōu)化的時候會有許多協(xié)助的，不要以為一個概念是句廢話，實際上是經過前人不停試驗出的總結，最難的是那些沒有界說的當?shù)兀銦o法判定是對是錯。

分享文章：說不清楚SEO的爬取收錄和索引？
瀏覽地址：http://jinyejixie.com/news/5557.html

網站建設、網絡推廣公司-創(chuàng)新互聯(lián)，是專注品牌與效果的網站制作，網絡營銷seo公司；服務項目有網站營銷、網站收錄等

聲明：本網站發(fā)布的內容（圖片、視頻和文字）以用戶投稿、用戶轉載內容為主，如果涉及侵權請盡快告知，我們將會在第一時間刪除。文章觀點不代表本網站立場，如需處理請聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內容未經允許不得轉載，或轉載時需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內容

成人午夜视频全免费观看高清-秋霞福利视频一区二区三区-国产精品久久久久电影小说-亚洲不卡区三一区三区一区

說不清楚SEO的爬取收錄和索引？

說不清楚SEO的爬取收錄和索引？