同樣的一本搜索引擎原理書籍,不同的人可能有不同的理解程度,而且一些以前的seo理論雖然已經(jīng)根深蒂固了,但是在目前的seo情況下已經(jīng)不太實(shí)用了,比如一個(gè)收錄問題。其實(shí)想準(zhǔn)確了解索引、收錄、site這些之間的關(guān)系,我們可以從基本的原理出發(fā)去考慮一些問題。
從搜索原理上講,蜘蛛先抓取到一個(gè)網(wǎng)頁的URL,然后對這個(gè)URL對應(yīng)網(wǎng)頁的內(nèi)容進(jìn)行下載、分析,對于符合其質(zhì)量標(biāo)準(zhǔn)或有一定用途的網(wǎng)頁進(jìn)行索引,把索引后的網(wǎng)頁放入索引數(shù)據(jù)庫中。這時(shí)候索引庫內(nèi)的網(wǎng)頁有些具有用戶檢索價(jià)值的,有些是具有搜索引擎自身的檢索價(jià)值的,對于對用戶有檢索價(jià)值的被索引的網(wǎng)頁,會進(jìn)行輸出,也即是我們說的收錄。而對僅僅有搜索引擎自身檢索價(jià)值的網(wǎng)頁可能并不輸出,僅僅有一定的索引量而沒有輸出結(jié)果數(shù),因此我們可以看到很多時(shí)候收錄量會比索引量低很多。
站在搜索的角度而言,一個(gè)網(wǎng)站的網(wǎng)頁數(shù)量有時(shí)候是大于目前所擁有的網(wǎng)頁數(shù)量的。舉例來講,比如一個(gè)站有100個(gè)網(wǎng)頁,對于用戶或者站長而言,是100個(gè)網(wǎng)頁,但是這100個(gè)網(wǎng)頁可能進(jìn)行了數(shù)據(jù)更新,網(wǎng)頁改變等多個(gè)操作,不同版本或許能滿足不同的需求,(因此我們也可以看到很多時(shí)候一個(gè)網(wǎng)頁有不同的快照。)從這個(gè)角度而言,在搜索的眼中一個(gè)網(wǎng)站的網(wǎng)頁數(shù)量是可以大于網(wǎng)站目前所擁有的輸出網(wǎng)頁數(shù)量的,特別對于頻繁修改的網(wǎng)站或者URL不規(guī)范的站點(diǎn)。同時(shí),站在搜索引擎的數(shù)據(jù)角度而言,其數(shù)據(jù)量可能由歷史數(shù)據(jù)和更新數(shù)據(jù)等組成的,因此site相關(guān)結(jié)果值也大于site結(jié)果數(shù)。
依據(jù)上面的說法,我們把四者的關(guān)系重新梳理下:
索引量和收錄量:索引量是所有對搜素有價(jià)值頁面的集合,這些頁面有些對用戶有價(jià)值,把這些頁面輸出出來就是收錄量(不同的人可能定義不一樣),有些頁面僅僅對搜索引擎自身有價(jià)值,這些頁面數(shù)量就造成了索引量高于收錄量的數(shù)值。
我們看到一個(gè)問題,相關(guān)結(jié)果數(shù)為215,而site結(jié)果僅僅為40左右,兩者差距甚大。造成期差距的原因可能是有多個(gè)因素造成的,比如有些網(wǎng)頁可能被重復(fù)計(jì)算了,有些網(wǎng)頁雖然被收錄了(檢索價(jià)值是有的)但是頁面質(zhì)量不高(網(wǎng)頁價(jià)值和檢索價(jià)值不是一碼事,網(wǎng)頁檢索價(jià)值僅僅是網(wǎng)頁價(jià)值的一個(gè)基礎(chǔ)而已,而網(wǎng)頁價(jià)值是多個(gè)因素組成的。)
同時(shí)我們也要知道,蜘蛛畢竟是機(jī)器,而且互聯(lián)網(wǎng)上很多網(wǎng)站的網(wǎng)頁數(shù)量在不同地進(jìn)行著變化,一直有新的網(wǎng)頁產(chǎn)生和老網(wǎng)頁的刪除,我們某個(gè)時(shí)候看到的值是一個(gè)大體準(zhǔn)確的值,而并不是100%準(zhǔn)確的。
從包含關(guān)系而言,這四者的關(guān)系大體如下:
索引量大于收錄量,收錄量大于site結(jié)果數(shù),而相關(guān)結(jié)果數(shù)是大于site結(jié)果數(shù)。不過在一般情況下,我們個(gè)人建議采用下面的方法簡化這些關(guān)系:
1,百度索引量=百度收錄量,因?yàn)槭珍浟科鋵?shí)是無法看到的,site結(jié)果數(shù)和相關(guān)結(jié)果值也無法代表收錄量。
2,site直接結(jié)果數(shù)對seo意義和價(jià)值較大,除了可以用site結(jié)果數(shù)來判斷一些頁面價(jià)值外,在收錄上我們建議提高site結(jié)果數(shù)和百度索引量的比值、百度索引量與整個(gè)網(wǎng)站網(wǎng)頁數(shù)量的比值,從這2個(gè)比值入手進(jìn)行seo優(yōu)化和操作。至于其中糾糾結(jié)結(jié)的概念這類的,直接無視就好了。
本文來源于成都網(wǎng)站建設(shè)公司與成都網(wǎng)站設(shè)計(jì)制作公司-創(chuàng)新互聯(lián)成都公司!
本文名稱:索引量、收錄量、site結(jié)果與相關(guān)結(jié)果
標(biāo)題來源:http://jinyejixie.com/news37/323037.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供企業(yè)建站、網(wǎng)站內(nèi)鏈、企業(yè)網(wǎng)站制作、網(wǎng)站維護(hù)、移動網(wǎng)站建設(shè)、網(wǎng)站收錄
廣告
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源:
創(chuàng)新互聯(lián)