2015-11-06 分類: 網(wǎng)站建設(shè)
今天創(chuàng)新互聯(lián)小編為大家深入地分析搜素引擎的工作原理,這對(duì)于更深層地理解seo非常重要,知己知彼才能百戰(zhàn)百勝。一些SEO從業(yè)者總是喜歡講眼光放得非常高,認(rèn)為這些基本理論沒有什么值得研究的價(jià)值,成天幻想著獲得SEO的秘籍,讓網(wǎng)站一夜成名。這是不現(xiàn)實(shí)的,也脫離不SEO的本質(zhì)。
蜘蛛spider并非是動(dòng)物
搜索引擎蜘蛛spider,一個(gè)很形象的名字。把互聯(lián)網(wǎng)比喻成一個(gè)蜘蛛網(wǎng),那么spider就是在網(wǎng)上爬來爬去的蜘蛛。搜索引擎蜘蛛是通過網(wǎng)頁的鏈接地址來尋找網(wǎng)頁,從網(wǎng)站某一個(gè)頁面(通常是首頁)開始,讀取網(wǎng)頁的內(nèi)容,找到在網(wǎng)頁中的其他鏈接地址,然后通過這些鏈接地址尋找下一個(gè)網(wǎng)頁,這樣一直循壞下去,直到把這個(gè)網(wǎng)站所有的網(wǎng)頁都抓取完為止。如果把整個(gè)互聯(lián)網(wǎng)當(dāng)成一個(gè)網(wǎng)站,那么搜索引擎蜘蛛就用這樣方法把互聯(lián)網(wǎng)上所有的網(wǎng)頁都抓取下來。
蜘蛛spider的分類
按照抓取內(nèi)容的不同可以將搜索引擎蜘蛛分為以下幾類。
全文索引
搜索引擎分類部分提到過全文搜索引擎從網(wǎng)站提取信息建立網(wǎng)頁數(shù)據(jù)庫概念。搜索引擎的自動(dòng)信息搜集功能分兩種。一種是定期搜索,即每隔一段時(shí)間(比如Google一般是28天),搜索引擎主動(dòng)派出“蜘蛛”程序。對(duì)一定IP地址范圍內(nèi)的互聯(lián)網(wǎng)網(wǎng)站進(jìn)行檢索。一旦發(fā)現(xiàn)發(fā)現(xiàn)新的網(wǎng)站,它會(huì)自動(dòng)提取網(wǎng)站的信息和網(wǎng)址加入自己的數(shù)據(jù)庫。
另一種是提交網(wǎng)站搜索,即網(wǎng)站擁有者主動(dòng)向搜索引擎提交網(wǎng)址。它在一定時(shí)間內(nèi)(2天到數(shù)月不等)定向向你的網(wǎng)站派出“蜘蛛”程序,掃描你的網(wǎng)站并將有關(guān)信息存入數(shù)據(jù)庫,以備用戶查詢。隨著搜索引擎索引規(guī)則發(fā)生很大變化,主動(dòng)提交網(wǎng)址并不能不保證你的網(wǎng)站進(jìn)入搜索引擎數(shù)據(jù)庫,最好的辦法是多獲得一些外部鏈接,讓搜索引擎有更多的機(jī)會(huì)找到你并自動(dòng)將你的網(wǎng)站收錄。
當(dāng)用戶以關(guān)鍵詞查找信息時(shí),搜索引擎會(huì)在數(shù)據(jù)庫中進(jìn)行搜尋。如果找到與用戶要求內(nèi)容相符的網(wǎng)站,便采特殊的算法---通常根據(jù)網(wǎng)頁中關(guān)鍵詞的匹配程度、出現(xiàn)的位置、頻次、鏈接質(zhì)量--計(jì)算出各網(wǎng)頁的相關(guān)度及排名等級(jí),然后根據(jù)關(guān)聯(lián)度高低,按順序?qū)⑦@些鏈接返回給用戶。這種引擎的特定是搜全率比較高。
目錄索引
目錄索引也稱為“分類檢索”,是因特網(wǎng)上最早提供www資源查詢的服務(wù)。它主要通過搜集和整理因特網(wǎng)的資源,根據(jù)搜索到網(wǎng)頁的內(nèi)容,將其網(wǎng)址分配到相關(guān)分類主題目錄的不同層次的類目之下,形成像圖書館目錄一樣的分類樹形結(jié)構(gòu)索引。目錄索引無須輸入如何文字,只要根據(jù)網(wǎng)站提供的主題分類目錄,層層點(diǎn)擊進(jìn)入,便可查到所需的網(wǎng)絡(luò)信息資源。
它雖然有搜索功能,但在嚴(yán)格意義上,不能被稱為真正的搜索引擎,只是按目錄分類的網(wǎng)站鏈接列表而已。用戶完全可以按照分類目錄找到所需要的信息,不需依靠關(guān)鍵詞進(jìn)行查詢。
與全文搜索引擎相比,目錄索引有許多不同之處。
首先,搜索引擎屬于自動(dòng)網(wǎng)站檢索,而目錄索引則完全依賴手工操作。用戶提交網(wǎng)站后,目錄編輯人員會(huì)親自瀏覽你的網(wǎng)站,然后根據(jù)一套自定的評(píng)判標(biāo)準(zhǔn)甚至編輯人員的主觀印象,決定是否接納你的網(wǎng)站。其次,搜索引擎收錄網(wǎng)站時(shí),只要網(wǎng)站本身沒有違反有關(guān)的規(guī)則,一般都能登錄成功;而目錄索引對(duì)網(wǎng)站的要求則高得多,有時(shí)登錄多次也不不一定成功。尤其像Yahoo這樣的超級(jí)索引,登錄更是困難。
此外,在登錄搜索引擎時(shí),一般不用考慮網(wǎng)站廢分類的問題,而登錄目錄搜索引時(shí)則必須將網(wǎng)站放在一個(gè)最合適的目錄。
最后,搜索引擎中個(gè)網(wǎng)站的有關(guān)信息都是從用戶網(wǎng)頁自動(dòng)提取的,所以從用戶的角度看,我們擁有更多的自主權(quán);而目錄索引則要求必須手工另外填寫的網(wǎng)站信息,而且還有各種各樣的限制。更有甚者,如果工作人員認(rèn)為你提交網(wǎng)站的目錄、網(wǎng)站信息不合適,她可以隨時(shí)對(duì)其進(jìn)行調(diào)整,當(dāng)然事先是不會(huì)和你商量的。
注:搜索引擎與目錄索引有相互融洽參透的趨勢(shì)。一些純粹的全文搜索引擎也提供目錄搜索,如Google就借用opendirectory提供分類查詢,而像Yahoo這些老牌目錄索引則通過與Google等搜索引擎合作擴(kuò)大搜索范圍,在默認(rèn)搜索模式下,一些目錄類搜索引擎首先返回的是自己目錄中匹配的網(wǎng)站,如中國的搜狐、新浪、網(wǎng)易等;而另一些則默認(rèn)的是網(wǎng)頁搜索,如Yahoo,這種引擎的特點(diǎn)是找的準(zhǔn)確率比較高。
元搜索
元搜索引擎接受用戶查詢請(qǐng)求后,同時(shí)在多個(gè)搜索引擎上搜索,并將結(jié)果返回給用戶。著名的元搜索引擎有infospace、dogpile、vivisimo等,中文元搜索引擎中具有代表性的是搜索引擎,在搜索結(jié)果排列方面,有的直接按來源排列搜索結(jié)果,如dogpile;有的則按自定的規(guī)則將結(jié)果重新排列組合,如vivisimo。
分享文章:深度理解搜索引擎工作原理-專業(yè)SEO技術(shù)教程
URL網(wǎng)址:http://jinyejixie.com/news/28326.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供品牌網(wǎng)站制作、品牌網(wǎng)站建設(shè)、全網(wǎng)營(yíng)銷推廣、小程序開發(fā)、App設(shè)計(jì)、營(yíng)銷型網(wǎng)站建設(shè)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容