2020-09-03 分類: 網(wǎng)站建設(shè)
HITS(Hyperlink - Induced Topic Search)鏈接分析算法誕生在1997年,該算法是由康奈爾大學(xué)中的一位博士提出,并且該算法沿用于全球多個(gè)搜索引擎當(dāng)中。當(dāng)然,不同的搜索引擎針對(duì)于該算法的側(cè)重點(diǎn)和內(nèi)部公式都有不一的算法結(jié)構(gòu)調(diào)整,并且HITS算法也是鏈接分析中最為重要的基礎(chǔ)算法之一。
對(duì)于目前國(guó)內(nèi)的整體搜索引擎而言,百度作為國(guó)內(nèi)的搜索引擎領(lǐng)頭羊,我會(huì)帶著HITS的公開文檔針對(duì)百度搜索引擎進(jìn)行多元化的角度和實(shí)驗(yàn)來深度解析HITS在SEO中的實(shí)戰(zhàn)應(yīng)用。
首先,我們先來了解一下什么是HITS算法,包括他的計(jì)算公式和算法原理以及他優(yōu)缺點(diǎn)。深刻的理解了這些含義以后,然后我們借助一些特定的實(shí)驗(yàn)來驗(yàn)證HITS的效果和實(shí)用性。
在HITS鏈接分析算法當(dāng)中,闡述最多的兩個(gè)點(diǎn)就是Hub頁(yè)面與Authority頁(yè)面。
一、什么是Authority頁(yè)面(權(quán)威頁(yè)面)
簡(jiǎn)單來說Authority頁(yè)面(權(quán)威頁(yè)面)是指在某一個(gè)領(lǐng)域范圍內(nèi)或者某一個(gè)相關(guān)主題范圍內(nèi)的高質(zhì)量網(wǎng)頁(yè)。比如招聘領(lǐng)域,前程無憂網(wǎng)站的首頁(yè)就是該領(lǐng)域的一個(gè)高質(zhì)量?jī)?yōu)質(zhì)網(wǎng)頁(yè)。比如淘寶首頁(yè)就是電商領(lǐng)域的優(yōu)質(zhì)網(wǎng)頁(yè)。
二、什么是Hub頁(yè)面(樞紐頁(yè)面)
而Hub頁(yè)面(樞紐頁(yè)面)通常就是它頁(yè)面本身包含了很多高質(zhì)量的Authority頁(yè)面的鏈接,比如360網(wǎng)址導(dǎo)航首頁(yè)就是一個(gè)非常好的Hub頁(yè)面(樞紐頁(yè)面)。因?yàn)樵?60網(wǎng)址導(dǎo)航的站點(diǎn)頁(yè)面里面聚合了眾多的不同類型的權(quán)威站點(diǎn)集合,比如新聞板塊聚集了新浪、騰訊等權(quán)威站點(diǎn)。視頻板塊聚集了搜狐視頻、優(yōu)酷視頻等權(quán)威站點(diǎn)。這個(gè)點(diǎn)和大家經(jīng)常發(fā)布的一些分類目錄網(wǎng)站外鏈有點(diǎn)類似(所以為何網(wǎng)站目錄外鏈還存在一定的效果,正是因?yàn)樗阉饕姹旧碛凶约禾赜械乃惴ú艜?huì)影響到你的排名)。
三、HITS算法意義
之所以存在HITS算法,是因?yàn)樗阉饕嫘枰谌蛩ト〉木W(wǎng)頁(yè)文檔集合當(dāng)中找到與用戶搜索請(qǐng)求查詢?cè)~匹配度與之相關(guān)高的頁(yè)面進(jìn)行符合匹配,而這里的匹配度相關(guān)高的則是一些高質(zhì)量的“Authority”頁(yè)面和“Hub”頁(yè)面,而不是大家常常理解的站內(nèi)文章優(yōu)質(zhì)原創(chuàng)等因素。尤其是一些權(quán)威頁(yè)面,搜索引擎更加親耐,因?yàn)檫@類站點(diǎn)頁(yè)面的內(nèi)容會(huì)更加滿足用戶查詢的內(nèi)容。
有很多朋友可能會(huì)問到一個(gè)問題,如何成為權(quán)威頁(yè)面或者樞紐頁(yè)面呢?
其實(shí)樞紐頁(yè)面在前面從概念意義上解釋來說已經(jīng)告訴了大家如何去成為樞紐頁(yè)面。比如360導(dǎo)航網(wǎng)站的某一個(gè)站點(diǎn)類型的聚合頁(yè)面,再比如網(wǎng)站分類目錄站點(diǎn)的某一個(gè)站點(diǎn)類型的聚合頁(yè)面,這些都屬于樞紐頁(yè)面,但是樞紐頁(yè)面也會(huì)分為高質(zhì)量樞紐頁(yè)面和一般性樞紐頁(yè)面。比如360導(dǎo)航網(wǎng)站首頁(yè)不僅是樞紐頁(yè)面并且還是導(dǎo)航站點(diǎn)的權(quán)威頁(yè)面。
那么又如何成為權(quán)威頁(yè)面呢?
這里就會(huì)提到大家想要理解的一個(gè)深層次的東西了,所謂的高權(quán)重外鏈其實(shí)可以理解為高權(quán)威外鏈,即權(quán)重=權(quán)威。搜索引擎針對(duì)每一個(gè)站點(diǎn)和該站點(diǎn)的每一個(gè)頁(yè)面都有一系列的網(wǎng)頁(yè)評(píng)分,而這類評(píng)分決定著頁(yè)面的鏈接是否為有效的信任度。而權(quán)威頁(yè)面往往會(huì)有幾個(gè)特點(diǎn):
1、品牌屬性
不管是某一種類型的站點(diǎn),一旦要想成為行業(yè)的權(quán)威,品牌屬性必定濃厚,這點(diǎn)大家可以從百度搜索引擎的知心算法可以得知。如當(dāng)用戶搜索網(wǎng)上商城會(huì)聯(lián)想到京東、天貓;再如當(dāng)用戶搜索空調(diào)會(huì)聯(lián)想到海爾、格力、美的等知名品牌。正是因?yàn)檫@類品牌屬性,可以讓這類品牌官網(wǎng)站點(diǎn)在某一個(gè)行業(yè)領(lǐng)域形成獨(dú)特的權(quán)威度。但是,對(duì)于搜索引擎而言,這類品牌屬性搜索引擎是感觀不到的,而用戶卻可以知曉。因?yàn)閷?duì)于用戶而言,用戶可以通過報(bào)刊,電視等多媒體方式了解到這些品牌的循環(huán)曝光,從而積累品牌的印象程度。那么搜索引擎是如何計(jì)算出這些品牌屬性的權(quán)威程度呢?針對(duì)搜索引擎來說,搜索引擎會(huì)通過全網(wǎng)抓取技術(shù)檢索全球所有網(wǎng)頁(yè)集合,根據(jù)文檔檢索模型計(jì)算出詞頻,而詞頻計(jì)算出來的相關(guān)詞頻次結(jié)合度高的一類詞就是一個(gè)主題的符合度。通常情況下,是行業(yè)產(chǎn)品詞+品牌詞檢索。
2、歷史屬性
歷史屬性我們可以稱之為信任度屬性,何為信任度屬性,簡(jiǎn)單的理解就是一個(gè)權(quán)威的站點(diǎn)必定是本身的頁(yè)面存在一定的真實(shí)性、可靠性的價(jià)值信任信息,就如百度百科的詞條會(huì)有對(duì)應(yīng)的參考資料來作為參考佐證,從而針對(duì)內(nèi)容進(jìn)行信任度提升。所以即使內(nèi)容不是原創(chuàng),如果頁(yè)面滿足了信任度屬性,你的內(nèi)容一樣非常有價(jià)值,也利于搜索引擎優(yōu)化。信任度屬性除了信息價(jià)值信任之外還有一點(diǎn)就是歷史數(shù)據(jù)積累,這點(diǎn)在老域名站點(diǎn)體現(xiàn)的非常明顯。越老的站點(diǎn)信任度屬性就體現(xiàn)的越明顯,比如做一些灰色產(chǎn)業(yè)或者做醫(yī)療的SEO人員就非常喜歡采用使用過的并且干凈底子的老域名進(jìn)行優(yōu)化效果好。
3、曝光屬性
權(quán)威頁(yè)面除了品牌屬性和歷史數(shù)據(jù)積累等屬性還有一點(diǎn)就是曝光屬性,這類曝光屬性會(huì)包含兩個(gè)大類,其中是站內(nèi)曝光屬性和站外曝光屬性。站內(nèi)曝光屬性可以理解為頁(yè)面收錄量,一般情況下,當(dāng)一個(gè)域名使用了10多年,每天都在充實(shí)著一些主題非常一致的優(yōu)質(zhì)樞紐頁(yè)面的時(shí)候,那么自然而然他的曝光也會(huì)放的很大。而站外曝光屬性就是在整個(gè)互聯(lián)網(wǎng)站點(diǎn)文檔集合里面所體現(xiàn)出你品牌屬性的詞頻集合和關(guān)鍵詞主題一致的文檔數(shù)量,比如闡述淘寶的網(wǎng)頁(yè)相關(guān)結(jié)果數(shù)有X億個(gè)網(wǎng)頁(yè)。而X億張網(wǎng)頁(yè)集合里面和淘寶相關(guān)度最密切的是關(guān)于電商、商城、網(wǎng)購(gòu)等主題行業(yè)詞匯。那么通過歷史屬性的數(shù)據(jù)積累,淘寶站點(diǎn)在電商領(lǐng)域歸屬于權(quán)威站點(diǎn)。
四、HITS算法缺陷
每個(gè)搜索引擎算法都有自己的優(yōu)勢(shì)和缺陷,HITS也不例外,在HITS算法當(dāng)中,有4個(gè)最常見的缺陷,其中包含了計(jì)算效率低、主題漂移、容易作弊和結(jié)構(gòu)不穩(wěn)定。
由于HITS算法是與之查詢相關(guān)的算法,所以不能先計(jì)算,而必須是用戶請(qǐng)求了某一個(gè)搜索詞以后才能去計(jì)算該詞的一些站點(diǎn)文檔匹配度(鏈接評(píng)分板塊),加上HITS算法的計(jì)算屬性需要通過多次的計(jì)算迭代才能最終計(jì)算出檢索結(jié)果的文檔鏈接的推薦度投票,所以導(dǎo)致計(jì)算效率比較低下。
而主題漂移問題則是大家常常可以看到了一些現(xiàn)象,即使我交換的鏈接和我站點(diǎn)主題沒有一條相關(guān),但是也會(huì)促進(jìn)我的頁(yè)面關(guān)鍵詞排名提升。而這種現(xiàn)象正是因?yàn)镠ITS的特殊算法結(jié)構(gòu)才出現(xiàn)了給與這些無關(guān)網(wǎng)頁(yè)很高的排名。最終導(dǎo)致了搜索結(jié)果發(fā)生了主題漂移,而這種現(xiàn)象也稱為“緊密鏈接社區(qū)現(xiàn)象”。
之所以容易用來作弊是因?yàn)镠ITS強(qiáng)調(diào)的比較多的還是樞紐頁(yè)面和權(quán)威頁(yè)面之間的一種相互增強(qiáng)關(guān)系。作弊者可以通過建立新頁(yè)面的形式,并且在新建立的網(wǎng)頁(yè)中加入了很多高質(zhì)量的權(quán)威頁(yè)面鏈接,自身頁(yè)面就會(huì)形成了一個(gè)很好的樞紐頁(yè)面,然后作弊者可以通過該頁(yè)面的一個(gè)權(quán)威樞紐性,再指向作弊網(wǎng)頁(yè)鏈接,從而給與作弊網(wǎng)頁(yè)增加權(quán)威頁(yè)面得分。如下圖所示:
上圖所示的頁(yè)面文檔集合里面包含了4個(gè)導(dǎo)出鏈接,假設(shè)該頁(yè)面是闡述視頻網(wǎng)站排行榜的相關(guān)內(nèi)容信息,而4個(gè)導(dǎo)出鏈接均包含了不同的4個(gè)獨(dú)立的視頻站點(diǎn),其中三個(gè)為已知的權(quán)威站點(diǎn),第二個(gè)站點(diǎn)為我們作弊的站點(diǎn)。而此方式可以用來增加鏈接的投票推薦度。
最后一個(gè)HITS的缺陷在于它的結(jié)構(gòu)不穩(wěn)定,何為結(jié)構(gòu)不穩(wěn)定?簡(jiǎn)單來說就是在原來的網(wǎng)頁(yè)文檔集合里面,如果新增或刪除網(wǎng)頁(yè)鏈接,那么就會(huì)對(duì)HITS算法排名有著非常大的改變。比如大家都知道交換的鏈接除了相關(guān)性還需要講究穩(wěn)定性,卻不知道穩(wěn)定性這個(gè)概念正是因?yàn)镠ITS的缺陷而導(dǎo)致的,如果鏈接一旦不穩(wěn)定,包括鏈接位置變動(dòng)、鏈接被刪除等都會(huì)影響算法結(jié)構(gòu)的重新計(jì)算。從而影響了自身站點(diǎn)的關(guān)鍵詞排名。
五、HITS算法實(shí)戰(zhàn)應(yīng)用(實(shí)驗(yàn))
現(xiàn)在我們到了SEO實(shí)驗(yàn)階段了,說千道萬(wàn)不如實(shí)戰(zhàn)驗(yàn)證。由于文章的特殊性,所以本文只發(fā)布和分析一個(gè)案例。首先我們來了解下實(shí)驗(yàn)步驟!
步驟:
第一步:實(shí)驗(yàn)假設(shè)
假設(shè)一:樞紐頁(yè)面與權(quán)威頁(yè)面均成立(存在這種現(xiàn)象/說法);
假設(shè)二:假設(shè)一個(gè)網(wǎng)站在不操作任何外鏈、站內(nèi)更新、站內(nèi)布局調(diào)整的情況通過HITS算法的邏輯提升排名;
第二步:準(zhǔn)備實(shí)驗(yàn)站點(diǎn)(記錄實(shí)驗(yàn)時(shí)間和站點(diǎn)快照時(shí)間)
1、首先我們準(zhǔn)備了一個(gè)地區(qū)SEO詞排名在23位的站點(diǎn),該站點(diǎn)的該詞排名穩(wěn)定23位超過1一個(gè)月(因?yàn)椴慌懦渌怄?、?nèi)容更新影響排名的下降或者提升),所以該站排名23位空檔穩(wěn)定一個(gè)月+最好。
2、然后我們記錄好站點(diǎn)的快照時(shí)間以及最后更新文章的時(shí)間節(jié)點(diǎn),保證頁(yè)面沒有被蜘蛛抓取更新過和頁(yè)面做過內(nèi)容變動(dòng)(達(dá)到實(shí)驗(yàn)的好效果),如下圖所示:
快照時(shí)間:2017年02月03日 11:42:34
第三步:HITS算法驗(yàn)證(記錄實(shí)驗(yàn)時(shí)間和站點(diǎn)快照時(shí)間)
1、驗(yàn)證方式:Hub樞紐頁(yè)面驗(yàn)證
2、驗(yàn)證詳細(xì)步驟:首先我們知道一個(gè)好的樞紐頁(yè)面里面肯定會(huì)包含一些權(quán)威頁(yè)面或者包含了一些好的樞紐頁(yè)面,那么我們是不可能去加一些百度、新浪這種鏈接給自己做導(dǎo)出的,因?yàn)椴⒉环舷嚓P(guān)性邏輯。那么我們添加的其實(shí)就是排名首頁(yè)的太原SEO站點(diǎn),如下圖所示:
上圖是實(shí)驗(yàn)站點(diǎn)添加的7個(gè)排名在首頁(yè)的太原SEO網(wǎng)站站點(diǎn),并且為了防止頁(yè)面權(quán)重流失,均添加了Nofollow。那么肯定就會(huì)有一個(gè)問題,為何我們要添加首頁(yè)的而不是排名第三頁(yè)或者第五頁(yè)的太原SEO的站點(diǎn)。其實(shí)如果大家往回去思考這個(gè)Hits算法就不難發(fā)現(xiàn)hits所強(qiáng)調(diào)的hub頁(yè)面在某一個(gè)點(diǎn)(領(lǐng)域)上肯定是有權(quán)威性的,并且搜索引擎的目的是為了用戶需求而產(chǎn)生檢索結(jié)果。如果你把排名前10位的站點(diǎn)容納在一個(gè)站點(diǎn)上面,就已經(jīng)告訴了用戶,我的這個(gè)站可以找到你想要的內(nèi)容。并且我這個(gè)站的主題也是“太原SEO”,那么可以更加符合用戶檢索結(jié)果。
第四步:排名統(tǒng)計(jì)(記錄實(shí)驗(yàn)時(shí)間和站點(diǎn)快照時(shí)間)
我們?cè)趤砜匆幌绿砑蛹恿薔ofollow以后的單向鏈接的快照,如下圖所示:
快照更新時(shí)間:2017年02月08日 21:45:06
雖然快照更新。但是排名記錄23位,這個(gè)時(shí)候需要有耐心,因?yàn)榭煺崭虏淮砼琶麜?huì)更新,需要時(shí)間等待,我們用工具每天記錄了該站點(diǎn)“太原SEO”的排名,如下圖所示:
我們可以通過5118大數(shù)據(jù)平臺(tái)看到從2月4日修改鏈接以后直到2月8日快照更新排名都沒有提升過,直到快照更新后的5天時(shí)間,排名發(fā)生了變化,并且中途出現(xiàn)過排名波動(dòng)退檔到原來的位置。然后我們?cè)趤砜匆粡埮琶貓D,如下圖所示:
從2月20日排名回檔在到恢復(fù)以后直到目前文章截稿位置排名一直穩(wěn)定第二頁(yè)。說明整個(gè)實(shí)驗(yàn)操作過程排名提升了10個(gè)位置左右。
第五步:效果評(píng)估與總結(jié)(記錄實(shí)驗(yàn)時(shí)間)
通過整個(gè)的算法原理分析、實(shí)驗(yàn)認(rèn)證,大家可以很清晰的看到利用一些搜索引擎算法去做到一些事情。當(dāng)然這里面可能有會(huì)有人提出質(zhì)疑,一個(gè)實(shí)驗(yàn)會(huì)不會(huì)是巧合,由于類似實(shí)驗(yàn)我操作過不下數(shù)十次,成功率基本上高達(dá)90%,所以幾乎不存在所謂的巧合。但是并不是每個(gè)朋友都可以去這么操作,因?yàn)槔锩嬗泻芏嘈枰⒁獾募?xì)節(jié)。
1、為何我要選擇一個(gè)站點(diǎn)排名在23位去做實(shí)驗(yàn),而不是100后的站點(diǎn)?因?yàn)閺腍its算法本身來說,如果你去采用一個(gè)100以后也就是沒有排名的站點(diǎn)去做實(shí)驗(yàn)操作明顯是有問題的,因?yàn)椴⒉粷M足Hub的要求。搜索引擎認(rèn)可一個(gè)站點(diǎn)需要一定的時(shí)間和信任度,在你網(wǎng)站沒有任何信任度的情況下你去加一些很好的Hub鏈接放到自己的網(wǎng)站上面并不能產(chǎn)生很大的效果。
2、之所以在有排名的情況下去操作是因?yàn)檫@種微調(diào)效果非常好,并且記得加上Nofollow,利于防止權(quán)重流失。
3、如果你的域名是老域名(使用過的老域名站點(diǎn)),那么及時(shí)在沒有排名的情況也可以去進(jìn)行這類實(shí)驗(yàn)操作,因?yàn)槔嫌蛎军c(diǎn)本身就具備一定的信任度,無需讓搜索引擎長(zhǎng)時(shí)間的去評(píng)定頁(yè)面的質(zhì)量(包含了信任度評(píng)分、頁(yè)面價(jià)值評(píng)分等)。
總體來說,在搜索引擎里面,算法其實(shí)有非常多,包括公開的鏈接分析算法就有Hits算法、HillTop算法、SALSA算法、PageRank算法等等,在比如還有文檔檢索模型(包含向量空間模型、概率模型、布爾模型等),在比如還有倒排索引、TF-IDF等,其實(shí)這類算法在百度上都可以找到他們對(duì)應(yīng)的透明的計(jì)算公式(涉及到高等數(shù)學(xué)),如果你能夠前行研讀和深究的話不難發(fā)現(xiàn)一些SEO排名的奧秘所在。
本文題目:SEO深度解讀之HITS鏈接分析算法
URL分享:http://jinyejixie.com/news10/85910.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供靜態(tài)網(wǎng)站、網(wǎng)站排名、建站公司、App開發(fā)、虛擬主機(jī)、網(wǎng)站導(dǎo)航
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容