2016-08-24 分類: 網(wǎng)站建設(shè)
新獲谷歌專利揭示搜索引擎看到實(shí)體
專欄作家成都網(wǎng)站設(shè)計(jì)解釋了最近谷歌的專利,暗示在搜索引擎處理的實(shí)體信息回答問(wèn)題。這可以提供提示如何SEO可以構(gòu)建自己的內(nèi)容被視為相關(guān)。
了解我的人都知道我是一個(gè)大風(fēng)扇的閱讀谷歌專利,或者,當(dāng)我感覺(jué)懶惰,閱讀他們的分析,Bill Slawski在他的博客里, SEO的海。
我也在那些涉及實(shí)體特別感興趣,因?yàn)樗麄兪牵ㄖ辽賹?duì)我來(lái)說(shuō))的定義是谷歌試圖解決的問(wèn)題。作為機(jī)器學(xué)習(xí)的發(fā)展,實(shí)體代表了搜索引擎如何越來(lái)越多地看世界。
在我們挖到這個(gè)谷歌最新的專利2016年12月22日,這是理所當(dāng)然的,讓我們先定義一個(gè)實(shí)體為了確保我們都在同一頁(yè)上。根據(jù)專利,定義如下:
[一] n實(shí)體是一個(gè)事物或概念,是獨(dú)特的,獨(dú)特的,明確的和可區(qū)分的。例如,一個(gè)實(shí)體可以是人、地方、項(xiàng)目、理念、抽象的概念,具體的元素,其他合適的東西,或它們的任意組合。
讓事情變得簡(jiǎn)單,你可以隨便想一個(gè)實(shí)體作為一個(gè)名詞。
另一個(gè)定義是很重要的理解非結(jié)構(gòu)化數(shù)據(jù)這是非常準(zhǔn)確的,在維基百科的定義像這樣的:
非結(jié)構(gòu)化數(shù)據(jù)…是指信息,沒(méi)有一個(gè)預(yù)先定義的數(shù)據(jù)模型或是沒(méi)有組織在一個(gè)預(yù)先定義的方式。
這下我們的皮帶,我們要馬上到專利。本文將結(jié)構(gòu)化的方式,我將包括在斜體專利重要路段的確切措辭,其次是每一節(jié) 意味著什么的一個(gè)解釋。
摘要
方法,系統(tǒng)和計(jì)算機(jī)可讀介質(zhì)提供集體和解。在一些實(shí)施方案中,接收查詢時(shí),其中的查詢相關(guān)的至少部分與實(shí)體類型。一個(gè)或多個(gè)搜索結(jié)果至少部分基于查詢生成。先前生成的數(shù)據(jù)檢索的一個(gè)或多個(gè)搜索結(jié)果的至少一個(gè)搜索結(jié)果相關(guān),包括一個(gè)或多個(gè)在至少一個(gè)搜索結(jié)果對(duì)應(yīng)的實(shí)體類型的實(shí)體引用的數(shù)據(jù)。一個(gè)或多個(gè)實(shí)體引用排名,和一個(gè)實(shí)體的結(jié)果是選擇從一個(gè)或多個(gè)實(shí)體引用至少部分基于排序。要查詢的答案是至少部分地基于實(shí)體結(jié)果提供。
這是一個(gè)不小的摘要描述所包含的全部范圍的專利。就抽象而言,我們要看到的是,實(shí)體獲得排名,而排名確定一個(gè)查詢的答案。
這是足以吸引我的專利,它的確是準(zhǔn)確,但你很快就會(huì)看到,有很多描述的不是簡(jiǎn)單的“我們排名的名詞。”
概要
以下摘錄 都包含在該專利的摘要部分。
2節(jié)
[一] 系統(tǒng)依靠實(shí)體引用確定的基礎(chǔ)與搜索結(jié)果相關(guān)的非結(jié)構(gòu)化數(shù)據(jù)提供自然語(yǔ)言搜索查詢的答案。…[不]他系統(tǒng)獲取額外信息,例如預(yù)處理相關(guān)的至少一些搜索結(jié)果…附加信息包括各自的網(wǎng)頁(yè),在網(wǎng)頁(yè)中出現(xiàn)的人的名字。在一個(gè)例子中,為了回答“誰(shuí)”的問(wèn)題,該系統(tǒng)將出現(xiàn)在搜索結(jié)果的前十名,在附加信息識(shí)別。該系統(tǒng)識(shí)別最常出現(xiàn)的名字作為答案…
在摘錄以上,我們開(kāi)始看到背后的系統(tǒng)方法。谷歌是在這里討論的是確定的回答“誰(shuí)”的問(wèn)題的想法,他們將出現(xiàn)在搜索結(jié)果的前10名最常見(jiàn)的名字。
4節(jié)
“[T]他查詢是一種自然語(yǔ)言查詢…排名的一個(gè)或多個(gè)實(shí)體引用,包括基于至少一個(gè)信號(hào)排名排名。在一些實(shí)施方案中,一個(gè)或多個(gè)排序信號(hào)包括頻率的各個(gè)實(shí)體引用的發(fā)生。在一些實(shí)施方案中,一個(gè)或多個(gè)排序信號(hào)包括各實(shí)體引用局部性評(píng)分。在一些實(shí)施方案中,先前生成的數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)。
進(jìn)一步的信息上的方法是在專利概述,我們看到在一個(gè)文檔中使用的 術(shù)語(yǔ)的頻率,可能跨越多個(gè)文件。此外,我們看到,性是一個(gè)關(guān)聯(lián)因素,這是應(yīng)用于非結(jié)構(gòu)化數(shù)據(jù)的方法。
5節(jié)
[問(wèn)]題可供查詢的自動(dòng)化和不斷更新的時(shí)尚。在一些實(shí)施方案中,問(wèn)答可以利用搜索結(jié)果排序技術(shù)。在一些實(shí)施方案中,問(wèn)題的答案可能是基于網(wǎng)絡(luò)的非結(jié)構(gòu)化內(nèi)容自動(dòng)識(shí)別。
在本節(jié)中,我們看到它的鋼筋,問(wèn)題的答案可能是基于搜索結(jié)果或排序法確定,但似乎我們也看到專利擴(kuò)展到包含問(wèn)題的答案基于其他技術(shù)及其在非結(jié)構(gòu)化數(shù)據(jù)的能力,確定答案的自動(dòng)測(cè)定。
專利美國(guó)2016 / 0371385 A1的真正的肉
部分14至96 給予詳盡的圖像描述、流程圖和真正的肉類包括本專利。一些圖像將包括以下一些簡(jiǎn)單地指出,這取決于在信息將得到更好的。
19節(jié)
“[T]他系統(tǒng)獲取實(shí)體引用與排名前十的搜索結(jié)果相關(guān)。…和/或選擇排名是根據(jù)質(zhì)量得分,新鮮度得分,相關(guān)性,其他任何合適的信息,或它們的任意組合。
在這里,我們看到谷歌闡明不同類型的實(shí)體和答案可能是基于不同的信息。例如,新鮮度可以作為一個(gè)更強(qiáng)的信號(hào)如果你看天氣,而質(zhì)量可能如果你正在尋找一個(gè)定義更強(qiáng)壯,健康信息等。
20節(jié)
我得承認(rèn),我讀了一本第幾次完全掌握他們?cè)谡務(wù)撌裁?。本?jié)涉及的專利圖1,如下:
一個(gè)問(wèn)答按照目前披露的一些實(shí)現(xiàn)高水平的系統(tǒng)框圖。
一個(gè)高層次的系統(tǒng)的框圖問(wèn)答,按照一些實(shí)現(xiàn)本發(fā)明的。
他們寫(xiě)的:
[從實(shí)體引用110與一個(gè)特定的網(wǎng)頁(yè)相關(guān)的檢索]他信息列表出現(xiàn)在網(wǎng)頁(yè)的人。例如,一個(gè)特定的網(wǎng)頁(yè)可能包括一些人名,和實(shí)體引用110可以包括一個(gè)列表的名稱包含在網(wǎng)頁(yè)。實(shí)體引用110也包括其他信息。在一些實(shí)施方案中,實(shí)體引用110包括實(shí)體引用不同的類型,例如,人,地方,和日期。在一些實(shí)施方案中,多個(gè)實(shí)體類型的實(shí)體引用作為一個(gè)單一的實(shí)體引用注釋列表維護(hù),作為分隔的列表,在任何其他合適的格式的信息,或它們的任意組合。這可以理解,在一些實(shí)施方案中,實(shí)體引用110和108指數(shù)可能存儲(chǔ)在一個(gè)單一的指標(biāo),多指標(biāo),在任何其他適用的結(jié)構(gòu),或它們的任意組合。
背后的想法是他們這里指的是在專利在其他地方重復(fù)。其中一個(gè)大問(wèn)題,我想到在閱讀該專利是巨大的處理能力要。如果任何實(shí)體搜索需要運(yùn)行在它自己的索引的查詢引擎,過(guò)程的前10個(gè)結(jié)果,然后確定哪些條款經(jīng)常被用來(lái)建立一個(gè)問(wèn)題最可能的答案,一個(gè)搜索結(jié)果,這樣的處理會(huì)把更多資源。
在20節(jié)中,他們討論了這個(gè)方法,這是預(yù)設(shè)的參考文獻(xiàn)列表(圖110)從指標(biāo)本身分開(kāi)。
所以,當(dāng)一個(gè)查詢像“dave davies是誰(shuí)”時(shí),數(shù)據(jù)是從指標(biāo)得出(確定有答案的可能,但第二頁(yè))參考點(diǎn)(110)也表明將包含實(shí)體數(shù)據(jù)(如多少次,“dave davies”是每個(gè)文檔中提到的),從而節(jié)省了谷歌需要算出它的飛行。
21節(jié)
[O] NE或更多的排名指標(biāo)是用來(lái)實(shí)體引用的排名,包括發(fā)生頻率和話題性評(píng)分。發(fā)生頻率涉及次實(shí)體引用出現(xiàn)的次數(shù),一個(gè)特定的文件內(nèi),收集的文件,或其他內(nèi)容。地區(qū)性的評(píng)分包括實(shí)體引用和它的內(nèi)容之間的關(guān)系。
撇開(kāi)對(duì)術(shù)語(yǔ)的使用次數(shù)的重復(fù)作為一個(gè)指標(biāo),在這一節(jié)中我們也看到一個(gè)強(qiáng)化的時(shí)效性。雖然這可能涉及到一個(gè)網(wǎng)站的主題和加權(quán)參考應(yīng)該有關(guān)聯(lián),我傾向于相信這更多的是有助于理解實(shí)體引用。
例如,如果實(shí)體的“dave davies”是一個(gè)相關(guān)的SEO頁(yè)面看到,那可能是我。另一方面,如果“戴夫戴維斯”出現(xiàn)在一個(gè)與音樂(lè)有關(guān)的頁(yè)面,這可能是“問(wèn)題人”(我喜歡稱他)。
看到更多的“dave davies”音樂(lè)的主題相關(guān)的網(wǎng)頁(yè)會(huì)幫助他們?cè)谶x擇顯示:
谷歌的結(jié)果,誰(shuí)是dave davies
25節(jié)
“[T]他系統(tǒng)訂單,基于一個(gè)或多個(gè)質(zhì)量分?jǐn)?shù)的搜索結(jié)果。在一些實(shí)施方案中,質(zhì)量分?jǐn)?shù)包括相關(guān)的搜索查詢,與搜索結(jié)果相關(guān)的質(zhì)量得分,一個(gè)數(shù)據(jù)的時(shí)候,內(nèi)容最后生成或更新相關(guān)的新鮮度評(píng)分,與特定的搜索結(jié)果以前的選擇從一系列的搜索結(jié)果評(píng)分,其他合適的質(zhì)量分?jǐn)?shù),或任何組合。在一個(gè)例子中,一個(gè)與搜索結(jié)果相關(guān)的質(zhì)量得分可能包括鏈接的數(shù)量和相應(yīng)的網(wǎng)頁(yè)。
在25節(jié)中,我們看到更多的質(zhì)量評(píng)分澄清作為度量。這一部分,當(dāng)然,也包括 不只是其參考的鏈接作為一個(gè)質(zhì)量指標(biāo),而且導(dǎo)出鏈接包含作為一個(gè)可能的信號(hào)。
28節(jié)
“[T]他系統(tǒng)生成一個(gè)集實(shí)體引用出現(xiàn)在網(wǎng)頁(yè)通過(guò)結(jié)構(gòu)化或非結(jié)構(gòu)化的文本中的一個(gè)已知的實(shí)體引用,例如一個(gè)名單。在一些實(shí)施方案中,實(shí)體引用先前不知道的基礎(chǔ)上發(fā)生的頻率或其他聚類技術(shù)鑒定。在一些實(shí)施方案中,實(shí)體引用人實(shí)體引用,例如,出現(xiàn)在一個(gè)網(wǎng)頁(yè)的文本的人的名字。在一個(gè)例子中,系統(tǒng)維護(hù)一個(gè)列表中的所有在一個(gè)特定的網(wǎng)頁(yè)中出現(xiàn)的人的名字,并列表檢索網(wǎng)頁(yè)時(shí),出現(xiàn)在搜索結(jié)果的頂部結(jié)果206盒。
在28節(jié)中,我們看到的理解出來(lái),不是所有的實(shí)體都是已知的,和開(kāi)發(fā)方法需要了解新的。這就首先提到在互聯(lián)網(wǎng)上一個(gè)人發(fā)生,新建筑的開(kāi)發(fā)等。谷歌將利用其了解其他實(shí)體的引用(例如,位置在頁(yè)面)開(kāi)始添加新的實(shí)體,實(shí)體引用列表(見(jiàn)“110”在上面的圖1)。
36節(jié)
在一些實(shí)現(xiàn)中,系統(tǒng)處理的網(wǎng)頁(yè)和其他內(nèi)容的識(shí)別實(shí)體引用。在一些實(shí)施方案中,系統(tǒng)進(jìn)行離線處理,這樣在搜索的時(shí)候獲得。在一些實(shí)施方案中,該系統(tǒng)處理信息的實(shí)時(shí)搜索的時(shí)間。
在36節(jié)中,我們看到系統(tǒng)論述適應(yīng)更快的結(jié)果通過(guò)離線處理,我們看到在20節(jié)早些時(shí)候。我們也看到參考系統(tǒng),實(shí)時(shí)操作。顯然,有查詢類型,就需要這個(gè)(天氣),和一個(gè)可以認(rèn)為谷歌將有可靠來(lái)源的這類信息的列表,使他們?nèi)匀惶幚硇畔⒀杆?,以最少的資源。
37節(jié)
[我]是條目包括實(shí)體引用,一個(gè)獨(dú)特的標(biāo)識(shí)符和實(shí)體引用相關(guān)的實(shí)體引用的頻率發(fā)生,在實(shí)體引用出現(xiàn)的頁(yè)的位置,與內(nèi)容如新鮮和訂購(gòu)相關(guān)的元數(shù)據(jù),其他任何適用的數(shù)據(jù),或它們的任意組合。在一些實(shí)施方案中,先前產(chǎn)生的數(shù)據(jù)可能包括類型的實(shí)體引用,例如,一個(gè)人,一個(gè)地點(diǎn),日期,任何其他適合的類型,或它們的任意組合。在一些實(shí)施方案中,先前生成的數(shù)據(jù)包括識(shí)別實(shí)體作為一個(gè)特定類型的信息,如人的實(shí)體引用,一個(gè)實(shí)體引用,或一次實(shí)體引用。在一些實(shí)施方案中,多個(gè)數(shù)據(jù)集可以為網(wǎng)站或其他內(nèi)容,其中每一組都與一個(gè)或多個(gè)類型相關(guān)。在一個(gè)例子中,一個(gè)網(wǎng)站可以與表人的實(shí)體引用發(fā)生和列表的位置發(fā)生的相關(guān)實(shí)體引用。
對(duì)于那些好奇的不同的實(shí)體將被孤立,我們這里有我們的答案,他們?cè)谀抢镉懻?ldquo;唯一標(biāo)識(shí)符”實(shí)體。這是,而不是思維的問(wèn)題,Dave Davies Dave Davies,筆者這篇文章,為“Dave Davies的兩個(gè)版本,谷歌會(huì)認(rèn)為我們有一個(gè)相同的屬性標(biāo)識(shí)符。
你或我都會(huì)想到他們的名字的人,谷歌不會(huì);他們會(huì)認(rèn)為他們的獨(dú)特的、可能的字母數(shù)字、序列。我會(huì)說(shuō)明下文,但在其最簡(jiǎn)單的形式,它可能看起來(lái)像:
Unique ID(0000000 1A)–>的名字(Dave Davies)->工作(音樂(lè)家)
和
Unique ID(0000000 1b)–>的名字(Dave Davies)->工作(SEO)
過(guò)去,這一部分主要強(qiáng)調(diào)認(rèn)識(shí)SEO和關(guān)聯(lián)性強(qiáng)化因素如實(shí)體使用頻率,對(duì)內(nèi)容、鏈接的網(wǎng)頁(yè)的位置,等等。
38節(jié)
[阿]他們的名字或內(nèi)容發(fā)生實(shí)體引用,可以用來(lái)消除歧義的參考。在一個(gè)例子中,[喬治·華盛頓]的名字出現(xiàn)在同一個(gè)文本,[ Martha Washington ]可能會(huì)被認(rèn)定為與列表中的美國(guó)總統(tǒng)的一個(gè)獨(dú)特的實(shí)體引用,而[喬治·華盛頓]發(fā)生在同樣內(nèi)容的[大學(xué)]和[華盛頓D.C. ]是關(guān)于[喬治華盛頓大學(xué)]。
在這一部分中,我們進(jìn)一步看到實(shí)體是如何通過(guò)上下文理解。當(dāng)有兩個(gè)或更多的實(shí)體具有類似名稱的屬性、專利概述從頁(yè)的附加數(shù)據(jù)以幫助確定具體的實(shí)體的使用被引用。
用我的例子,一提到“Dave Davies”的頁(yè)面上出現(xiàn)“扭結(jié)”而不是0000000磅副Dave Davies獨(dú)特的ID 0000000 1A以上。
41節(jié)
另一個(gè)例子中,系統(tǒng)通過(guò)將出場(chǎng)的文檔或任何其他合適的度量長(zhǎng)度決定了頻率。
老實(shí)說(shuō),包括我的一部分41節(jié)在這寫(xiě)的是,這可能是我最后一次能夠參考關(guān)鍵字密度作為一個(gè)沒(méi)有背景”在本世紀(jì)初的度量的唯一原因。”
有趣的是,這正是他們?cè)谶@里,在這方面確實(shí)有道理。如果是用在排名前10位的結(jié)果作為一個(gè)問(wèn)題的答案的一個(gè)指標(biāo)參考實(shí)體的頻率,我們應(yīng)該考慮到一個(gè)10000字的頁(yè)面應(yīng)該有不同的影響,數(shù)量比一頁(yè),700字。
盡管如此,你可能從來(lái)沒(méi)有讀過(guò)或聽(tīng)到的唯一ID 0000000 1b再次關(guān)鍵詞密度參考。
42節(jié)
“[T]他系統(tǒng)使用性評(píng)分作為排名的信號(hào)。在一些實(shí)施方案中,地區(qū)性的評(píng)分包括新鮮,文檔的年齡,鏈接的數(shù)量和/或文件,在以前的搜索結(jié)果的文檔選擇的號(hào)碼,有實(shí)力的文檔和查詢之間的關(guān)系,任何其他合適的分?jǐn)?shù),或它們的任意組合。在一些實(shí)施方案中,一個(gè)地區(qū)性的分?jǐn)?shù)取決于實(shí)體引用,其中實(shí)體引用出現(xiàn)的內(nèi)容之間的關(guān)系。例如,實(shí)體引用[喬治·華盛頓]可能有較高的地區(qū)性得分在歷史網(wǎng)頁(yè)比當(dāng)前的新聞網(wǎng)頁(yè)。另一個(gè)例子中,實(shí)體引用[巴拉克奧巴馬] 可能在政治網(wǎng)站有較高的地區(qū)性得分比在法學(xué)院網(wǎng)站。
在本節(jié)中,我們看到谷歌澄清性意味著什么,它的影響將會(huì)對(duì)結(jié)果。這將不是一個(gè)特定的實(shí)體的選擇一個(gè)答案(例如, 選擇Dave Davies被引用)更多的是在什么樣的數(shù)據(jù)是用來(lái)制作答案。
例如,他出生的八個(gè)孩子最后不是局部相關(guān)足以被包括在“誰(shuí)是dave davies”,如上圖所示的答案,而是信息如他的出生日期和樂(lè)隊(duì)。所有這些信息是準(zhǔn)確的,但由于地區(qū)性信號(hào)如頻率在文件,更“重要”的信息選擇。
47節(jié)
47節(jié)是最重要的人物要想真正了解谷歌是如何回答問(wèn)題的邏輯和數(shù)據(jù)組織。所以在我們開(kāi)始寫(xiě)的是什么,讓我們?cè)诶涌?。注意紅色文字不是最初的專利部分已經(jīng)加入由我來(lái)提供上下文是很重要的。
通過(guò)數(shù)據(jù)圖包含按照節(jié)點(diǎn)和邊與本發(fā)明的一些實(shí)現(xiàn)
每個(gè)包含一塊或數(shù)據(jù)塊的邊緣節(jié)點(diǎn)代表包含在邊緣連接的節(jié)點(diǎn)的數(shù)據(jù)之間的關(guān)系。在一些實(shí)施方案中,圖中包括一對(duì)或多對(duì)一個(gè)邊緣連接的節(jié)點(diǎn)。的邊緣,這樣的圖,可以引導(dǎo),即單向的,無(wú)向的,即雙向的,或兩者兼而有之,即一個(gè)或一個(gè)以上的邊緣可以向和一個(gè)或多個(gè)邊緣可能在同一個(gè)圖有方向性。
節(jié)點(diǎn)的引用是圓形元素和包含數(shù)據(jù);線邊緣和包含關(guān)系。例如,Dave Davies(402)的兄弟Ray Davies(404),都有帶扭結(jié)(408)。
這個(gè)圖很簡(jiǎn)單容易理解。在現(xiàn)實(shí)中,這些節(jié)點(diǎn)將是獨(dú)特的ID,這些ID將元素”的名字”,但我們的目的在這里,上面的插畫(huà)作品。
52節(jié)
一個(gè)領(lǐng)域是指一組相關(guān)的實(shí)體類型。例如,域[電影]可能包括,例如,實(shí)體類型[演員],[導(dǎo)演]、[拍攝地點(diǎn)],[電影],任何其他適用的實(shí)體類型,或它們的任意組合。在一些實(shí)施方案中,實(shí)體與多個(gè)域類型相關(guān)。例如,實(shí)體結(jié)[本杰明·富蘭克林]可能與實(shí)體類型節(jié)點(diǎn)[政客]域中的[政府]以及[創(chuàng)造者]實(shí)體型節(jié)點(diǎn)在域[企業(yè)]。
在本節(jié)中,我們看到的信息進(jìn)一步分組域。合理的,我們可以假設(shè)大多數(shù)或所有域也會(huì)在其他的應(yīng)用程序節(jié)點(diǎn)。“基努里維斯,”為例,將一個(gè)節(jié)點(diǎn)連接到另一個(gè)節(jié)點(diǎn)”的電影“邊緣”的行為。” 這兩節(jié)點(diǎn)將包含域中的“電影”。
56節(jié)
“[T]他知識(shí)圖可以包括分化和條款和/或?qū)嶓w消歧信息。本文所使用的分化指的是多對(duì)一的情況下,多個(gè)名字都與一個(gè)單一的實(shí)體關(guān)聯(lián)。本文所使用的消歧義是指一對(duì)多的情況下,相同的名字與多個(gè)實(shí)體關(guān)聯(lián)。在一些實(shí)現(xiàn)中,節(jié)點(diǎn)可以被分配一個(gè)獨(dú)特的識(shí)別標(biāo)準(zhǔn)。在一些實(shí)施方案中,獨(dú)特的識(shí)別可以參考一個(gè)字母數(shù)字字符串,一個(gè)名字,一個(gè)數(shù)字,二進(jìn)制代碼,任何其他合適的標(biāo)識(shí)符,或它們的任意組合。獨(dú)特的識(shí)別參考可以讓系統(tǒng)分配唯一的參考節(jié)點(diǎn)具有相同或相似的文本標(biāo)識(shí)符。在一些實(shí)施方案中,獨(dú)特的標(biāo)識(shí)符和其他技術(shù)用于分化,消歧,或兩者。
在56節(jié)中,我們得到了澄清的分化(解決的情況下,有很多的名字,一個(gè)實(shí)體 例如:電影,電影,電影)和消歧(解決方案有一個(gè)名字由多個(gè)實(shí)體–例如:Dave Davies分享)。
我們說(shuō)的話的唯一標(biāo)識(shí)符和其使用的部分??傊悴皇悄?,沒(méi)有實(shí)體本身是在我們溝通。每個(gè)實(shí)體都是一個(gè)獨(dú)特的身份,和唯一的ID分配給節(jié)點(diǎn),包括常見(jiàn)的參考資料,如姓名和特征。
58節(jié)
[不]在這里可能是城市[費(fèi)城]相關(guān)實(shí)體的節(jié)點(diǎn),對(duì)電影[費(fèi)城]相關(guān)實(shí)體的節(jié)點(diǎn),和奶油奶酪品牌[費(fèi)城]相關(guān)實(shí)體節(jié)點(diǎn)。每一個(gè)節(jié)點(diǎn)可以有一個(gè)獨(dú)特的識(shí)別依據(jù),存儲(chǔ)例如數(shù)、消歧在知識(shí)圖。在一些實(shí)施方案中,在知識(shí)圖的消歧的連接和節(jié)點(diǎn)之間的關(guān)系提供了。例如,城市[紐約]可以消除從國(guó)家[紐約]因?yàn)槌鞘惺沁B接到一個(gè)實(shí)體類型[城市]和國(guó)家是連接到一個(gè)實(shí)體類型[國(guó)家]。它可以理解,更復(fù)雜的關(guān)系也可以定義并區(qū)分節(jié)點(diǎn)。例如,一個(gè)節(jié)點(diǎn)可以通過(guò)相關(guān)的類型定義,其他實(shí)體的特殊性質(zhì)與它的連接,通過(guò)它的名稱,任何其他適合的信息,或它們的任意組合。這些連接可能有助于消除歧義,例如,節(jié)點(diǎn)[格魯吉亞]是連接到節(jié)點(diǎn)[美國(guó)]可以理解代表美國(guó)國(guó)家,而節(jié)點(diǎn)[格魯吉亞]連接到節(jié)點(diǎn)[亞洲]和[東]可以理解為代表的東歐國(guó)家。
在第58節(jié)討論如何具體的實(shí)體可以由節(jié)點(diǎn)和連接識(shí)別,真正重要的是,這是一種他們將決定哪個(gè)答案更可能是正確的。本文將結(jié)合節(jié)點(diǎn),在這一部分,討論的領(lǐng)域,如前面所討論的。如果我問(wèn)谷歌的問(wèn)題:
“誰(shuí)是費(fèi)城?“
谷歌了解到,根據(jù)問(wèn)題的類型最有可能的參考(我尋找的人)是電影“費(fèi)城”。它可能是一個(gè)去過(guò)的城市,所有已知的人的名單的回答,但它的 可能就是我想要的信息。因此,谷歌提供了基于電影的答案。如果我改變我的問(wèn)題:
“有多少人在費(fèi)城?“
答案是谷歌給出的是155萬(wàn)3000。它可以用在電影的演員總數(shù)的回答,但它選擇了什么感覺(jué)是最有可能的答案是尋求基于實(shí)體和被尋找的數(shù)據(jù)幀。
61節(jié)
【N】頌歌和邊緣的實(shí)體類型定義節(jié)點(diǎn)與其性能之間的關(guān)系,從而定義一個(gè)模式。
在這里,我們看到谷歌基本上把非結(jié)構(gòu)化數(shù)據(jù)到一個(gè)結(jié)構(gòu)通過(guò)創(chuàng)建自己的模式的邊和節(jié)點(diǎn)在以前的定義。這將使谷歌的人產(chǎn)生自己的圖式(例如)不斷調(diào)整、添加和刪除與之相關(guān)的圖式。
68節(jié)
[的]各自的知識(shí)圖保持各自不同的領(lǐng)域,不同的各自的實(shí)體類型,或根據(jù)任何其他合適的界定特征。
在本節(jié)中,我們看到谷歌針對(duì)不同類型的數(shù)據(jù)創(chuàng)建知識(shí)圖的不同類型。這是不同的,框架基于信息所要求的類型的答案。我們會(huì)到為什么這是重要的下面。
還等什么?
現(xiàn)在我們已經(jīng)進(jìn)入了信息的關(guān)鍵位結(jié)束,你可能會(huì)問(wèn), ”怎么樣?“好的問(wèn)題。
在了解谷歌如何組織數(shù)據(jù),本身是一件好事,有具體的可操作的項(xiàng)目我們可以帶走這可以顯著提高我們的排名和相關(guān)性。部分是,他們不努力,實(shí)際上并不需要太多的努力 只是了解你想要什么。
包括數(shù)據(jù)讓你有關(guān)。好的, 現(xiàn)在我要脫下我的“隊(duì)長(zhǎng)”的帽子,指出,如果我們只看現(xiàn)場(chǎng)回答來(lái)自什么數(shù)據(jù)有實(shí)體,我們可以更了解谷歌找到相關(guān)的特定主題。而谷歌要給一個(gè)答案,他們也希望他們的用戶有機(jī)會(huì)獲得更完整的數(shù)據(jù),如果需要的話。因此,他們將更可能排名的網(wǎng)站,而不只是他們想要的答案,但可能支持信息的搜索也可以找。
創(chuàng)建結(jié)構(gòu)化的非結(jié)構(gòu)化的數(shù)據(jù),而這顯然是理想的使用標(biāo)記 構(gòu)造你的數(shù)據(jù)引擎,它也是重要的框架內(nèi)容等信息可以連接沒(méi)有它。谷歌希望通過(guò)內(nèi)容來(lái)確定自己的連接,所以使用語(yǔ)句如“Dave Davies是一個(gè)吉他手扭結(jié)”將幫助谷歌了解具體是哪個(gè)Dave Davies你指的是什么,他的角色是誰(shuí),作用是。語(yǔ)句如“扭結(jié)”Dave Davies將有可能達(dá)到正確的實(shí)體;然而,數(shù)據(jù)將不會(huì)被視為全面完成。 好的谷歌,因?yàn)樗麄兛梢栽谄渌胤将@得的信息。不過(guò),如果我們想要好的排名,我們應(yīng)該努力 徹底。
和更多的結(jié)構(gòu),這是之前所說(shuō)的,這個(gè)專利了,我們需要尋找的方式傳遞知識(shí)和我們自己的數(shù)據(jù)結(jié)構(gòu)。如果你看了這個(gè)問(wèn)題的答案,“誰(shuí)是dave davies”上面,你會(huì)發(fā)現(xiàn)答案是段落格式。如果我們考慮專利,我們會(huì)認(rèn)為這是谷歌是如何連接這些類型的查詢實(shí)體之間的點(diǎn)。因此,如果我們有Dave Davies的一頁(yè),我們要結(jié)構(gòu)信息在段落格式而不是列表。這是不同于“我如何…”式的查詢,往往采取列舉他們的答案格式。這是在68節(jié)討論的,它將影響的不只是我們的排名問(wèn)題答案的能力,而且谷歌如何解釋我們的網(wǎng)站,我們的內(nèi)容結(jié)構(gòu)的有效性。
結(jié)論
實(shí)體,在我如此卑微的意見(jiàn),了解谷歌的算法最重要的一個(gè)方面,而這項(xiàng)專利增加了理解。理解實(shí)體是如何理解谷歌的看法它遇到的每件事物之間的聯(lián)系。這有助于決定你應(yīng)該如何組織你的內(nèi)容(這樣的內(nèi)容應(yīng)該包括)被視為不相關(guān),但最相關(guān)的。
分享文章:新獲谷歌專利揭示搜索引擎看到實(shí)體
標(biāo)題鏈接:http://jinyejixie.com/news6/21106.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供動(dòng)態(tài)網(wǎng)站、域名注冊(cè)、Google、手機(jī)網(wǎng)站建設(shè)、品牌網(wǎng)站設(shè)計(jì)、網(wǎng)站設(shè)計(jì)公司
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容