成人午夜视频全免费观看高清-秋霞福利视频一区二区三区-国产精品久久久久电影小说-亚洲不卡区三一区三区一区

搜索引擎與網頁文本分詞的原理

2023-11-06    分類: 網站建設

對于SEO人員來說,自己工作的主要目標就是搜索引擎,所以深刻理解搜索引擎運行機制有助于我們針對搜索引擎進行優(yōu)化,這就相當于兩國交兵,必須要知道對方的虛實,再分析自己的優(yōu)勢,然后才能夠一舉進兵消滅對方,如果你還不知道對方的虛實,別人以逸待勞,那你失敗是肯定的了!而在分析搜索引擎方面,知道其運行機制和分詞技術是非常重要的一環(huán)!
搜索引擎工作的第一步:提取頁面文字
首先就是抓取頁面的文字,一般而言搜索引擎會把相關關鍵詞的對應文字提取出來,還有就是meta標簽等等,還有就是關鍵詞和描述以及圖片的ATL屬性等等,這個ALT屬性是需要用戶把鼠標對應到圖片上才能夠看到,另外還有就是網頁的相關文本,所以很多FLASH網站在搜索引擎優(yōu)化方面就會吃很多虧,因為沒有很多的文本,而且搜索引擎也不會抓取flash源代碼!所以很多做flash網站優(yōu)化的基本上會再編一套源碼程序,讓相關的文字和內容對應上,這樣才能夠被搜索引擎識別!
搜索引擎工作的第二步:中文分詞技術
當搜索引擎把文字抓取之后,接下來的工作就是將這些文字進行分詞,講一句話分解成一個一個的短語,比如齊天大圣孫悟空這個短語,就會被分成齊天大圣和孫悟空兩個單詞,還比如:楊柳如是冷月這個詞,我們可以通過圖示一下看看這百度和谷歌的分詞區(qū)別!
這兩個搜索結果是不同的,谷歌更傾向于將柳如是當成一個名詞,所以在柳如是貼吧變成了第一個匹配的!而對于百度來說,就直接把這個楊柳如是冷月這個詞分別變成了楊柳,如是和冷月了,所以有關柳如是貼吧卻沒有出現(xiàn)在首頁上,為什么會出現(xiàn)這么明顯的區(qū)別呢?關鍵是谷歌沒有一個專有的詞典,所以匹配方式會有一些區(qū)別,我們要針對不同搜索引擎進行關鍵詞優(yōu)化,在內容上要盡量的靠近關鍵詞,而不能夠讓關鍵詞和內容割裂開來,這樣關鍵詞的排名就很難上去了!
搜索引擎工作的第二步:匹配技術
一:正向匹配,上面的楊柳如是冷月就是正向匹配,這種匹配方式有助于消除歧義,讓搜索出來的結果更加準確,而不會將楊柳如是,變成柳如是了!
二:逆向匹配,這是一種從后往前匹配的方法。
三:大化匹配,比如把美利堅合眾國是自由的,大匹配就成了美利堅合眾國,自由!
四:最小化匹配,依然拿美利堅合眾國是自由的,最小匹配就成了美,利堅,合眾,國,自由了,而在搜索引擎實際分詞過程中,會將這幾種匹配方式進行綜合的運用,不會只會使用其中的一種,搜索引擎的分詞技術最終的目的就只有兩點,我們要奔著這兩點來進行搜索引擎優(yōu)化就能夠有助于提升網站的排名!其一是通過各種匹配的技巧來消除文本中的歧義,讓搜索的詞出來的內容更加的準確和完整!其二就是通過各種匹配方式將一些人名,地名和機構名以及一些從沒有登陸的詞比如口頭禪,流行語等等進行統(tǒng)計,然后將統(tǒng)計的結果和用戶的想要了解的內容進行不同方式的匹配,從而讓用戶獲得自己想要的內容!

當前文章:搜索引擎與網頁文本分詞的原理
轉載注明:http://jinyejixie.com/news7/292757.html

成都網站建設公司_創(chuàng)新互聯(lián),為您提供網站維護網站建設、標簽優(yōu)化網站收錄、網站排名、移動網站建設

廣告

聲明:本網站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)

h5響應式網站建設
沂水县| 赞皇县| 柳州市| 资兴市| 沧州市| 金门县| 喀喇| 宁城县| 明光市| 青冈县| 南宁市| 白朗县| 综艺| 湘西| 习水县| 开江县| 建瓯市| 丹江口市| 黎川县| 阳谷县| 沈阳市| 和平区| 麻栗坡县| 韩城市| 泰兴市| 海城市| 阳西县| 新蔡县| 普定县| 台湾省| 公主岭市| 手游| 依兰县| 全州县| 蕉岭县| 柏乡县| 青浦区| 宁都县| 牡丹江市| 五莲县| 莒南县|