2021-09-23 分類: 網(wǎng)站建設(shè)
一 搜索引擎如何處理查詢
1,搜索引擎的被動(dòng)行為。
如果用戶根據(jù)自已的意愿在搜索的關(guān)健詞的時(shí)候有加上空格,標(biāo)點(diǎn),那么搜索引擎會(huì)優(yōu)化按用戶的行為進(jìn)行查詢,這個(gè)應(yīng)該很好理解!例如:百度搜索 鄭智化水手與搜索 鄭智化 水手,所返回的結(jié)果會(huì)是不一樣的!可能這個(gè)例子還并不直觀,舉一個(gè)更直觀的例子,分別搜索:鄭智化 學(xué) 和 鄭智 化學(xué)。搜索結(jié)果分別如下圖:
2,搜索引擎的主動(dòng)行為搜索引擎收到用戶的搜索內(nèi)容,會(huì)根據(jù)自已基礎(chǔ)詞典與特殊詞庫(kù)為用戶的查詢進(jìn)行主動(dòng)分詞,如搜索:鄭智化水手,百度會(huì)根據(jù)其搜索詞庫(kù)(猜測(cè)為:人名庫(kù)+歌名庫(kù))智能將鄭智化與水手這兩個(gè)詞分別進(jìn)行查詢,搜索結(jié)果如: 那么如果搜索內(nèi)容中包含同時(shí)中文與英文百度是如何處理的呢百度會(huì)將英文做為單獨(dú)的一塊來(lái)處理,然后英文前后的詞也做為一個(gè)單獨(dú)的塊。試搜索:鄭智化bt下載,結(jié)果如下:
二,搜索引擎如何進(jìn)行分詞與匹配分詞根據(jù)字符串進(jìn)行匹配,最常見(jiàn)的有三種分詞匹配法,分別為:正向大匹配法,反向大匹配法和最短路徑分詞法。
1,什么是正向大匹配法呢
簡(jiǎn)單點(diǎn)說(shuō)就是從左到右進(jìn)行分詞,例如百度:武林外傳說(shuō),武林外傳與傳說(shuō)是兩個(gè)不同的詞,根據(jù)用戶搜索習(xí)慣與詞庫(kù)分析百度會(huì)返回一個(gè)正向大的匹配,也就是分詞為:武林外傳說(shuō)。搜索結(jié)果如下圖:
2,什么是反向大匹配法反向分詞固名思義就是從右向左進(jìn)行分詞了?;氐絼偛诺睦?,百度:鄭智化學(xué),如果按照正向分詞那么我們應(yīng)該得到的分詞結(jié)果是:鄭智化學(xué)。那么百度搜索的結(jié)果為什么卻不是這樣呢而是分成了鄭智 化學(xué)。
3,正反向同時(shí)分詞匹配
而有一種特殊的情況,就是關(guān)健詞前后組合內(nèi)容被認(rèn)為粘性相差不大,而搜索結(jié)果輥也同時(shí)包含這兩組詞的話,百度會(huì)進(jìn)行正反向同時(shí)進(jìn)行分詞匹配,如搜索關(guān)健詞:北京華煙云,返回結(jié)果如下:
4,什么是分詞最少化
指:分出來(lái)的詞數(shù)應(yīng)該是最求最少化,以搜索:武林外傳說(shuō) 為例,理論可以分成:武林 外 傳說(shuō),可是百度只分成了 武林外傳 說(shuō),即能盡量將分組數(shù)減少,能分成兩組的盡量不分成三組!
分享文章:百度分詞理論之標(biāo)題的設(shè)計(jì)實(shí)例解析
標(biāo)題鏈接:http://jinyejixie.com/news/128062.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供App開(kāi)發(fā)、ChatGPT、企業(yè)建站、網(wǎng)站設(shè)計(jì)公司、網(wǎng)頁(yè)設(shè)計(jì)公司、響應(yīng)式網(wǎng)站
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容