什么是語義圖譜?
網(wǎng)站建設哪家好,找創(chuàng)新互聯(lián)公司!專注于網(wǎng)頁設計、網(wǎng)站建設、微信開發(fā)、成都微信小程序、集團企業(yè)網(wǎng)站建設等服務項目。為回饋新老客戶創(chuàng)新互聯(lián)還提供了郎溪免費建站歡迎大家使用!語義圖譜是一種新的知識表征方法。在語義圖譜里,一條知識是由一個問法+一個知識點+一個主題表示的。
如上圖所示:“什么是彩虹”+“彩虹是氣象中的一種光學現(xiàn)象。當陽光照射到半空中的水珠時,光線被折射及反射,在天空上形成拱形的七彩光譜?!?“彩虹”構成了“什么是彩虹”這條知識。
一個問題的多種表達并不能構成新的知識。“彩虹的定義”+“彩虹是氣象中的一種光學現(xiàn)象。當陽光照射到半空中的水珠時,光線被折射及反射,在天空上形成拱形的七彩光譜?!?“彩虹”不是一條新知識,和“什么是彩虹”這條知識是一條知識。
“彩虹有幾種顏色”+“彩虹有紅橙黃綠青藍紫七種顏色”+“彩虹”構成了一條新知識。
“為什么說彩虹有七種顏色”+“陽光本來就包含這些顏色,混在一起人眼看起來就成白色。彩虹是經(jīng)過陽光折射形成的,顏色變化非常豐富,只不過粗略的說是七種顏色?!?“彩虹”構成了一條新知識。
知識點不變的不是新知識,知識點變化的形成新知識。
一個主題的各個知識點以及關于每個知識點的不同問法,構成了一個主題的語義圖譜。主題可能是個詞,也可能是個句子;可能是個事物,也可能是個過程。
例如:如果把“小雞孵化的過程”作為一個話題,它的知識點就包含“小雞孵化一共需要大約22天時間。”“小雞孵化需要適宜的溫度和濕度,還要重視通風。適當溫度:溫度控制在37.1~37.2℃。適當濕度:濕度控制在70~80%?!薄靶‰u可以進行人工孵化”“小雞孵化選擇好孵化用的種蛋。種蛋的來源必須是優(yōu)質無病害的,然后觀察雞蛋表面,好的雞蛋應該是蛋殼厚薄均勻、顏色正、無破損的。用燈照檢驗時,蛋黃流動性大、蛋內(nèi)有氣泡、個頭畸形等不能列入終種蛋的選擇”等等。針對不同知識點,又可以有各種不同的問法。
怎么構建一個語義圖譜?
第一步:在構建一個語義圖譜時,先要確定一個主題。語義圖譜是圍繞主題建立的,主題是語義圖譜的核心。主題可以是事物,也可以是規(guī)則、過程、事件等等。比如:獅子、彩虹、煤矸石、彩虹、獅子、老王、小雞、煤炭形成的過程、足球比賽的規(guī)則、第二次世界大戰(zhàn)、小雞孵化的過程、足球比賽的規(guī)則、商王朝滅亡的過程、三國演義的故事故事梗概等等都可以是一個主題。
第二步:根據(jù)對本主題的相關描述生成知識點。對一個主題的描述一般是一段文字或者一篇文章。根據(jù)訓練好的模板或者通過人工,對這段文字或者文章進行分割,生成不同的知識點。
不同性質的主題有不同的知識點。比如關于一個人物劉備的知識點應該包含“劉備字玄德,三國時期蜀漢開國皇帝,謚號昭烈皇帝,史家又稱為先主。劉備是漢朝的宗室,漢中山靖王劉勝的后代,是三國時期著名的政治家,221年在成都稱帝,國號漢,史稱蜀或蜀漢。223病逝于白帝城,謚號昭烈帝,廟號烈祖,葬惠陵?!薄皠?23病逝于白帝城,謚號昭烈帝,廟號烈祖,葬惠陵?!薄皠涫侨龂鴷r期蜀漢開國皇帝?!薄皠涫侨龂鴷r期著名的政治家?!钡鹊取τ诘谝粋€知識點的提問方式可能有“劉備是誰”“介紹下劉備”“劉備的簡介”“劉備的生平”等等。
對于一個動物,知識點也是有限的。比如針對“獅子”這個主題的知識點應該包含“獅子(lion)是唯一的一種雌雄兩態(tài)的貓科動物,是地球上力量強大的貓科動物之一,獅子生存的環(huán)境里,其他貓科都處于劣勢。漂亮的外形、威武的身姿、王者般的力量和夢幻般的速度完美結合,贏得了萬獸之王的美譽?!薄蔼{子是哺乳動物貓科豹屬,可分為兩個亞種,非洲獅及亞洲獅?!薄蔼{子原來分布于除了熱帶雨林地區(qū)以外的非洲各地一起南亞和中近東地區(qū),現(xiàn)在除了印度的吉爾以外亞洲其它地方的獅子均已經(jīng)消失,北非也不再有野生的獅子,目前獅子主要分布于非洲撒哈拉沙漠以南的草原上,因此現(xiàn)在基本可以算是非洲的特產(chǎn)?!薄蔼{子是唯一成群生活的貓科動物,雌雄獅在群中分工不同,由母獅捕食?!薄蔼{體重在120—250公斤,體長140—192厘米?!薄皡^(qū)別于其它貓科動物的是雄獅有明顯的鬃毛,為的是相互打斗時起保護頸部的作用。尾端的角質刺也是顯著特征。獅子還是貓科動物中唯一能真正發(fā)出吼叫的動物,吼聲可傳到八九公里以外?!薄蔼{子的視力極佳,在很遠以外就能發(fā)現(xiàn)獵物,集體捕食,速度快且效率高。 ”“獅子主要捕食有蹄類,如:牛羚、大羚羊、斑馬,有時也捕食大象、犀牛?!睂ψ詈笠粋€知識點的問法可能有“獅子喜歡吃什么東西”“獅子主要的捕食對象”“獅子的食性”等等。
第三步:根據(jù)訓練好的模板或者通過人工,對每個知識點從不同角度生成不同的問題。
對于一個知識點,用戶從不同角度會產(chǎn)生不同的問法。比如對于“劉備是三國時期蜀漢開國皇帝”這個知識點,用戶從不同角度的提問可能有“劉備是什么時期的開國皇帝”“劉備是三國時期的開國皇帝嗎”“誰是三國時期蜀漢的開國皇帝”等等。
對于同一性質的主題,知識點有相似的結構,可以通過歸納總結建立模型。兩個主題性質越接近,語義網(wǎng)絡的結構就越相近。比如,關于人的語義網(wǎng)絡結構就是基本類似的。劉邦、劉備、張飛、朱元璋、孫悟空、獨孤求敗等等,他們的語義網(wǎng)絡結構就基本相似。劉邦、劉備、朱元璋的語義網(wǎng)絡結構就更加相似。
語義圖譜怎樣生成?
語義圖譜可以從一篇對某個對象的描述文章生成。具體生成過程包含以下幾步:
第一步:生成模板。根據(jù)多篇特征相似的文章生成語義圖譜模板。這個生成的過程可以用機器學習也可以人工加工。例如,描述動物的語義圖譜模板經(jīng)過分析對獅子、老虎、大象的描述就可以提取共同特征生成模板。模板生成過程主要是對文章分段的過程,和生成問法模板的過程。
第二步:根據(jù)模板生成知識。
首先是根據(jù)原始材料確定主題,然后根據(jù)模板對文章進行分段生成知識點(答案),然后根據(jù)模板生成不同的問法(問題)。最后根據(jù)主題、知識點、問法生成語義圖譜。
語義圖譜有什么用?
語義圖譜主要是應用在自然語言問答領域的。當用戶提問時,把用戶提問和語義圖譜中的問題(問法)做對比。如果語義相似,把知識點作為答案輸出。語義圖譜中的問法是鏈接知識點和用戶提問的橋梁。
根據(jù)一個語義圖譜生成一篇文章。同樣的道理,也可以把一篇文章變成一條條的知識,這些相關的知識,構成了一個語義圖譜。如下圖所示:
語義圖譜怎么用?
語義圖譜主要是應用于問答的。具體的應用過程是,先用語義圖譜構建好知識庫,然后當用戶提問時,把用戶提問和語義圖譜里的問法進行語義相似對比,如果有語義相似的問法,則把對應的知識點當成答案輸出。具體業(yè)務流程如下:
我們的技術語義圖譜是為自然語言問答而生的。當用戶提問“獅子喜歡吃什么東西”“獅子主要的捕食對象”“獅子的食性”等等,通過語義網(wǎng)絡都會指向“獅子主要捕食有蹄類,如:牛羚、大羚羊、斑馬,有時也捕食大象、犀牛”這個知識點。
如果用傳統(tǒng)技術知識圖譜處理這個事情就會比較力不從心,它們是為搜索設計的,不是為問答設計的。它們處理關鍵字,理解不了句子的細微差別。比如“獅子喜歡吃什么東西”“獅子主要的捕食對象”“獅子的食性”三句話里實體詞是不一樣的,會被知識圖譜當成不同的知識點。在語義圖譜看來這三個問題指向的是一個知識點。
在實際的自然語言問答過程中,用戶的輸入一般是口語化的句子,是在一定的對話場景里。需要系統(tǒng)對用戶的輸入做精細化處理。需要系統(tǒng)功能分清楚語義非常接近的句子。需要系統(tǒng)分清楚哪些提問指向相同的知識點。這些都是知識圖譜不能解決的問題。語義圖譜本身存儲的就是句子,比知識圖譜存儲的實體和關系要更精細,更適合與用戶輸入做對比。
用知識圖譜做問答,只能處理簡單的句子或者命令,不能處理復雜的句子。用語義圖譜處理問答,能有效提高問答準確率,處理口語、倒裝句等各類句子。
你是否還在尋找穩(wěn)定的海外服務器提供商?創(chuàng)新互聯(lián)www.cdcxhl.cn海外機房具備T級流量清洗系統(tǒng)配攻擊溯源,準確流量調度確保服務器高可用性,企業(yè)級服務器適合批量采購,新人活動首月15元起,快前往官網(wǎng)查看詳情吧
文章標題:語義圖譜技術介紹-創(chuàng)新互聯(lián)
文章出自:http://jinyejixie.com/article36/dehjpg.html
成都網(wǎng)站建設公司_創(chuàng)新互聯(lián),為您提供營銷型網(wǎng)站建設、Google、面包屑導航、定制網(wǎng)站、App設計、網(wǎng)站設計公司
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉載內(nèi)容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容