|
我們構(gòu)建知識圖譜的目的,在于利用知識圖譜來做一些事情。有效利用知識圖譜,就是要考慮知識圖譜的具備的能力,知識圖譜具有哪些能力呢,首先我們知道知識圖譜包含了海量的數(shù)據(jù),是一個超級知識庫,所以我們可以依賴它進(jìn)行搜索一些內(nèi)容,由于知識圖譜的數(shù)據(jù)組織方式是計算機(jī)能理解的,具有語義,這種搜索可以定義為語義搜索。第二,對搜索進(jìn)行延伸,搜索的結(jié)果可能會有很多,按照一定的規(guī)則排序,如果只取最可能的答案,就變成了問答系統(tǒng),這也是知識圖譜的典型應(yīng)用。第三,將知識圖譜與其它技術(shù)進(jìn)行結(jié)合,可以充分利用知識圖譜的知識,比如將用戶的個性化特征與知識圖譜結(jié)合,能夠得到個性化推薦系統(tǒng)。第四,將知識圖譜的數(shù)據(jù)進(jìn)行深度分析,按照一定的規(guī)則進(jìn)行推斷,還可以得到輔助決策。 1 語義搜索知識圖譜的概念,最早就是由谷歌提出,大家知道,谷歌是做搜索引擎的,它提出知識圖譜的概念,就是為了優(yōu)化搜索。語義搜索作為一個概念,起源于常被稱為互聯(lián)網(wǎng)之父的Tim Berners-Lee 在2001 年《科學(xué)美國人》(Scientific American)上發(fā)表的一篇文章。其中,他解釋了語義搜索的本質(zhì)。 語義搜索的本質(zhì)是通過數(shù)學(xué)來擺脫當(dāng)今搜索中使用的猜測和近似,并為詞語的含義以及它們?nèi)绾侮P(guān)聯(lián)到我們在搜索引擎輸入框中所找的東西引進(jìn)一種清晰的理解方式。 百科給出了更明確地定義,也更容易理解。 所謂語義搜索,是指搜索引擎的工作不再拘泥于用戶所輸入請求語句的字面本身,而是透過現(xiàn)象看本質(zhì),準(zhǔn)確地捕捉到用戶所輸入語句后面的真正意圖,并以此來進(jìn)行搜索,從而更準(zhǔn)確地向用戶返回最符合其需求的搜索結(jié)果。 舉例來說,我們用百度來搜索“現(xiàn)任美國總統(tǒng)的夫人”的圖片,搜出來的多數(shù)是美國總統(tǒng)特朗普的夫人,還有少量克林頓和奧巴馬夫人的圖片,說明搜索引擎理解了我們的搜索內(nèi)容,給我們找到了我們想要的答案。少量前任總統(tǒng)夫人的結(jié)果,說明搜索技術(shù)還需要進(jìn)一步完善,可以把這部分內(nèi)容看作是噪聲,應(yīng)該過濾掉的,隨著算法的改進(jìn),結(jié)果應(yīng)該會更加準(zhǔn)確。 語義搜索是知識圖譜最典型的應(yīng)用,它首先將用戶輸入的問句進(jìn)行解析,找出問句中的實體和關(guān)系,理解用戶問句的含義,然后在知識圖譜中匹配查詢語句,找出答案,最后通過一定的形式將結(jié)果呈現(xiàn)到用戶面前。 2 智能問答智能問答,就是通過一問一答的形式,用戶和具有智能問答系統(tǒng)的機(jī)器之間進(jìn)行交互,就像是兩個人進(jìn)行問答一樣,具有智能問答系統(tǒng)的機(jī)器就像一個智者一樣,為用戶提供答案,友好的進(jìn)行交談。 作為人工智能的一個重要應(yīng)用案例,智能問答系統(tǒng)在很多場景中發(fā)揮作用。 比如原來很多的在線客服,正在部分的被智能問答系統(tǒng)取代,早些年銀行、電信等行業(yè)的在線客服,不同業(yè)務(wù)按不同的數(shù)字,在進(jìn)入細(xì)分業(yè)務(wù),繼續(xù)選不同的數(shù)字,一直要選很多次,有了智能問答,會簡化這些繁瑣的過程,直接根據(jù)用戶的問話,給出答案。當(dāng)然,現(xiàn)在的智能問答,還不夠完善,只能部分取代在線客服,如果不能提供有效的答案,還是要由人工客服提供服務(wù)。還有一些智能問答機(jī)器人,也會提供一些簡單的服務(wù),比如給孩子用的機(jī)器人,可以提供兒歌、算術(shù)、詩詞、語文、英語等方面的內(nèi)容,代替了老師的一部分職能。還有一些聊天機(jī)器人,提供情景對話,就像一個人一樣,和用戶進(jìn)行聊天。 同為智能問答,特點(diǎn)不同,依賴的知識圖譜技術(shù)也不同,聊天機(jī)器人,不僅提供情景對話,也能夠提供各行各業(yè)的知識,它依賴的知識圖譜是開放領(lǐng)域的知識圖譜,提供的知識非常寬泛,能夠為用戶提供日常知識,也能進(jìn)行聊天式的對話。那些行業(yè)用的智能問答系統(tǒng),依賴的是行業(yè)知識圖譜,知識集中在某個領(lǐng)域,專業(yè)知識豐富,能夠為用戶有針對性的提供專業(yè)領(lǐng)域知識。 智能問答,可以看作是語義搜索的延伸,語義搜索的結(jié)果會按照某種規(guī)則進(jìn)行排序,依據(jù)一定的算法將最相關(guān)的排在前面,我們使用百度、谷歌搜索引擎進(jìn)行搜索時,結(jié)果可能包括很多頁,就是語義搜索的常見形式。智能問答,屬于一問一答,只要一個答案,也就是將最相關(guān)的那個答案反饋給用戶,如果像聊天一樣,不斷地進(jìn)行問答,回答不僅僅是在知識庫中搜索,還要考慮前面的聊天內(nèi)容。 3 個性化推薦個性化推薦是根據(jù)用戶的個性化特征,為用戶推薦感興趣的產(chǎn)品或內(nèi)容。百度百科給出的定義是: 個性化推薦系統(tǒng)是互聯(lián)網(wǎng)和電子商務(wù)發(fā)展的產(chǎn)物,它是建立在海量數(shù)據(jù)挖掘基礎(chǔ)上的一種高級商務(wù)智能平臺,向顧客提供個性化的信息服務(wù)和決策支持。 我們上網(wǎng)的時候會經(jīng)常查找一些我們感興趣的頁面或者產(chǎn)品,在瀏覽器上瀏覽過的痕跡會被系統(tǒng)記錄下來,放入我們的特征庫,比如對于電子商務(wù)網(wǎng)站來說,如果我們想購買筆記本,就會在電子商務(wù)網(wǎng)站上查看比較不同商家的筆記本,我們再次打開電子商務(wù)網(wǎng)站的時候,筆記本這個產(chǎn)品就會優(yōu)先顯示在商品列表中,供我們選擇。再比如,瀏覽新聞,如果我們對體育類或者社會熱點(diǎn)很關(guān)注,新聞APP就會給我們推薦體育題材或者社會熱點(diǎn)的新聞。 個性化推薦系統(tǒng)通過收集用戶的興趣偏好、屬性,產(chǎn)品的分類、屬性、內(nèi)容等,分析用戶之間的社會關(guān)系,用戶和產(chǎn)品的關(guān)聯(lián)關(guān)系,利用個性化算法,推斷出用戶的喜好和需求,從而為用戶推薦感興趣的產(chǎn)品或者內(nèi)容。 4 輔助決策輔助決策,就是利用知識圖譜的知識,對知識進(jìn)行分析處理,通過一定規(guī)則的邏輯推理,得出對于某種結(jié)論,為用戶決斷提供支持。以下是百科給出的定義。 輔助決策系統(tǒng),以決策主題為重心,以互聯(lián)網(wǎng)搜索技術(shù)、信息智能處理技術(shù)和自然語言處理技術(shù)為基礎(chǔ),構(gòu)建決策主題研究相關(guān)知識庫、政策分析模型庫和情報研究方法庫,建設(shè)并不斷完善輔助決策系統(tǒng),為決策主題提供全方位、多層次的決策支持和知識服務(wù)。 隨著我國日益變?yōu)槔淆g化社會,養(yǎng)老問題成為人們關(guān)注的焦點(diǎn),也成為研究的重要課題。對一個地區(qū)來說,應(yīng)該采用什么樣的養(yǎng)老模式,配套設(shè)施應(yīng)該如何建設(shè),才能解決老人的養(yǎng)老問題。就需要對這個地區(qū)的老人、基礎(chǔ)設(shè)施、配套情況、周圍環(huán)境等建立知識庫,分析老人日常生活,發(fā)現(xiàn)問題,對數(shù)據(jù)進(jìn)行匯總,根據(jù)已有事實得出結(jié)論,為政府制定政策提供決策支持。這里面最基礎(chǔ)的問題是建立所有數(shù)據(jù)的知識圖譜以及有效的推理規(guī)則,最后才能得出有意義的結(jié)論。 知識圖譜知識點(diǎn): 一、知識圖譜概論 1.1知識圖譜的起源和歷史 1.2知識圖譜的發(fā)展史——從框架、本體論、語義網(wǎng)、鏈接數(shù)據(jù)到知識圖譜 1.3知識圖譜的本質(zhì)和價值 1.4知識圖譜VS傳統(tǒng)知識庫VS關(guān)系數(shù)據(jù)庫 1.5經(jīng)典的知識圖譜 1.5.1經(jīng)典的CYC, WordNnet, WikiData, DBpedia, YAGO, NELL等知識庫 1.5.2行業(yè)知識圖譜: Google知識圖譜,微軟實體圖,阿里知識圖譜,醫(yī)學(xué)知識圖譜,基因知識圖譜等知識圖譜項目 二、知識圖譜應(yīng)用 2.1知識圖譜應(yīng)用場景 2.2知識圖譜應(yīng)用簡介 2.2.1知識圖譜在數(shù)字圖書館上的應(yīng)用 2.2.2知識圖譜在國防、情報、公安上的應(yīng)用 2.2.3知識圖譜在金融上的應(yīng)用 2.2.4知識圖譜在電子商務(wù)中的應(yīng)用 2.2.5知識圖譜在農(nóng)業(yè)、醫(yī)學(xué)、法律等領(lǐng)域的應(yīng)用 2.2.6知識圖譜在制造行業(yè)的應(yīng)用 2.2.7知識圖譜在大數(shù)據(jù)融合中的應(yīng)用 2.2.8知識圖譜在人機(jī)交互(智能問答)中的應(yīng)用 三、知識表示與知識建模 3.1知識表示概念 3.2 知識表示方法 a.語義網(wǎng)絡(luò) b.產(chǎn)生式規(guī)則 c.框架系統(tǒng) d.描述邏輯 e.本體 f.RDF和RDFS g.OWL和OWL2 Fragments h.SPARQL查詢語言 i.Json-LD、RDFa、HTML5 MicroData等新型知識表示 3.3典型知識庫項目的知識表示 3.4知識建模方法學(xué) 3.5知識表示和知識建模實踐 1.三國演義知識圖譜的表示和建模實踐案例 2.學(xué)術(shù)知識圖譜等 四、知識抽取與挖掘 4.1知識抽取基本問題 a.實體識別 b.關(guān)系抽取 c.事件抽取 4.2數(shù)據(jù)采集和獲取 4.3面向結(jié)構(gòu)化數(shù)據(jù)的知識抽取 a.D2RQ b.R2RML 4.4面向半結(jié)構(gòu)化數(shù)據(jù)的知識抽取 a.基于正則表達(dá)式的方法 b.基于包裝器的方法 4.5.面向非結(jié)構(gòu)化數(shù)據(jù)的知識抽取 a.實體識別技術(shù)(基于規(guī)則、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、預(yù)訓(xùn)練等方法) b.關(guān)系抽取技術(shù)(基于模板、監(jiān)督、遠(yuǎn)程監(jiān)督、深度學(xué)習(xí)等方法) c.事件抽取技術(shù)(基于規(guī)則、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等方法) 4.6.知識挖掘 a.實體消歧b.實體鏈接c.類型推斷 d.知識表示學(xué)習(xí) 4.7知識抽取上機(jī)實踐 A.面向半結(jié)構(gòu)化數(shù)據(jù)的三國演義知識抽取 B.面向文本的三國演義知識抽取 C.人物關(guān)系抽取 五、知識融合 5.1知識融合背景 5.2知識異構(gòu)原因分析 5.3知識融合解決方案分析 5.4.本體對齊基本流程和常用方法 a.基于文本的匹配 b.基于圖結(jié)構(gòu)的匹配 c.基于外部知識庫的匹配 e.不平衡本體匹配 d.跨語言本體匹配 f.弱信息本體匹配 5.5實體匹配基本流程和常用方法 a.基于相似度的實例匹配 b.基于規(guī)則或推理的實體匹配 c.基于機(jī)器學(xué)習(xí)的實例匹配 d.大規(guī)模知識圖譜的實例匹配 (1)基于分塊的實例匹配 (2)無需分塊的實例匹配 (3)大規(guī)模實例匹配的分布式處理 5.6 知識融合上機(jī)實踐 1.百科知識融合 2.OAEI知識融合任務(wù) 六、存儲與檢索 6.1.知識圖譜的存儲與檢索概述 6.2.知識圖譜的存儲 a.基于表結(jié)構(gòu)的存儲 b.基于圖結(jié)構(gòu)的存儲 6.3.知識圖譜的檢索 a.關(guān)系數(shù)據(jù)庫查詢:SQL語言 b數(shù)據(jù)庫查詢:SPARQL語言 6.4.上機(jī)實踐案例:利用GraphDB完成知識圖譜的存儲與檢索 七、知識推理 7.1.知識圖譜中的推理技術(shù)概述 7.2.歸納推理:學(xué)習(xí)推理規(guī)則 a.歸納邏輯程設(shè)計Øb.關(guān)聯(lián)規(guī)則挖掘 c.路徑排序算法 上機(jī)實踐案例:利用AMIE+算法完成Freebase數(shù)據(jù)上的關(guān)聯(lián)規(guī)則挖掘 7.3.演繹推理:推理具體事實 Ø a.馬爾可夫邏輯網(wǎng) b.概率軟邏輯 7.4.基于分布式表示的推理 a.TransE模型及其變種 b.RESCAL模型及其變種 7.5.上機(jī)實踐案例:利用分布式知識表示技術(shù)完成Freebase上的鏈接預(yù)測 八、語義搜索 8.1.語義搜索概述 8.2.搜索關(guān)鍵技術(shù) a.索引技術(shù):倒排索引 b.排序算法:BM25及其擴(kuò)展 8.3.知識圖譜搜索 a.實體搜索 b.關(guān)聯(lián)搜索 8.4.知識可視化 a.摘要技術(shù) 8.5.上機(jī)實踐案例:SPARQL搜索 九、知識問答 9.1.知識問答概述 9.2.知識問答基本流程 9.3.相關(guān)測試集:QALD、WebQuestions等 9.4.知識問答關(guān)鍵技術(shù) a.基于模板的方法 b.語義解析 c.基于深度學(xué)習(xí)的方法 9.5.上機(jī)實踐案例:DeepQA、TemplateQA 555555">學(xué)習(xí)和關(guān)注人工智能技術(shù)與咨詢,更多詳情可咨詢175-3102-1189(v同號)。
|