近日,由清華人工智能研究學院,北京人工智能研究學院,清華的工程院知識智能聯(lián)合研究中心,以及阿里集團聯(lián)合發(fā)布了人工智能知識圖譜。
知識圖譜(Knowledge Graph)于2012年由谷歌提出并成功應用于搜索引擎當中。它以結構化的形式描述客觀世界中概念、實體及其之間的關系,將互聯(lián)網(wǎng)的信息表達成更接近人類認知世界的形式,提供了一種更好地組織、管理和理解互聯(lián)網(wǎng)海量信息的能力。
知識圖譜的原理和方法
知識體系構建。
根據(jù)分類,可以把知識圖譜分為通用型和領域型。無論是什么類型的知識圖譜都需要對其服務的領域進行知識建模。也就是說,采用什么樣的方式來表達知識。
知識融合。
一個知識庫可以和其他知識庫進行融合。在不同領域知識圖庫進行融合時,會發(fā)現(xiàn)來自不同領域,不同語言,甚至不同結構的知識需要做“補充,更新和去重的操作”。
這就是知識融合,一般分為:知識體系融合和實例融合。這部分的操作也可以在構建知識體系的時候統(tǒng)籌考慮。
知識獲齲
知識獲取的目的是從海量的信息中抽取知識。本文中提到的“獲取信息”多為文本信息,因此這里的“獲取信息”也是從文本中獲取信息的過程。
獲取信息結構上劃分為三類,分別是結構化信息,半結構化信息和非結構化信息。
從獲取信息內容上又分為,實體識別,實體消歧,關系抽取和事件抽齲知識存儲在完成了知識抽取和融合之后,就需要將知識存儲下來了。
有RDF格式和圖數(shù)據(jù)庫兩種方式。因為圖數(shù)據(jù)庫對于查詢友好,因此被廣泛使用,例如:Neo4j。
知識推理。
識別并抽取知識以及存儲知識以后,我們會試圖挖掘實體之間隱含的語義關系。這個過程就是知識推理。例如:已知A是B的兒子,又知道B是C的兒子。那么可以推理出A是C的孫子。
知識應用。
識別,抽取,存儲和推理的最終目的還是為了應用。知識圖譜在搜索,問答,推薦,決策方面被廣泛應用。
知識圖譜的發(fā)布,揭示著人工智能的發(fā)展將會持續(xù)呈現(xiàn)特色化、開放化、智能化的趨勢,為更好發(fā)揮現(xiàn)有知識圖譜知識表達、知識資源優(yōu)勢,需與其他技術(信息推薦、事理圖譜、機器學習、深度學習等)相結合。
各大互聯(lián)網(wǎng)巨頭布局知識圖譜領域,而知識圖譜尚處于發(fā)展初期,商業(yè)應用落地場景有限,如何有效實現(xiàn)知識圖譜的應用,利用知識圖譜實現(xiàn)深度知識推理,提高大規(guī)模知識圖譜計算效率和應用場景?這些問題將是未來一段時間業(yè)界亟需解決的問題!
信息提娶查詢應答、問題回答、機器學習、概率邏輯、實體消歧、實體識別、查詢處理、決策支持等方向的研究熱度在近年來逐漸上升,知識圖譜也因此成為了各大人工智能與互聯(lián)網(wǎng)公司的兵家必爭之地,它與大數(shù)據(jù)、深度學習一起,成為推動互聯(lián)網(wǎng)和人工智能發(fā)展的核心驅動力之一。