如果把人工智慧領域比作江湖,機器學習和深度學習堪稱武林中的屠龍刀、倚天劍,而知識圖譜則是一部葵花寶典級的武林絕學。

一、圖譜一出,誰與爭鋒(圖譜簡史)

如果把人工智慧領域比作江湖,機器學習和深度學習堪稱武林中的屠龍刀、倚天劍,而知識圖譜則是一部葵花寶典級的武林絕學。

知識圖譜並非武林新生獨創,其江湖地位久遠。相傳在六十年前,江湖上有三大門派:其一是連接派(神經網路),其二是經驗派(機器學習),其三是符號派(知識工程)。三大門派明爭暗鬥,十餘年後一部武林秘籍從符號派悄然流傳於武林之中,受限於當時的環境,初出茅廬,其功力還未受到其他門派的重視,名號也毫無大俠之風——語義網路。當時語義網路由相互連接的節點和邊組成,節點表示概念或者對象,邊表示他們之間的關係(is-a關係,比如:打狗棒是一種兵器;part-of關係,比如:精鋼是兵器的一部分)。在表現形式上,語義網路側重於描述概念與概念之間的關係(門派武功劍譜等的層次分類體系),幾十年後,符號派經歷語義網路、邏輯描述、元數據、OWL等血雨腥風的磨礪,經歷從弱語義到強語義的嘗試,因了谷歌等一代宗師的繼承研習,集各家所長,發揚光大而重出江湖,凝結出這部驚世絕學——知識圖譜。知識圖譜雖傳承了語義網路衣缽,但更偏重於描述實體之間的關聯(包括人物、兵器、武功等)。二者還有一個最顯著的差異就是規模,傳統語義網可稱為小擒拿手,知識圖譜則為禪宗大法。

二、得圖譜者得天下(圖譜作用)

知識圖譜歷經多年沉澱,集眾家之長,以不變應萬變:搜索引擎,問答系統,社交網路,電商平台,反欺詐,智能投顧等等。追溯其核心的應用能力,有如下幾個方面。

1.為NLP輸入渾厚內力

機器對自然語言的理解,需要有如下條件:足夠大的數據規模,豐富的語義關係,完美的數據結構,優良的數據質量。知識圖譜天然具備此要素:知識圖譜規模巨大,實體可達到億級;關係多樣,目前通用的知識圖譜,均有包含數千種常見語義關係;結構友好,SOP三元組的結構對於機器而言能夠高效處理;質量精良,知識圖譜可以充分利用大數據的多源特性進行交叉驗證,也可利用眾包保證知識庫質量。所以知識圖譜成為了讓機器理解自然語言所需的背景知識的不二選擇,使NLP內力驟增。

2.對XAI見招拆招

XAI(可解釋人工智慧)是人工智慧的一個新興分支,用於解釋人工智慧所做出的每一個決策背後的邏輯,有人稱之為」人工智慧的聖杯」。

日常生活中我們的問答搜索等,都涉及解釋這件事。問幾個問題:(1)神鵰為什麼會飛?因為鳥有翅膀;(2)為什麼提到楊過會想到小龍女?因為他們是神仙眷侶;(3)為什麼鶴頂紅會致命?因為鶴頂紅是一種毒藥,俗稱砒霜。三個答案,分別用屬性、關係、概念來對問題做解釋,而這三者,恰恰是包含於知識圖譜里。因此,解釋離不開知識圖譜。知識圖譜的應用不僅如此,它可應用於更多的人工智慧場景,包含輔助問答、輔助決策、輔助搜索、常識推理等。

3.ML(DL)攻擊力++

知識圖譜與深度學習結合,可稱霸武林。一種是將知識圖譜的語義信息輸入到深度學習模型中,將離散化的知識表示為連續化的向量,從而使得知識圖譜的先驗知識能夠稱為深度學習的輸入;另外一種是利用知識作為優化目標的約束,指導深度學習模型的學習過程,通常是將知識圖譜中的知識表示為優化目標的後驗正則項。反之,在知識圖譜的構建和擴展中,又依賴深度學習的強力支撐,陰陽互補,可以大成。

三、欲練此功,先修內功(圖譜構建)

凡上乘武功,皆需內力深厚,外功紮實,絕不是一朝一夕即可練就,效仿葵花寶典,如若自宮,必不成功。郭靖的降龍十八掌至剛至柔,是因二十餘年九陰真經的內力沉澱其中。知識圖譜的修鍊一般分四個等級。

1、內功心法:知識抽取(實體抽取,語義抽取,關係抽取,屬性和屬性值抽取)

所需技能:爬蟲,NER(命名實體識別),ML,正則,相似度計算,馬爾科夫邏輯網,DeepDive框架。

2、苦練招式:知識表示(SPO三元組,稠密低維實值向量)

常規招法:距離模型、單層神經網路模型、雙線性模型、神經張量模型、矩陣分解模型、翻譯模型。

升級招法:Trans系列、KG2E模型。

3、內外兼修:知識融合(實體對齊,本體構建、質量評估、屬性校正)

所需技能:概率模型,機器學習,聚類演算法。

4、集大成者:知識存儲和推理。

必殺技能:圖資料庫,基於符號邏輯、OWL本體、圖、TransR、分散式知識語義表示、深度學習等的推理方法)

四、法律圖譜,初涉江湖

2018年底,實在智能包小黑苦練內功,實現了垂直領域法律知識圖譜的構建和應用,在民事案由的智能評估中發揮智慧大腦的作用。法律知識圖譜初現武林,秉公平正義之舉,懷為國為民之心,修千家之好,迎百家之客,期待為人工智慧發展和人類進步盡綿薄之力。

參考文獻:肖仰華《知識將比數據更重要,得知識者得天下》

作者介紹:布魯托博士,杭州實在智能科技有限公司演算法工程師,在深度學習、知識圖譜等方面有豐富實踐經驗及深入研究創新。

歡迎評論留言,交流經驗心得。


推薦閱讀:
相关文章