信息檢索的本質為什麼是人工智慧?
老師上信息檢索課,給了一個命題,就是上面的題,大家怎麼看,求解釋
這句話本身其實還是別太當回事了,現在「人工智慧」的概念都快被炒爛了。
但如果退一步講的話,信息檢索未來的發展方向確實是引入機器學習/神經網路,因為在很多方面,搜索引擎通過啟發式方法判別搜索結果質量是存在局限性的,但如果對用戶具體點擊了哪個結果進行在線學習的話,就可以非常有效地進一步改善搜索結果質量,再比如說,傳統的信息檢索技術是按關鍵字進行文檔匹配的,如果把關鍵字和文檔都換成Embedding的詞向量/文檔向量,通過計算餘弦相似度進行匹配的話,也可以進一步改善搜索結果質量。
竟然還有人主動往人工智慧上靠...我們機器學習什麼的都故意取些聽起來跟人工智慧沒什麼關係的名字,不都是為了不要跟人工智慧扯上關係嘛。
因為沒有智能的檢索都是不徹底的檢索。
檢索的本質是搜索想要的答案。
回答一個問題,需要無限的智能,很多時候普通人類都無法答好,所以好的回答需要更聰明的智能。
比如這樣的問題:
我家附近性價比最高的幼兒園?買哪款毛巾好?望京有沒有值得推薦的餐館?有哪篇論文講述了三段論的神經機制?
去澳大利亞怎麼玩?幫我選一件適合我的休閑西裝?這些問題現在的智能技術都解決不了,所以還得靠ugc,比如知乎上很多人回答很認真,但是ugc也不是終極辦法,他只能一定程度上緩解人類對真相的渴望,但最懂的人未必來知乎,更不要說還有無數堆圖的,抖機靈的,寫軟文的來混淆視聽,騙了無數的同意。即使一切都是很認真的寫,很真誠的寫,他也很難滿足你的個性化要求,比如有人說今冶的毛巾好用,推薦給你,結果你反日;再比如有人推薦了牛逼的烤箱可惜要麼太貴要麼你家廚房小不適合。凡此種種皆須智能,而且還要超級智能。檢索信息包括提取信息、匹配信息,一個高質量的檢索信息還包括理解信息和生成信息,這不就是人工智慧嗎?可以參考https://www.zhihu.com/question/299836000
信息檢索的終極目標是個性化檢索,而這便是事實上的人工智慧。
個人覺得,deep learning應該叫「深度擬合」,更不應該直接等於AI。
推薦閱讀: