台湾 || 语言: 大陆简体港澳繁體台灣正體

推薦系統研究中常用的評價指標

雪花台灣 2019-07-14 17:18

整理了一下過去大半年中所看推薦系統相關文獻中出現過的評價指標，如果大家發現有本文遺漏的評價指標歡迎在評論區中指出，我再補充進來。

目錄

一、概述

二、常用的評估指標

三、其他的評估指標

一、概述

自推薦系統研究開始以來，對預測和推薦結果的評估一直都是十分重要的環節，一個推薦演算法的優劣直接體現在其在這些評估指標上的表現。一般來說，按照推薦任務的不同，最常用的推薦質量度量方法可以劃分為三類：（1）對預測的評分進行評估，適用於評分預測任務。（2）對預測的item集合進行評估，適用於Top-N推薦任務。（3）按排名列表對推薦效果加權進行評估，既可以適用於評分預測任務也可以用於Top-N推薦任務。。

這三類度量方法對應的具體評價指標分別為：

（a）評分預測指標：如準確度指標：平均絕對誤差（MAE）、均方誤差根（RMSE）、標準化平均誤差（NMAE）；以及覆蓋率（Coverage）

（b）集合推薦指標：如精密度(Precision)、召回(Recall)、 ROC和AUC

（c）排名推薦指標：如half-life和discounted cumulative gain等

本文餘下的部分將針對這些指標進行詳細介紹

二、常用的評估指標

1、quality of the predictions

為了衡量RS結果的準確性，通常使用一些最常見的預測誤差指標的計算，其中平均絕對誤差（Mean Absolute Error，MAE）及其相關指標：均方誤差（Mean Squared Error，MSE）、均方根誤差（Root Mean Squared Error，RMSE）和標準平均絕對誤差（Normalized Mean Absolute Error，NMAE）是其中最具有代表性的指標。

符號定義

U代表測試集中user集合，I代表測試集中item集合， $r_{ui}$ 代表u對i的評分，●代表空缺的評分（ $r_{ui}$ =●代表u沒有對i評過分）， $p_{u,i}$ 代表預測的u對i的評分，

相关文章