OTB評估指標

OTB 可以用來衡量你的目標跟蹤演算法好壞，它包含一些 benchmark 結果，打好標記（即ground-truth.txt )的數據集，以及一個用來測試你的演算法的代碼庫。

數據集包括50幀的序列和100幀的序列，其中50幀序列的數據集是2013年提出來的，100幀的數據集是2015年提出來的，所以OTB50也叫OTB2013，OTB100也叫OTB2015，相關的數據集和測試代碼庫都可以在 http://cvlab.hanyang.ac.kr/tracker_benchmark/下載。

不同的數據集還標有不同的屬性，這些屬性可以代表目標跟蹤領域的常見難點。例如，IV（Illumination Variation）表示光照變化，SV（Scale Variation ）表示尺度變化，OCC（Occlusion ）表示遮擋，DEF（Deformation ）表示變形，MB（Motion Blur ）表示運動模糊，FM（Fast Motion）表示快速移動，IPR（In-Plane Rotation）表示平面內旋轉，OPR（Out-of-Plane Rotation）表示平面外旋轉，OV（Out-of-View ）表示離開視野，BC（Background Clutters ）表示相似的背景，LR（Low Resolution）表示低的解析度。

精確圖 precision plot

追蹤演算法估計的目標位置（bounding box）的中心點與人工標註（ground-truth）的目標的中心點，這兩者的距離小於給定閾值的視頻幀的百分比。不同的閾值，得到的百分比不一樣，因此可以獲得一條曲線。

該評估方法的缺點：無法反映目標物體大小與尺度的變化。

成功率圖 Success Plot

首先定義重合率得分（overlap score，OS），追蹤演算法得到的bounding box（記為a），與ground-truth給的box（記為b），重合率定義為：OS = |a∩b|/|a∪b|，|·|表示區域的像素數目。當某一幀的OS大於設定的閾值時，則該幀被視為成功的（Success），總的成功的幀占所有幀的百分比即為成功率（Success rate）。OS的取值範圍為0~1，因此可以繪製出一條曲線。

OPE

用ground-truth中目標的位置初始化第一幀，然後運行跟蹤演算法得到平均精度和成功率。這種方法被稱為one-pass evaluation (OPE)。

魯棒性評估（SRE，TRE）

通過從時間（temporally，從不同幀起始）和空間（spatially，不同的bounding box）上打亂，然後進行評估。可以分為：temporal robustness evaluation (TRE) 和 spatial robustness evaluation (SRE)。

在一個圖片/視頻序列中，每個跟蹤演算法從不同的幀作為起始進行追蹤（比如分別從第一幀開始進行跟蹤，從第十幀開始進行跟蹤，從第二十幀開始進行跟蹤等），初始化採用的bounding box即為對應幀標註的ground-truth。最後對這些結果取平均值，得到TRE score。

由於有些演算法對初始化時給定的bounding box比較敏感，而目前測評用的ground-truth都是人工標註的，因此可能會對某些跟蹤演算法產生影響。因此為了評估這些跟蹤演算法是否對初始化敏感，作者通過將ground-truth輕微的平移和尺度的擴大與縮小來產生bounding box。平移的大小為目標物體大小的10%，尺度變化範圍為ground-truth的80%到120%，每10%依次增加。最後取這些結果的平均值作為SRE score。

以上，就是OTB評估的幾個指標。

精確圖 precision plot

成功率圖 Success Plot

OPE

魯棒性評估（SRE，TRE）

热门新闻

周热门

OTB評估指標

精確圖 precision plot

成功率圖 Success Plot

OPE

魯棒性評估（SRE，TRE）

如何評價 CVPR 2020的論文接收結果？有哪些亮點論文？

李世石和李昌鎬誰更厲害？

人工智慧領域裡的Interpretability和Explainability有什麼區別嗎？

ACL 2019將會有哪些值得關注的論文？

人類社會都智能了！人還有何用？

如果不從事機器學習，人工智慧，大數據這塊，未來還有機會在互聯網賺錢養家嗎？本人三本院校軟體專業。？

如何看待語音識別大牛、Kaldi 之父 Daniel Povey 加入小米？會產生哪些影響？

經典Python入門書籍都是python2.x, 先學這些再轉3.x難不難？

對於未來AI的時代，你有什麼想法!？

自學轉行學人工智慧怎麼樣？

李宏毅 吳恩達誰的課更好?

學計算機視覺好找工作嗎？

用mAP衡量目標檢測的性能是否科學？

靠OpenCV吃飯的圖像演算法工程師在深度學習的衝擊下衝擊下還有活路嗎？ 瀉藥，「靠OpenCV吃飯的圖像演算法工程師在深度學習的衝擊下衝擊下還有活路嗎？」

本人碩一小白，最近找課題，想問問深度學習GAN這個方向有哪些具有實際應用價值還好發文章的課題?

热门新闻

周热门

李宏毅吳恩達誰的課更好?

靠OpenCV吃飯的圖像演算法工程師在深度學習的衝擊下衝擊下還有活路嗎？瀉藥，「靠OpenCV吃飯的圖像演算法工程師在深度學習的衝擊下衝擊下還有活路嗎？」