行人重識別。偏應用,目前商湯華為等公司都有實際場景的需求。

推薦先看這篇心歷路程。。

夢裡風林:我的研究生這三年?

zhuanlan.zhihu.com圖標

(= 。=)

論文角度,如果不啃硬骨頭的話: 可以在baseline上做一些incremental的工作。

  1. 簡介: https://zhuanlan.zhihu.com/p/26168232
  2. 強力baseline (pytorch):https://zhuanlan.zhihu.com/p/50387521
  3. 強力baseline (mxnet):https://zhuanlan.zhihu.com/p/42345854
  4. 入門: https://www.zhihu.com/question/62928784/answer/236351943

啃硬骨頭的話: 解決一些熱點問題

  1. 比如這個回答中提到的 https://www.zhihu.com/question/65944772/answer/236372546

2. 跨域行人重識別 https://zhuanlan.zhihu.com/p/53660395

3. 少量訓練樣本 https://zhuanlan.zhihu.com/p/54576174

4. 行人屬性 https://zhuanlan.zhihu.com/p/37931822

5. 利用生成數據訓練 https://github.com/NVlabs/DG-Net


提名一下GAN吧,哈哈哈。感覺GAN的評估太玄了,多數屬於人眼看得過去就可以(MOS)【相比要在大型公開數據集刷點的任務,個人感覺如果都是水,那你GAN怎麼更水呢,23333(玩笑戲謔。。

可以看看CVPR 2020 上的GAN論文,真心好多:

CVPR 2020的117篇GAN生成對抗網路論文分類大匯總

CVPR 2020最全GAN生成對抗網路論文匯總!(附帶介紹)

GAN相關閱讀:

1.GAN公式簡明原理之鐵甲小寶篇

  1. GAN整整6年了!是時候要來捋捋了!
  2. 數百篇GAN論文已下載好!搭配一份生成對抗網路最新綜述!
  3. 新手指南綜述 | GAN模型太多,不知道選哪兒個?
  4. 人臉圖像GAN,今如何?(附多篇論文下載)
  5. 人臉生成新SOTA?
  6. 語義金字塔式-圖像生成:一種使用分類模型特徵的方法
  7. 拆解組新的GAN:解耦表徵MixNMatch
  8. CVPR 2020 | StarGAN第2版:多域多樣性圖像生成
  9. CVPR 2020 | GAN中的反射/反光、陰影
  10. CVPR 2020 | 幾篇GAN語義生成論文
  11. CVPR 2020 | 10篇改進GAN的論文(網路、訓練、正則等)
  12. CVPR 2020 | 11篇GAN圖像轉換img2img 的論文
  13. CVPR2020之MSG-GAN:簡單有效的SOTA?
  14. CVPR2020之姿勢變換GAN
  15. CVPR2020之多碼先驗GAN:預訓練好的模型怎麼使用?
  16. 兩幅圖像!這樣能訓練好 GAN 做圖像轉換嗎?
  17. 2020年5月60篇GAN論文匯總
  18. 最新下載!2020年4月份70多篇GAN論文!
  19. 最新下載!一覽2020年3月至今90多篇GAN論文!
  20. 最新下載!一覽2020年2月50多篇GAN論文!
  21. 一覽!2020年1月份的GANs論文!
  22. 2019年12月份的GANs論文一覽
  23. 這麼多!11月份來的這些GAN論文都在解決什麼方向的問題?

部分應用介紹:

  1. 臉部轉正!GAN能否讓側顏殺手、小豬佩奇真容無處遁形?
  2. 【無中生有的AI】關於deepfake的入門級梳理
  3. 容顏漸失!GAN來預測?
  4. 異常檢測,GAN如何gan?
  5. 虛擬換衣!這幾篇最新論文不來GAN GAN?
  6. 臉部妝容遷移!速覽幾篇用GAN來做的論文
  7. 有點誇張、有點扭曲!速覽GAN如何誇張漫畫化人臉!
  8. 見微知細之超解析度GAN!附70多篇論文下載!
  9. 天降斯雨,於我卻無!GAN用於去雨如何?
  10. 結合GAN的零次學習(zero-shot learning)
  11. 強數據所難!SSL(半監督學習)結合GAN如何?
  12. 弱水三千,只取你標!AL(主動學習)結合GAN如何?
  13. 【1】GAN在醫學圖像上的生成,今如何?


目前很多計算機視覺的方向都是一線實驗室或者大廠(如google)之間的比拼,沒有顯著的計算資源,工程能力是很難在這些方向上發文章的。個人覺得比較好發文章的方向比如weakly supervised segmentation(detection, object localization), GAN的一些應用,co-segmentation 等等。


謝邀。

個人感覺,論文肯定是有獨創演算法且實踐效果好才可以發表在CCF-A類會議中的。

但是在企業中,更看重演算法模型的快速部署和線上應用。建議可以多多關注下模型壓縮層面的事情,這個是在可以應用在各種模型中的,通過對模型中不同模塊間的處理(壓縮、降維、變換等操作)可以尋找到高效且輕量的演算法,這會給產品帶來很大的提升。


現在視覺識別技術,商用上線強烈要求縮小模型和提高速度,保證準確率的情況下。另外情感識別可以考慮考慮


跨方向的,比如醫學圖像處理,用目標檢測來檢測腫瘤位置。


把深度學習方法和經典信號處理結合起來,比如:

Non-local Neural Networks[1] = 非局部均值降噪 + 深度學習

深度殘差收縮網路[2] = 軟閾值化 + 殘差網路

參考

  1. ^Non-local Neural Networks https://openaccess.thecvf.com/content_cvpr_2018/papers/Wang_Non-Local_Neural_Networks_CVPR_2018_paper.pdf
  2. ^深度殘差收縮網路 https://ieeexplore.ieee.org/document/8850096


都不好發,要深耕精耕。。。


推薦閱讀:
相关文章