為什麼大家都把演算法工程師叫做調參俠?我做cv的 調參只是在我研究中占很小一部分 影響模型效果的還是要看網路結構和數據和損失函數 這三方面確定下來後 調參基本花不了多少時間。我還專門問了實驗室以為挺厲害的博士 他也是這麼認為的。我甚至覺得調參只是大部分人網路跑不出效果的借口。有沒有演算法工程師來交流下?


不好講。AlexNet就是調參很久的,後來不少工作把它當作base model。不過如果不考慮合適的loss函數和正確的模型架構,調參效果不大。


網路結構和 loss不是一步步設計一步步調出來的?難道一錘定音?


那調參也比寫介面掙得多(逃ε=ε=ε=┏(゜ロ゜;)┛


演算法工程師這個崗位覆蓋面很廣。舉例說,在有些偏業務的部門裡,比如推薦組下面,會有專門團隊負責待推薦文章質量的衡量,需要設計模型對文章質量打分,這就要求演算法工程師要充分理解業務,制定標準、樣本富集流程,特徵設計,模型離線評估,數據流建設,模型上線,case分析,迭代……,在這種場景下,往往模型的調參並非最關鍵的,可能分析過更多的badcase後,通過對業務的深刻理解,調整下樣本或者添加幾條預處理規則給模型帶來的提升就比把參數調來調去大得多。

當然也有一些做演算法輸出的平台部門或者研究院部門,考核目標就是發paper,或者持續優化特定模型效果,開發成通用運算元提供給其他業務部門。相應團隊的演算法工程師並不直接面對產品業務,那麼在模型優化的過程中調參的時間可能佔比更多些。

所以說演算法工程師是「調參俠「並不合適。


這樣說的是真正不理解這個行業的 。

可以說這個行業裡面最低等的剛入門的所謂的演算法工程師也就只能幹干調參的工作 。

真正的老手往往是從數據和特徵下手的,而且還需要豐富的行業經驗 遠遠不是調參數這麼簡單的事情 。

一定要記住一句行業內的諺語,數據和特徵才決定演算法 的上限,而選擇的演算法和參數只是決定了已逼近這個上限的速度


因為大部分公司不希望你用一個沒有驗證過的模型,他要考慮後面接手的小白還能不能看得懂。實驗室和企業玩的是兩種路子。


如果不是深刻的理解數學原理,靠著數據的堆砌那就容易成為調參工程師


參數肯定影響效果,不同的函數通過參數調節可以加速收斂和避免提前收斂,但是這兩個特性是矛盾的,所以你要根據實際情況選擇不同參數


程序員被稱為碼農,代碼狗。演算法工程師被稱為調參俠。

都一樣的,這類稱呼全是扯淡。


曾經在兩個完全不同的業務上面使用過一模一樣的兩組參數,模型都是 XGBoost,並且效果都是OK的。當然樣本和特徵需要提前處理好,也要做很多的數據預處理的工作。


推薦閱讀:
相关文章