想法很美好,现实很骨感,我也不想天天听项目经理指挥来工作,我也想自己接单。

真实情况是,机器学习演算法工程师比其他程序员更依托平台资源。

怎么说呢?即使你演算法能力没问题,但没有平台资源,你的演算法只是demo,有了平台资源,你的演算法才能变成产品。

具体点说吧。

比如你接外包,要给一个公司构建一个推荐系统。你用给他弄伺服器,然后安装spark,调试,传数据,资源管理等等。每项都很费时间,结果你会发现,你开发周边的时间要比你开发演算法的时间多出几十倍。

下面这个图很直观地解释了机器学习项目里每个部分要多少投入资源(精力或者人力)。中间那个黑色的,小到字都看不清了的,就是你开发演算法投入的精力。

图源自:《Hidden Technical Debt in Machine Learning Systems》

https://papers.nips.cc/paper/5656-hidden-technical-debt-in-machine-learning-systems.pdf?

papers.nips.cc

挺值得一读的论文。

况且演算法依赖数据,你在不知道客户数据质量的情况下,贸然接个单来开发可以说是无底洞。专业的公司都需要经历一个数据评估过程才报价的。

如果你要出来自己干,最好有个团队。但现在出来创业的AI团队太看背景了,一个团队十人里五六个常青藤的都未必能拉到投资。

有的做quant的,对数据平台需求就不多,但是对数据本身需求高,对网路延迟要求要够低,还是很难单干。。

我认识的机器学习演算法工程师赚外快的出路就只有做AI技术文章,开公众号,建社群,吸引读者,做培训。这是门槛最低的赚外快路子了。但是这么做副业,倒不如多刷题,然后跳槽,来的涨幅更多。


不可能。

软体程序员可以接外快或者绝大多数可以接项目单干的情况都是因为行业为轻资产类型。一般出脑力,出经验背台电脑就行。

然而机器学习项目显然是重资产类型,无论是集群,显卡,还是数据本身。没有可能脱离生产资料,由劳动者掌控。可预见的是,5-10年内强AI对口专业会和生化材料一样变成劝退专业…

不如上班努力点看看能不能分到期权股票升值加薪…


说个段子。

17年的时候,广州某直播平台找了一家做演算法的外包团队来帮他们构建自己的智能直播推荐系统。

该外包团队开价数千万,公司想了下,答应了,但是得先出成果后付款

一年过去,指标只升了一点点。

好巧不巧,公司内部推荐组的有个工程师想了一个简单的组合排序规则,大概就是用户历史看过+热门+其他的规则,结果效果完爆演算法外包团队。

该团队忙了一年,分文未收。

那么问题来了,我们怎么才能超过以上的团队,赚到比公司发的钱更多的收入。


首先既然是自己单干,那么你就必须要面临两个机器学习方面最大的难点,一个是训练数据去哪找第二个是硬体资源怎么解决。由于这两个限制,语音相关的和图像相关的就别考虑了,那活就不是个人该干的活。

既然没了语音和图像这两个ai大项而且还必须找那种数据好收集,规则相对简单,通过较浅层的神经网路就能实现的项目那目前看来一个方向是nlp,一个方向是金融。

先说nlp,在这个方面个体最容易完成的项目应该就是小语言模型了。现在很多asr里的解码器其实是将一个大语言模型和一个专项的小语言模型先插值再剪枝之后再compose成有限加权状态机的,个体很难搞定几百G文本训练的大语言模型那用几个G文本甚至几百M文本训练的专项小语言模型总是有可能的吧,只不过就是看你收集文本的能力了。而且ngram语言模型对计算资源要求还真的很低很低。

第二个是金融领域,基于ai的模型拟合分析和未来趋势预测都是不错的选择。而且市场分析模型这种东西对于数据宽度的要求远远大于对数据长度的要求(举个例子就是你能挖掘出多少对某一个时刻的股指数据产生影响并且相互独立的因素这件事比你能找到多少个时刻的股指数据重要多了)。所以相对而言数据还是比较容易收集的。如果你有心的话从现在开始每隔5-15分钟收集一次股指数据,尽可能从更多的方面收集不同类型的数据,那几个月的时间就足够你收集出一个很优秀的训练数据集。用这个数据集训练出的金融分析模型很可能就是目前作为个人所能训练出的最有价值的ai模型了

当然,如果你作为一个ai演算法真的可以做到私活比工资赚的多那说明你该换工作了。既然你有那个层次的水平,换份工作升职加薪它不香么?


嗯?做机器学习演算法培训课程。


推荐阅读:
相关文章