学了点opencv,做了一个车牌识别,被打击到了。目前有点迷茫,不知道该学点什么。是否要听听吴恩达老师的机器学习(本人对机器学习没有任何了解),是否听听李飞飞老师的课。然后再代码实现方面要具备哪些能力(代码水平一般)类似那些框架什么的。本人的目标是能做出点小的东西,主要是发论文(想读博)。目前研一已经过去2个月了。求大佬不吝赐教


推荐关注我们公众号有三AI,一年原创将近百万字的技术文章,大部分是计算机视觉领域,可以参考我们的年终总结:

【年终总结】2019年有三AI做了什么,2020年我们要做什么??

mp.weixin.qq.com图标

另外从两个方向来回答这个问题,第一个是怎么系统性进阶,第二个是如何系统性学习。

第一个问题,如何系统性进阶,我斗胆将学习深度学习的同志分为5大境界,分别是白身,初识,不惑,有识,不可知,下面一个一个道来,以计算机视觉方向为例。

http://weixin.qq.com/r/xEw1LebEMbtOraJO9xnW (二维码自动识别)

1 白身

所谓白身境界,就是基本上什么都不会,还没有进入角色。在这个境界需要修行的内容包括:

(1) 熟练掌握linux及其环境下的各类工具的使用(2) 熟练掌握python及机器学习相关库的使用

(3) 掌握c++等高性能语言的基本使用

(4) 知道如何获取和整理,理解数据

(5) 掌握相关的数学基础

(6) 了解计算机视觉的各大研究方向

(7) 了解计算机视觉的各大应用场景

(8) 了解行业的优秀研究人员,知道如何获取最新的资讯,能够熟练阅读简单的技术资料

如果掌握了这些,那么就从白痴,不,是白身境界晋级了。怎么判断这个境界呢?可以参考以下的文章,看看掌握的如何。

AI白身境界系列完整链接:

第一期:【AI白身境】深度学习从弃用windows开始

第二期:【AI白身境】Linux干活三板斧,shell、vim和git

第三期:【AI白身境】学AI必备的python基础

第四期:【AI白身境】深度学习必备图像基础

第五期:【AI白身境】搞计算机视觉必备的OpenCV入门基础

第六期:【AI白身境】只会用Python?g++,CMake和Makefile了解一下

第七期:【AI白身境】学深度学习你不得不知的爬虫基础

第八期: 【AI白身境】深度学习中的数据可视化

第九期:【AI白身境】入行AI需要什么数学基础:左手矩阵论,右手微积分

第十期:【AI白身境】一文览尽计算机视觉研究方向

第十一期:【AI白身境】AI+,都加在哪些应用领域了

第十二期:【AI白身境】究竟谁是paper之王,全球前10的计算机科学家

2 初识

所谓初识,就是对相关技术有基本了解,掌握了基本的使用方法。在这个阶段,需要修行以下内容。

(1) 熟练掌握神经网路

(2) 培养良好的数据敏感性,知道如何正确准备和使用数据

(3) 至少熟练掌握一个深度学习框架的使用

(4) 熟悉深度学习模型的基本训练和调参,网路设计

(5) 掌握归一化,激活机制,最优化等对模型性能的影响

(6) 能熟练评估自己的演算法,使用合适的优化准则

我们正在更新这一个系列的文章

AI初识境界系列完整链接:

第一期:【AI初识境】从3次人工智慧潮起潮落说起

第二期:【AI初识境】从头理解神经网路-内行与外行的分水岭

第三期:【AI初识境】近20年深度学习在图像领域的重要进展节点

第四期:【AI初识境】激活函数:从人工设计到自动搜索

第五期:【AI初识境】什么是深度学习成功的开始?参数初始化

第六期:【AI初识境】深度学习模型中的Normalization,你懂了多少?

第七期:【AI初识境】为了围剿SGD大家这些年想过的那十几招

第八期:【AI初识境】被Hinton,DeepMind和斯坦福嫌弃的池化,到底是什么?

第九期:【AI初识境】如何增加深度学习模型的泛化能力

第十期:【AI初识境】深度学习模型评估,从图像分类到生成模型

第十一期:【AI初识境】深度学习中常用的损失函数有哪些?

第十二期:【AI初识境】给深度学习新手开始项目时的10条建议

3 不惑

进入到不惑境界,就是向高手迈进的开始了,在这个境界的重点就是进一步巩固知识,并且开始独立思考。如果说学习是一个从模仿,到追随,到创造的过程,那么到这个阶段,应该跳过了追随,进入了创造的阶段。

如果是在学校读研究生,就要能够发表水平不错的文章,如果是在公司做业务,就要能够提出正确且快速的解决方案,如果是写技术文章,就要能够信手拈来原创写作而不需要参考。

这个阶段需要修行以下内容:

(1) 熟练玩转数据和模型对一个任务的影响

(2) 能够准确的分析出模型的优劣,瓶颈

(3) 对于新的任务能够快速寻找和敲定方案

(4) 拥有各种各样的深刻理解深度学习模型的技能,从可视化到参数分析等等等

(5) 能够优化模型到满足业务的需求,实现工业级落地

(6) 了解行业的最新进展,并在某些领域有自己的独到理解

不惑境界的内容

第一期:【AI不惑境】数据压榨有多狠,人工智慧就有多成功

第二期:【AI不惑境】网路深度对深度学习模型性能有什么影响?

第三期:【AI不惑境】网路的宽度如何影响深度学习模型的性能?

第四期:【AI不惑境】学习率和batchsize如何影响模型的性能?

第五期:【AI不惑境】残差网路的前世今生与原理

第六期:【AI不惑境】移动端高效网路,卷积拆分和分组的精髓

第七期:【AI不惑境】深度学习中的多尺度模型设计

第八期:【AI不惑境】计算机视觉中注意力机制原理及其模型发展和应用

第九期:【AI不惑境】模型剪枝技术原理及其发展现状和展望

第十期:【AI不惑境】模型量化技术原理及其发展现状和展望

第十一期:【AI不惑境】模型压缩中知识蒸馏技术原理及其发展现状和展望

第十二期:【AI不惑境】AutoML在深度学习模型设计和优化中有哪些用处?

4 有识

到这里,就步入高手境界了。可以大胆地说自己是一个非常合格的深度学习演算法工程师甚至是研究员了,在自己研究的领域里处于绝对的行业前沿,对自己暂时不熟悉的领域也能快速地触类旁通。

无论是眼界,学习能力,还是学习态度都是一流水平,时而大智若愚,时而锋芒毕露,当之无愧的大师兄。

5 不可知

最后一个境界,就是不可知境界,超出我能描述的范围了。举一个例子,马文·闵斯基,既可以让AI生,又可以让AI死,这样的人是不会遇到的,放心好了。

这个修行之路仍然在更新中,我们发布了超过360页的指导手册,大家可以去自行获取。

------------------------------------这是分隔线------------------------------------

第二个问题,如何系统性学习,大家就可以去我们公众号《有三AI》和知乎专栏《有三AI学院》看,覆盖CV/NLP两大领域,涵盖深度学习数据和模型、GAN、AutoML等基础技术,人脸图像,医学图像,图像分类分割等应用领域,学习资源、论文推荐、AI行业与产品等学习资料,将近30个专栏。

下面是一些综述性质的总结和两个适合初学者的内容

  • 有三AI发布360页11万字深度学习CV演算法工程师成长指导手册,可下载收藏列印,未完待续
  • 有三AI一周年了,说说我们的初衷,生态和愿景
  • 【年终总结】2019年有三AI NLP做了什么,明年要做什么?
  • 【年终总结】有三AI至今在人脸图像演算法领域都分享了哪些内容?
  • 【年终总结】2019年有三AI知识星球做了什么,明年又会做什么
  • 【小结】除了网路搜索(NAS),AutoML对深度学习模型优化还有哪些贡献?
  • 【完结】12篇GAN的优化文章大盘点,浓浓的数学味儿
  • 【杂谈】有三AI不得不看的技术综述(超过100篇核心干货)
  • 【总结】言有三阿里天池深度学习模型设计直播汇总,附赠超过200页直播PPT课件
  • 【完结】16篇图像分类干货文章总结,从理论到实践全流程大盘点!
  • 【完结】12篇文章带你逛遍主流分割网路
  • 【完结】优秀的深度学习从业者都有哪些优秀的习惯
  • 【完结】给新手的12大深度学习开源框架快速入门项目
  • 【杂谈】有三AI专栏作者邀请,在这里写文章能获得什么,有什么不同?

2 深度学习模型设计

模型解读系列文章:

第一期:【模型解读】从LeNet到VGG,看卷积+池化串联的网路结构

第二期:【模型解读】network in network中的1*1卷积,你懂了吗

第三期:【模型解读】GoogLeNet中的inception结构,你看懂了吗

第四期:【模型解读】说说移动端基准模型MobileNets

第五期:【模型解读】pooling去哪儿了?

第六期:【模型解读】resnet中的残差连接,你确定真的看懂了?

第七期:【模型解读】「不正经」的卷积神经网路

第八期:【模型解读】「全连接」的卷积网路,有什么好?

第九期:【模型解读】从「局部连接」回到「全连接」的神经网路

第十期:【模型解读】深度学习网路只能有一个输入吗

第十一期:【模型解读】从2D卷积到3D卷积,都有什么不一样

第十二期:【模型解读】浅析RNN到LSTM

第十三期:【模型解读】历数GAN的5大基本结构

2 开源框架速成(更新完)

开源框架速成系列:

第一篇:【caffe速成】caffe图像分类从模型自定义到测试

第二篇:【tensorflow速成】Tensorflow图像分类从模型自定义到测试

第三篇:【pytorch速成】Pytorch图像分类从模型自定义到测试

第四篇:【paddlepaddle速成】paddlepaddle图像分类从模型自定义到测试

第五篇:【Keras速成】Keras图像分类从模型自定义到测试

第六篇:【mxnet速成】mxnet图像分类从模型自定义到测试

第七篇:【cntk速成】cntk图像分类从模型自定义到测试

第八篇:【chainer速成】chainer图像分类从模型自定义到测试

第九篇:【DL4J速成】Deeplearning4j图像分类从模型自定义到测试

第十篇:【MatConvnet速成】MatConvnet图像分类从模型自定义到测试

第十一篇:【Lasagne速成】Lasagne/Theano图像分类从模型自定义到测试

第十二篇:【darknet速成】Darknet图像分类从模型自定义到测试

将近500篇成系统的文章,超过100万字原创,相信全网没有第二个这样的计算机视觉公众号,希望对你有用。


学了点opencv,做了一个车牌识别,被打击到了。目前有点迷茫,不知道该学点什么。是否要听听吴恩达老师的机器学习(本人对机器学习没有任何了解),是否听听李飞飞老师的课。然后再代码实现方面要具备哪些能力(代码水平一般)类似那些框架什么的。本人的目标是能做出点小的东西主要是发论文(想读博)。目前研一已经过去2个月了。求大佬不吝赐教

猜测一下,同学你是大本毕业直接读研没出去工作过的吧~

A、计算机视觉三大关键发展是获取、处理、识别分析(也有认为识别与分析可以分开);

B、获取、处理、识别各自有自己的技术瓶颈点,目前主要集中在处理、识别两个方向上的瓶颈亟待突破;

C、机器学习是目前计算机视觉中解决「识别」瓶颈的一种重要方法,但也有局限性和劣势区域。

D、处理与识别的技术重要性基本是等同的。

E、不管你用什么代码语言,最关键的是如何将数学模型转化为可运行代码的转化能力。

F、高校论文研究热点不一定赚钱,赚钱的热点不一定好出论文!

暂时给出以下建议:

建议一:了解所处行业的市场技术供需情况

毕竟不管怎么学习,最终大家的目标都是要恰饭吗~

目前计算机视觉的市场化有两个大方向,一个是针对普通民用、商用方向,一个是针对实体制造业用以提升生产能力的工业应用方向。

对于普通民商用方向,可以参考的企业有Face++旷世、商汤以及国内外知名IT企业的计算机视觉技术研发部门。但大体来说,基本集中在日常社会环境中对于人/物体的分割识别、状态与身份确认上。具体应用环境有警用人脸身份识别(巡逻过程中高效搜索通缉犯)、特定场所人群分析、AR互动(虚拟试穿,活体检测,美颜与换脸)等等。

对于实体制造业的工业应用方向,三大基本需求是定位、测量、状态(瑕疵)识别,可参考企业美国康耐视、德国MVTec。

而这两个大方向上,挣钱的方式与服务的客户(及其需求特性)都是有很大差异的,你只能选择其中一个去收获财富与成就,而挣大钱的前提是抓住行业需求痛点。

另外,不对本专业所涉及行业的需求有清晰认识的话,我估计你开题报告都可能写不出来~

建议二:想清楚为什么要读研博

一般研究生阶段迷茫的,普遍都是没有行业经验(抓不住需求痛点),而没有行业经验就容易找不到研究方向。所以我希望同学你先想清楚你为什么要读研,并且为什么打算继续读博!千万不要陷入为了读书而读书的境地,你读理工学科出来,最终是要服务于社会,满足社会某种需求的。

此外,一直待在学校的学生没有行业经验很正常,没什么可感觉难受的,但不去主动了解就很有问题了,至少说明你的信息收集能力很成问题!计算机视觉在工商业的使用很丰富案例和问题讨论,有不少交流群和交流论坛,多去看看。

建议三:搞清楚自己适合走什么道路

最后请允许我回归到你的职业发展问题上,不是所有人毕业后(包括博士毕业)都留在本专业范围内工作,一般有效转化率最高也就50%。你毕业后可以选择的职业途径很多(行政公务员、中小学教师、企业职员、自主创业、继承家业等等~),如前面所述高校论文研究热点不一定赚钱,我希望你在单纯头大于如何完成硕士学业之前,先搞清楚自己以后到底要怎么走职业道路。


卷积神经网路是计算机视觉领域的重要方法,尤其在模式识别方面的应用非常多。

如果想要提高识别准确率的话,可以从卷积神经网路开始学起,以及它的一些变体,例如深度残差网路、深度残差收缩网路等。

卷积神经网路

残差网路

深度残差收缩网路

首先还是需要做很多实验的,opencv做车牌识别据我所知已经有非常成熟的方案了,重要的是先找到自己感兴趣的点,然后再对这个感兴趣的点做研究主要流程一般如下:

1、找到自己感兴趣方向的主流方案,2、在github上找相关代码,一般都会公布的。3、clone代码,然后复现,了解整个流程,要是自己没有GPU,也可去智星云租用GPU,我们现在没法回实验室,就这么干的。4、对已经复现的实验,进行改进,只要能稍微有所改进就可以发论文了。


可以看看我这篇回答,希望能为你提供帮助

机器视觉CV:图像处理+深度学习方向,需要学习什么知识??

www.zhihu.com图标

更多信息可以关注 『机器视觉CV』公众号,我分享了大量图像处理 计算机视觉 OpenCV 深度学习的相关知识和实战项目,让你掌握计算机视觉的相关知识。


推荐阅读:
相关文章