AI在一定程度上重塑了我们观察和记录世界的方式。

DJI大疆推动机器视觉、深度学习技术与无人机等设备结合起来,将复杂的操作变成简单的指令,让专业影像记录门槛不断降低,普通人也能轻松地实现自己的创作构想。

航拍无人机进入机器视觉时代

当精灵2被冠以Vision之名起,大疆就已经显露出它在机器视觉领域的野心。2015年,初代智能跟随的雏形成功在研究室中诞生。

(知乎动图显示失灵,在手机端双击该图即可查看动态效果)

次年3月,大疆精灵 Phantom 4 诞生,这款消费级无人机具备环境感知与避障、视觉追踪、指点飞行三大创新功能,标志著消费级无人机从此拥有了「视力」与「智力」,能够识别周边物体、判断飞行环境,并在一定条件下实现自主飞行。无论在当时还是现在看来,都是革命性的创新。

(知乎动图显示失灵,在手机端双击该图即可查看动态效果)

什么是机器视觉呢?机器视觉是人工智慧正在快速发展的一个领域方向。简单说来,机器视觉就是用机器代替人眼来做测量和判断,先将被摄取目标转换成图像信号,得到被摄目标的图像后,通过数学模型计算,提取目标的多层次表征,再结合立体几何与运动学模型的计算,对目标的位置进行测量、估计和预测,进而根据一系列观测数据来控制设备动作。

当时的精灵4通过程序预设好的参数和演算法来识别物体的主要特征,在识别目标对象后,协同飞控完成空中自动构弧等操作,极大降低了使用者的操作门槛。

在实际操作中,用户只要在DJI GO App中选择「智能跟随」模式并点击被跟随目标,精灵4便会在视野中自动扫描该对象,将相机镜头牢牢锁定在被跟随对象身上,而且在被跟随对象进行不规则运动的时候,精灵4也能进行跟拍。

先进的机器视觉技术让航拍不再是专业人士的权利。「精灵4开启了一个全新时代,让初学者也可以自如操控无人机,将用户从繁琐操作中解放出来,专注于航拍。」

引入深度学习演算法,识别能力也更为精确。

如果你听说过AlphaGo那次震惊世界的人机围棋大赛,那你一定对深度学习不陌生。从16年至18年,历时3年的跨步,人工智慧所采用的深度学习演算法,被成功引入到无人机开发当中。

无人机的深度学习,就是通过对大量物品和身体的样本学习,让它能够更加智能而准确地识别出被摄物体。

当时,为了让大疆精灵4P能够对运动物体进行自动跟随拍摄,研发人员加入了更多特征模型,也通过大量的样本学习,让飞行器可以分辨人、汽车、船只,根据物体运动速度调整灵敏度,拍摄更加流畅稳定。

最后先进的图像识别演算法让精灵 4 Pro V2.0能识别和追踪拍摄对象,在运动中保持构图一致,让高难度航拍变得轻而易举。

深度学习演算法的运用,也为御2无人机航拍效果锦上添花。

(知乎动图显示失灵,在手机端双击该图即可查看动态效果)

强大的跟随性能,让御2除了主动绕行之外,还实现了轨迹预测、高速跟随等更多效果,识别能力也更为精确。

(知乎动图显示失灵,在手机端双击该图即可查看动态效果)

语义理解作为计算机视觉领域的一个重要研究方向,大疆在该领域的研发成果为精准农业提供了新的科技支持。

比如在果园场景中,果树往往分布不均匀,高矮差异大,期间也经常夹杂建筑物、电线杆等障碍物,针对果树的全自动喷洒作业难度较大。而利用三维重建和深度学习技术,精灵 4 RTK版、多光谱版可以对植保机作业区域进行三维场景的精准扫描,通过大疆智图软体构建果园场景的三维模型。

基于深度神经网路的三维模型识别系统,即可在三维模型中识别出果树、建筑、电线杆等物体,并标记出每棵果树的位置与树冠大小,构建果园三维语义地图。就这样,地块区域状况一目了然,就可以即时洞察植物健康,根据准确数据进行打药、施肥等精细作业。

人人都能用得上的人工智慧

在航拍场景中,大疆的智能跟随技术已趋成熟,但是他们并未止步于此。

大疆针对手持场景进行了专门的优化,引入了基于头肩的检测与跟随演算法,并把学习样本增加到千万量级,从而覆盖更多场景,这就是2019年推出的全新智能跟随3.0。

(知乎动图显示失灵,在手机端双击该图即可查看动态效果)

基于头肩模型演算法,智能跟随3.0可以智能识别头部与肩部的协调关系,不仅跟随目标时不易丢失,对于用户的低头、转身、跳跃等丰富的动作变化,都可以被捕抓到。

而且,采用头肩演算法的智能跟随3.0,从远到近都能够精准识别判断,相比身体与脸部识别而言,能给用户提供更大的创作空间。

(知乎动图显示失灵,在手机端双击该图即可查看动态效果)

当然,智能跟随3.0最有意义的地方还不仅于此。

在这个全民vlog的时代,每个人都亟需一个功能强大且操作门槛低的拍摄设备。而智能跟随3.0,就实现了这一点。它是一个真正意义上的,人人都用得起的人工智慧。

(知乎动图显示失灵,若在APP端请双击该图即可查看动图效果)

之所以说它变得「人人用得起」,是因为之前的智能跟随技术,因为涉及庞大的计算量,必须依靠特定的硬体模块才能实现,所以基本只能应用在无人机产品上,使用门槛相对较高。

(知乎动图显示失灵,在手机端双击该图即可查看动态效果)

而智能跟随3.0极大优化了演算法,在保持演算法精度的前提下,使得技术更加的轻量化,让即便是晶元能力稍逊的千元手机,都可以用上这个功能。大疆在2019年发布的灵眸手机云台3、如影SC都应用了这项技术。

(知乎动图显示失灵,在手机端双击该图即可查看动态效果)

未来,依然有无数的可能

2019年RoboMaster 机甲大师赛的全国赛事的直播中,最新一代AI技术应用让画面更趣味性和观赏性。

可以看到,画面上可以动态显示对战小车类型、种类和血槽进度。注意了,这不是事后加的特效,而是直播实时渲染的结果。

这样的效果看似简单,但在技术层面实现相当不容易。识别物体运动变化非常丰富,现场环境光照不仅很弱而且还有各种光影变化,加上实时显示不能有拖影的限制,对演算法的要求非常高。

未来,这项技术与AR增强现实结合后,必将大放异彩。

随著以人工智慧为代表的新一轮信息技术革命的突破性进展,影像技术必将迎来高速发展和革新的历史时刻。

我们可以一起期待,属于大疆的下一个「不可能」。

关注 @DJI大疆创新 ,为你分享最新鲜专业的内部技术干货及产品资讯~


学科教育。

从我的设想来看,我认为AI将是未来教育的趋势。一直以来,我都在想一个问题,我们的教育缺乏什么。个性化和定制化。因为我们从事教育的都是老师,给学生解答问题都只能来一个讲一次,或者选择大部分人错误的集体讲解。也就是说,作为一个老师,我们对学生的指导最小单位为班级。但是作为变化不算大,或者说几乎没有变化的知识,引入Al进行定制,将最小单位到达个人。

其实,我们平时所做的作业,目的是什么?不就是为了将不会的地方暴露出来吗,不知道各位有没有看过一个魔术。就是给你一张纸,你在上面挑一个字,然后魔术师依次给你看5张不同的纸,你只需要回答他上面有或者没有即可,然后他就会告诉你那个字是什么。实际上就是一个交集和补集之间的应用而已,而在我们的教学上,其实作业的设计也可以利用类似原理,通过这种方式对学生的知识盲区进行锁定。想想都知道没有一个老师能够做到,但是对于AI来说确是可以。

同时,大家有没有想过,我们每个人在学习上的成长其实会反应在我们的每次考试中,当然一个人只是个例,可是每年每届有多少的学生?这些学生的数据,甚至能做到包含每个阶段不同类型的学生,我就问问大家高考前做这么多模拟题,每份都是你需要的吗,做完之后你知道自己应该往那个方向查漏补缺吗?学生太容易迷恋在题海里面,而老师只能根据全级或者全班的情况布置模拟题,甚至老师也不会分析哪些模拟题适合。

我希望,有一天,我们每个人的备考都能做属于适合自己的模拟题,希望每个人做完每次考试后,都能拿到属于自己的反馈。这些靠老师做不到的,但是靠AI却可以。

当然这是我们对Al最理想的期待,能够完成自主的分析,题目的推荐等等。

其实从信息技术上,我认为各个互联网大厂都完全有能力去实现这个,但是从我接触来看,各大互联网大厂都有向教育业进军的想法,但是他们都只是著眼于将线下课程搬至线上,主要招聘还是一些前端后端等技术人才。

但是要完成我上述的期望和设计,没有一个厉害的教育团队是做不到的。

奈何我不胜码力,亦无资本。希望有朝一日,我能把这个梦想实现了吧。


我目前在做的一件事,就是利用AI反射人类的学习方式,以AI为镜而明己身。如何理解呢?

像其他回答所讲的AI革新与进步,本质上都是将AI当作一件工具或一个发明,与计算机、汽车似乎没有什么差别,作为一种技术手段来看,这样的理解非常准确。不过,让我们再稍微思考一下这其中的不同

AI在做的,是将人类的认知、学习、记忆等功能剥离出来,并在二进位计算机上复现,以获得特定任务上快速、准确的处理能力。在某些任务上,比如自然语言处理中的文本分类,BERT衍生的最新模型甚至已经达到超越人类基准线的水平。归根结底,AI学科在诞生之初,就是从脑科学以及认知神经学衍生而来的,也就是说,AI的底层学习方式,本质上就是在模仿人类,比如最著名的深度神经网路,其神经元激活方式和多层结构就是直接效仿了人脑神经网路的机制。

既然如此,我们能不能将AI看作人的多个子集,不同子集中活跃的某些模型或系统机制,正好对应著人类所具有的某种思考、学习模式?更进一步,这些模式是否可以被用来借鉴,甚至提升人类的思维方式?

答案是肯定的。

虽然我的研究从去年开始,在各个平台已经发表了一些成果,目前也帮助了上万名对思维、学习方式感到困惑的学生,但因为只是个人的业余兴趣,缺少系统性的计算机科学、神经学及心理学的实验结论支撑。不过,有趣的是,Deepmind前段时间发表的论文,正好印证了我的假说:

Prefrontal cortex as a meta-reinforcement learning system?

www.nature.com

这篇paper论证了人脑的前额皮质与AI强化学习系统的联系。为了证明导致人工智慧元强化学习的关键因素也存在于大脑之中,DeepMind 研究者提出了一个理论,也就是我所说的AI反射理论。该理论不仅符合多巴胺和前额叶皮质的现有知识,而且也解释了神经科学和心理学的一系列神秘发现。尤其是,该理论揭示了大脑中如何出现结构化的、基于模型的学习,多巴胺本身为什么包含基于模型的信息,以及前额叶皮质的神经元如何适应与学习相关的信号。

根据论文中的描述,对人工智慧的深入了解可以帮助解释神经科学和心理学的发现,这也强调了领域之间可以互相提供价值。比如在目前进展较快的强化学习领域,根据智能体的学习模式,我们已经可以从特定的脑回路组织中获得许多逆向思维的益处。

举个例子,我的第1期文章从强化学习讲起,最后通过智能体的学习方式,解构了日常生活中游戏的成瘾机制,最后借助强化学习系统的知识,总结出了如何高效利用大脑的系统机制进行学习

图灵的猫:【思维论01】如何让自己像打王者荣耀一样发了疯、石乐志的学习??

zhuanlan.zhihu.com图标

在未来,希望有更多科研成果出现,让我们可以通过通俗易懂的语言,将这种思维方法普及给更多人,提高我们获取知识的能力,并改变对事物的认知和思考习惯。


不是AI从业人员,就从两个身份入手回答嗷。科研人员和城市规划师,还都非常初级,观点不成熟,看官轻拍。我的观点都是基于ai能做好,做不好的大概只能叫机器,所以比较夸张哈。

城市科学。AI可以自动做研究,写基金,写论文。个人三年文献阅读量估计在2000篇左右,写作量去年大概不到20万字。有了科研AI。我这种弱鸡大概可以被导师辞退退学了。分分钟成千上万的文献检索量,分分钟写出科研八股文。。即便未必有特别大的价值。可架不住人家做的多啊。。这种科技创新能力不敢想像。。。甚至可以发展一些新领域,会不会有一些领域的开拓创新是纯粹的ai引领,发现新的规律是ai做的,莫非后来的科研人员,文章里面会这样引用「AI(2050)提出新的科学理论,AI(2070)对此有不同观点,本研究认同AI(2075)的理论」。。哇。酸爽。

城市规划行业呢。一直收到新技术的刺激。CAD,Gis各种吧。好像现在就有城市大脑这个东西,已经能做很多东西了。规划有了Ai大概我们就可以失业了。自动招商引资,自动策划项目,自动做发展战略,自动做强排方案,自动做设计凹造型方案,自动做效果图,自动做ppt。然后自己汇报,自己列印成果,自动审批,自动检测管控。哇。我们主要做一些辅助调整,坐享结果。以后规划就是这样的名称某市国土空间总体规划(2030年AI/非AI)主要规划人员:规划AI(教授级工程智能系统),设计AI(高级设计智能系统)等等。目前强排的人工智慧应该可以实现了吧,所以其他部分的实现是时间、成本等问题。

总结一下。AI很好,也很重要。但只是辅助人的智慧工作,而非代替。人与AI相处还是要有绝对的信息优势,大概就是可操作和可控制,即使某个个体、某个领域无法实现优势,那么打破也是一种优势。城市规划这个领域,AI也不能做到绝对的公平公正,提高效率减少错误倒是可以的。


作为围棋界的一员,相比其他传统行业,AI对我们的革新可以说是「让围棋换了个游戏方式」。

众所周知2016年AlphaGo战胜了李世石,但大家不知道的是大致从2017年开始,AI就从伺服器级才能到达九段水平,变成了家庭电脑就可以轻松战胜人类最顶尖的高手

现在随便一款家用级的电脑,加上AI水平就能超过最厉害的人类高手(在我码前面两行字的一小会功夫,我家电脑就算了七万五千个变化,这是人类所远远不及的。)

AI显示变化图及左侧的胜率变化。

因此围棋的训练方式也发生了天翻地覆的改变,原本与对手复盘总结的方法,变成了「瞎琢磨」。找问题变成了交给AI,几秒后AI就会告诉你正确的下法。

在比赛过程中,AI会实时给出胜率和最佳参考图

整局棋的胜率走势,和自动分析过程变化

不过招法上的革新倒是其次,最重要的是AI的思路与人完全不同。因为围棋的空间和变化太多,因此以前人类是先去边角这些能算得清的地方下棋棋盘中间的广阔星空留到后面争夺而AI最令人震惊的一点就是它能分析出中间天文数字的变化,然后给出最佳一手。

这使得现在再去看2016年以前的棋谱,感觉恍如隔世一般,甚至像DOTA1和DOTA2一样,围棋在短短几年间变得陌生得像两个游戏似的。

现如今,围棋的训练深受AI的影响,因此随著对AI的模仿,大家开始主动往棋盘中间的去探索。一方面是令人类距离完美的「围棋之神」越来越近。另一方面是改变了此前略显单调的布局下法和战斗思想,让比赛也变得更有观赏性

同时由于AI对训练方式的改变,使得原本认为「年轻力壮」才能下好棋的观点出现了改变,近两年出现了一些原本默默无名,靠AI训练逆生长的选手。比如李昊承等人。

在此前的职业生涯里一直默默无闻的李昊承(左一)在服完兵役回来后,却在近一年的比赛中战胜了包括朴廷桓、李世石、申真谞等N位韩国高手。并随队打入韩国围棋联赛季后赛的总决赛(可以理解成NBA总决赛)

由于AI出现后,大家都能在技术上跟上年轻人。所以我相信随著时间的推移,围棋选手会变成经验+技术的结合体。这会给棋界发展带来新的变化。


说完AI对围棋职业圈的影响,接下来说一下目前AI下沉到业余圈对围棋培训的影响。

以前在围棋的初学阶段,为了激起学生的兴趣,所以对围棋的解释是4个围一个的「围」棋

后面再慢慢改回围空围地盘的「围」棋。而现如今随著AI也进入围棋教学中,「爱思通」等软体则用画图标记等方式让学生跳过4个围一个的第一阶段,直接进入「」棋第二阶段

并且在作业方面,现在可以利用AI分析,每道题是做了多久、试了几次、哪种类型的题容易错等方面,从而更有针对性的去教学


推荐阅读:
相关文章