【智能观】日前偶遇一本书:《与大数据同行,学习和教育的未来》,作者是英国的维克托·迈尔-舍恩伯格(Viktor Mayer-Schonberger)、肯尼思·库克耶(Kenneth Cukier)。在本书成书的2014年底,利用大数据推动教育和学习还处于早期阶段,但即便如此,吴恩达在那个时候就已经有了很大突破。在吴恩达将自己的事业重心重新放在教育上的今天,我们一起来看看三年前的他,通过大数据解决了教学中的什么问题。

截然不同的教学形式

达瓦(Dawa)正在集中注意力。他在笔尖上蘸一抹颜料,小心翼翼地下笔画出一条细细的黑线,然后又蘸了一点颜料,再画出一条细细的黑线。几小时后,一副唐卡——由迷人的几何细节构成的、描绘佛祖的丝绸卷轴画——逐渐成型。

屋外,环绕著不丹首都廷布四周的喜马拉雅雪峰,在傍晚阳光的照射下闪闪发光。屋内,达瓦和他那些同样20来岁、身著蓝色长袍的同学们,已经在中年师父的注视下持续作业了很长时间。

唐卡画家的培养遵循传统。达瓦和他的同学们来到这里,不是为了拓宽思维,而是为了成为一个训练有素的学徒。

达瓦的师父要确保这些年轻人严格遵守他的指令,重复那些先代唐卡画家的操作。对规则有任意一点的偏离或是破坏,不仅会惹得师父怒上眉头,还会遭到严令禁止。最好的画家,是能够完美再现师父作品的学徒。尽管师父给予的持续指导能够实现即时的反馈,但这仍然是一种极度缺乏数据的学习形式。

这与吴恩达(Andrew Ng)的教学形式有根本上的区别。吴恩达是斯坦福大学计算机科学家,也是提供在线课程服务的新兴公司Coursera的创始人之一,在互联网上教授他的机器学习课程,他的尝试预示著大数据对教育的变革。

吴恩达教授收集所有关于学生举动的信息,从中提取最有效的内容并将其纳入系统设计,从而使他的课程能够自动实现:教学的改善,学生理解力和成绩的提高,基于个人需求的定制教育。

比如,他追踪学生与视频讲座的互动行为:当学生观看视频时,点击了暂停或快进键,又或者是在视频结束前选择了放弃——这种数字互动意味著学生提早溜出了课堂。他能发现学生多次回看同一门课程,或者后退至上一个视频浏览课程内容的行为。

此外,他也会在视频课程中穿插突击测验,其目的并不是要督促学生集中注意力学习,这种重视课堂纪律的古老教学形式不是他关注的内容,他想知道的是,学生是否正在领会教学材料,以及是否卡在了某个问题上。每一个学生个体,都是他的观察对象。

通过追踪学生在计算机或平板电脑上完成作业和测验的情况下,吴恩达教授能够确定学生需要额外帮助的具体内容。他可以分析整个班级的数据,观察这一群体的学习情况,并以此为依据对课程进行调整。他甚至可以把这些信息与不同年级的不同班级做对比,从中判断最有效的课程元素。

数据的非凡效果

这些举措的确扩大了吴恩达教授的班级规模——成千上万的学生参与了他的课程学习——数量大到足以支撑他的研究成果,而大多数教育研究的开展仅仅基于小范围的观察对象。然而,班级规模本身并不是重点,数据才是其中的关键。

吴恩达教授已经发掘了数据的非凡效果。比方说,在追踪学生观看视频课程顺序的过程中,他发现了一个令人困惑的现象——大部分学生的学习是循序渐进的,然而在课程进行了数周之后(第7课前后),他们会跳回到第3课——其中的原因是什么?

他做了进一步地研究,发现第7课要求学生用线性代数写一条公式,而第3课是一堂关于数学知识的复习课,显然许多学生对自己的数学能力信心不足。

由此,吴恩达教授知道了该如何改进他的课程,即在那些容易让学生感到气馁的地方提供更多的数学知识回顾。而具体在哪里加入复习的知识点,正是数据提示给他的。

还有一次,他发现许多学生在重复同一主题的课程。针对这一现象,他采取的手段是进行数据可视化处理:当用户的学习进程出现顺序上的交错时,统计数据的显示颜色将由深蓝色变为鲜红色。在第75课和第80课,正常的学习秩序被打乱了,学生们在以各种各样的顺序反复观看视频。

对此,吴恩达教授的心得是:学生们正在努力尝试把握其中的概念。于是他认识到,如果教师具备这样的洞察力,就会重新制作课程,并且检查由此产生的数据,以确保此类情况得到改善。

大数据正在进入教育的方方面面

除此之外,还有大量的数据得以发掘。通常,论坛帖子的内容价值,是通过对文章的读者人数和评论人数的追踪加以判断的。但是,吴恩达教授开展了一个更为复杂的统计研究,用以「真实判断」课程论坛发帖的有效性。

他查看的数据是:在家庭作业或测验中做错了某个习题,但在阅读了某个特定论坛帖子之后,能够正确解答同一习题的学生比例。

例如,2011年,在一门机器学习的课程中,有成千上万的学生做错了关于「计算成本」的线性回归。但在浏览过第830篇论坛文章的学生中,则有64%不会再犯同样的错误。

以后,当有学生犯同样的错误时,系统就会自动推送第830篇论坛文章为他们答疑。在这里,确定最适合学习的论坛内容,凭借的是数据驱动的手段,而不是学生的自行判断。

这种大数据应用策略并不局限于吴恩达教授在斯坦福的课程,相关课程仅仅是这个领域中的先驱尝试。大数据正在进入教育的方方面面,并将对这个世界的学习产生深远的影响。

风投资金涌入教育领域

大数据促进了教育和技术的结合,激发了创业者的想像力,吸引著投资人的资金。仅2012年一年,就有超过10亿美元的风投资金注入教育领域,这个数字比5年前足足增加了一倍。

这一迹象表明,教育科技的时代已经到来,业界充斥著特有而晦涩的缩写名称,如LMS(learning management system,学习管理系统)和ITS(intelligent tutoring system,智能教学系统)等。而像Noodle、Knewton和Knowillage Systems这些有著可爱名称的公司也随处可见。

传统企业,如麦格劳-希尔公司(McGraw-Hill)、新闻集团(News Corp.)、培生教育集团(Pearson)和凯博教育(Kaplan)已经在这一领域建立据点,投入的研发和收购资金达到数十亿美元。

根据知名教育科技市场调查机构GSV Advisors的估计,在线学习市场的价值超过千亿美元,并且以每年25%的速度不断攀升。在美国,对教育的整体开支高达1.3万亿美元,相当于GDP的9%,仅次于医疗卫生。

大数据将为教育带来巨大变革

达瓦注视著他模仿师父画下的黑线,随后又画了一次,试图做到如师父教导的那般精确。这一过程似乎过于机械,难以称之为教育,而系统的传统教育也曾经一度与不丹的唐卡画家培训非常相似。

据传说,过去的法国教育部长们只需查看一下他们的怀表,就能准确得知这个国家每一个孩子在那个时间点上正在学习什么。在美国,1899年的教育署长威廉·哈里斯(William Harris)也曾夸口说,学校有著「机器的外观」,能够培养孩子「有条不紊地行动,并在自己的位置上端坐」等被动服从的美德。

的确,假如生活在两三个世纪前的人物——比如英国的弗洛伦斯·南丁格尔(Florence Nightingale)、法国的塔列郎(Talleyrand)、美国的本杰明·富兰克林(Benjamin Franklin)——走进今天的教室,他们会感到相当的熟悉。他们可能会说:没有什么变化——即使校园之外的世界早已变得几乎面目全非。

而与此同时,人们一直在关注利用CD、电视、广播、电话和计算机等技术变革教育的机会。「在公立学校里,书本将很快过时,」托马斯·爱迪生(Thomas Edison)在1913年满怀信心地说,「人类知识的所有门类都可以通过动态影象来进行教学。我们的学校系统会在十年内发生翻天覆地的变化。」

大数据能否超越那些力量甚微的创新而真正地变革教育呢?

对吴恩达教授而言,这场变化的发生速度,已经超出了他的想像。过去在校园里,他的机器学习课程一个学期的选修人数是几百名,而当他在2011年把课程搬上互联网之后,注册的学生突破了10万人,其中约有4.6万人确实开始了课程学习,并提交了第一次的作业。在为期4个月的课程结束之前,他又扩充了113个长度约10分钟的视频,这时已有2.3万人完成了大部分的学习任务,有1.3万人因成绩合格而获得了结业证书。

10%的完成率看起来似乎相当低下,而其他网路课程的完成率甚至只有5%。事实上,吴恩达教授的一位斯坦福同事——Udacity(Coursera公司的竞争对手)创始人之一的塞巴斯蒂安·特龙(Sebastian Thrun)——曾经于2013年秋天公开宣称MOOCs是一个失败的新生事物,而他提出该主张的原因就在于其过低的完成率。

然而这类忧虑忽略了一个更为重要的事实,那就是,即使就这个完成率而言,吴恩达教授单独一门课程的学生人数,如果凭借传统的教学手段,则需要他终其一生才能达成。

大数据已经做好了准备为教育带来它所期待的巨大变革。就让我们来共同关注这些变化将会如何发生吧。

想知道AI加教育领域有哪些最新研究成果?请在智能观(zhinengguanym)对话界面回复「论文」;

想要AI领域更多的干货?请在对话界面回复「干货」;

想了解更多专家的「智能观」,请在对话界面回复「观点」,去获取你想要的内容吧。

关于我们

朋友说,智能观是几个女文青在做科技的事情。

哪里,我们充其量是几个对AI和教育有无限好奇与情怀的伪文青。

我们以独特的视角观察AI给教育带来的变化,从国内到国外,从清华到麻省,从小学到大学,从有志于此的小团队以及个人到巨头,都是我们关注的对象。

我们希望用心、用准确的信息介绍业内的最新研究成果、进展、愿景与观点,希望对关注这个领域的你有所帮助,希望跟你一起发现更多潜能。

PS:我们团队还是有理性大叔的~

[笔芯]


推荐阅读:
相关文章