摘要:假如人工智能介入教育,那么学习的过程将会发生什么样的变化?人工智能是否可以取代人类老师?如果能,又会有多少老师被它所取代?什么是真正的自适应学习?乂学的自适应学习怎么做?本文将揭秘自适应学习的前世今生。

谷歌研发的阿尔法狗(AlphaGo)4:1打败韩国围棋名将李世乭,一时间人们开始相信,在未来,诸多职业将被人工智能取代。假如人工智能介入教育,那么学习的过程将会发生什么样的变化?人工智能是否可以取代人类老师?如果能,又会有多少老师被它所取代?

Robot hand playing a game of checkers (draughts), 3D rendering.

最近有很多鲸媒体的真爱粉在后台留言,要求听听智慧教育中的“人工智能”。为了给各位粉丝发福利,我们专程连线了去年刚刚从美国归国的自适应学习专家王枫博士,他在2015年初与合伙人栗浩洋和周伟创办了以“将个性化学习带给全世界的每一位孩子”为目标的上海乂学教育科技有限公司。今年1月8日,乂学教育成功开发了国内第一个拥有完整自主知识产权、以高级算法为核心的自适应学习引擎。

王枫博士告诉鲸媒体,AlphaGo是只针对围棋这一垂直领域的人工智能,而K12领域的自适应学习可要复杂的多了:“自适应学习引擎就像一个大脑,它是以前期积累的内容以及学生大数据基础,通过后台算法,为学生推荐最有价值的知识点和习题,最大限度地提高学习效率,真正做到因材施教。对比AlphaGo,二者背后的深度学习、机器学习的原理是有许多相似之处的。

什么是真正的自适应学习?乂学的自适应学习怎么做?本文将揭秘自适应学习的前世今生。(本文分上下两篇,根据王枫博士口述整理)

 

  • 什么是自适应学习系统?

针对这个最普遍的入门级问题,王枫博士所给出的回答是这样的:

“其实简单地说,这套学习系统就是能够根据学生的不同情况进行“自动适应”,然后给出学生最适合的学习内容,根据不同学生的情况,可能会推送不同的题目或者视频等内容。在这种推送的背后所隐藏的,是大数据和智能技术在教育层面的深度应用。

除了自适应本身的核心特性之外,王枫博士还向鲸媒体谈起了与自适应类似的慕课(MOOC)模式,并且分析了二者的区别。

“可以说,自适应学习是智慧教育的核心和制高点,未来这个市场将会出现很多公司,也会越来越热闹。如果我们拿自适应学习来跟几年前备受瞩目的MOOC或者网校等模式相比,你会发现MOOC模式是在互联网的基础上,通过录播直播等形式解决了教育领域的“可获得性”(Accessibility),同时还具备随时随地学习的“灵活性”(Flexibility;以及边际成本趋零、价格较低的“可支付性”(Affordability)。但其实MOOC模式有一个巨大的缺陷,那就是它的课程完成率很低。为什么会产生这种情况?就是因为它没有解决交互性(Interactivity)的问题。然而对于教育产品来说,交互性是处于核心位置的。

“所谓的交互性,并不是简简单单指界面上的交互,而是学生在学习过程中不断地获得反馈。一般而言,交互性体现在三个方面:

一是老师和学生的交互,其最理想的情况是优秀的老师可以针对几个学生的特点,给予针对学生的个性化的教学和辅导但客观情况是,优秀的教师所供给的教育能力毕竟有限,不是每个学生都能获得这一机会;

二是指学生之间的交互,最理想的状态是优秀的学生可以跟其他学生深入交流。但这一点总体来说是不可行的。因为不论什么样的学生,在学习过程里都会自发组合,产生学生之间的交互,其质量和保障是难以控制的;

第三就是普遍最受重视的,学生与系统内容的交互这才是最核心的解决办法,因为计算机系统的运算能力、准确性、信息量以及供应力是相当强大的。但目前的MOOC模式并不能解决这个问题。就像我之前说的那样,MOOC模式能够实现的是知识的“可获得性”,是纯粹单向的“送达”,只是像邮件一样把知识传播过去。由于缺乏针对学生学习行为和效果的辨别、处理和知识调整的能力,MOOC模式当然也就只能像个优秀的老师在上万人大课一样,无从下手,无法保证质量。但我们所谓的自适应学习,就是在这个交互性的领域实现智能化。用最直观的方法描述,就是学生在学习的任何过程中,怎么学、学什么内容,都会有一个像好老师一样的智能学习引擎来对学生进行有针对性的一对一指导。”

Abstract digital brain,technology concept.

“举个例子来说,就像我们平时看到的一些互联网巨头,他们都已经实现了所谓的个性化推送。比如滴滴打车,他就可以做到针对用户的位置、目的地等等推送合适的司机;再比如电商领域,淘宝或者亚马逊,都可以通过对用户的浏览和购买行为进行追踪分析,然后实现对商品的建议性推送。而教育领域的人工智能,则需要考虑学习过程的复杂性,对于任何一个学生,不论处于什么样的学习状态,其下一步要学习什么,怎么学,目前的程度是什么,都是需要综合判断和测量的。如果在技术层面模拟一个优秀老师的教学过程,面对这些复杂的问题,一定要基于大数据进行分析和演算,对学生的特征进行测量和量化描述,最终推送适合某个学生的学习内容。

 

  • 能举个自适应学习的例子吗?我们生活中有这样的自适应学习吗?

“这种例子肯定是有的,我们先假设一种情况:如果一位学生做十道一元一次方程的题目,结果他做对题,做错了四道题;然后这个学生又去了十道一元二次方程的题目,结果是对了两题,错了八道题。那么这个时候老师应该怎么办?”

王枫说:

“这个时候,不同的老师就会有不同的反应。水平比较差的老师,这时候会要求学生再去做一批一元二次方程的题,让学生多练,觉得这样学生自然就会熟能生巧;水平中等的老师呢?他会降低难度,让学生去做一些难度低一点的一元二次方程,看看学生的情况;而好的老师则会发现他的问题不在于一元二次方程,而是在于一元一次方程的基础没有打牢。所以会要求学生回到一元一次方程或者求根的过程里去学习和练习。——这就是自适应学习系统,模拟优秀教师的教学过程去给学生提出个性化的要求。”

“以上只是对问题的简化描述,而现实情况更复杂。比如 A学生是不会一元一次方程; B学生是不会求根;C学生可能是连方程的移位都不会;其他学生每人都有每人的薄弱点,每一个学生的情况不一样,综合的知识点数量如此庞大,出现的问题几乎是所有情况的乘积。因此,如果希望通过简单的编程方式去判断学生的情况,那么我们为了编程所需要预设的规则路径几乎是天文数字。因此,试图通过简单程序的判断来解决问题的方法是不可行的。

“而这个例子只是数学这一个学科,数学的许多知识点有明确的前提后续关系,好比只有先学到知识点甲,并且练习熟悉后才可以学知识点乙。如果学生掌握了乙知识点,那可以推断学生也已经掌握了甲知识点,这个过程姑且还容易追溯。但在实际应用中,还有很多情况更加复杂,例如英语,其知识点的关系是离散的,并不一定先学习名词的单复数后才可以学不定冠词的用法,各个知识点呈现的只是相关性。这种学习过程只能通过优秀教师去以极强的经验来进行综合判断和指导;对于计算机系统而言,这个过程基本没有简单的规则可以预设,因此几乎不可能通过简单的编程手段来实现这一类的教师智能,只能采用类似阿尔法狗的人工智能算法来进行运算模拟。

“所以,解决学习的‘交互性’是我们通常可以看到的问题,很多企业也在做着各种有益的尝试。但如果要彻底解决这一问题,计算机系统需要 “模拟优秀教师的教学过程”,这并非通过简单的计算机编程可以实现,而是需要通过人工智能的技术手段进行深度的模拟,这就是自适应学习系统的目标和根本定义。

 

  • 自适应学习系统分哪些层级?

“从最广义上说,任何能够通过学生的反馈而推荐不同题目或知识点的系统,都有着‘自适应学习’的功能意味,但我们所强调的自适应学习,一定是基于某种技术深度的。简单地说,常见的自适应学习系统可以分为三个层次:

第一种是最简单的自适应学习系统,系统预先设定学习路径,通过简单的路径设定来指导学习过程,这叫做所谓基于规则的自适应学习系统。

第二种的复杂度稍高,系统并不预设学习路径,而是在后台具有一定的算法,根据每一个学生的做题记录,来推断学生的问题所在和能力水平,为学生匹配学习内容。

第三种是最为复杂的自适应学习系统,也就是乂学教育现在做的事情,在基于人工智能的自适应学习系统里,解决学生的学习路径的问题和内容推送的问题。

就学习路径而言,比如说知识点的跳转,还是拿前面的例子来说,关于知识点之间的相关性,通常会通过知识图谱来设定。但就知识图谱而言,每一个知识点的相关性是需要专家预设的,专家的预设是主观的,不同专家也有不同的判断结果,所以最终的图谱难免也是主观的。因此比较完善的自适应学习系统的做法是,先通过专家预设的知识图谱来进行阶段性使用,最终根据使用后学生留下的海量行为数据进行数据挖掘,最终优化知识图谱达到准确客观的程度。最终系统会以这个客观的知识图谱,为学生匹配最优化的学习路径。

在学习内容方面,首先需要拥有最优质的学习内容,这是毋庸置疑的;这里的关键是,在针对某一学生的学习路径下,我们需要匹配什么样的内容给学生。这里所谓的适合,是指难度稍高于学生当前的水平,既不能高得太多,也不能是学生已经掌握的重复性内容。在这个问题上,内容与学生的水平相匹配,那么内容的难度以及学生的水平就需要客观地测量,这里面不仅仅采用IRT理论,而是采用更为复杂的知识空间等算法。”

 

  • 自适应学习系统的构成部分是什么?

对于这个问题,王枫博士的回答是这样的:

从系统结构来看,自适应学习系统由三大部分组成:内容模型、学生模型(也叫检测模型)、推荐模型(也叫教学模型)。

首先是内容模型,就是以此为依据来建立详细的学习内容和知识点结构图。

以乂学开发出的智能自适应学习系统为例,其知识图谱的构件先要把知识点颗粒度拆成纳米级别。什么是纳米级呢?比如冠词分成定冠词和不定冠词,定冠词的用法可以拆分成13个纳米级的知识点,不定冠词的可以拆成6个,就是要细到不能再细的程度。

而知识点的呈现方式有视频、音频、文字、图片等。题库里有题目、答案、解析;解析里面又可以分文字解析、视频解析和图片解析等。

然后每个知识点还要打上标签,标签包括知识点内容、学习时间、学习风格、倾向性(喜欢音频学习还是视频学习)、内容质量、难易度、区分度等。颗粒度很细,标签很多,就可以使学生实现匹配的更精细化,例如一个学生做50道题,围绕相关知识点,背后需要有至少1200道题的题库量。

知识图谱拆分由专业的老师来做,最初的标签也是由老师来打,但是后期,随着学生数据越来越多,系统对标签进行自动更新,例如难易度等级,这样就慢慢淡化了前期老师的主观因素。

其次是学生模型,也就是检测模型它能够实时测评每一个学生在每一个知识点的掌握水平,并且通过大数据分析方法推算和量化学生在当前知识点以及相关知识点的能力水平。

自适应学习系统能对学生进行动态检测,学生每做一组题和每看一段视频,系统对学生的专项能力值和整体能力值都会不断修正判断,系统对学生就越来越了解。

值得注意的是,对于学生做错的题目,到底学生粗心大意还是真的不会,系统也要有一个判断。比如,如果是粗心写错的,系统可以通过其他题目中的相邻知识点和关键知识点的检测,发现学生已经掌握了某个知识点,因此分析之后不再推荐这个知识点给学生练习。

第三个是教学模型,也叫推荐模型。能根据每个学生的最新能力水平,提供相应的反馈,并匹配出最为合适的学习内容。

Abstract digital brain,technology concept.

如果说前两个模型是系统的进口的话,教学模型(推荐模型)就是出口,根据检测结果,给学生推荐下一步学什么。

在传统线性教育中,老师会让学生自己整理错题集,有经验的老师则根据学生的错题来判断他掌握知识的程度,而自适应系统通过后台数据发掘和算法找到学生的薄弱点,推荐最适合于当前学习的题目、视频、解析等等(这些内容也都是颗粒度为“纳米级”的)。

需要说明的是,后面两个模型是开发难点,需要应用到数据科学、教育测量学、标签技术和机器学习等技术。考虑到不同学科、年段、地区的考试风格和侧重都非常不一样,平台型的自适应产品无法解决所有问题,因此还应该根据学生用户群体和学习目标,来定制开发学习产品。

 

  • 很重要的问题:自适应学习系统可以完全替代老师的工作吗?

“这个问题也是很多人一直在关心的问题,对于人工智能代替人肉教师这个猜想,我是这么认为的:自适应学习系统将替代传统的教学模式,但是它能够替代的只是模式,而不是老师。对于老师来说,自适应学习系统只能替代掉老师80%的工作。比如批改、推荐题目、机械地讲解等,但是是不会完全替代老师的。毕竟,从学习的本身来看,95%以上的中小学生都不适合只面向系统进行自主学习,学习需要监督。但自适应学习系统的作用其实是它可以把老师真正解放出来,让老师去做更有价值的事情,比如花更多心血在更有价值的教学活动和教研上,花时间去照顾每一个孩子,花精力去了解孩子的兴趣和学习目标。如果有了自适应学习系统,老师以后就可以去处理更多的主观性信息,例如学生的学习倾向性如何,学生的学习计划如何,要如何组织学习活动等。另外,老师还可以基于自适应学习系统,参与开发出更具个性化、本地化的内容,例如自己专门录一段视频讲解,发给自己的学生学习等。自适应学习不是用来替代老师的,而是用来帮助老师,给老师减负的。”

 

人物简介:

王枫博士

图片8

乂学教育创始人。美国佐治亚大学教育技术学博士,宾夕法尼亚大学,弗吉尼亚大学博士后。在线教育、自适应学习、教育大数据领域资深专家。

王枫博士自2008年开始在纽约州圣玛丽学院负责在线教育工作。随后于 2011年至2014年在纽约城市大学创办约翰杰在线教育(John Jay Online),打造了全面的在线教育商业计划及运营模式,开发了学术严格且盈利创收的高质量在线硕士学位专业和认证专业。

乂学教育于2015年6月获得了3100万人民币的种子轮投资,由青松基金、正和磁系资本、好未来集团和新东方创始人俞敏洪共同投资。