摘要:人工智能如何解决教育行业痛点。

2017年7月国务院发布《新一代人工智能发展规划》,规划中特别提到,将加快推动新型教育体系、智能校园建设以及开发智能教育助理。随着人工智能技术的发展,AI+教育赛道受到资本追捧,好未来、新东方、 VIPKID、51talk、沪江、科大讯飞、英语流利说等公司相继宣布发力人工智能+教育, 集体打响攻坚战; 在人工智能自适应学习领域,Knewton、乂学教育成功融资等国内外大额融资事件刺激市场关注度升温。全国最大的中小学在线作业平台一起教育科技也加入这一赛道,公开宣布发力人工智能自适应教育。

2018年3月20日,K12在线教育平台一起作业宣布完成2.5亿美金E轮融资,迈入10亿美金估值独角兽行列,同时,将公司品牌从“一起作业”改为“一起教育科技”,并且发布了“Socrates”智能学习系统。

官方资料表明,目前公司整体业务包括一起作业、一起学、一起公益。而本轮融资将用于投入优质的教育内容、人工智能和教育公益。截至2018年3月,一起科技用户数达到6000万,包含4000万学生,2000万家长以及190万教师。用户涵盖中国31个省,363个城市近12万所学校,平台上每天会产生上亿条作业行为。

该公司表示,自公司成立以来就在技术方面持续投入,2017年,成立人工智能团队,研发改进自适应学习系统,并落地多款人工智能教育产品,全面推进人工智能方向布局。

雷锋网来到公司总部,对一起教育科技CEO刘畅和算法产品总监罗侃进行了专访。

 

为什么引入人工智能?

2017年一起科技 AI 团队成立,主要聚焦在 AI 技术在教育领域的研究和应用。研究方向主要包括语音识别、图像识别、自然语言理解、 数据挖掘等领域。团队自主研发了一系列 AI 成果并且应用在教育领域, 其中包括口语评测、 手写识别、作文批改等。

谈到为什么引入人工智能,刘畅说:“因为我们经常会高估技术眼前对于业务的改变,但是会低估技术对于整个教育行业,当然也包括对其他行业的改造。所以把时间线拉长来看,你也不知道作业批改的、给家长发评语的、发送报告的,是一个人还是一个机器。这些大概率会被机器取代。所以并不是今天出于某种营收或融资的压力来做所谓的人工智能,而是基于对于行业的理解和对于用户需求的理解,我们是基于这个预判来进行投入。”

 

一起教育科技人工智能技术

一起教育科技人工智能产品中运用了图像识别、语音交互、自然语言处理、深度学习等技术。人工智能团队认为技术应该为应用服务,学习的过程中知识点掌握只是开始,学科能力也只是个性化学习路径的中间过程,最终的目的是掌握举一反三的跨学科综合能力。这种能力体系的建设依赖于丰富的素质教育内容和智能诊断、智能推荐等人工智能技术的结合。在3月20日发布会上,正式将该学习系统命名为“Socrates 智能学习系统”。

现阶段,人工智能在教育领域主要体现在自适应学习方向。而“Socrates 智能学习系统”,是经过改进的一套自适应学习系统。

《解码自适应学习》的报告中定义,“自适应学习是一种教育科技手段,它通过自主提供适合每位学生的独立帮助,在现实中与学生产生实时互动。”自适应学习的核心思想是通过构建每个学生的能力评测模型, 来对学生进行定制化的教育, 从而实现千人千面, 进一步提升学习效率。

在 Socrates 智能学习系统下,系统会根据学生的数据量身定制个性化学习路径,以实现学生知识和能力共同发展的目标。在知识层面不超纲、不超前,让学生用更少的时间、更有效的练习,达成知识点的掌握和跨学科思维能力的建设,学习知识的同时获得终身受益的思维方式。

在传统的学习规划中, 受限于老师的人力成本, 对每个学生的能力缺乏细致的评估, 从而导致对每个学生的学习规划是基本一致的, 同学们都在同一个进度下进行学习,如果能够更好地对学生进行评测, 从而能够提供匹配学生当前的能力的教材、作业、考试,这将极大的提高学生的能动性和学习效率。

从技术角度讲,在线教育要想真正达到有效需要完成下面的闭环:

1. 准确评测学生水平。

2. 针对现有水平推送训练。

3. 针对薄弱点背后训练思维能力。

4. 再次测试学生水平。

在上述步骤当中,准确测试是基础也是最难的步骤。只有准确知道学生真实的水平才能进行针对性学习和训练。是后续提取知识薄弱点和背后的思维模型薄弱点的关键。人工智能团队对此经历了多个阶段探索。

2015年, 一起教育科技引入了 IRT ( Item Response Theory ) 模型对学生能力进行评测。但是随着业务的拓展, IRT 本身存在着一定的缺陷。 IRT 的目的的通过对学生的做题来评估学生的能力,IRT 假设所有题目都是独立不相关的。 但是实际中, 做题的顺序, 以及题目之间的关系对学生能力的最终评估起到了非常重要的作用。举个例子, 如果一个学生做了100道题目, 只对了50道题目, 那么可否认为学生的能力为50分(满分100),  如果这个学生是一开始做错了50道题, 而后面50道题目全部作对呢?

为了更好的表示时序特征序列, 2016年引入BKT (Bayesian Knowledge Tracing ) 和 DKT(Deep Knowledge Tracing ) 模型。

BKT 模型在很长一段时间内作为最受欢迎的刻画学生学习过程的时序模型, 可以基于答题记录具体追踪到某个知识点掌握程度上的改变,这个刻画对某些类型的产品(应试教育类)是相当合适的, 但是缺点在于参数估计稳定性其实并不好,EM算法下并不能保证居合道唯一参数,并且在单体多知识点的处理上面, 会遇到参数爆炸的问题。

一起教育科技结合了两种模型的特点采用两层 LSTMP 来替换 DKT 最初模型的 RNN 模型。LSTMP 可以通过 gate 来控制关键时序序列的信号, 使模型能够有更长的时序表征。同时在大数据训练情况下, 可以有效的避免梯度消失和梯度爆炸现象。

对于 IRT 而言,模型迭代后,拟合出来 theta 值以及题目集的参数,通过这些参数可以拟合出对特定知识点的掌握程度。而DKT则是在训练结束的 sigmod 层可以算出来学生对每个知识点的掌握程度,取数学数据举例, 一起科技在小学数学和中学数学上分别计算对学生答题的预测准确度。 DKT 在 AUC 上要明显好于 IRT的评测效果。进一步 , 针对每个学生, 可以计算出在时刻 T 上该学生的能力分布图。

以上是针对学生个体构建能力分布图, 基于 DKT 模型对题目进行建模( Chris Piech  NIPS 2015 ),可以基于一组时序做题历史记录来预估某道题的被掌握可能性。 另外, 结合教研, 对题目本身进行进一步抽象归纳, 例如 知识点、考点、错因等,可以进一步挖掘知识点(考点、错因)之间的关系。通过关联度的统计分析, 可以进一步挖掘出重要的知识点以及考点, 例如对前置权重的统计加成, 可以得到关键知识点。基于权重的无监督聚类, 则可以帮助发现知识点之间的冗余性。

例如下图,图中心位置的知识点为一元二次方程的解法-配方法,从此知识点出发,与其相关度很高的是一元二次方程根判别式和一元二次方程解法-公式法,其后便是开始接触三角形类的知识点以及勾股定理,而其前置便是一元一次方程类的知识点。从机器所学习出来的结果上看,一元二次方程的解法-配方法是一个承上启下的知识点,这个不但符合现行的教学大纲,而且从出题的知识点组合的出现概率来看,也是很高频的一个考察点。

一般情况下, 教学知识点都是以树状的形式展现出来, 这样可以很好的体现出教学的进度以及概念的分层, 但是却很难发现知识点与知识点的内在关系, 通过构建图的方式, 而 DKT 模型可以将知识点图谱和知识点树有效的结合起来, 为学生提供更丰富的学习路径。

 

大数据为人工智能算法提供燃料

从技术上讲,一起教育科技数据持续并且准确。每个 ID 都是实名绑定,可以精确获得教材版本、学生班级、授课老师、学习进度、作业情况,并且随着学生年级提高数据持续更新。根据2018年3月份最新数据,公司拥有6000万用户,其中包含4000万中小学生,数据量本大,测试周期大幅度缩短,为后续人工智能打下良好基础。雷锋网下载了一起作业学生端App尝试注册,注册页面显示需要输入老师给的号码才能加入,点击“没有老师号”按钮,自动出现弹框显示”需要输入老师号,来找到你的班级,若你的老师未提供,请询问老师。”以这样的设置,保证了数据的真实性和有效性。

数据体系分为三层:

1. 内容层(Contant Level):包含有知识点、思维模型和数据标签,每一个最基础的信息点(POI)上汇总而成的一张知识大网,这些数据数量最庞大同时也是最基础的内容。

2. 用户层(User Level):主要包含用户数据,用户行为痕迹以及用户调取数据。比如ID所属地区、学校、教材以及做过的题,活跃度,做题时间等等。

3. 混合层(Contant+User):主要是指内容和用户层交互产生的新数据,这层数据累积后的共性数据将会供深度学习和数据挖掘。

基于多层数据,推荐策略更加科学,通过数据池的内容针对不同 ID 的个性化数据进行匹配,同时兼顾“德才知行”四个方面进行考量。比如说针对知识面窄而深度能力达标的用户更多匹配知识面角度设计的推题,而针对知识面广深度不够的学生逐步从能力体系角度进行阶梯型推题。保证每道题都让学生既保持做题的兴趣,又不至于难到无从下手。

 

引入人工智能效果如何?

至于如何能提高学生做题专注度和效率,罗侃打开一起作业学生端App,一边演示并向雷锋网(公众号:雷锋网)解释:“我们其实在iOS和安卓 App 里都设有访问限制,基本上都会从和老师对接的时候,就引导他们让孩子在做题时可以把这个访问性限制打开。所谓访问性限制,就是你只能开这几个App,其他是锁定的。还有一个方法是我们每次布置作业,系统会大概率估算每一次作业的时间。比如说这次作业10分钟做完,如果这个孩子做了30分钟,系统就认为这个孩子是不是在偷玩什么别的,否则为什么10分钟的题他30分钟才做完,是不是遇到什么困难,会有措施来解决这个问题。”

此外,为了激发学生做题兴趣,在App里设置了个性化闯关类产品,罗侃谈到:“比如说我进去第一关之后,比方说,这个关卡,是一关一关去做的,做题时间会比较长。但我们会一个关卡一个关卡,根据学生的动态的去设定,一共闯了几关,最后有一个测试。”

谈到这款产品背后的技术,罗侃说:“整个自适应学习有一个非常重要的模型,就是IRT模型,我们是用EM算法去迭代。2014年我们就在线上系统里面引入了IRT模型。这个模型是一个比较经典的测评模型,比如说像GRE,都是用这个模型去做测评的。因为自适应学习包括自适应的这种测试系统和练习系统,最早的包括经典的模型,其实都是依赖于IRT。所以我们在很早的时候,这个模型能够通过学生的做题记录,去评估学生的能力以及题目的难度。而且这个题目,是不需要人去介入,通过EM算法实现,这是一种无监督学习算法。先假设学生的能力一样,去估算题的难度,然后再通过学生做题的准确率,再去估算这个学生的能力,一步一步修炼到局部最优解。”

“这个深度学习其实已经有非常多的算法和模型,因为DKT模型是2017年提出来,它基本上一提出来,我们就跟进,尝试把这个模型应用到我们现有的产品里。”

上图是上海市今日中学倪佳青老师在使用一起作业后的前后对比,使用后的学生在完成率和正确率上都有明显的提升。同样的两个班级,使用在线作业的实验班完成预习作业的比例是70% ,对照班只有25% ;实验班课后练习的正确率是 96.7% ,对照班则是 78.6% 。倪老师发现,这是因为班里的学生 98% 都是打工子弟,水平参差不齐,传统作业很难做到给不同的学生布置不同的内容,而在线作业通过对每个同学布置个性化的作业,提高了学生做作业的积极性。

据介绍,在学生实际使用DKT模型构建的做题产品之后,完成率、积极性都有所提高。“学生在线下的做答正确率,我们看到有提升,通过使用我们新的算法,他的成绩会比不用我们的学生成绩提升更大。这个其实我们在2014、2015年已经验证过了。我们最近的一些实验通过整合结果表明,这种新的方法对比我们原来的方法,学生在同样一套卷子上提升的成绩幅度绝对值是8%左右,相对值能够提升15%。我们刚好最近也在做更大规模的样本测试,但是结果还出来。”

至于公司商业模式和营收情况,一起作业是学校教育场景产品,流量来源,属于免费产品。一起学是家庭教育场景产品,里面有帮助学生学习能力提高的付费产品。据介绍,一起教育科技通过切入学校获取了大的流量、数据,商业化的做了两个,一是个性化做题,二是直播上课,这两个模式让小学业务已经实现了盈利。总体上来说,目前已经做到盈亏平衡。

 

未来展望:人工智能是否能替代教师?

前段时间,有研究人士分析了365种职业在未来被人工智能“淘汰”的概率,其中,教师的被淘汰概率是0.4%。看上去教师拥有自身难以被机器简单替代的独特性。但也有不同声音,教育部副部长杜占元认为“人机结合可能将是我们迎接智能时代最普遍的形式。”惠灵顿学院院长安东尼·谢尔顿爵士认为,10年之内教师将失去其传统角色,只能成为助教。给学生们教授知识这一重要的工作将完全由人工智能计算机完成。

人工智能能否取代教师,一起教育科技的回答是:“我们其实对一起作业的定位是公立教育的好帮手,我们从来没有想过去取代老师,或者我们来教孩子。因为我们始终认为,机器在教育这一块是无法完全取代人的。”

 

本文转载自雷锋网,作者为张莉。