摘要:“传统教育的一个知识点在教科书里面可能是一个,讲课时有两三个,竞争对手会拆到7到8个知识点,我们会拆到70-80个知识点。当知识点越精细时,像过去的医疗从中医把脉到最后有了CT,再到核磁把肿瘤的距离直径看得更清楚,现在医学技术可以把每一个细胞看得很清楚。到底哪些细胞是有问题、病变的,哪些细胞是良好的,不需要去学,不需要在上面浪费时间。”

鲸媒体讯(文/宛青)在日前举行的“2018全球AI智·适应教育峰会”上,Knewton创始人、乂学教育创始人、前ALEKS首席数据科学家Dan Bindman等人分别分享了对智·适应的观点和看法。

Knewton创始人Jose Ferreira剖析了“AI智适应”的历程、概念、技术和应用,探讨了智适应教育在市场发展上的三个阶段——“怀疑期”、“炒作期“和“腾飞期”,阐述了高质量的AI智适应和冒牌的假智适应的区分。他强调了AI智适应进入市场的机遇和挑战,确认了中国市场B2C补习学校业务模式的必然性和优越性。他对AI未来的展望也印证了AI技术对教师角色的影响及冲击。

他通过对人类教育技术的变革历史过程的观察和总结,把智适应这一教育技术的改变,放在和当年的印刷术这样的几次大的转折点的级别上,即颠覆性的变革,而这种改革好像是当年的钢铁战舰摧毁木质战舰那样所向披靡的,对所有行业的竞争对手将是碾压式的。

Jose认为AI智适应学习系统的最大优势在于能够定位到每位学生的知识漏洞,而且在中国教育的课外辅导市场尤为有效。人类老师的精力毕竟都是有限的,一名最优秀的名师也不可能全面了解到学生的知识漏洞,更不可能跟踪到学生的学习情况随着学习时间的变化,AI智适应学习系统借助于人工智能和大数据分析技术能够做到这一点。

如今,智适应教育已正在成为一个风口,许多企业纷纷地挤入这个行业。其中,有些企业在真正做事,但也不乏一些机构假借智适应教育之名来获取用户,一时间鱼龙混杂。Jose认为,冒牌的假智适应并没有智能算法匹配,在知识点的拆分方面也比较粗狂,必将会被高质量的智适应教育所取代。

(Knewton创始人Jose Ferreira)

乂学教育创始人栗浩洋揭示了AI智适应教育的现状和未来,以及如何才能做好一个真正的AI智适应教育产品。他认为,目前来看,“知识点的拆分就是AI智适应教育产业中一个非常大的难题”,“只有更细腻地拆分每个知识点,才能让每个人都成为一个学霸”。乂学教育在知识点拆分的细致程度上进行研究,并且利用AI技术介入到学生的课前测试、学习流程、课后测试、作业流程等整个学习过程中,进行可定义、可测量、可传授的个性化教育。

栗浩洋举了一个知识点拆分的例子:“传统教育的一个知识点在教科书里面可能是一个,讲课时有两三个,竞争对手会拆到7到8个知识点,我们会拆到70-80个知识点。当知识点越精细时,像过去的医疗从中医把脉到最后有了CT,再到核磁把肿瘤的距离直径看得更清楚,现在医学技术可以把每一个细胞看得很清楚。到底哪些细胞是有问题、病变的,哪些细胞是良好的,不需要去学,不需要在上面浪费时间。”

栗浩洋表示,“我希望在7年最多15年时间,能够让AI智·适应系统,像达芬奇+苏格拉底+爱因斯坦合体一样给到每一个孩子一对一的教育,给到他启发,给到他创造力的发挥和不一样的未来。”

(乂学教育创始人栗浩洋)

前ALEKS首席数据科学家Dan Bindman认为,从建立一个智能应学习系统的角度来说,高质量的内容、智能AI给所有学生绘制高知识转化的状态图谱,以及量身定做的选择材料,三者缺一不可。他还向与会者分享了自身在智适应算法模型方面的研究成果——多轨道模型,与传统的IRT和KST等其他模型相比,他认为人的能力是在多轨边上出现的,并运用多个例子来证实多轨道模型算法的精准性。

前Knewton亚太区技术负责人Richard Tong总结了构建一个AI智适应学习系统的四大核心要素,分别是本地化的课程体系、高质量多样化的学习内容、多种AI算法的结合运用、严格学习环境下采集的有效大数据。

 

以下是栗浩洋演讲全文,鲸媒体编辑整理:

栗浩洋:大家好!非常高兴能在今天这个场合跟在座上百位VC行业的同事和互联网教育,以及教育领域的同事一起分享,人工智能智·适应教育的现状和未来。

我自己在四年前痛下决心在国内A股第一家教育行业上市公司里面辞去职务,去做乂学教育。我希望在7年最多15年时间,能够让AI智·适应系统,像达芬奇+苏格拉底+爱因斯坦合体一样给到每一个孩子一对一的教育,给到他启发,给到他创造力的发挥和不一样的未来。

每一天我们所做的事情难度都非常大,今天我不同于过去的各种演讲,在这次人工智能峰会上,也讲一下我们公司从来没有亮出来的干货事情。

在做知识点拆分时,全球都有大量的智·适应人工智能公司,2015年到现在,中国已经有40多家公司宣称自己是智·适应了。到底如何做好一个真正的人工智能智·适应教育?如何让算法真正的发挥作用?如果你只有极少数的知识点和规则的路径,不可能做到。所以,知识点的拆分就变成一个非常大的难题。我们拿一个知识点做拆分的例子,传统教育的一个知识点在教科书里面可能是一个,讲课时有两三个,竞争对手会拆到7到8个知识点,我们会拆到70-80个知识点。当知识点越精细时,像过去的医疗从中医把脉到最后有了CT,再到核磁把肿瘤的距离直径看得更清楚,现在医学技术可以把每一个细胞看得很清楚。到底哪些细胞是有问题、病变的,哪些细胞是良好的,不需要去学,不需要在上面浪费时间。这个是我们和国内三家相对在行业里面有声誉的机构对比。

(在有理数知识点拆分对比方面,乂学教育把自己和三家竞品公司进行了对比。不同颜色代表不同公司,白色为乂学教育。)

在每一个知识点,可以看到我们乂学教育和别人不一样。在这个当中,不是说谁在做这个领域,而是谁在用心投入到这个领域。这是非常痛苦的工作,因为我们所做的知识点拆分,应该说是全球教育历史上前所未有的,我们是一种无人之境。拆到那个地步我们自己都不知道如何拆?知识点拆分既要有专业性,又要有科学实践的效果,很多知识点的命名是我们跟教育专家一起命名的。

我们把分数的加减法,拆分成100个知识点。很多人说有意义吗?一个小学三四年级的加减法可能一个半小时就教完了,你拆成100个知识点,可能要教7天7夜才能讲完,我说不是的,我们节省了孩子7天7夜的时间。为什么?可以做难度分级,如果一个孩子分数加减法的连加连减都不会,我只能给你降到第37级,分数加法。如果你还不会,我们给你降到第29级,同分母分数相加,你不需要把两个分母相乘然后再去加法。如果你还不会,我帮你降到第17级,同分母的分数相加,并且不会出现三分之十这样的情况。如果你还是不会,我们可能把你降到第8级的知识应用,这个知识点叫做同分母的知识相加,并且不需要约分。当我们把知识点拆到这么细的时候,我们发现没有学不会知识的孩子。

我自己过去在学习过程中,我每次考试都是145分。那个时候我同桌是一名漂亮的女孩,她父亲因为是市领导,所以就被老师安排成我的同桌,来帮她提升成绩。我当时很奇怪,我们都是小学六年级,到了初一的时候,我考了145分,她却考20分。是不是人和人之间的学习差距,可以差到7倍。不是这样的,而是因为她没有遇到适合她的好老师。当你针对她的知识进行教学的时候,从20分起步,她可以到25分、30分、35分、40分,可以不断的往前走。而如果给她教八九十分知识点时,那可能她跟不上学习,她一辈子可能都会被废掉。

所以,当我们把知识点拆分成细腻颗粒度时,我们会发现如果你是比刚才学霸还要强的学霸,你连分数的加减法、应用题都会了。但是你可能第97级的一个知识点带参数的应用题不会,可能我告诉你几个分数,问你一个结果你会,但是前面四个参数里面有一个我不告诉你,但是告诉你结果了,这个对于会设方程式的小孩子很容易的。但是没有学到方程式的时候,很多小孩子脑子里会有一个反算的能力才能解出来,我们只需要给他学97级,从而大剂量的节省他的时间。甚至,我们就讲到第9级一个知识点,同分母的分数相加,需要约分的情况,有些题目可能对学霸来说都是难题,发现他都会错。我们当时发现一个九十一分之五加九十一分之八,最后约分为7,其实结果是七分之一。我们如何给他们针对性的教学的,大幅度提升他们的学习效率。

不只是知识点的拆分是令人发指的程度,我们在教学的流程全过程中应用到智·适应,在和所有中国最顶级竞品比较中,发现如果你在教学过程中没有智·适应,其实你只有错数据和他最后做作业的数据,这些数据孩子的知识点到底有没有提升?你根本不知道在这个过程中如何教学,和学生的认知速度怎么来的?整个教的过程和学的流程如果没有被数据化,没有拿到中间过程数据的话,所有的智·适应教学是没有用的。你只能给他们一些作业,好学生给一些难点的作业,差学生给一些容易的作业,根本无法解决他大脑中的认知过程问题,也就是说你没有这个兴趣时,也就是没有办法训练你的算法。所以,你在整个教的过程和学生认知成长过程中的数据和知识才是最重要的。

当时遇到的最大困难是语文学科,因为数学、物理、化学都是很容易做智·适应知识点拆分,但是语文如何拆分?以前语文教研组的组长,也是国内20亿规模最大上市公司的语文学科组长,我们挖过来,他也是深清楚智·适应方向的。他跟我说:我们做语文的阅读无法做智·适应,最多给你一个级就了不起了。这是一门玄学,我当时就跟杜老师说了一句话我们乂学教育做AI智·适应教育,就是希望把中医变成西医,把玄学变成科学。

所以,大家看到现在我们把阅读理解做到9级的知识点拆分,你可能不是阅读理解不懂。像我小的时候由于逻辑性比较强,线索题、主旨题做的很好,很多中等生和差生这种题容易错。我的逻辑性很强,不会错。但是我在一些细节性题目上经常错,通常在找这个细节时通篇去找都找不到。有的孩子可能对于自然环境题目很容易理解,但是社会环境的题里面,只要一考他就会错。在描写环境可能还比较容易,但是描写人物心理的题,难度更高,而有些孩子很容易在描写人物心理题中最容易出错。

这里面我们举了一个线索题。我们公司的CTO在做自己系统时发现,他在线索题里面还分成7大线索,比如说时间线索题目、地点线索题目、空间线索题目、人物线索题目、情感线索题目,他只会在情感线索题目中出错。因为只要有情感线索的题目一定有人物,为什么在四个选项中偏要选情感线索呢?到底什么区别呢?甚至普通的老师都讲不清楚,这个学生一旦出现这样的题就会错。什么叫名师,为什么新东方和好未来要用双师课堂,因为好的老师讲一个知识点,可能3分钟能讲清楚你一年不会的知识点。比如说朱自清写的《背影》和父亲的关系,这不是人物线索,而是以情感为线索。因为父子之情可以放在任何一个人身上,并不是朱自清或者鲁迅某一个人独有的。

简单的几句话,让同学又做了10道人物线索的情感线索题,他以后在情感线索题上面再也不会犯错。我是河南出身的,考交大我的母校,我们说1分压万人。在几十万考生当中只有几十个能够进得去。我刷一万道题,才能出来一道情感线索题的。如果不把颗粒度分得这么细,给你专项的线索训练,根本无法给你实时有效的教育。更别说常规的课程,不管是业余学校还是补习班,它就是叫做初二数学,初三物理,是把所有的知识点给你讲完,而不是针对性学习。

错因重构知识地图,也是我们公司提出的,去年开始做。包括Knewton全球的人工智能智·适应公司里面,他们是一个非常复杂的知识图谱,之间的关系错综复杂。刚才的知识点都是知识地图的一部分,颗粒度越细,效果越好。我提的叫错因重构知识地图,为什么叫这个呢?错因重构知识地图,也就是说一道题是考的其中一个知识点,发现有些学生的知识点已经会了,但是仍旧会做错。或者是他知识点不会,但是不会的方面和层级角度不同。

所以一道题当中我们找出了孩子12种错因,也就是说你仅仅给这个孩子解决知识点的问题,他都没有问题。但等到他一做题,在这一类的错因当中屡屡犯错,而且每个孩子的错因是完全不同的。每一个学生在每一个知识点上,错因完全不同。

无论英语、语文、数学、物理方面,我们给到各种各样的孩子去搜集他的错因。这件事情,过去只有特级教师一对一跟这个孩子学习,才能帮他去找出来进行解决。但是现在非常感谢AI的力量,我们找到了。我们现在如果用错因的话,整个初中数学可能有近百万的错因。这样海量的数据,不可能是一名优秀的教师能够全部掌握的,但是对于AI不是问题。我们找到所有孩子的错因,通过最高算法去找到每一个孩子的错因可能性,然后就可以非常针对性地下药解决孩子的学习问题。

我们两年前跟斯坦福研发中心一起合作研发,我们公司不仅拥有来自微软的核心算法科学家崔炜崔博士,还有Knewton的亚太区的技术负责人,现在也是我们的首席架构师,而且也非常有幸在几个月前让Danam加入到我们,这都代表着我们希望能够做全球技术最强的人工智能自适应公司的决心。同时,我们也找到的全球在人工智能领域里面排名第一个,超过Facebook,甚至微软和谷歌人工智能研究实力的斯坦福研究中心一起合作,这是CEO副总裁,我们一起建立实验室。

斯坦福研究中心大家可能并不了解,但是我说Siri是他们发明的,你们就了解了。50年前人类第一个机器人是他们发明的,10几年前第一个会行走的机器人,也是他们发明的。他们现在的技术,甚至用到谷歌无人车的底层技术,也是他们发明的。而且他们发明了GPS互联网和高清电视,如果没有他们的发明,人类的社会就会进入到黑暗中去。这个是今年会比人类跟Alphago的人机大战,震撼一百倍。是用一个钢铁机器人,和人类最牛的赛车手去比赛。

我们和斯坦福研究中心的合作,在各种深度学习、神经网络、人机对话界面,以及学生学习能力的预测等方面,都会在未来一两年有巨大的进展。

在这里面,我个人也和崔博一起提出了一个非直接关联知识点关系的理论,当时也是受到科学家们的认可。今年我们希望一起联合,能够申请人工智能奖项。

过去所有知识点都是叫做实务型知识点,他们之间的关系是先觉知识点,你要知道股票是什么以及买空卖空,才能会做对冲基金。但是很多知识点之间没有关联,你懂得对冲基金这个知识点,那你知道债券是什么?你理解对冲基金知识点,你知道CP是什么?可转债是什么?并不知道。在我们知识点里面,任何一个知识点都有非关系性必然的联系,如果在广袤地图里面不仅通过关联知识点判断这个学生的知识含量,还可以通过非直接关联知识点去做,也就是说每在一百万个知识点里面测试一个知识点,就能给其他所有剩下的知识点,做一个概率的知识图。

换句话说,对于一万个知识点里面不需要测一万道题或者一千道题,只需要200道题,剩下9800个知识点都被做了200次的渲染,我们都会知道这个孩子百分之多少会,还有百分之多少不会。在这样的非关系知识点的概率分布下,我们的测试可以比现在全球最顶尖人工智能的测试效率更高5-10倍。一个科技或者是一个公司超越或者创新,可能它的技术提升30%、50%、80%就足以达到这种效果了。如果这种技术是2倍、3倍甚至5-10倍的进展,我相信所有的竞争对手都没有办法跟上。我们不仅停留在现在人工智能最高端,还要不断在这个领域突破。

我自己对于概率和算数理解上面,会有自己的理解。再加上不断的跟崔博一起学习,我们一起碰撞产生新的想法和技术,来把我们的效率一起提升。

接下来我们的做法崔炜博士和斯坦福研究中心共同去做,包括中科院的王飞博士,我们跟中科院建联合实验室,来做Alpha Zero的算法,不仅通过已有的专家经验,而是通过自我博弈进行进化。

我们崔博博士的毕业论文,就是他的导师花一两万美金买到纽约证交所历年的数据,他当时认识人工智能量化金融领域,他自己构建了一套模型。通过这套模型能够来做系统对抗。他当时是模拟了所有公司的股票情况,以及各种各样的参数,模拟了所有的买家和卖家,来去进行演算。在一套全部模拟的对抗模型中,不断优化自己的算法找到最佳策略。人工智能智·适应系统也是需要不断的找到学生的学习最佳策略,通过这样的对抗网络,能够不断的大幅度提升算法准确度,以及给到每个孩子的知识内容推荐和知识路径推荐的准确度。

仅仅在过去情况下,我们大量的学生得到反馈,他们在半年时间里面提升10分、20分、30分、40分,甚至半年时间提升50分的效果出现。每个孩子对于智·适应的感受不一样了,他们觉得整个系统是人性化的,是根据自己的水平去定制的。

以前有的孩子对数学甚至某个学科是非常头疼,不想学习的。但是有了这样的软件,他慢慢了解自己是什么样的?自己站在哪里?不管是好还是差。在这个过程中,每个学生的感受都不一样,他们不断的在这个系统里面,他们爱上了学习。教育不应该是用趣味性解决教育的问题,而是用学习成长的成就感去解决教育的问题。当你有了成就感之后,你会不断的愿意枯燥的进入下一个阶段的学习,只有这样才会有最好的结果。

放眼五到十年,我们乂学教育在做的一件事是学生最新的学习能力拆分。也就是说我们教孩子如何举一反三,如何举一反一百。当孩子掌握这些能力,不仅仅依赖于智·适应系统,他们对学习的能力和对未来的感受、人生能力,都会极大的提升。但是能力教学是非常难的事情,因为它没有办法被评估,它更是一门中医跟玄学。

我在我的研发部提出了三可理论,第一个叫可定义,能力要可定义。比如说情商如何定义?情商这个词我们都讲不清楚,就没有办法提供教学。第二个叫做可测量,能力拆分完一定要可测量。第三个是可传授,就是我一定要教给你。达到三可之后,我们现在的能力已经有了500多种能力的拆分,每一个学科都有100多个能力的拆分,这些所有拆分全部做到可定义、可测量、可传授。

在这个过程中,我们相信不仅仅只是应试的教育,同时还给孩子能力的成长。现在我带着我们团队,已经开始研究的是AI系统是不是给孩子进行创造力的培养,这是原来同行都觉得不可能的事情。像当年我带着团队进行知识点拆分一样,拆分那些不可拆分的内容一样,我已经找到一些方法可以给到孩子进行创造力培养。

我们可以把所有创造力的方向,也拆分成一万个,十万个,甚至百万种细分可量化、可规则化、可模块化的描述。通过这些描述,不断的采用机器对学生的启发式的人机对话,来获得学生的反馈和感受。通过ALP的语义理解,知道学生的反馈是在哪个层面,然后给到他不同的回答。这件事情有赖于三四年以内一些机构不断的成长成熟,希望人机对话和语义理解有一个提升,相信可以7-15年里面,真正做到我们的AI系统像苏格拉底、达芬奇、爱因斯坦一样,给到每一个孩子最完美的教育,谢谢大家!