AI自动批改口算作业,“爱作业”离商业化还有多远?
摘要:手机一秒圈出错题,爱作业在视觉识别技术中遇到了哪些“坑”?
打开小学生的口算作业本,写满答案的算术题往往让家长和老师在批阅时焦头烂额。如果一个软件通过“拍一下”就能迅速辨别题目对错,家长和老师会为此买单吗?
杭州大拿科技推出的“爱作业”就是这样一款运用人工智能技术自动批改口算作业的APP。目前该产品免费下载使用,据说在上线一周内的下载量达到了30万。
事实上,自动批改领域早已有解铃网、批改网等公司入局,还有科大讯飞旗下的智慧作业平台也覆盖众多中小学校。
爱作业在视觉识别技术中遇到了哪些“坑”?在人工智能+教育火到爆的今天,爱作业未来如何应对其他大公司的竞争?
1 从“形色”到“爱作业”,视觉识别技术有哪些“坑”?
在大拿科技的官网上,最先映入眼帘的是公司四个核心技术的名称——Live AI、数据管理、深度学习、视觉识别。创始人陈明权对鲸媒体解释到,人工智能可以简单理解为如何让计算机拥有人的智慧,而Live AI也叫活着的AI,是让AI形成一个闭环。“简单说,就是先做出一个产品,让这个产品吸引用户,用户会在使用过程中产生数据,再通过这些数据驱动产品的发展。”要让人工智能进行学习的前提就是要有数据,并且公司要能够对这些数据进行高效地整理,让系统更好地对这些数据进行学习,这个过程就是数据管理。
“深度学习作为人工智能中的一种技术,是通过深度卷积神经网络形成一个模型,形成能处理某个领域问题的一个‘大脑’。”而大拿科技研发的两个App其实都是利用深度学习技术进行视觉识别实现的。
2015年7月,陈明权和合伙人罗欢一起成立了杭州大拿科技,并很快研发并上线了一款植物识别软件——形色App。用户只需拍照上传植物照片,形色能够在1秒内给出植物的名称、花语诗词、养护知识等等。
陈明权坦言,从2015年8月上线到2016年初,没有做推广的形色仅有1万名左右的用户;但在2016年,苹果手机为“形色”做了首页推荐,几个月内用户数从1万涨到50万。2.0版本的形色上榜了App Store的精选推荐,目前App激活用户数600万,月活跃用户数210万,日新增用户2万(近一周)。
2017年,一款定位于自动批改口算作业的产品——“爱作业”正式立项;9月2日,第一个版本的App正式上线。用户只需拍照或相册选择口算照片上传检查,爱作业将在1秒内给出检查结果,对有错误的题目进行高亮标注,并对检查结果呈现标签鼓励和趣味展示。
出乎意料的是,上线一周后,爱作业App的下载量达到30万,陈明权笑笑说,“看来批改作业确实是家长和老师的痛点。”他曾潜伏在家长群中给其他家长推荐爱作业App,但很多家长都表示孩子的数学老师已经推荐过了。 目前App的推广主要是靠口碑传播,公司没有做付费推广。
数月的研发过程让陈明权感慨其开发难度大大超出了团队的预估,“到处都是坑,想都想不到。”
他坦言,技术上最大的“坑”在于数据降噪——比如当打印体和手写体(尤其是小孩子的字)混在一起的时候,机器识别起来有一定的困难。“最初,我们想要用现有的OCR(光学字符识别)技术进行文字识别,但这一技术只能识别打印体,无法对学生写上去的手写数字进行识别,而小朋友书写习惯极不稳定,不同人之间差别很大。拿最简单的数字8来说,有的是开口的,有的是闭口的,开口的方向可能还不一样。”此外,很多小朋友习惯在算数本上打草稿、乱涂乱画,这就意味着需要让机器知道哪些内容是需要识别的,哪些是不需要的,而且还会遇到纸张质量差、下一页的铅字“透”过来等等问题。

(右开口8和左开口8)
为此,陈明权和团队在深度学习算法的基础上,将OCR技术进行改进,让系统自动排除与题目和答案无关的内容;在字迹潦草的情况下,系统也能检测出疑似错误的答案。
据悉,团队共收集了500-600本小学生们使用过的数学算术题作业本(作业本来自杭州彩虹城小学、万家小学和文三街小学),并拍摄照片为机器学习算法提供训练资源。此外,他们还购买了近1000册新作业本以收集不同题型扩充数据库。
2 从数学到英语、语文,跨学科技术挑战重重?
除了基本的拍照批改作业功能外,爱作业还有批量批改作业、作业批改记录、分享批改结果等功能。
陈明权告诉鲸媒体,目前爱作业支持识别各种口算练习本出版物、手写口算题及打印口算训练等,识别准确率达98%。1.3版本的爱作业支持1-4年级的整数、分数的四则混合运算,支持估算、带余数除法、括号内比大小、填写最大数最小数等多种题型。
目前App的激活用户数为80余万,日活用户超过20万,日新增用户1万多(近一周),后台每天接收近50万张作业图。
在陈明权看来,爱作业的核心竞争力在于没有强制性地更改用户习惯。“我觉得纸质作业并不会被替代,五千年以来教育方式的改变并不是特别大,都是老师留作业,学生写作业。我们希望不改变用户传统的体验和习惯,用户还是做纸质作业,我们只是在批改作业这个环节去优化体验,利用技术大大节约用户的时间和精力。”他和团队都认为,好的产品是要让用户感觉不到产品的存在。
现在爱作业的智能程度到小学4年级,陈明权透露,团队的下一个小目标是让它小学毕业。“我们希望爱作业在数学方面能做得更好,全面支持数学方面的各类题型批改,接下来会逐步支持英语和语文教学等。”
但跨学科的挑战也不容忽视。“比如语文方面,手写文字的识别是非常困难的,机器能够认识一个字,但机器很难认识这个字的错别字,这给语文作业的批改加大了难度。另一方面,语文和英语除了视觉识别外,还包含语义理解等其他应用。”

(数学算术题作业本)
从形色到爱作业,两款产品在研发方面有何异同?陈明权告诉鲸媒体,二者都是利用人工智能深度学习技术,找到一种方式,教会计算机在不同的应用场景里满足不同的需求。“形色是满足小朋友对大自然的好奇心,爱作业是帮助爸妈和老师批改作业,节省他们的时间。”不过两个产品的模型并不一样,“深度学习最重要的就是模型,模型就像是储存不同知识的大脑,比如,形色的模型是告诉你这是哪种花的概率是多少,爱作业的模型就会比较复杂,首先要对作业中的各种要素进行提取,然后识别、计算、判断。”
目前爱作业还未实现盈利,盈利模式也还在探索中。陈明权说,他和团队更关注用户体验和产品升级,“至于融资我觉得做得好自然会有关注度。”公司的运营资金来自于创始团队的个人投资,后期会考虑引入行业内的优质战略资源。
现在杭州大拿科技团队成员共30余位,大部分人都是工程技术出身。未来,陈明权希望公司人才结构能够更加多样化,期待技术研发、人工智能、神经科学、产品运营等各类型的人才加入。
未来大拿科技会专注在教育行业,利用人工智能技术继续在教育行业开发出更多能解决用户需求的产品。陈明权表示,爱作业的最终目标是实现因材施教、个性化教育,让人工智能名师家教走进千家万户。“爱作业未来将对名师的教学法进行深度研究,通过大数据对名师教学方法进行分解,找到各科学习的关键点。同时,通过汇聚大量孩子的学习过程和效果,针对每个孩子的学习优势和薄弱点,用AI技术进行辅助学习,帮助老师不断提高教学效果,形成老师、学生、家长的良性互动。”
采访后记:
在创立大拿科技之前,2009年陈明权和清华毕业的罗欢还一同创立过“睿琪软件”,致力于金融、汽车、图形图像、云计算等领域的研发和创新。而此前,陈明权则在Trilogy Software(三联软件公司)工作了五年,当年他是这家公司在中国招收的17人之一,并担任三联中国的技术总监。
陈明权从小对电脑游戏、计算机技术非常着迷,初中时他因想通关玩游戏而自学编程。15岁时的陈明权曾帮好朋友姐姐的公司开发了一款工资计算和发放的系统软件,这不仅让他赚得了第一桶金,也对他触动颇大,“感觉好像在计算机的世界里,只要学好编程就可以成为操纵一切的超人,所以我想用自己的技术改变身边人的生活。”因此陈明权报考了浙江大学计算机学院。
在日前科大讯飞的2017年度发布会上,科大讯飞一口气推出多款“AI+教育”产品可谓声势浩大。其中,智慧作业平台能自动识别小学和初中学生的选择题、填空题和作文题,并及时给出对错的反馈,指出写作中存在的问题。此外,诸如拍照搜题起家的猿题库、作业帮等产品也早已抢占流量和资本优势。对面这类“财大气粗”大公司的“来势汹汹”,未来的大拿科技又将如何“迎战”?

