新浪教育

松鼠AI教学机器人再次战胜百城真人教师

新浪教育

关注

继AlphaGo与李世石、柯洁接续对弈之后,人机大战火了起来,但各领域敢于挑战人机大战的公司并不多,这要求是必须具备非常实力的技术才会敢于挑战。近期在8月27、28日两天,在跨越了中国的100座城市同时上演了一场百城规模的人机大战,这正是由已经举办过三次人机大战的乂学教育的松鼠AI教学机器人进行的比拼,这一次是否机器教学可以再次获胜呢?

本次百城的人机大战是全国100个城市的数千名学生,在多年教学经验的中高级老师教学下的对照组进行的真人授课,与使用松鼠AI智适应教学机器人的实验组进行的学习效果的对比,通过两天的真人老师和教学机器人分别对初中数学做针对性的教学辅导,通过前测和后测来客观地比较两组学生的学习效率的提升情况。

为了保证这次人机大战的公平公正和公开,松鼠AI采取四重措施来保证参加测试样本的真实有效:1)所有测试考题出题和批改均由第三方公立学校教师负责;2)引入艾瑞和多家媒体进行全程监督;3)教学过程全程直播录像全部对外公开透明;4)媒体和第三方机构随机抽查考题保证考题无外泄。

围棋界的人机大战,AlphaGo与围棋大师李世石、柯洁等人轮番上演的精彩绝伦的人机大战,彻底引爆了人们对于人工智能的认知。医疗领域中的人工智能(AI)选手“BioMindTM天医智”,以高出20%的正确率,战胜了来自全球神经系统疾病诊断的25名医界“最强大脑”。在语音识别领域,科大讯飞实时转写和多语种翻译系统——讯飞听见智能会议系统在与人类速记员的三次PK中,以超快的速度、超高的正确率在短句、绕口令、长篇文章的实时速记中均赢了人类速记员。

在国外的教育领域,人机大战的相关测试得到过广泛的印证。2013年,亚利桑那州立大学引进Knewton推出的数学智适应辅助课程后,学生通过率提高了17%, 课程退学率降低56%, 且45%的学生提前四周完成课程,震撼了业界,因为传统观念认为在线教育只适合学霸因为专注力和自制力、自学能力都强,而这次实验中,差生的及格率大幅度提升,退学率大幅度下降,并且一半人提前完成学业,媒体当时高呼“人工智能自适应教育的元年来到了”。2014年,在南卡罗莱纳州安德森市 2500多名五到八年级的学生使用Waggle备考南卡罗来纳州评估测试,使用Waggle后,语言能力熟练的七年级优秀学生数增长124%,八年级优秀学生数量增长93%。2018年上半年最新国际学术研究成果,采用了科学、严谨的对比实验,样本量达到12000名学生,再一次有效验证了智适应系统的学习效果优于传统授课。发表在国际知名学术会议International Conference on Learning Analytics & Knowledge上的论文“Studying Adaptive Learning Efficacy using Propensity Score Matching”的研究发现使用智适应系统ALEKS数学课程的学生的课程通过率比未使用ALEKS学生高出15个百分点。

其实在教育领域,教学系统是比下围棋更复杂的系统,老师对学生的教学辅导牵涉到教育学、心理学、认知学等更复杂的过程,人工智能突破的难度要大得多。乂学教育松鼠AI此次敢于举办如此大规模的人机大战,在众多媒体的聚光灯下接受来自人类教师的挑战,也显示了其对于自身技术实力具有强大的自信心。

据乂学教育松鼠AI创始人兼董事长栗浩洋介绍,乂学的人工智能自适应学习模型和技术,代表了中国市场上的最先进水平,很大一个原因在于先后引进集结了三位全球领先的智适应学习技术专家包括崔炜、Richard Tong和Dan Bindman分别作为首席科学家、首席架构师和首席数据科学家。

崔炜博士是乂学教育松鼠AI的联合创始人、首席科学家,前RealizeIT核心工程师,师从全球人工智能进化学派领域顶级专家Michael O’Neill教授和Anthony Brabazon教授,崔炜博士是人工智能智适应学习和大数据专家,人工智能博士和博士后,在国际顶级人工智能学术会议ACM、IEEE等发表过18篇学术论文,受邀在AIED、图灵大会、PRICAI、雷锋网等全球人工智能国际技术峰会上发表过超过20次的学术演讲。

松鼠AI的首席架构师Richard Tong,2016年加入乂学教育松鼠AI,曾担任Knewton亚太区方案实施总负责人,在国际技术峰会IJCAI、AIED上发表演讲,在AIED会议上Richard Tong代表松鼠AI作为唯一中国教育企业加入IEEE的AIS(Adaptive Instruction System)标准工作组成员,参与制定自适应教学全球标准。

松鼠AI的首席数据科学家Dan Bindman教授,是人工智能智适应教育算法和产品专家,曾是ALEKS创始团队一员,任首席架构师、内容研发总裁,去年底作为首席数据科学家加入乂学教育松鼠AI。Dan Bindman教授自2005年起就领导创建了ALEKS的旗舰数学产品,并领导规划/实施了ALEKS整体的知识点和关联知识图谱(百万级别的图谱数据连接参数体系)。

乂学教育松鼠AI首席科学家崔炜博士向记者介绍,本次人机大战并不是乂学教育松鼠AI第一次通过这种形式来全面对比分析通过乂学教育的松鼠AI智适应系统学习和真人老师教学的差别。2017年10月,乂学教育在郑州组织了亚太地区第一场教学的人机大战。活动招募了三名17年平均教龄的中高级老师与松鼠AI教学系统进行PK,2018年4月29日-5月1日,在成都市举办的第二场人机大战中,乂学教育招募了平均教龄近20年的三名高级教师、优质课竞赛一等奖名师、中考命题组成员与松鼠AI 智适应系统进行对垒,2018年6月,在山东东营举办了第三场人机大战,本次人机大战进行了升级更加具有挑战性。针对120名学生,松鼠AI 智适应系统对垒真人老师1对3小班教学。结果显示,通过松鼠AI智适应系统学习初中课程的提分效果,都显著优于传统真人老师的提分效果。

乂学教育松鼠AI前几次的人机大战都取得了胜利,本次的百城人机大战的两天教学和比拼中,人机大战的结果显示:在最核心的平均提分上,机器教学组平均提高5.4分,真人教学组平均提高0.7分。根据实验设计,两组学生在同样的学习时间里,机器教学组比真人教学组的提分效果更好,而且具有统计显著性。

中国有上千个城市和地区,一二三四五线城市的经济发展状况各不相同,教育资源分布也不均衡,学生对互联网学习的习惯和认知情况也不同,本次百城人机大战机器教学组的获胜,体现了松鼠AI智适应学习系统的有效性和普适性。本次人机大战的结果统计显示,机器教学组8小时平均每个学生学了42个知识点,真人教学组8小时平均每个学生学了28个知识点,所以机器组的学生学习效率更高。栗浩洋介绍说:“松鼠AI智适应学习系统能够在短短两天的时间内取得很好的成绩,系统会通过AI深度学习检测出学生知识点的漏洞,进行个性化、针对性的学习,系统实时评估学生知识掌握的熟练程度、追根溯源分析学生学不会的原因,并及时动态调整学生接下来的学习内容和学习路径,孩子们可以精准的学习了,也就大大的减少了学习的时间,并且能够提升学生的学习效率。”

以下为艾瑞访谈实录:

记者:艾瑞在这次人机大战中主要参与了哪些环节?

艾瑞:艾瑞在人机大战中是以第三方公证的身份参与的,主要是监督这次测试的真实有效。参与的环节主要涉及学生的分组、现场教学与测试的观察以及问卷结果的检查确认。

记者:各个环节,艾瑞咨询是如何监督公证,保证公平性的?

艾瑞:人机大战的过程涉及多个环节,艾瑞首先会和比赛组织方确定整体实施方案,保证从方法论和样本量角度符合统计的合理要求。在实际进行过程中,监督实验组与对比组的学生分组随机且公平,并分派工作人员全程现场参与9场现场测试,覆盖学生数超过50%,同时其他场次的测试艾瑞也通过视频直播的形式进行监督,保证测试的真实有效。在统计学习结果的过程中,艾瑞会保留并检查所有前测、后侧问卷,并与出题老师进行尽职访谈。

记者:艾瑞如何看待这次人机大战的初衷和意义呢?

艾瑞:人工智能在教育的应用现在大家都很关注,但是对现有产品的效果大家都是有很多不同的意见。人机大战最大的意义还是在于通过科学的试验,验证在一定领域、一定条件下人工智能自适应教育和真人教师的教学到底存在什么不同,对大家提高对人工智能教育的认识和整体行业的未来发展应该都是很有帮助的,这也是国外在这一领域一般都会采用的试验形式。

加载中...