高考恢复40周年,机器人已经开始挑战高考:昨天学霸君和准星云学的机器人解答2017年高考数学科目的试卷,并且学霸君机器人Aidam还与6位高考状元实时PK,拿到134分的高分。高考机器人是国家863计划的一个重点项目,新智元专访了项目负责人之一的胡郁,以及学霸君首席科学家张凯磊,深度解答高考机器人的来龙去脉和技术详情。AlphaGo之后,高考机器人很可能会在社会再掀热潮,这次会在教育行业带来一场颠覆性的变革。
2017年6月7日,高考恢复后的第40届高考如期而至。40年前,人们为新时代的开启欢呼雀跃。40年后,从高考走出的一代又一代学子正在不断探索科技的新前线——在人工智能领域,科学家们正在努力让机器通过“高考”,创造能适应时代发展的机器智能。
这个夏天,正在高考如火如荼的举行之时,国内一些前沿的技术公司、教育公司都发起了让机器人挑战高考的活动,比如科大讯飞、学霸君和准星机器人等。6月6日晚,科大讯飞轮值总裁吴晓如在直播平台上介绍“高考机器人”;6月7日晚,学霸君智能教育机器人将与四位往届高考状元现场PK;准星机器人也在挑战高考数学卷。
134分,机器人的数学水平能碾压多少人?
6日晚,机器人高考成绩出炉。学霸君的Aidam首次与6名高考理科状元在北京同台PK,解答2017年高考文科数学试题。Aidam的成绩为134分,6名状元的平均分为135分。Aidam答题耗时9分47秒。“学霸君”创始人张凯磊介绍,为了展示,Aidam今天答题放慢了六倍速度,平时每道题完成时间应该在7-15秒。
同时进行的另一场机器人高考测试中,“准星数学高考机器人”AI-MATH测试北京文科数学试卷估分105分,用时22分钟。据报道,AI-MATH也答了全国卷,得分100,用时10分钟。
学霸君创始人张凯磊在接受蓝象营的专访时表示:“学霸君用的是 SVO 模型,当 SVO 模型工作的时候,就是在传递一个最小可用的信息模型。传递过后再进行符号计算和逻辑推理。我们向计算机内输入公理、定理,跟经典题目形成一系列的计算规则。然后快速做搜索,穷尽计算规则,看它能不能解出来。这两部分是计算机相对而言比较擅长的。最后,它会把形式语言变成自然语言输出,让人能读懂步骤。”
新智元了解到,未来学霸君的所有合作都会通过蓝象资本开放。
学霸君的首席科学家陈锐锋对新智元介绍,Aidam 的解题过程涉及到三个步骤:
1)自然语言翻译成机器能理解的形式语言,这里主要可以用RNN的一套机制,把题目翻译成以“主谓宾”为单位的最小描述单位,用于描述题目的各种状态。
2)进行推理和运算。这也是一个多层网络。区别在于数学计算(比如函数的最大值)在目前有很多运算比较难以用简单的RNN或者CNN等去模拟。学霸君采用了一类叫做知识元网络的方案,把知识的基础运算连接成网络。
3)形式语言翻译成自然语言。解题引擎预测出解题步骤之后,输出的是一些形式语言,这时候可以对其进行一个翻译,再转换成人可以理解的自然语言。
关于训练量,陈锐锋对新智元说,高考机器人已经做过和尝试做超过一千万的问题。因为机器解题是很快的,这个跟显示学生是不可同日而语的。“我们的AI学产品上平均学生在单学科上每天的做题量不超过40道,所以,这个对比是悬殊的”,他说。
张凯磊说:“我们有400台至强十二核 64G 内存的服务器加上1000台左右的辅助服务器,这400台基本都是 Tesla,容量很大。一个Aidam 的背后大概有7个引擎,代数和几何使用的是完全不同的引擎,从算法、逻辑到推理全都不一样,技术上难度很大。数学公式非常重要的是需要翻译成 LaTex ,通过 LaTex 进行阅读理解和输出。Aidam 每天训练30万道到50万道题目, 训练时间基本是全天的。但是因为白天有大量的中断性测试,所以晚上训练的时间更长。”
高考机器人:国家立项,两条腿走路
科大讯飞是863类人答题机器人项目的测试组织单位,他们认为,要客观的评价“机器人”参加高考的水平,要确保以下几点:
要有权威的第三方来主导和主持测试,包括测试机器的准备、测试系统的安装以及测试过程的操作;
参加考试的机器,要确保处于断网的环境;
测试试卷必须是原创的新题,在测试试卷实际完成测试之前,确保参测方无法获得试卷;
测试过程要求输出详细的机器处理的中间过程,备查。