微软“爱写作”公众号上线 主推四大亮点

新浪教育
由微软亚洲研究院开发的个性化英语学习助手微软小英,致力于用 AI 技术帮助用户解决“听”和“说”的难题。对于“写”的问题,微软亚洲研究院在2018年将“作文打分”功能嵌入了微软小英,并在去年年底对该功能全面升级,推出了微软“爱写作”网页版。

微软爱写作
近日,微软“爱写作”公众号正式上线,基于微软亚洲研究院在自然语言处理、OCR(光学字符识别)等领域的多项最新研究成果,以及微软小英多年的技术积累,“爱写作”打造了四大亮点:语法检查、词语替换、分类作文打分和手写图片识别,可根据不同年级的作文标准,从语法到用词、文章结构,全面且便捷地帮助小初高学生、成人培训学习者,以及四六级、雅思、托福、考研的备考者提升英文写作水平。
“爱写作”在快速完成全文语法检查的同时,会将提交作文中的语法问题用红色下划线标记出来。学生只需点击红线,就能获得有针对性的语法讲解,并且还可以看到修改后的正确表达,作为参考,让学生们不仅知错就改,而且知道如何去改。“爱写作”的语法检查功能采用了微软亚洲研究院此前提出的全新的学习和推断机制Fluency Boost Learning and Inference(流畅度提升学习与推断),帮助用户“找茬”。通过 Fluency Boost Learning(流畅度提升学习)生成的大量纠错数据,结合 seq2seq 预训练技术,“爱写作”的语法纠错模型在 CoNLL-2014 和 JFLEG 两个权威语法纠错数据集上都率先超越了人类参考水平,并且持续保持着业界领先的技术水准。
“爱写作”的词语替换功能可以根据上下文筛选出多个高级词汇供用户选择使用。针对某个特定的词或短语,“爱写作”可以自动关联三个同义词作为备选,让用户不再只会用“good”、“nice”这样的简单词汇,而是能够看到更多的如“impressive”、“admirable”这样更复杂的词汇,来进行替换。
在词语替换功能中,微软亚洲研究院的研发人员提出了基于预训练语言模型的词替换方法,并结合微软原创的预训练语言模型——UniLM作为词替换的解决方案。该方法通过半遮盖(partial masking)等策略让预训练语言模型能够同时考虑原目标词词义以及上下文语境,从而选出合适的替换词。
基于此前微软小英“作文打分”功能和“爱写作”网页版积累的经验,升级后的“爱写作”作文打分功能不仅可以对所有文章进行一般性评分,还可以测试同一篇作文在不同考试类型中的得分状况。因为不同的考试在词汇、语法、文章结构、连贯性、切题程度等维度上对作文有不同的考量标准,所以“爱写作”在给出分数的同时,还可以有针对性地评价一篇作文在上述这些维度上的表现,并给出反馈建议,以便学生更好地进行自我提升。目前,“爱写作”支持小学、中考、高考、四级、六级、考研、托福、雅思共八大英语考试类型。“爱写作”使用了微软亚洲研究院研发的序数回归模型(Ordinal Regression),减少了对标注数据量的依赖。该技术把“文章与具体分数的匹配”问题,变成了一个有序的比 较大小的问题,在训练过程中,将已有的标注数据两两配对进行对比,进而形成新的文章与评分,再将此数据加入到标注数据集中,使得可用于训练的标注数据量呈指数级增加,从而整体提高了评分的准确性。
“爱写作”能将笔记转换成可用智能终端进行编辑的文字,语法检查、作文打分、词语替换等等作文批改功能全部轻松实现。而且,老师们也可以借助此功能,轻松识别学生们各不相同的手写字体,方便完成作文批改工作。
微软亚洲研究院研发的微软新一代 OCR引擎为“爱写作”中的手写识别功能提供了强大的技术支撑。微软新一代OCR引擎像“鹰眼”一样,可以有效地检测出图像中的各类文字,还可以同时支持打印体和手写体的复杂文字场景识别。
除了上述四大亮点,“爱写作”还支持中英文双向的查词功能和逻辑连接词的查找功能,用户再也不需要退出应用到专门的词典里进行查询了,使用更加简便、高效。