Microsoft AI Achieves Milestone in Machine Translation

pic

美国和亚洲的微软研究人员今天通过AIcommunity发表了一篇关于自动中文到英文新闻翻译的文章“人类自我平等”的报道,该文件介绍了一种神经机器翻译系统,他们认为这与人类专家在汉英翻译中的表现相当。 。



虽然人工智能在图像准确性和语音识别等任务中的表现优于人类,但许多专家怀疑机器可以通过语言翻译来实现。 “在机器翻译任务中达到人类平等是我们所有人都拥有的梦想,”负责微软演讲,自然语言和机器翻译工作的技术研究员黄学东说道。 “我们只是没有意识到我们能够很快打到它。”



微软的系统在基准新闻故事数据集newstest2017上进行了测试,该测试由一组行业和学术合作伙伴开发,并于去年秋天的WMT17研究会议上发布。为准确衡量翻译质量,微软研究人员聘请双语人工评估员将微软的结果与两个独立制作的人类参考译文进行比较,而不是参考传统的指标,如BLEU和TER。



“同一个源句可以翻译成有时截然不同但同样正确的方式。这使得基于参考的评估在确定人类翻译质量或接近人类质量的机器翻译方面几乎无用,“该论文称。



据报道,微软的新机器翻译系统得分为69.0,与人工翻译无法区分,得分为68.6。







Huang告诉Synced,机器翻译是掌握自然语言理解(NLU)的关键,研究人员相信这将有助于人工智能(AGI)的发展 - 人工智能技术是当代AI技术的远程,人类智能水平目标。



“NLU没有大型数据集。但是,机器翻译呢。我们使用深度神经网络来学习语义表示,这可以应用于NLU。当我们学习语言的表达时,我们可能有机会解决NLU并改进认知服务(一套微软的机器学习算法),“黄说。



微软研究人员专注于中文(普通话)到英语语言对,因为它们是世界上使用最多的两种语言,并且从新闻领域采样文本,因为新闻报道的内容种类繁多。微软研究人员警告说,他们的结果不一定会推广到其他语言对或域,即使使用的技术不是特定于语言或域。



Huang将突破归功于三个因素:Nvidia的GPU提供的计算能力提高;改进的算法和特别深的神经网络;和优化的数据集,使用工程方法消除低质量数据或噪音。



为了提高模型的准确性和流畅性,研究人员使用了额外的培训方法,例如双重学习技术,通过从中文翻译成英文并将其翻译回来,从源到目标和目标到源翻译数据中学习。中文,然后将结果与原始句子进行比较。



采用的另一种技术是审议网络,它训练模型重复翻译相同的文本。类似于人类如何编写多个草稿,深度神经网络逐渐改进并改进其输出。







这个新系统尚未应用于Microsoft的商业翻译产品,如Microsoft Translator,PowerPoint Presentation Translator或Cognitive Services,但Huwang说他的团队正在研究它。



研究人员在机器翻译方面仍面临许多挑战,尤其是实时翻译和语音转换。微软的里程碑使该公司成为这个繁忙研究领域的全球领导者。



记者:Tony Peng |编辑:Michael Sarazen



亲爱的同步读者,即将推出的Synced的AI Weekly Newsletter可帮助您及时了解最新的AI趋势。我们每周都会提供一系列顶级人工智能新闻和故事,并与您分享全球即将举行的人工智能活动。