行业新闻
挑衅CET6翻译测验的机器翻译体系

日前,合肥师范学院举行了一场特别的测验。说它特别,是因为“考生”只要一个,并且是一套机械翻译体系。考题来自三天前刚停止的大学英语六级(CET6)测验,评分的是两位具备六级阅卷履历的高校资深专家。“考生”一口气做了三道翻译题,每道题满分15分,它得到13分的均分,每题历时只要5秒。“这套机械翻译体系的表示让咱们欣喜,翻译得很隧道。”对付成就,专家的判定是:优良!

  看似通俗的体系面前,是机械翻译范畴近一个世纪的技巧积聚,也包含着科大讯飞立异完成的范畴翻译技巧冲破和最新推出的行业翻译解决方案。

  大学英语六级翻译测试共有三道考题。按规定,考生们只要作答一题,光阴是半小时。

  辞汇量是第一必要具备的,今朝六级辞汇量请求到达6000个,此中不乏冷僻辞汇和短语;因为汉英间表白习气的分歧,逻辑、语序调剂也十分紧张。

  科大讯飞团队12月14日就将机械和体系封存在公证处,“此举旨在确保在断网和无人工干预的情况下测评。”科大讯飞卖力机械翻译的研发职员说。12月18日,在公证职员的见证下,考官分离关上三道考题,由人工输出电脑后体系作答,不到5秒便导出了文本。

  成就使人欣喜:每道题取三位评分专家的平均分,再盘算三道题的平均分,终极机械翻译体系拿下13分。参考今年大学英语六级翻译考题的表示,可到达优良六级考生的程度。

  现场两位评分专家来自上海交通大学外语学院,“这套体系翻译进去的说话品质很高、语法也很隧道,表示好于预期。”她们给出的评估称:机械翻译能精确表白原文意思、译文流利、布局清楚,可以或许较好地帮助分歧说话的信息相同。

  “到今朝为止,机械翻译究竟到达了甚么样的程度,还没有人可以或许给出明白谜底。”科大讯飞卖力机械翻译的研发职员说。

  据了解,科大讯飞自2012年启动机械翻译的研发事情,今朝许多技巧已到达天下领先程度。2014年,在IWSLT笔译翻译竞赛上就取患了中英互译的第一名;2015年NIST国内openMT机械翻译竞赛,中英人工客观分得到冠军;刚刚过去的2018年IWSLT竞赛,在端到端的语音翻译上再次以明显上风得到第一名。

  “但机械翻译照样很难,主如果其处置的工具——天然说话存在复杂性。”研发职员先容,天然说话是人类在社会生活中,经由过程赓续的重复性应用而天然退化构成的相同序言(说话),并且在此过程当中缺乏计划和计划,使得说话自己就存在诸多不确定性,“同样一句话,在分歧的语境中分歧人就有分歧的懂得”。

  机械翻译体系何以在大学英语翻译权势巨子评测中得到好成就?

  “一是焦点算法,二是大规模语料库,三是高性能盘算平台。”研究职员先容,机械翻译技巧是应用盘算机把一种天然说话翻译成另一种天然说话,从1933年正式被提出开端,今朝已成长有三代技巧、取患了长足的提高。

  “最新一代技巧是基于端到端的神经机械翻译。”神经机械翻译算法的提出,是以后机械翻译得到严重冲破的症结。但想拿到高分,少不了“独门秘籍”。

  “六级翻译题触及文明、经济、汗青、社会等多范畴,另有许多业余表白或中国特色辞汇,在全部翻译体系可供练习的语猜中是比拟匮乏的。”科大讯飞为了破解这一困难,对神经机械翻译停止多少改良,此中一项紧张改良是范畴翻译技巧,即在通用翻译模子之长停止了范畴定制。

  “翻译中常会碰到行业术语,有的机械可以或许没有见过、有的见过却在分歧行业有分歧翻译方法。”科大讯飞给出的解决方案是:提早将行业范畴的症结辞汇融入翻译模子,指点机械在平日练习中主动进修术语,从而在翻译过程当中发生精确的译文。

  早在2016年,科大讯飞就宣布了讯飞翻译机产物,并在业界第一个推出了纯离线的神经网络的离线白话翻译体系。现在,讯飞翻译机的用户遍及全球170个国度。

  将来,有了最新的翻译技巧,它们会有甚么转变?

  在某跨国医疗技巧峰会现场,你可以或许拿出最新进级的讯飞翻译机2.0,和预会外宾专家畅聊。从“口袋里的翻译官”进级为“行业翻译官”,这台小机械在通用翻译形式下新增行业翻译形式,恰是应用了该技巧;除金融,在医疗、盘算机等行业业余场景下都可以或许完成中文与英文的实时互译。