近日,某高校学生在豆瓣给一本西班牙语译作《休战》写的短评引发热议,该短评就此书的翻译质量提出质疑,认为该书“机翻痕迹严重”,而后《休战》译者韩烨回应称该评价近乎人身攻击。而北京外国语大学高级翻译学院副教授王华树指出:“被指责机翻痕迹严重实际上不是机器翻译的问题,而是译者自身翻译水平的问题。”
翻译技术的多样性构成了其复杂的技术体系,其中最具代表性的就是机器翻译。机器翻译从1950年代发展至今,经历了三个阶段:基于规则的机器翻译,基于统计的机器翻译,以及目前主流使用的神经网络机器翻译。前两代机器翻译的质量不高,产出的译文往往生硬难懂。
目前广泛使用的神经网络机器翻译在译文质量上已经大有提升,尽管仍有一些自身暂时难以克服的缺陷,比如译文句式比较死板等,但读来生硬拗口的译文,却未必是机器翻译的结果,人工翻译中同样存在大量类似的“翻译腔”问题,即翻译出来的译文有洋化现象或不符合汉语的表达范例,表现为译文生硬、难懂、费解等特点。
事实上,目前译者与机器翻译的关系更像使用者与词典的关系,过去的译者遇到不懂的术语就会去查词典,而现在则是把查询的需求放到一个更复杂的“词典”之中。对于翻译专业的学生而言,主动使用机器翻译进行译后编辑,其实是向“集体译者”学习的过程,使他们能够深入分析优秀译文的形成模式。
在现实商业环境中,翻译质量其实具有不同层次的需求,大致上可以分为参考级、常规级、出版级等,这给机器翻译留下了广阔的应用空间。当下在文学领域,大多数人还不太认可机器翻译的能力,这是机器翻译的领域适用性和需求层次适用性的问题。在某些商业的专业领域,如果有足够的训练语料,机器翻译译文准确率可达到80%甚至更高。因此,机器翻译当前主要应用于非文学翻译领域,甚至因为市场驱动,非文学的翻译市场可能占到98%,甚至更多,这就提供了更多的语料和更多的技术投入,使得机器翻译系统所能发挥的作用更为强大。
深圳云译科技作为投入机器翻译商业应用的高新企业,通过在自然语言处理领域与语言服务行业深耕三十余载,云译科技积累了上百亿行业精准数据,包含40多亿的句对专业语料,覆盖86种语言、20个垂直细分领域,实现了机器翻译多应用场景的落地,服务客户已覆盖政府、高校、金融、医药、ICT等领域,在全球市场已获得上千家企业的认可与信赖。
在文本翻译上,云译科技通过三代机器翻译技术深层结合,国内第一个推出神经网络翻译的开源系统。支持批量解码、GPU解码,支持多个可选领域的机器翻译引擎,支持数字自动识别翻译。在图片识别上,云译科技利用OCR智能识别模块自动识别各类型图片文件,并自动转化为可编辑的文件类型,提高翻译效率及便利性。而在语音识别方面,云译科技采用的是先进的深度学习DNN模型的识别引擎,语音识别响应速度达到RTF<0.5,识别实时率在0.5以内。中文语音识别准确率在95%以上,英文准确率在90%以上。
借助上述技术,云译科技的机器翻译解决方案可以应用于多种场景,如大型社交平台调用云译翻译引擎,使用户可任意阅读社交评论,实现与国际友人的互动交流;通过扫描设备识别文字并快速进行翻译;办公软件可调用云译MT翻译引擎,邮件、办公文件等内容一键翻译;同传会议或论坛可配置云译坤伸智能同传系统,实现实时同步的多语投屏等等。
机器翻译广泛应用于商业领域,对于语言服务行业而言,其实是大势所趋。人工智能技术在当下的发展确实给翻译带来了巨大的冲击,包括翻译的手段、效率、质量、模式等。人工智能所拥有的三大推动力:算法、数据、算力正在以指数级的速度发展,在图像、视频、语音、翻译等应用方面优化机器翻译技术,能够很大程度上提高翻译效率,节约企业的成本。