机器自动翻译壮医英译应用研究
来源:用户上传
作者:
摘要:计算机翻译技术的不断升级给传统“手工作坊式”的翻译方式带来了很大的冲击,翻译人员要学习使用现代机器翻译技术,根据不同文本选择相应翻译技术,适应时代快速增长的需求。
关键词:机器自动翻译;壮医;翻译
中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2019)25-0062-02
一、机器自动翻译概述
随着全球一体化的不断深入,我国与西方国家之间的联系日益加强,对翻译的需求与挑战越来越大,而传统的人工翻译方法费时耗力、效率低下,已经不能满足当前快速增长的翻译需求。在此背景下,机器翻译应运而生,并发挥着越来越大的作用。随着计算机科学技术的飞速发展,人工智能在自然语言处理上的应用以及大规模语料库的不断涌现,机器翻译技术的开发呈现出多元化的特点,研发出了多种实用性很强的机器翻译系统,出现了基于词、句法、短语、实例等各种层次的机器翻译模型,还涌现出包括百度翻译、有道翻译、谷歌翻译、微软必应翻译等在内的多种在线机器自动翻译系统。根据杜金华等的预测,未来只有10%的任务需要人工翻译,70%的文档需要机器翻译,而中间的20%的信息则会采用译后编辑方式进行翻译。
二、机器自动翻译壮医英译应用研究
作为机器自动翻译行业的杰出代表,谷歌翻译是谷歌公司推出的针对文本、语音、图像以及视频提供的多语种翻译服务,是一款在线翻译软件。谷歌翻译最初采用的是与其他同类型公司(例如雅虎)类似的机器翻译系统,但是得出的翻译准确度并不理想。随后,谷歌翻译放弃了基于句法规则的机器翻译模型,开始基于平行语料库,结合统计和数学方法,研究构建大数据分析模型挖掘各种语言间的内在规律。随着谷歌翻译掌握的语料数据越来越庞大,谷歌翻译软件的翻译准确度也越来越高,其市场占有率也在不断提高。谷歌翻译的成功引来了其他翻译技术公司的竞相效仿,不少以谷歌翻译、百度翻译为代表的机器翻译软件都能利用大数据时代的庞大语料库,在短时间内进行即时、快速和高效的翻译,有些软件已经成为翻译人士的必备工具。
壮医翻译领域涉及的题材非常广泛,包括药品和医疗器械使用说明书、医学报告、医学论文及综述、临床操作、对外交流与推广等。不同题材文本的翻译目的不同,在词汇、语法、风格上各有特色,如译者能根据不同的题材、不同的文本特点使用恰当的翻译技术,从而达到事半功倍的效果。比如,壮医药品使用说明书有两个非常显著的文本特征:一是内容重复率高且在常见语料库可查,尤其是其中的禁忌、副作用、用法等内容,不仅句式基本一样,甚至内容也可能完全一样。使用机器翻译类似文本可以获得准确率非常高的译文。以壮药说明书中的常见的禁忌和副作用为例,使用谷歌翻译得到以下结果:(原文)禁忌:女性经期和严重胃病患者谨慎使用!(译文)Taboo:Women with menstrual period and severe stomach problems should be used with caution!(原文)副作用:无明显的药物反应。(译文)Side effects:No obvious drug reaction.二是含有大量常见语料库可查的专有名词,尤其是与药品成分及主治病症相关的专业词汇。使用机器翻译可以节省专有名词的查询时间,大大提高效率。下例中的原文一节选自壮药骨关节止痛中草药说明书,译文一为百度机器翻译自动处理的译文。
(原文一)功能范围:针对痛风痛症,肩周炎痛,风湿关节炎痛,类风湿关节炎痛,颈椎增生炎症痛,腰椎间盘突出发炎痛,股骨头坏死、经络堵塞疑难杂症痛有止痛和修复的效果。(译文一)Function range:for gout pain,periarthritisof shoulder,rheumatoid arthritis pain,rheumatoid arthritis pain,cervical vertebra hyperplasia and inflammation pain,lumbar intervertebral disc protruding inflammation pain,femoral head necrosis,meridian blockage of difficult and complicated pain and repair pain and repair effect.
分析译文发现原文中众多与病名相关的专业词汇百度翻译基本都翻译出来了。也就是说,原来占据人工翻译大部分时间和精力的专业词汇查询工作,机器翻译只用两秒种就完成了粗加工,形成了半成品。译员只需进行简单的译后编辑即可得到译文二的结果。(注:译后编辑①中,原文“肩周炎痛”中的“痛”机器漏译,需手动添加pain;编辑②中,风湿关节炎、类风湿关节炎在英文中共用“rheumatoid arthritis”一词,翻译机器将两者重复翻译,需手动删除。)
(译文二)Function range:for gout pain,periarthritisrain(编辑①)of shoulder,rheumatoid arthritis pain(编辑②),cervical vertebra hyperplasia and inflammation pain,lumbar intervertebral disc protruding inflammation pain,femoral head necrosis,meridian blockage of difficult and complicated pain and repair pain and repair effect.
译文二波浪线部分问题较大。原文“股骨头坏死、经络堵塞疑难杂症痛有止痛和修复的效果”断句不清,导致机器无法识别,翻译质量较差,需要进行的译后编辑较复杂。更简便的解决方案是进行译前编辑,即在使用翻译机器之前先对原文进行编辑。译前编辑通常涉及格式处理和语言处理两部分,目的是让文本简洁和可控,利于被机器分析理解,从而产出高质量的机器译文,提高译文准确率和可读性,减少译后编辑的工作量。因而,可将上例中的相关原文修改为“及其他由骨头坏死、经络堵塞等引起的疑难杂症痛,有止痛和修复的效果”,再次使用百度翻译可得到以下译文:(译文三)...and other pains caused by bone necrosis,obstruction of meridians and so on,it(编辑③)has the effect of pain relief and repair.如此一来,只需在机器翻译的基础上按照英文表达习惯,增加主语“it”(见编辑③)便可完成最终翻译。
可见,针对像药品说明书一样,具有专业词汇繁多、内容重复率高且大多在常见语料库可查等显著特征的壮医文本,机器翻译可以大大提高翻译的速度和效率,在量的方面发挥关键作用,完成传统人工翻译过程中超过80%的工作。当然,从质的角度來说,译员的译前编辑和译后编辑至关重要,剩下20%的工作必不可少。不过,就大多数壮医文本而言,由于现有的壮医英语相关语料极其有限,以目前的技术水平,使用机器自动翻译获得的译文质量有限。若想在提高速度和效率的同时获得高质量的翻译,需要译员借助计算机翻译辅助技术,人机交互进行翻译工作。
三、小结
随着计算机技术的不断升级,机器翻译的准确率不断提高,给传统翻译方式带来的挑战越来越大,这就要求翻译人员要根据不同文本特点,综合选择不同的翻译策略以提高翻译的速度和效率,适应时代快速增长的需求。
参考文献:
[1]杜金华,张萌,宗成庆,孙乐.中国机器翻译研究的机遇与挑战——第八届全国机器翻译研讨会总结与展望[J].中文信息学报,2013,(4).
[2]斯介生,宋大我,李扬.大数据背景下的谷歌翻译——现状与挑战[J].统计研究,2016,(33).
转载注明来源:https://www.xzbu.com/9/view-14940418.htm