大学英语四级翻译评分策略研究
来源:用户上传
作者:
摘 要:翻译题型作为大学英语四级测试中的主观题,其评分决策受到多方面因素的影响,但相关领域缺少对评分员认知的实证研究。本研究采用定性研究方法,对四级翻译任务评分员的评分策略进行初步探索。根据13位评分员对5篇四级进行有声思维评分的结果,评分员评分时采用了7种认知策略和2种元认知策略,且不同系数的评分员评分策略存在差异。最后,本文对完善四级翻译评分培训提出相关建议。
关键词:四级;翻译;评分策略;有声思维
一、引言
翻译能力作为一项重要的语言技能,在许多大型英语能力测试中都予以考察。2013年的全国大学生四六级英语考试中,翻译任务的分数比重提升至15%,题型从汉译英部分的单句翻译改为了段落翻译,这也提高了对评分工作的要求。在评分决策时,评分员通常会采用多种评分策略,这反映了评分员如何具体使用评分标准,以及如何解决评分中出现的各种问题。然而,针对像大学英语四六级测试这样的大规模、高风险考试中的翻译评分策略研究也非常缺乏,目前仅有的研究也只是针对作文评分模块。鉴于四级翻译任务对大学英语教学具有检测功能和反拨作用,有必要在前人研究的基础上对四级的翻译评分策略展开研究,从而对翻译评分标准以及评分培训提出建议。
二、文献综述
现阶段,对于翻译评分的实证研究主要聚焦于评分信度、评分方法以及评分标准的制定等,而尚未有针对翻译评分策略的实证研究。
评分过程是一个做决策的过程,涉及评分员如何使用评分标准,以及如何处理评分时的问题。评分员无法机械地将评分标准描述语套用在自己对译文的反应上,而是需要根据译文的细节表现对评分标准进行重复解读与调整。翻译评分的过程中会面对各种难题(譬如评分标准等级描述语的模糊性,评分标准的开发未考虑考生的实际水平、存在评分标准中未涉及的情形等),需要采取多种评分策略来帮助自己完成评分决策。目前关于评分员认知的实证研究主要集中于作文评分。由于翻译测试与写作测试类似,都屬于行为测试。鉴于此,本文在研究翻译评分策略时将参考作文评分策略的相关研究。
在作文评分领域,提出了一个较全面的作文评分员决策策略描述性框架(见表1),相关研究包括不同经验作文评分员的评分策略差异、造成评分差异的原因等,为本文研究设计提供了重要参考。
评分员的评分决策过程对评分结果的形成有至关重要的作用。鉴于此,本研究旨在探讨四级翻译任务评分员在评分过程中所采用的评分策略,包括认知策略和元认知策略,并以提出的作文评分策略描述性框架作为依据。其中,认知策略指评分员处理信息时的心理活动,而元认知策略指评分员用于监控和调节自己认知和决策的策略。同时,本研究还将对比不同系数评分员的评分策略差异。系数是四级翻译阅卷过程中用作判定评分员评分质量的重要参考指标,其生成的主要依据是主观题得分与客观题得分的相关性一般情况下,系数越高即代表阅卷员的评分质量越好,评分更加准确。研究不同系数评分员的评分策略差异,有助于完善评分员的培训,提高阅卷质量。
具体研究问题如下:
1)评分员在评阅四级翻译时采用了哪些评分策略?
2)不同系数的评分员的评分策略是否存在差异?
三、研究设计
3.1研究背景
四级翻译的题型是将长度为140-160个汉字的段落汉译英。其测试的目的为考察考生把汉语所承载的信息用英语表达出来的能力。四级翻译采用总体印象法进行评分,满分为15分,主要从内容(译文与原文的匹配程度)和语言表达两个方面进行评判。分数分为5个档位,分别是14分档(13-15分)、11分档(10-12分)、8分档(7-9分)、5分档(4-6分)和2分档(0-3分)。CET考委会为每个分数档提供一篇参考译文,以锚定评分员决策。评分员应首先根据评分标准中的档位描述确定分数档,再通过比较译文与样卷后在档位分上加减1分的方式来确定译文的最终分数。
3.2研究对象
本研究邀请了13名曾参加2019年1月四级翻译阅卷工作的评分员。根据评分员的平均阅卷系数将其分为低系数组(6人)和高系数组(7人)。其中,高系数组的平均系数与低系数组的平均系数相差值为0.15,平均系数为0.6。为便于操作,以Ai(i=1,2,…,6)和Bi(i=1,2,…,7)的方式,分别标识高系数组和低系数组评分员。
3.3研究材料
本研究使用的材料为2018年12月的四级翻译试题,由笔者所在学校非英语专业学生课后完成。在3名四级专家评分员完成评分后,笔者选取了5篇专家分数完全一致且覆盖所有分数档的译文用作研究材料。这些译文的得分依次为11、5、8、14、2。
3.4数据收集
本研究采用有声思维收集评分员的决策过程。有声思维评分过程分为以下三步:首先,向参与实验的评分员进行简短的介绍会,以确保评分员都熟悉本次研究实验的流程。其次,让评分员采用有声思维的方法进行简单的数学计算,以确保每个评分员都能够边思考边评分。最后,让评分员根据四级评分标准,对所选的5篇译文分别进行有声思维评分。全程录音以做进一步分析。
3.5数据分析
首先,将收集到的有声思维录音进行转写,并切分为独立的意义单位。最后使用winMAX质性分析软件,基于徐鹰的评分策略框架,对意义单位进行编码。
四、结果和讨论
4.1评分员在评阅四级翻译时使用的评分策略
有声思维编码结果见表2,包括7种认知策略(“比较”、“概括”、“解读”、“决策”、“推测”、“诊断”和“修改”)和两种元认知策略(“避免”和“自我评估”),每个编码(子策略)都配有示例。
与前人研究相比,本研究中“诊断”策略中的两个子策略,“诊断区分性特征”和“诊断是否忠实”,是区别于作文评分、仅适用于翻译评分的评分策略。评分员会参照参考译文设置一些能区分考生水平的采分点,并将其作为判断译文质量好坏的参考。此外,考生的译文是否贴合原文也被作为评价的标准之一。评分员会找出若干信息点,来具体衡量译文是否贴合原文,以及贴合原文的程度。这一现象体现了评分员对翻译评分的准确认知,因为翻译任务是建立在传达原文信息基础之上的。 整体来看,绝大多数评分员在评分时都能够运用各种评分策略来给分,尤其是认知策略,其可能原因如下:
1)翻译评分的性质和要求。翻译任务有别于写作任务,翻译评分要求评分员在对照译文与原文贴合程度的基础上对考生的译文质量进行判断。因此评分员会采用各种诊断策略来诊断译文是否贴合原文。此外,四级翻译测试与其他国内英语能力测试的翻译任务形式相类似,主要考察译文的贴切和准确、流畅,故而评分员会依据译文漏译、误译、语言错误的情况进行分数档位的调整(“诊断”策略)。
2)评分培训的影响。在四级阅卷工作开始前,评分员需参加考委会组织的评分培训,旨在评分员能熟练掌握评分标准,内化5个分数档的具体表征。在培训过程中,阅卷组长会指导评分员对照评分标准打分、判断具体分数时可以对比参考译文;打分时需要先判断分数档、再确定具体分数等。此外,有经验的评分员也会分享自己的评分策略,比如推测考生的考试策略、考生的语言能力;诊断语言错误;避免给满分等,从而起到在同伴之间相互影响的作用。在这两种因素的共同作用下,评分员能够掌握并运用各种评分策略,如“比较”“决策”“推测”“诊断”“避免”等,从而提高评分质量。
3)客观条件的限制。由于每位评分员必须每天完成较大工作量,以确保能在规定时间内完成评分任务,而评分标准在又一定程度上规定了各个分数档的错误个数,因此评分员会在阅卷时“纠错”,以简化评分过程,提高评分效率。此外,由于四级采用同一考生的主观分和客观分之间的相关系数作为衡量评分质量的重要标准,评分员会通过译文推测考生的英语水平,作为分数决策的依据之一。
4)评分员自身的阅卷习惯。在阅卷过程中,评分员会遇到水平参差不齐的譯文,一些评分员会使用“概括”、“解读”策略来助其整合译文中的各种语言特点、文本特征,从而对译文质量形成整体的把握,最终做出分数决策。
4.2不同系数评分员使用的评分策略差异
通过比较高系数组与低系数组评分员的编码结果,发现两组评分员在策略上存在差异,表3为各自最常采用的3种策略。
与低系数组评分员相比,高系数组评分员更关注译文的忠实度和区分性特征。如前所述,这两种策略表明了评分员对翻译评分的明确认知,即他们是在对译文而非作文进行评分。与低系数组评分者相比,他们更多地采用“诊断”策略,这表明他们对自己评分的质量更加在意。
而低系数组评分员采用的评分策略中,“识别语言错误”排在第一位,这表明他们更加注重“纠错”而非更多关注译文。此外,还有一个值得注意的发现,即相较于高系数评分员,低系数评分员更多采用了“自我评估”策略。推测可能的原因为,当评分员的评分质量较差时(即主客观题得分的相关系数较低),在后台监控阅卷质量的阅卷组长会约谈评分员,让其注意此种情况。他们会因此或多或少丧失评分信心,不敢给分,也更容易怀疑自己的判断。他们将会反复研究评分标准,并重新调整自己对于每个分数档位的心理表征。
而这与前人研究结果有所不同,相关研究表明高系数组更倾向于采用元认知策略,因为审阅大量的翻译可以帮助评分员建立一套有效的、稳定的、内化的评分标准。
本文则认为,低系数评分员会投入更多的认知努力来解读译文,他们不仅把有限的工作记忆集中在更全面的文本特征上,而且还使用更多的元认知策略来监控自己的评分决策。这一结论需要采用定量研究在后续研究中加以补充。
结论
本研究采用定性方法探讨了四级翻译评分员的评分策略,尝试建立起翻译评分与作文评分之间的联系,是翻译评分认知研究的一次有价值的探索。本研究发现四级翻译评分员在评分过程中运用了多种评分策略,可能受到翻译评分性质和要求、评分培训、客观条件限制、评分员自身习惯等多种因素的影响,并且高系数评分员对翻译评分更具准确认知,更能从评分标准所要求的忠实度和语言准确度两方面入手。上述结果深化了我们对翻译评分员认知的认识,同时对评分培训有一定启示:首先,不仅要给出参考译文和各自的分数,还要提供专家打分过程的依据,比如有声思维评分的录音。这有助于评分员更好地理解评分标准,运用各种评分策略,最终解决实际评分过程中的问题。其次,高系数评分员和低系数评分员可以采用不同的培训方案,低系数评分员应该投入更多的精力来掌握评分标准和学习各档位的参考译文。可以在每天评分工作开始之前或结束之后总结经验,解决问题。最后,高系数评分员可以向低系数评分员传授经验,以便低系数评分员能更有效的掌握具体的评分策略,从而提高评分质量。本研究尚存不足之处,如由于参与研究的评分员数量有限,未能收集定量数据等。后续研究将采用混合性研究的方式进一步探索翻译评分员的评分策略。
[参考文献]
[1]陈怡.英语专业高年级学生汉译英能力与文本测试评分[D].上海外国语大学博士论文,2010
[2]王金铨,文秋芳.学习者汉英翻译分析性评分细则的制定[J].外语教学,2009⑷
[3]肖维青.翻译测试的评分员信度研究—TEM8翻译项目评分员问卷调查记略[J].外语学刊,2011⑹
[4]徐鹰.大规模语言测试作文评分策略研究—以CET-4为例[J].解放军外国语学院学报,2018⑹
[5]张洁.评分过程与评分员信念—评分员差异的内在因素研究[D].广州:广东外语外贸大学,2009
(作者单位:华南理工大学外国语学院,广东 广州 510641)
转载注明来源:https://www.xzbu.com/7/view-15209381.htm