这篇文档属于类型a,是一篇关于人工智能神经机器翻译(Neural Machine Translation, NMT)在文学翻译中应用的原创新研究。以下是详细的学术报告内容:
作者与机构
本研究由Hu Kaibao和Li Xiaoqian(上海外国语大学语料库研究院)合作完成,发表于期刊Babel(2023年7月24日在线发表,第69卷第4期,页码546–563)。研究得到国际翻译工作者联合会(FIT)支持,DOI编号为10.1075/babel.00331.hu。
学术背景
研究领域:本研究属于计算语言学与翻译学的交叉领域,聚焦神经机器翻译(NMT)在文学文本翻译中的表现,尤其是远距离语言对(如英语-汉语)的适用性。
研究动机:
1. 争议性背景:传统观点认为机器翻译(MT)仅适用于信息型文本(如新闻、法律),而文学翻译因需处理文化隐喻、情感和风格,被视为MT的“禁区”。例如,Voigt和Jurafsky(2012)认为文学MT是“近乎矛盾的术语”,而Besacier(2015)则主张MT可作为低成本替代方案(需后期编辑)。
2. 技术空白:既往研究多关注欧洲语言间的MT,而汉语与英语的文学翻译研究稀缺,且NMT的“创造性”潜力尚未系统评估。
研究目标:
1. 评估NMT系统DeepL在莎士比亚戏剧英译汉中的准确性与流畅性;
2. 对比DeepL与著名译者梁实秋的翻译,分析NMT的局限性与创造性表现;
3. 探讨NMT在文学翻译中的可行性。
研究流程与方法
1. 语料构建与预处理
- 研究对象:莎士比亚戏剧《科利奥兰纳斯》(*Coriolanus*)和《威尼斯商人》(*The Merchant of Venice*),选取喜剧与悲剧各一部以增强代表性。
- 语料来源:
- 原文:两剧英文文本(共52,475词,5,625词型);
- 译文:DeepL的自动翻译结果(58,722词)与梁实秋译本(62,266词)。
- 分析范围:聚焦两剧的第一幕和第五幕(《威尼斯商人》增加第四幕),共1,804句(占全文30%-38%),确保样本覆盖剧情关键节点。
2. 错误分析
- 错误类型:
- 准确性错误(对比源文本与目标文本):
- 词汇错误(如“call”误译为“电话”而非“喊叫”);
- 句法错误(如结构误译)。
- 流畅性错误(仅评估目标文本):语法不通或表达不地道。
- 统计方法:人工标注错误并计算错误率与准确率。
3. 语言学特征分析
- 句末语气助词(如“啊”“吧”“呢”):统计频率并对比DeepL与梁实秋译本的使用差异,分析其情感再现能力。
- 情态动词(如“必须”“应该”):
- 分类统计认知情态(epistemic)、道义情态(deontic)和动力情态(dynamic);
- 对比直译与增译(无对应源词的情态动词添加)。
4. 翻译策略对比
- 直译(Literal Translation)与自由译(Free Translation)的占比;
- 创造性策略:
- 显化(Explicitation):如将“catch him upon the hip”译为“抓到把柄”而非字面“抓住腰部”;
- 转换(Conversion):词性转换(如英语名词“mocker”译为汉语动词“嘲弄”);
- 视角切换(Shift of Perspective):如主语从“our business”改为“元老院”。
5. 数据统计工具
- 量化指标:词符数(Tokens)、词型数(Types)、标准化类符形符比(STTR);
- 显著性检验:卡方检验(Chi-square)分析频率差异(如语气助词使用)。
主要结果
1. 准确性与流畅性
- DeepL表现:
- 准确性:平均85.33%(《科利奥兰纳斯》83.86%,《威尼斯商人》86.30%);
- 流畅性:平均88.77%(《威尼斯商人》90.23%优于《科利奥兰纳斯》87.31%)。
- 对比梁实秋译本:DeepL的词汇多样性(STTR 39.64/千词)低于梁译本(43.61/千词),符合NMT普遍存在的“词汇贫化”现象(Vanmassenhove et al., 2019)。
2. 语言学特征
- 句末语气助词:DeepL使用频率(11.84/万词)显著低于梁译本(15.27/万词),但“吗”使用更多(188次 vs. 72次),体现对疑问句的敏感处理。
- 情态动词:DeepL使用频率更高(140.66/万词 vs. 71.95/万词),但增译比例较低(21.07% vs. 39.50%),显示其依赖源语结构。
3. 翻译策略
- 局限性:DeepL 61.2%的句子采用直译,易受源语结构束缚(如文化词“cypress grove”直译为“柏树林”)。
- 创造性:
- 显化:13.8%的句子通过补充隐含意义提升可读性;
- 视角切换:7.5%的句子调整主语以符合汉语表达习惯。
结论与价值
- 可行性验证:NMT在文学翻译中表现良好(准确率>80%),尤其适合处理句法复杂文本,但需警惕文化词误译。
- 创造性潜力:DeepL能通过显化、转换等策略部分再现文学性,但创造性依赖训练数据,无法自主处理超句子层级的语境。
- 学术意义:为首个系统评估英语-汉语文学NMT的研究,为后续跨语言文学MT提供方法论参考。
- 应用价值:支持“人机协作”模式——NMT完成初译,人工校对付诸出版。
研究亮点
- 创新方法:结合语料库语言学与错误分析,量化NMT的“创造性”指标(如增译频率);
- 特殊对象:聚焦远距离语言对(英语-汉语)及高难度文学体裁(戏剧);
- 重要发现:揭示NMT的“有限创造性”本质——受限于算法,但可通过策略调整部分突破。
其他价值
- 技术启示:未来NMT需融入文化语境模型以提升文学翻译质量;
- 争议回应:反驳“文学MT不可行”的绝对观点,提出分级应用场景(如非出版级翻译)。