分享自:

AI神经机器翻译的创造力与局限性:基于语料库的莎士比亚戏剧DeepL英汉翻译研究

期刊:BabelDOI:10.1075/babel.00331.hu

这篇文档属于类型a,是一篇关于人工智能神经机器翻译(Neural Machine Translation, NMT)在文学翻译中应用的原创新研究。以下是详细的学术报告内容:


作者与机构

本研究由Hu KaibaoLi Xiaoqian(上海外国语大学语料库研究院)合作完成,发表于期刊Babel(2023年7月24日在线发表,第69卷第4期,页码546–563)。研究得到国际翻译工作者联合会(FIT)支持,DOI编号为10.1075/babel.00331.hu。


学术背景

研究领域:本研究属于计算语言学翻译学的交叉领域,聚焦神经机器翻译(NMT)在文学文本翻译中的表现,尤其是远距离语言对(如英语-汉语)的适用性。

研究动机
1. 争议性背景:传统观点认为机器翻译(MT)仅适用于信息型文本(如新闻、法律),而文学翻译因需处理文化隐喻、情感和风格,被视为MT的“禁区”。例如,Voigt和Jurafsky(2012)认为文学MT是“近乎矛盾的术语”,而Besacier(2015)则主张MT可作为低成本替代方案(需后期编辑)。
2. 技术空白:既往研究多关注欧洲语言间的MT,而汉语与英语的文学翻译研究稀缺,且NMT的“创造性”潜力尚未系统评估。

研究目标
1. 评估NMT系统DeepL在莎士比亚戏剧英译汉中的准确性与流畅性;
2. 对比DeepL与著名译者梁实秋的翻译,分析NMT的局限性创造性表现;
3. 探讨NMT在文学翻译中的可行性。


研究流程与方法

1. 语料构建与预处理

  • 研究对象:莎士比亚戏剧《科利奥兰纳斯》(*Coriolanus*)和《威尼斯商人》(*The Merchant of Venice*),选取喜剧与悲剧各一部以增强代表性。
  • 语料来源
    • 原文:两剧英文文本(共52,475词,5,625词型);
    • 译文:DeepL的自动翻译结果(58,722词)与梁实秋译本(62,266词)。
  • 分析范围:聚焦两剧的第一幕和第五幕(《威尼斯商人》增加第四幕),共1,804句(占全文30%-38%),确保样本覆盖剧情关键节点。

2. 错误分析

  • 错误类型
    • 准确性错误(对比源文本与目标文本):
    • 词汇错误(如“call”误译为“电话”而非“喊叫”);
    • 句法错误(如结构误译)。
    • 流畅性错误(仅评估目标文本):语法不通或表达不地道。
  • 统计方法:人工标注错误并计算错误率与准确率。

3. 语言学特征分析

  • 句末语气助词(如“啊”“吧”“呢”):统计频率并对比DeepL与梁实秋译本的使用差异,分析其情感再现能力。
  • 情态动词(如“必须”“应该”):
    • 分类统计认知情态(epistemic)、道义情态(deontic)和动力情态(dynamic);
    • 对比直译与增译(无对应源词的情态动词添加)。

4. 翻译策略对比

  • 直译(Literal Translation)与自由译(Free Translation)的占比;
  • 创造性策略
    • 显化(Explicitation):如将“catch him upon the hip”译为“抓到把柄”而非字面“抓住腰部”;
    • 转换(Conversion):词性转换(如英语名词“mocker”译为汉语动词“嘲弄”);
    • 视角切换(Shift of Perspective):如主语从“our business”改为“元老院”。

5. 数据统计工具

  • 量化指标:词符数(Tokens)、词型数(Types)、标准化类符形符比(STTR);
  • 显著性检验:卡方检验(Chi-square)分析频率差异(如语气助词使用)。

主要结果

1. 准确性与流畅性

  • DeepL表现
    • 准确性:平均85.33%(《科利奥兰纳斯》83.86%,《威尼斯商人》86.30%);
    • 流畅性:平均88.77%(《威尼斯商人》90.23%优于《科利奥兰纳斯》87.31%)。
  • 对比梁实秋译本:DeepL的词汇多样性(STTR 39.64/千词)低于梁译本(43.61/千词),符合NMT普遍存在的“词汇贫化”现象(Vanmassenhove et al., 2019)。

2. 语言学特征

  • 句末语气助词:DeepL使用频率(11.84/万词)显著低于梁译本(15.27/万词),但“吗”使用更多(188次 vs. 72次),体现对疑问句的敏感处理。
  • 情态动词:DeepL使用频率更高(140.66/万词 vs. 71.95/万词),但增译比例较低(21.07% vs. 39.50%),显示其依赖源语结构。

3. 翻译策略

  • 局限性:DeepL 61.2%的句子采用直译,易受源语结构束缚(如文化词“cypress grove”直译为“柏树林”)。
  • 创造性
    • 显化:13.8%的句子通过补充隐含意义提升可读性;
    • 视角切换:7.5%的句子调整主语以符合汉语表达习惯。

结论与价值

  1. 可行性验证:NMT在文学翻译中表现良好(准确率>80%),尤其适合处理句法复杂文本,但需警惕文化词误译。
  2. 创造性潜力:DeepL能通过显化、转换等策略部分再现文学性,但创造性依赖训练数据,无法自主处理超句子层级的语境。
  3. 学术意义:为首个系统评估英语-汉语文学NMT的研究,为后续跨语言文学MT提供方法论参考。
  4. 应用价值:支持“人机协作”模式——NMT完成初译,人工校对付诸出版。

研究亮点

  1. 创新方法:结合语料库语言学与错误分析,量化NMT的“创造性”指标(如增译频率);
  2. 特殊对象:聚焦远距离语言对(英语-汉语)及高难度文学体裁(戏剧);
  3. 重要发现:揭示NMT的“有限创造性”本质——受限于算法,但可通过策略调整部分突破。

其他价值

  • 技术启示:未来NMT需融入文化语境模型以提升文学翻译质量;
  • 争议回应:反驳“文学MT不可行”的绝对观点,提出分级应用场景(如非出版级翻译)。
上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com