分享自:

ChatGPT翻译与人工翻译的文学文本对比研究

期刊:cogent social sciencesDOI:10.1080/23311886.2025.2472916

学术研究报告:ChatGPT翻译与人工翻译在文学文本中的对比研究

一、研究作者与发表信息
本研究由约旦耶尔穆克大学(Yarmouk University)翻译系的Rafat Al Rousan、Raghad Jaradat和Mona Malkawi合作完成,发表于期刊*Cogent Social Sciences*(2025年,第11卷第1期,DOI: 10.108023311886.2025.2472916)。研究聚焦人工智能(AI)驱动的机器翻译(Machine Translation, MT)与人工翻译(Human Translation, HT)在阿拉伯语文学文本英译中的质量差异。

二、学术背景与研究目标
1. 科学领域:研究属于翻译学与计算语言学的交叉领域,涉及机器翻译质量评估(Machine Translation Evaluation, MTE)和文学翻译的特殊性。
2. 研究动机:随着ChatGPT等生成式AI的普及,其翻译能力引发争议。尽管ChatGPT在多领域表现优异,但文学翻译需处理文化特异性、隐喻和语法复杂性(如阿拉伯语的屈折性特征),现有研究缺乏对其翻译质量的系统性评估。
3. 研究目标
- 对比ChatGPT-4与专业译者Denys Johnson-Davies对阿拉伯小说《北迁季节》(*Mawsim al-Hijra ela al-Shamal*)的英译质量;
- 识别ChatGPT的翻译缺陷(如文化术语误译、代词指代错误);
- 探讨AI是否可能取代文学翻译中的人类译者。

三、研究流程与方法
1. 数据收集
- 研究对象:选取Tayeb Salih的阿拉伯语小说《北迁季节》(1966)及其英译本(Johnson-Davies译,1969),从中随机抽取32个片段,最终筛选12个代表性段落(覆盖小说全部10个章节)。
- 机器翻译:使用付费版ChatGPT-4(GPT-4模型)生成对应英译。

  1. 评估框架

    • 多维质量度量框架(Multidimensional Quality Metrics, MQM):从准确性(Accuracy)、流畅性(Fluency)、设计(Design)三个维度评估翻译质量,错误按严重性分为轻微(Minor)、重大(Major)、关键(Critical)。
    • 评分模型:通过公式计算错误惩罚值(Penalties)和质量分数(Quality Score),例如:
      [ P = \frac{(1 \times \text{Minor} + 5 \times \text{Major} + 10 \times \text{Critical})}{\text{Word Count}} ]
      最终质量分数 ( Q = 100 - P )。
  2. 验证流程

    • 由两名翻译学教授独立审核错误分类,一致性达95.4%;
    • 通过定量(错误频率统计)与定性(文化术语分析)结合的方法验证结果。

四、主要研究结果
1. 准确性(Accuracy)
- HT显著优于ChatGPT:HT平均准确率94.5%,ChatGPT为77.9%。
- ChatGPT的典型错误
- 代词指代错误(例4):将阿拉伯语“بصدري”(以我的胸膛)误译为“into my chest”,导致动作逻辑颠倒;
- 文化术语误译(例7):“بلاد الهنك والرنك”(象征道德堕落的地区)被译为“the land of wealth and splendor”,完全偏离原意;
- 语法结构误判(例6):混淆阿拉伯语同音词“أحضر”(出席)与“يحضر”(带来)。

  1. 流畅性(Fluency)

    • ChatGPT略优(97.2% vs. HT的96.6%),但存在冗余标点(如过度使用引号)和拼写问题(如专有名词“Wad Rayyes”误拼为“Wad Rees”)。
  2. 设计(Design)

    • HT完美复现原文段落缩进和排版(100%),而ChatGPT忽略格式要求(平均98.8%)。

五、结论与价值
1. 核心结论
- ChatGPT在文学翻译中尚不可靠,尤其在处理文化负载词和复杂语法时;
- 人类译者的文化敏感性和语境理解力不可替代,如Johnson-Davies对苏丹方言的精准处理。

  1. 学术价值

    • 首次系统评估ChatGPT在阿拉伯文学翻译中的表现,填补了生成式AI在低资源语言对(Arabic-English)中的研究空白;
    • 验证了MQM框架在AI翻译评估中的适用性。
  2. 应用价值

    • 为翻译行业提供AI工具使用的边界建议,例如需人工校对关键文本;
    • 提示开发者需优化AI对文化语境和代词系统的处理能力。

六、研究亮点
1. 方法创新:结合MQM框架与混合方法(定量评分+定性分析),提升评估客观性。
2. 发现新颖性:揭示ChatGPT在代词指代和文化术语上的系统性缺陷,此前未被充分讨论。
3. 特殊研究对象:选择诺贝尔文学奖提名作品《北迁季节》,其语言复杂性和文化深度为翻译挑战提供了典型样本。

七、其他有价值内容
研究指出,ChatGPT的流畅性优势可能误导用户对其准确性的信任,需警惕“流利却错误”的翻译风险。此外,AI在格式还原上的不足(如段落缩进)可能限制其在出版业的应用。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com