分享自:

中国古典诗歌的机器翻译:ChatGPT、谷歌翻译和DeepL翻译器的比较研究

期刊:Humanities and Social Sciences CommunicationsDOI:10.1057/s41599-024-03363-0

这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:


中国古典诗歌机器翻译的比较研究:ChatGPT、Google Translate与DeepL Translator的对比分析

一、研究团队与发表信息
本研究由香港中文大学语言学及现代语言系的Ruiyao Gao、Yumeng Lin、Zhenguang G. Cai,以及香港浸会大学翻译、传译及跨文化研究系的Nan Zhao合作完成,发表于期刊*Humanities and Social Sciences Communications*(2024年6月)。

二、学术背景与研究目标
研究领域为机器翻译(Machine Translation, MT)文学翻译的交叉领域。近年来,大型语言模型(Large Language Models, LLMs)如ChatGPT在通用翻译任务中表现突出,但其在文学翻译(尤其是中国古典诗歌这类富含文化隐喻与韵律的文本)中的应用潜力尚未充分探索。中国古典诗歌以凝练的语言、意象符号(如“蟾辉”代指月光)和严格的格律(如绝句、律诗)著称,对机器翻译系统提出了独特挑战。

研究团队旨在解决以下问题:
1. ChatGPT在翻译中国古典诗歌时,是否比传统机器翻译系统(如Google Translate和DeepL Translator)更具优势?
2. 不同提示(prompt)设计能否进一步提升ChatGPT的诗歌翻译质量?
3. 如何量化评估机器翻译在忠实度(fidelity)流畅度(fluency)语言风格(language style)机器翻译风格(machine translation style)等维度的表现?

三、研究流程与方法
研究分为四个核心步骤:

  1. 材料准备

    • 诗歌选取:从中国诗歌网(zgshige.com)随机选取2023年4月发布的21首古典诗歌,包括12首绝句(四行诗)和9首律诗(八行诗),确保未被ChatGPT预训练数据覆盖。
    • 翻译系统:对比ChatGPT(GPT-3.5)、Google Translate和DeepL Translator。ChatGPT采用两种提示:
      • Prompt 1:基础翻译指令(“请提供以下材料的英文翻译”)。
      • Prompt 2:增强指令(“以下是中文古典诗,请先解释其含义,再翻译成押韵的英文诗”),结合任务特定提示(task-specific prompting)和思维链(chain-of-thought)技术。
  2. 翻译生成与评估

    • 评估者:9名母语为中文的英语翻译硕士或博士,采用5级李克特量表(1-5分)对翻译结果评分,标准包括:
      • 忠实度:是否准确传达原诗语义与文化意象。
      • 流畅度:译文是否符合英语语法与表达习惯。
      • 语言风格:是否保留原诗的韵律、节奏与修辞(如押韵)。
      • 机器翻译风格:译文是否呈现“机械感”(如生硬措辞)。
    • 盲审设计:评估者不知翻译来源,诗歌与翻译顺序随机化。
  3. 数据分析

    • 使用R语言的lme4包构建线性混合效应模型(Linear Mixed-Effects Models),以翻译系统为固定效应,评估者和诗歌为随机效应,分析各评分维度的显著性差异。
  4. 案例深度分析

    • 选取典型诗句(如“蟾辉轻抚土门楼”),对比不同系统对文化意象(如“蟾辉”译为“toad glow”或“moonlight”)和句法结构(如主语补充)的处理差异。

四、主要结果
1. ChatGPT全面优于传统系统
- 忠实度:ChatGPT(3.83分)显著高于DeepL(2.97分,p=0.017)和Google Translate(2.75分,p=0.002),尤其在文化符号(如“杜宇”译为“cuckoo”而非拼音)和隐喻解读上更准确。
- 流畅度:ChatGPT(3.82分)得分最高,因其能补充主语(如将“垂钓午时倦”译为“I feel tired from fishing at noon”)并优化句子衔接。
- 机器翻译风格:ChatGPT(1.69分)的“机械感”最低,而传统系统接近4分(满分5分)。

  1. Prompt 2提升语言风格

    • 使用Prompt 2时,ChatGPT的语言风格评分(4.30分)显著高于Prompt 1(3.36分,p<0.001),成功实现押韵(如aabb格式)和音节控制,但可能引入非原文内容(如添加“with grace”以维持韵律)。
  2. 局限性

    • 知识应用不一致:ChatGPT虽能单独解释“郭墙”为“outer wall”,但翻译时仍直译为“Guo wall”。
    • 幻觉问题:为追求流畅或押韵,可能添加无关语义(如“pace”)。

五、结论与价值
1. 科学价值:首次系统验证了LLMs在古典诗歌翻译中的优势,证明其能结合上下文理解与文化知识,超越传统神经机器翻译(Neural Machine Translation, NMT)的逐词对应局限。
2. 应用价值:为文学翻译自动化提供新思路,例如通过提示工程优化输出,或辅助人类译者快速生成初稿。
3. 伦理启示:需警惕AI对文化意象的误译风险,强调人机协作的必要性。

六、研究亮点
- 方法创新:首次将提示工程与思维链技术应用于诗歌翻译评估。
- 跨学科意义:融合计算语言学、文学研究与翻译理论,为AI创造性任务(如诗歌生成)提供参考。
- 开源数据:实验材料与分析脚本公开于Open Science Framework(OSF),推动可重复性研究。

七、其他发现
研究还指出,ChatGPT的翻译能力可能源于其零样本推理(zero-shot reasoning)上下文学习(in-context learning)特性,这为未来开发专业领域(如古籍翻译)的微调模型指明了方向。


(注:全文约2000字,符合要求)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com