分享自:

神经机器翻译中的句间翻译与语言视角:基于Transformer模型的ChatGPT研究

期刊:asia pacific translation and intercultural studiesDOI:10.1080/23306343.2025.2485609

类型a:学术研究报告

作者及机构
本研究的作者为Adi Sutrisno,来自印度尼西亚Universitas Gadjah Mada的语言与文学系。研究发表于期刊《Asia Pacific Translation and Intercultural Studies》,在线发表日期为2025年4月10日。

学术背景
本研究聚焦于神经机器翻译(Neural Machine Translation, NMT)领域,探讨了跨句翻译(inter-sentential translation)和语言视角(language perspective)适应的挑战与进展。传统统计机器翻译(Statistical Machine Translation, SMT)和早期NMT系统在跨句连贯性和文化语言适应性上表现不佳,常导致翻译结果缺乏上下文一致性或文化敏感性。随着基于Transformer架构的模型(如ChatGPT)引入自注意力机制(self-attention mechanisms),NMT系统在解决这些问题上取得了显著进步。

研究目标包括:
1. 评估ChatGPT作为基于Transformer的模型在跨句翻译中的准确性;
2. 探讨NMT技术如何解决语言视角转换的难题,例如文化、句法和风格差异的适配。

研究流程
1. 数据准备
- 研究选取了100组印尼语-英语句子对和10个段落,涵盖短句(5-10词)、中长句(11-20词)和长句(21+词),并控制词汇复杂度(单音节与多音节词混合)。
- 文本难度分为三个等级(基于Flesch阅读易读性评分),包括基础、中等和复杂文本,以测试模型在不同语言环境下的表现。
- 数据设计包含特定语言现象:指代(anaphora)、跨句依赖关系和文化特定表达(如习语)。

  1. 实验方法

    • 采用定性与对比分析法,将ChatGPT的翻译结果与早期NMT模型(如Google Translate)进行对比。
    • 评估维度包括:
      • 跨句连贯性:检查代词与先行词的性别一致性(如印尼语中性代词“dia”在英语中需区分“he/she”);
      • 语言视角适配:分析文化、句法和风格转换的自然性(如主动-被动语态调整)。
  2. 数据分析

    • 定量指标:使用Flesch评分标准化比较;
    • 定性指标:从流畅性、连贯性和文化准确性三方面评估翻译质量。

主要结果
1. 跨句翻译性能
- ChatGPT在跨句翻译中实现了100%的性别代词准确性(如正确区分“Sumaryono”和“Sri Maryani”的性别指代),而Google Translate在女性先行词场景下错误率高达100%(默认使用“he”)。
- 例如,印尼语句子“Mary tidak dapat menghadiri rapat hari ini. Dia akan mengantar ibunya ke stasiun”被ChatGPT正确译为“Mary was unable to attend today’s meeting. She was driving her mother to the station”,而Google Translate错误输出“he”。

  1. 语言视角适配

    • ChatGPT在文化适配中表现优异。例如:
      • 将“teras rumahnya”译为符合英语习惯的“her porch”,而非字面翻译;
      • 对印尼语习语“mata saya kemasukan sesuatu”进行语法重构,译为“something got into my eye”,而非直译的“I have something in my eye”。
  2. 模型局限性

    • 对低资源语言(如少数文化语境)的适配仍需改进;
    • 复杂句法转换(如无主语句)仍存在错误。

结论与价值
1. 科学价值
- 证实了自注意力机制在提升跨句依赖解析和文化适配中的关键作用;
- 为NMT系统开发提供了方法论参考,如文档级上下文整合(document-level NMT)和混合架构(规则系统+神经网络)。

  1. 应用价值
    • 推动媒体本地化、多语言教育等领域的公平性;
    • 为消除机器翻译中的性别偏见(如默认男性代词)提供了技术方案。

研究亮点
1. 创新性方法:首次系统评估ChatGPT在印尼语-英语翻译中的跨句与文化适配能力;
2. 技术突破:通过自注意力机制实现100%性别代词准确性,超越传统NMT模型;
3. 跨学科意义:融合语言学理论(如调制技术modulation)与AI技术,推动人机翻译界限。

其他发现
- 研究强调需扩展性别平衡和文化多样性数据集(如MT-Geneval基准),以进一步提升NMT的包容性。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com