类型a:这篇文档报告了一项原创研究,因此按照类型a的要求生成学术报告。
Rico Sennrich、Barry Haddow和Alexandra Birch来自爱丁堡大学信息学院(School of Informatics, University of Edinburgh)是本研究的主要作者。该研究发表在2016年NACL-HLT会议论文集上,时间为2016年6月12日至17日。
这项研究属于自然语言处理(Natural Language Processing, NLP)领域,特别是神经机器翻译(Neural Machine Translation, NMT)的研究。许多语言使用敬语来表达礼貌、社会距离或说话者与听者之间的相对社会地位。然而,在从没有敬语的语言(如英语)进行翻译时,预测适当的敬语是非常困难的。用户可能希望控制输出中的礼貌水平,但现有的神经机器翻译系统无法满足这一需求。因此,本研究旨在通过侧约束(side constraints)控制神经机器翻译中的敬语生产,从而允许用户指定所需的礼貌水平。
本研究的工作流程分为以下几个步骤:
首先,数据准备阶段。研究人员使用了OpenSubtitles2012作为训练语料库,并从OpenSubtitles2013中随机抽取测试样本。训练语料库包含558万对句子,其中48万对被标记为礼貌句,109万对被标记为非正式句。随后,他们采用规则自动标注德语文本中的T-V区分(即敬语形式),并在源文本末尾添加特殊标记(如
其次,模型训练阶段。研究人员使用GroundHog框架实现了一个基于注意力机制的编码器-解码器NMT系统,并遵循Bahdanau等人提出的设置和训练程序。他们采用了BPE(Byte Pair Encoding)方法将文本表示为固定词汇表的子词单元(词汇表大小为90000)。训练过程中,中性句子也被随机标记为礼貌或非正式,以防止模型过度依赖侧约束。
第三,测试与评估阶段。研究人员在一个包含2000个句子的测试集上进行了实验,这些句子均来自OpenSubtitles2013且包含第二人称代词“you”。他们测试了三种情况:无侧约束、强制礼貌输出和强制非正式输出。此外,还进行了一个Oracle实验,使用参考译文的礼貌标签确定侧约束,以模拟用户控制所需礼貌水平的场景。翻译质量通过BLEU分数进行评估。
研究结果显示,侧约束能够非常有效地控制NMT系统生成礼貌或非正式输出。在强制礼貌的情况下,96%的翻译被自动标注为礼貌或中性;在强制非正式的情况下,98%的翻译被标注为非正式或中性。BLEU分数也受到侧约束选择的显著影响,Oracle实验相较于基线(无侧约束)提高了3.2个BLEU点(从20.7提高到23.9)。此外,随机样本的实验表明,提供侧约束不会导致过多生成敬语代词,验证了训练过程中以恒定概率α引入侧约束的有效性。
本研究得出以下结论:通过在目标文本中标注T-V区分并将其作为额外输入集成到神经翻译模型的训练中,可以在测试时应用侧约束来控制NMT中的敬语生产。这不仅提高了翻译的语义准确性,还考虑了语用方面,例如生成社会上适当的形式称呼。未来的研究可以尝试从英语源文本中自动预测所需的礼貌水平,例如基于标题、名称或元文本信息。
本研究的亮点包括:首次提出通过侧约束控制NMT中的敬语生产的方法;设计了一种简单而有效的策略,通过在训练过程中以恒定概率引入侧约束,避免模型过度依赖侧约束;证明了T-V区分对翻译质量的重要性,特别是在专业翻译和字幕翻译任务中。
此外,本研究还探讨了侧约束在其他现象中的潜在应用。例如,除了T-V区分外,还可以用于控制语法特征(如包容性、时态、性别和话语参与者的数量)、方言选择以及文本语域等。这种方法的关键在于能够在训练时可靠地标注目标特征,无论是基于目标侧信息还是元文本信息。
这项研究为神经机器翻译中的敬语控制提供了一种创新的解决方案,具有重要的科学价值和实际应用前景。它不仅改进了翻译系统的性能,还为未来的多语言翻译研究提供了新的思路和方法。