通过侧约束控制神经机器翻译中的礼貌表达

分享自：
通过侧约束控制神经机器翻译中的礼貌表达

期刊:Proceedings of NAACL-HLT
类型a：这篇文档报告了一项原创研究，因此按照类型a的要求生成学术报告。
Rico Sennrich、Barry Haddow和Alexandra Birch来自爱丁堡大学信息学院（School of Informatics, University of Edinburgh）是本研究的主要作者。该研究发表在2016年NACL-HLT会议论文集上，时间为2016年6月12日至17日。
这项研究属于自然语言处理（Natural Language Processing, NLP）领域，特别是神经机器翻译（Neural Machine Translation, NMT）的研究。许多语言使用敬语来表达礼貌、社会距离或说话者与听者之间的相对社会地位。然而，在从没有敬语的语言（如英语）进行翻译时，预测适当的敬语是非常困难的。用户可能希望控制输出中的礼貌水平，但现有的神经机器翻译系统无法满足这一需求。因此，本研究旨在通过侧约束（side constraints）控制神经机器翻译中的敬语生产，从而允许用户指定所需的礼貌水平。
本研究的工作流程分为以下几个步骤：
首先，数据准备阶段。研究人员使用了OpenSubtitles2012作为训练语料库，并从OpenSubtitles2013中随机抽取测试样本。训练语料库包含558万对句子，其中48万对被标记为礼貌句，109万对被标记为非正式句。随后，他们采用规则自动标注德语文本中的T-V区分（即敬语形式），并在源文本末尾添加特殊标记（如或）表示侧约束。这些侧约束在训练过程中以固定的概率α（实验中设为0.5）应用于标记的训练实例。
其次，模型训练阶段。研究人员使用GroundHog框架实现了一个基于注意力机制的编码器-解码器NMT系统，并遵循Bahdanau等人提出的设置和训练程序。他们采用了BPE（Byte Pair Encoding）方法将文本表示为固定词汇表的子词单元（词汇表大小为90000）。训练过程中，中性句子也被随机标记为礼貌或非正式，以防止模型过度依赖侧约束。
第三，测试与评估阶段。研究人员在一个包含2000个句子的测试集上进行了实验，这些句子均来自OpenSubtitles2013且包含第二人称代词“you”。他们测试了三种情况：无侧约束、强制礼貌输出和强制非正式输出。此外，还进行了一个Oracle实验，使用参考译文的礼貌标签确定侧约束，以模拟用户控制所需礼貌水平的场景。翻译质量通过BLEU分数进行评估。
研究结果显示，侧约束能够非常有效地控制NMT系统生成礼貌或非正式输出。在强制礼貌的情况下，96%的翻译被自动标注为礼貌或中性；在强制非正式的情况下，98%的翻译被标注为非正式或中性。BLEU分数也受到侧约束选择的显著影响，Oracle实验相较于基线（无侧约束）提高了3.2个BLEU点（从20.7提高到23.9）。此外，随机样本的实验表明，提供侧约束不会导致过多生成敬语代词，验证了训练过程中以恒定概率α引入侧约束的有效性。
本研究得出以下结论：通过在目标文本中标注T-V区分并将其作为额外输入集成到神经翻译模型的训练中，可以在测试时应用侧约束来控制NMT中的敬语生产。这不仅提高了翻译的语义准确性，还考虑了语用方面，例如生成社会上适当的形式称呼。未来的研究可以尝试从英语源文本中自动预测所需的礼貌水平，例如基于标题、名称或元文本信息。
本研究的亮点包括：首次提出通过侧约束控制NMT中的敬语生产的方法；设计了一种简单而有效的策略，通过在训练过程中以恒定概率引入侧约束，避免模型过度依赖侧约束；证明了T-V区分对翻译质量的重要性，特别是在专业翻译和字幕翻译任务中。
此外，本研究还探讨了侧约束在其他现象中的潜在应用。例如，除了T-V区分外，还可以用于控制语法特征（如包容性、时态、性别和话语参与者的数量）、方言选择以及文本语域等。这种方法的关键在于能够在训练时可靠地标注目标特征，无论是基于目标侧信息还是元文本信息。
这项研究为神经机器翻译中的敬语控制提供了一种创新的解决方案，具有重要的科学价值和实际应用前景。它不仅改进了翻译系统的性能，还为未来的多语言翻译研究提供了新的思路和方法。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问