本文介绍的研究由Sangwon Yu、Changmin Lee、Hojin Lee和Sungroh Yoon等人完成,分别来自首尔国立大学电气与计算机工程系、Kakao公司以及首尔国立大学人工智能跨学科项目。该研究发表于2024年8月11日至16日举行的第62届计算语言学协会年会(ACL 2024)上,论文标题为《通过基于分数的渐进编辑器实现黑箱语言模型的受控文本生成》。
随着现代语言模型(如GPT系列)的发展,生成文本的流畅性已经达到了接近人类的水平。然而,生成的文本可能包含有害或不适当的内容,尤其是在输入上下文包含非期望属性时。因此,受控文本生成(Controlled Text Generation)成为了一个重要的研究方向,旨在确保生成的文本仅包含特定领域或数据集的期望属性。现有的方法要么无法应用于黑箱模型(即无法访问模型参数),要么在控制生成文本和保持其流畅性之间存在显著的权衡。本文提出的基于分数的渐进编辑器(Score-based Progressive Editor, SCOPE)旨在解决这些问题。
SCOPE的核心思想是在生成过程中对中间输出文本进行逐块编辑,确保编辑后的文本包含目标属性。具体流程如下:
研究在多个受控生成任务上进行了实验,使用了亚马逊客户评论数据集构建的不同语料库。实验结果表明,SCOPE能够有效调节生成文本的属性,同时充分利用黑箱大语言模型的生成能力。具体结果如下:
SCOPE通过逐块编辑的方式,有效解决了黑箱语言模型在受控文本生成中的挑战,特别是在控制性和流畅性之间的权衡问题。该方法不仅适用于单一属性的控制,还能够处理多属性控制任务,展示了其在现实应用中的广泛潜力。
尽管SCOPE在受控文本生成方面取得了显著进展,但仍存在一些局限性。例如,训练过程中需要大量的目标领域数据和计算资源。未来的研究可以进一步优化编辑器的稳定性,探索更多的编辑选项(如插入和删除),并研究在少样本设置下的应用。
SCOPE为黑箱语言模型的受控文本生成提供了一种高效且灵活的解决方案,具有重要的科学和应用价值。