基于分数渐进编辑器的黑箱语言模型控制文本生成

分享自：
基于分数渐进编辑器的黑箱语言模型控制文本生成

期刊:proceedings of the 62nd annual meeting of the association for computational linguistics
本文介绍的研究由Sangwon Yu、Changmin Lee、Hojin Lee和Sungroh Yoon等人完成，分别来自首尔国立大学电气与计算机工程系、Kakao公司以及首尔国立大学人工智能跨学科项目。该研究发表于2024年8月11日至16日举行的第62届计算语言学协会年会（ACL 2024）上，论文标题为《通过基于分数的渐进编辑器实现黑箱语言模型的受控文本生成》。
研究背景随着现代语言模型（如GPT系列）的发展，生成文本的流畅性已经达到了接近人类的水平。然而，生成的文本可能包含有害或不适当的内容，尤其是在输入上下文包含非期望属性时。因此，受控文本生成（Controlled Text Generation）成为了一个重要的研究方向，旨在确保生成的文本仅包含特定领域或数据集的期望属性。现有的方法要么无法应用于黑箱模型（即无法访问模型参数），要么在控制生成文本和保持其流畅性之间存在显著的权衡。本文提出的基于分数的渐进编辑器（Score-based Progressive Editor, SCOPE）旨在解决这些问题。
研究流程SCOPE的核心思想是在生成过程中对中间输出文本进行逐块编辑，确保编辑后的文本包含目标属性。具体流程如下：
输入与生成：给定一个输入序列x，语言模型生成一个中间输出文本块ỹ。
逐块编辑：SCOPE将生成的文本块ỹ划分为若干块，每块包含b个token。每次生成b个token后，SCOPE会对当前块进行编辑，生成编辑后的文本块ŷ。
目标分数最大化：SCOPE通过最大化目标分数来指导编辑过程，确保编辑后的文本块ŷ更接近目标分布。目标分数由预训练的掩码语言模型（Masked Language Model, MLM）计算，考虑了文本的流畅性和目标属性的匹配度。
迭代生成：编辑后的文本块ŷ被重新插入到输入中，作为下一生成步骤的输入，逐步引导生成过程包含目标属性。
实验结果研究在多个受控生成任务上进行了实验，使用了亚马逊客户评论数据集构建的不同语料库。实验结果表明，SCOPE能够有效调节生成文本的属性，同时充分利用黑箱大语言模型的生成能力。具体结果如下：
类别控制生成：在针对相机、视频游戏、杂货和音乐等类别的生成任务中，SCOPE显著提高了生成文本的流畅性和控制性。使用GPT-4进行评估时，SCOPE生成的文本在流畅性和控制性方面均优于基线模型。
情感控制生成：在情感控制生成任务中，SCOPE在保持文本流畅性的同时，显著提高了情感控制的准确性。与现有的基线模型（如GEDI、DExperts）相比，SCOPE在控制性和流畅性之间取得了更好的平衡。
多属性控制生成：SCOPE还可以同时控制多个属性（如类别和情感）。实验表明，SCOPE能够有效处理多属性控制任务，生成同时满足多个目标属性的文本。
结论SCOPE通过逐块编辑的方式，有效解决了黑箱语言模型在受控文本生成中的挑战，特别是在控制性和流畅性之间的权衡问题。该方法不仅适用于单一属性的控制，还能够处理多属性控制任务，展示了其在现实应用中的广泛潜力。
研究亮点创新性：SCOPE是首个能够在完全黑箱条件下实现受控文本生成的方法，无需访问模型参数或输出分布。
高效性：与现有的迭代采样方法相比，SCOPE显著提高了生成速度，减少了计算成本。
广泛适用性：SCOPE能够与多种大语言模型API（如GPT-4、ChatGPT）兼容，展示了其在现实应用中的实用性。
未来工作尽管SCOPE在受控文本生成方面取得了显著进展，但仍存在一些局限性。例如，训练过程中需要大量的目标领域数据和计算资源。未来的研究可以进一步优化编辑器的稳定性，探索更多的编辑选项（如插入和删除），并研究在少样本设置下的应用。
SCOPE为黑箱语言模型的受控文本生成提供了一种高效且灵活的解决方案，具有重要的科学和应用价值。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问