这篇文档属于类型a,即报告了一项原创研究。以下是针对该研究的学术报告:
该研究由Yew Ken Chia、Lidong Bing、Soujanya Poria和Luo Si共同完成,他们分别来自阿里巴巴集团和新加坡科技设计大学。该研究发表于《Findings of the Association for Computational Linguistics: ACL 2022》期刊,发表时间为2022年5月22日至27日。
该研究的主要科学领域是自然语言处理(Natural Language Processing, NLP),特别是关系抽取(Relation Extraction, RE)。关系抽取的目标是从非结构化文本中预测实体之间的关系,这在知识图谱构建和问答系统等应用中具有重要意义。然而,现有方法通常需要大量标注数据,且局限于固定的关系集合。因此,研究者提出了零样本关系三元组抽取(Zero-shot Relation Triplet Extraction, ZERORTE)任务,旨在鼓励低资源关系抽取方法的研究。
研究分为以下几个步骤:
任务定义与数据生成
研究者首先定义了ZERORTE任务,即从输入句子中抽取三元组(头实体、关系标签、尾实体),其中关系标签在训练阶段未见过。为了解决数据稀缺问题,研究者提出了RelationPrompt方法,通过提示语言模型生成结构化文本,从而合成关系样本。具体来说,他们设计了一个结构化提示模板,用于在关系标签提示下生成合成关系样本。
模型训练与微调
研究者使用两个模型:关系生成器(Relation Generator)和关系抽取器(Relation Extractor)。关系生成器首先在已见关系的数据集上进行微调,然后通过提示生成未见关系的合成样本。关系抽取器则先在已见关系的数据集上进行微调,最后在合成样本上进行最终微调,用于预测未见关系的三元组。
三元组搜索解码
为了克服从句子中抽取多个关系三元组的限制,研究者提出了三元组搜索解码(Triplet Search Decoding)方法。该方法通过枚举多个输出序列来生成多个候选三元组,并根据似然阈值过滤最终输出序列。
研究者在FewRel和Wiki-ZSL数据集上进行了实验,结果表明RelationPrompt方法在ZERORTE任务和零样本关系分类(Zero-shot Relation Classification, ZERORC)任务中均表现出色。具体来说,RelationPrompt在单三元组和多三元组抽取任务中的准确率和F1分数均显著优于基线方法。此外,生成的数据样本在质量和多样性方面表现良好,能够有效监督下游关系抽取模型。
该研究提出了ZERORTE任务,并通过RelationPrompt方法解决了低资源关系抽取的挑战。RelationPrompt通过提示语言模型生成合成数据,并结合三元组搜索解码方法,能够有效地从句子中抽取多个关系三元组。该研究为未来低资源关系抽取方法的研究设定了新的基准。
研究者在附录中提供了更多数据样本和实现细节,进一步验证了生成数据的多样性和质量。此外,他们还通过消融实验验证了三元组搜索解码和任务特定微调的重要性。
通过该研究,研究者展示了语言模型在零样本关系抽取中的潜力,并为未来相关研究提供了新的思路和方法。