本文档属于类型a,即报告了一项原创研究。以下是基于文档内容的学术报告:
基于大型语言模型指令微调的心理健康领域联合信息抽取研究
一、研究作者及发表信息
本研究由蔡子杰、方荟、刘建华、徐戈和龙云飞共同完成,分别来自福建理工大学计算机科学与数学学院、福建省大数据挖掘与应用技术重点实验室、闽江学院计算机与大数据学院、福建省心理健康人机交互技术研究中心,以及英国埃塞克斯大学计算机与电子工程学院。该研究于2024年8月发表在《中文信息学报》第38卷第8期,文章编号为1003-0077(2024)08-0112-16。
二、研究背景与目标
心理健康领域的信息抽取(Information Extraction, IE)旨在从文本中提取关键信息,反映语言模型对人类心理健康相关信息的自然语言理解能力。然而,中文心理健康领域的信息抽取指令数据集极为匮乏,限制了相关研究和应用的发展。为此,本研究旨在构建一个心理健康领域的联合信息抽取指令数据集,并通过参数高效微调(Parameter-Efficient Tuning, PEFT)技术提升大型语言模型(Large Language Model, LLM)在该领域的信息抽取能力,为AI心理健康服务提供重要的知识来源。
三、研究流程与方法
1. 数据集构建
在心理学专家的指导下,研究团队通过提示ChatGPT生成样本实例,并设计了生成指令及数据增强策略,构建了一个包含5641条数据的中文心理健康领域联合信息抽取指令数据集。该数据集涵盖三项基本抽取任务:命名实体识别(Named Entity Recognition, NER)、关系抽取(Relation Extraction, RE)和事件抽取(Event Extraction, EE)。
- NER任务:抽取性别、年龄、职业、躯体状况、情绪状况和家庭结构等实体。
- RE任务:抽取人际关系(如家庭亲近、同伴疏远)及事件与情绪、想法的因果关系。
- EE任务:抽取引发事件和过去经历。
数据集通过中文BERT模型计算困惑度(Perplexity)评估文本质量,并通过5分制人工打分验证数据质量。
指令设计与数据增强
研究团队设计了8条基础指令,并通过ChatGPT改写生成16条多样化指令,以增强模型的指令泛化能力。此外,采用字符级别和单词级别的数据增强策略,通过同义词替换、随机插入、随机交换和随机删除等操作提升模型的鲁棒性。
参数高效微调
研究采用低秩自适应(Low-Rank Adaptation, LoRA)技术对大型语言模型进行微调。LoRA通过在预训练模型的权重矩阵上应用分解低秩矩阵,显著减少参数量,降低计算复杂度和内存需求。实验在单张NVIDIA GeForce RTX 4090显卡上进行,超参数设置为:batch size为4,学习率为1e-3,共15个epoch,最大序列长度为512个token,最大目标长度为128个token。
基线模型与实验任务
实验选取了Bloom-560M、Bloomz-3B、ChatGLM2-6B和Baichuan-7B作为基座模型,并与BERT-BiLSTM-CRF、AdaSeqBERT-CRF、PRGC和OneRel等基线模型进行性能对比。评估指标包括F1分数和ROUGE-N,综合得分通过加权求和计算。
四、研究结果
1. 性能对比
- NER任务:ChatGLM2-6B在指令微调后达到88.59的综合得分,显著优于基线模型。
- RE任务:Baichuan-7B以70.78的综合得分表现最佳,Bloomz-3B和ChatGLM2-6B也优于基线模型。
- EE任务:Bloomz-3B以84.48的综合得分领先,ChatGLM2-6B和Baichuan-7B同样表现优异。
消融实验
人工评估
采用5分制李克特量表对模型输出进行人工评估,结果显示模型在正确性、帮助性和覆盖性方面均表现优异,进一步验证了其在心理健康领域信息抽取任务中的有效性。
五、研究结论
本研究通过构建心理健康领域的联合信息抽取指令数据集,并采用参数高效微调技术对大型语言模型进行微调,显著提升了模型在该领域的信息抽取能力。研究结果证明了大型语言模型在心理健康领域信息抽取任务中的有效性,为AI心理健康服务提供了重要的技术支持。
六、研究亮点
1. 数据集构建:首次构建了包含5641条数据的中文心理健康领域联合信息抽取指令数据集,填补了该领域数据集的空白。
2. 参数高效微调:采用LoRA技术实现了在单张消费级显卡上的高效微调,显著降低了计算资源需求。
3. 多样化指令设计:通过设计多样化的指令,增强了模型的指令泛化能力。
4. 联合信息抽取:首次在心理健康领域实现了NER、RE和EE三项任务的联合信息抽取,提升了模型的综合性能。
七、未来工作
未来研究计划进一步丰富标注数据集,从不同维度搜集更多心理健康相关的文本数据,并将该方法扩展到其他垂直领域,为相关研究和应用提供参考。
以上为基于文档内容的详细学术报告。