本文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:
本研究由Jianfeng Deng、Chong Chen、Xinyi Huang、Wenyan Chen和Lianglun Cheng共同完成。研究团队分别来自广州铁路职业技术学院电气工程学院、广东工业大学自动化学院以及广东工业大学广东省网络物理系统重点实验室。该研究发表于《Advanced Engineering Informatics》期刊,于2023年3月10日在线发布。
本研究的主要科学领域是供应链管理(Supply Chain Management, SCM)中的知识图谱技术。供应链管理在制造企业中具有重要地位,但由于其复杂性,传统的管理方法难以高效处理多品种、小批量生产模式下的供应链问题。近年来,大数据、人工智能和知识自动化技术为供应链优化提供了重要手段。然而,现有方法在事件本体知识的概念粒度、实体识别模型的潜在词匹配、注意力机制中的关键特征干扰以及标注训练样本的缺乏等方面存在不足。
为了解决这些问题,本研究提出了一种基于事件逻辑知识图谱(Event Logic Knowledge Graph, ELKG)的供应链管理知识图谱构建方法。通过定义供应链管理事件参数类别及其关系,构建事件逻辑本体模型,并基于生成对抗网络(GAN)的主动学习实体识别模型,提升事件参数实体识别的准确性。最终,通过句型和关键词匹配完成参数实体关系的匹配,构建供应链管理事件逻辑知识图谱,为自主供应链管理提供知识支持。
本研究主要包括以下几个步骤:
事件逻辑本体模型构建
首先,研究团队定义了供应链管理事件的参数类别及其关系,构建了事件逻辑本体模型。通过对供应链管理案例的文本语料进行分析,将事件知识细化为事件主体、触发元素和动作对象三个要素,并定义了事件逻辑关系,如顺序关系和因果关系。基于这些定义,使用Protégé工具实现了事件逻辑本体的结构化存储和表示。
事件参数实体识别模型设计
本研究提出了一种基于双阶段生成对抗网络(GAN)的主动学习事件参数实体识别模型(GA-BACSBN)。该模型的核心是生成器BACSBN,其结构包括字符嵌入与注意力层、堆叠双向长短期记忆网络(BiLSTM)层、n-gram池化特征注意力机制层和实体识别层。BACSBN通过BERT预训练模型生成字符特征,结合词级字符特征注意力机制和n-gram池化特征注意力机制,提升对不同长度实体关键信息的关注度。
双阶段GAN主动学习训练
在第一阶段,生成器通过标注样本进行预训练,并使用测试样本的预测标签训练判别器。在第二阶段,引入标签空间注意力机制,将未标注样本的预测标签与样本特征融合,生成新的特征表示作为判别器输入。通过对抗训练,选择与真实标签尽可能一致的预测标签样本,加入训练集重新训练生成器。该过程有效减少了手动标注的工作量,提升了模型的识别效果。
事件逻辑知识图谱构建与可视化
通过句型和关键词匹配,完成事件参数实体关系的匹配,构建供应链管理事件逻辑知识图谱。最终,通过可视化工具展示了知识图谱的结构,实现了供应链管理知识的存储与查询。
事件参数实体识别效果
实验结果表明,BACSBN模型在供应链管理事件参数实体识别任务中的F1值达到85.91%,优于其他基线方法。通过词级字符特征注意力机制和n-gram池化特征注意力机制,模型能够更准确地识别不同长度的实体。
主动学习效果
在缺乏大量标注样本的情况下,基于双阶段GAN的主动学习方法显著提升了模型的识别效果。当标注样本数量减少至240时,GA-BACSBN的F1值仍能达到85.8%,接近全标注样本训练的效果。
知识图谱构建与应用
通过事件参数实体关系的匹配,成功构建了供应链管理事件逻辑知识图谱。该知识图谱能够为制造企业提供供应链管理的知识支持,帮助企业降低生产成本,提升供应链整体性能。
本研究提出了一种基于事件逻辑知识图谱的供应链管理知识图谱构建方法,通过定义事件逻辑本体模型和设计基于GAN的主动学习实体识别模型,有效解决了供应链管理中的知识提取和知识自动化问题。该研究不仅为供应链管理领域提供了新的技术手段,还为知识图谱技术在特定领域的应用提供了重要参考。
事件逻辑本体模型的构建
本研究首次将事件逻辑知识细化为事件主体、触发元素和动作对象三个要素,并定义了事件逻辑关系,为供应链管理知识图谱的构建提供了理论基础。
基于GAN的主动学习实体识别模型
本研究提出的GA-BACSBN模型通过双阶段GAN主动学习方法,显著提升了在缺乏标注样本情况下的实体识别效果,为小样本学习提供了新的解决方案。
知识图谱的可视化与应用
通过事件参数实体关系的匹配和知识图谱的可视化,本研究为供应链管理知识的存储与查询提供了实用工具,具有广泛的应用价值。
本研究还详细分析了供应链管理语料的文本特征,制定了语料清洗规则,确保了研究数据的质量和可靠性。此外,研究团队通过5折交叉验证方法评估了模型的性能,进一步验证了研究结果的稳定性和可靠性。
以上是对本研究的全面报告,涵盖了研究的背景、流程、结果、结论及其科学价值和应用价值。