这篇文档属于 类型a(单篇原创研究论文报告)。以下是针对该研究的学术报告:
《Applied Soft Computing》期刊2025年刊载的异质图神经网络分类聚合算法研究
本研究由Yufei Zhao、Shiduo Wang和Hua Duan(通讯作者)合作完成,三位作者均来自山东科技大学数学与系统科学学院(College of Mathematics and Systems Science, Shandong University of Science and Technology)。论文标题为《LSPI: Heterogeneous Graph Neural Network Classification Aggregation Algorithm Based on Size Neighbor Path Identification》,发表于2025年的《Applied Soft Computing》(Volume 171, Article 112656)。论文代码已开源在GitHub(https://github.com/liuhua811/lspia)。
科学领域与背景
该研究聚焦于异质图神经网络(Heterogeneous Graph Neural Networks, HGNNs)的节点分类任务。异质图(HINs)广泛存在于现实世界(如学术网络、社交网络),其特点是包含多种节点类型和复杂语义关系。现有HGNNs多依赖元路径(meta-paths)捕捉语义信息,但忽视了不同元路径邻居数量的显著差异:某些路径(如长路径或高频关系)会引入大量噪声节点,导致模型性能下降。
研究动机与目标
作者发现,现有模型(如HAN)在处理邻居数量差异大的元路径时准确率下降(例如ACM数据集中PAP与PSP路径的邻居数量相差75倍)。因此,本研究提出LSPI算法,核心目标为:
1. 识别噪声路径:通过量化元路径邻居数量的差异,将路径分为大邻居路径(Large Neighbor Paths)和小邻居路径(Small Neighbor Paths)。
2. 选择性聚合:对大邻居路径中的节点基于拓扑和特征相似性过滤噪声,保留高相关性邻居。
LSPI算法分为三个核心模块:
路径判别器(Path Discriminator, PD)
路径内聚合(Intra-Path Aggregation)
子图级注意力聚合(Subgraph-Level Attention)
实验设计
- 数据集:ACM(论文-作者-主题)、IMDB(电影-导演-演员)、Yelp(商家-用户-服务等级)、DBLP(论文-作者-会议)。
- 对比基线:HAN、MAGNN、HPN等7种模型。
- 评估任务:节点分类(Micro-F1/Macro-F1)和聚类(NMI/ARI)。
分类性能提升
聚类效果优势
消融实验验证
参数敏感性分析
科学价值
1. 理论创新:首次系统研究元路径邻居数量差异对HGNNs的影响,提出路径分类与选择性聚合框架。
2. 方法创新:融合拓扑概率与特征相似性的双重过滤机制,有效抑制噪声干扰。
应用价值
- 适用于需处理大规模异质图的场景(如推荐系统、学术网络分析)。代码开源促进工业界应用。
(报告总字数:约1800字)