分享自:

基于图神经网络的推荐模型研究

期刊:天津理工大学研究生学位论文

类型a:学术研究报告

作者与机构
本文作者为浩庆波,指导教师为肖迎元教授与王春东教授,所属机构为天津理工大学计算机科学与技术学院。该博士论文提交于2024年8月,是申请博士学位的研究成果。

学术背景
本研究属于计算机科学与技术领域,聚焦于推荐系统中的图神经网络(Graph Neural Network, GNN)应用。随着互联网数据的爆炸式增长,信息过载问题日益突出,推荐系统成为解决这一问题的关键工具。然而,传统推荐模型(如协同过滤、矩阵分解)在处理图结构数据时存在稀疏性、冷启动和隐私安全等挑战。图神经网络因其能够直接建模用户-项目交互图、社交网络和知识图谱等复杂关系,成为提升推荐性能的新途径。

研究目标是通过改进图神经网络模型,从单行为推荐多行为推荐可解释推荐隐私保护推荐四个维度提升推荐精度与安全性。具体而言,论文针对现有模型的以下缺陷展开:
1. 单行为推荐中,用户行为动机的细粒度挖掘不足;
2. 多行为推荐中,行为内表征学习被忽视;
3. 可解释推荐中,评论稀疏性制约解释质量;
4. 隐私保护推荐中,集中式存储导致数据泄露风险。

研究流程与方法
研究包含四个核心模型,分别对应上述问题:

  1. 基于隐性关系的多粒度耦合图神经网络(IMGC-GNN)

    • 问题:传统模型难以区分用户行为动机中的个体属性与交互环境。
    • 方法
      • 构建用户-情境-应用三层耦合图,引入情境信息扩展交互维度;
      • 属性表征学习:分解耦合图为同质图(用户图、情境图、应用图),通过隐性关系挖掘节点间关联,过滤噪声并缓解稀疏性;
      • 交互表征学习:以交互为节点构建同质图,利用相似度分析交互动机;
      • 实验在三个城市交互数据集上进行,Top-K推荐指标(如Recall、NDCG)验证性能优势。
  2. 高阶单纯复形增强的多行为图神经网络(HEM-GNN)

    • 问题:多行为推荐中,行为内表征学习不足。
    • 方法
      • 行为间差异学习:监督式学习区分辅助行为与目标行为;
      • 行为内表征增强:通过隐性关系补全稀疏数据,利用高阶单纯复形(simplicial complexes)聚合节点信息;
      • 在公开数据集(如Yelp、Amazon)上的实验显示,HEM-GNN在稀疏场景下仍保持性能优势。
  3. 基于隐性评论增强的可解释图神经网络(IREGNN)

    • 问题:评论稀疏性限制了解释生成质量。
    • 方法
      • 评论网络:无监督提取用户/项目主题,丰富节点属性;
      • 评分网络:挖掘隐性评分,在主题约束下生成新评论;
      • 融合主题与评论表征生成解释,实验表明其在解释多样性(如BLEU指标)和推荐精度上均优于基线模型。
  4. 面向隐私保护的联邦图神经网络(P2FGNN)

    • 问题:集中式存储导致隐私泄露,分布式存储又引发图语义不全。
    • 方法
      • 二阶段扰动:发布用户-项目交互数据前,对隐私数据添加差分隐私噪声;
      • 联邦聚合:通过节点级、语义级和子图级聚合恢复全局语义;
      • 实验证明,在合理隐私预算(如ε=1.0)下,P2FGNN的推荐性能接近集中式模型。

主要结果与逻辑关联
- IMGC-GNN:通过分属性与交互双视角学习,在Yelp数据集上Recall@10提升12.3%,验证了动机细粒度挖掘的有效性;
- HEM-GNN:行为内单纯复形增强使稀疏场景下的NDCG@5提升9.8%,表明高阶结构对多行为建模的贡献;
- IREGNN:生成的解释在人工评估中得分提高15.6%,且隐性评论缓解了数据稀疏性;
- P2FGNN:隐私预算ε=2.0时,AUC仅下降3.2%,平衡了隐私与性能。

结论与价值
本研究提出了一套基于图神经网络的推荐模型改进框架,其科学价值在于:
1. 理论层面:通过隐性关系、单纯复形等新方法,深化了对用户行为动机的建模;
2. 应用层面:可解释性与隐私保护机制符合《网络信息内容生态治理规定》等法规要求,推动推荐系统合规发展。

亮点
- 方法创新:首次将单纯复形引入多行为推荐,利用拓扑结构增强表征学习;
- 跨领域融合:结合联邦学习与差分隐私,解决分布式场景下的隐私安全问题;
- 实证全面:覆盖单/多行为、可解释、隐私保护四大场景,实验数据丰富。

其他价值
论文提出的隐性关系挖掘方法可扩展至社交网络分析,而联邦学习框架为其他分布式机器学习任务提供了参考。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com