本文介绍的是清华大学电子工程系李寅峰、高晨†、罗恒亮(美团公司)、金德鹏和李勇共同发表在2022年ACM SIGIR会议(第45届国际信息检索研究与发展会议)上的研究论文《Enhancing Hypergraph Neural Networks with Intent Disentanglement for Session-Based Recommendation》。该研究提出了一种基于超图神经网络(Hypergraph Neural Networks)和意图解耦(Intent Disentanglement)的新型会话推荐系统(Session-Based Recommendation, SBR)模型HIDE,旨在解决现有方法在动态耦合意图建模和噪声信号过滤方面的不足。
会话推荐系统(SBR)是基于用户短期匿名行为序列(会话)预测下一交互项目的技术,在电商和流媒体平台中具有重要应用价值。传统方法面临两大核心挑战:
1. 动态耦合意图:用户兴趣由多意图耦合驱动(例如点击iPhone可能源于“苹果品牌偏好”或“智能手机购买需求”),而现有模型(如基于常规图的方法SR-GNN或超图方法DHCN)未显式解耦意图;
2. 会话噪声干扰:用户可能误点击无关项目(如会话“iPhone→iPad→牛奶→AirPods”中“牛奶”为噪声),影响兴趣建模。
HIDE的创新性在于通过超图构建和双重意图解耦(微观与宏观)解决上述问题,其目标是为每个会话生成意图感知的推荐结果。
每个会话被转换为超图(Hypergraph),包含三类超边(Hyperedge):
- 转移超边(Transition Hyperedges):捕捉时序转移的高阶关系(如点击iPhone后可能联合触发iPad和MacBook的浏览);
- 上下文超边(Context Hyperedges):通过滑动窗口捕获局部兴趣(如窗口大小𝑤=2时,{iPhone, iPad}构成超边);
- 意图超边(Intent Hyperedges):基于意图原型(Intent Prototype)计算项目相似性,连接同一意图下的Top-𝜀𝑛项目(𝜀控制稀疏度)。
引入意图分类辅助任务,通过多层感知机(MLP)预测会话意图标签,损失函数为交叉熵。该任务强制不同意图块相互独立,避免冗余。
在Tmall和Last.fm数据集上,HIDE的P@20和MRR@20显著优于基线:
- 性能提升:较最佳基线(GCE-GNN和DHCN),平均提升11.18%(Tmall)和12.65%(Last.fm);
- 长会话优势:当会话长度>6时,HIDE的精度优势更显著(见图3),验证其对复杂意图的建模能力。
HIDE的核心贡献在于:
1. 方法论创新:首次将超图与意图解耦结合,提出HGACONV和双重解耦框架;
2. 应用价值:为电商平台提供更精准的实时推荐,尤其适合长会话和噪声场景;
3. 开源意义:代码参数公开(如𝐾=5, 𝜆=1𝑒−4),推动SBR领域可复现性研究。
未来工作可探索工业级A/B测试,进一步验证HIDE在真实场景的效能。该研究为会话推荐系统提供了新的理论框架和技术路径。