《视觉感知推荐中的因果推断去偏方法:CausalRec模型研究》
作者及发表信息
本文由澳大利亚昆士兰大学(The University of Queensland)的Ruihong Qiu、Sen Wang、Zhi Chen、Hongzhi Yin和Zi Huang共同完成,发表于2021年ACM国际多媒体会议(ACM MM ‘21)。
学术背景与研究动机
研究领域:本文属于推荐系统与因果推断的交叉领域,聚焦于视觉感知推荐(visually-aware recommendation)中的视觉偏差(visual bias)问题。在电商平台中,用户对商品视觉特征(如外观)的点击行为可能与其真实偏好(如材质、价格)存在偏差,导致传统推荐模型因过度依赖视觉信号而产生误判。
研究目标:提出一种基于因果推断的通用框架,识别并消除视觉偏差,同时保留视觉信息的有效支持。最终开发新型推荐模型CausalRec,实现去偏后的高性能推荐。
研究方法与流程
1. 因果图构建与偏差分析
- 因果图设计:通过有向无环图(DAG)建模推荐系统中的关键变量,包括用户(*U*)、商品(*I*)、视觉特征(*V*)、真实偏好匹配(*M*)、视觉注意(*N*)和交互行为(*Y*)。
- 偏差机制:视觉特征作为中介变量(mediator),会引入虚假关联(spurious relationship),例如用户因视觉吸引点击商品,但实际未购买。
2. 干预与反事实推理
- 干预操作(Intervention):通过切断特定因果路径(如*I→V→N→Y*),分离视觉特征的直接效应(导致偏差)与间接效应(反映真实偏好)。
- 反事实问题:“若用户看到其他具有相同视觉特征的商品,是否仍会交互?”通过对比真实交互与反事实场景(如商品替换为I*),量化视觉偏差。
- 效应分解:
- 总效应(TE):原始交互与完全无干预场景的差异。
- 自然直接效应(NDE):仅保留视觉特征直接效应时的交互差异。
- 总间接效应(TIE):TE与NDE之差,反映去偏后的真实偏好信号。
3. 模型开发(CausalRec)
- 多任务学习架构:
- 匹配模块(Mi,u):用户-商品潜在向量点积(公式19)。
- 视觉间接模块(Mi,v,u):融合视觉特征与用户偏好(公式20)。
- 视觉注意模块(Nv,u):用户对视觉特征的独立响应(公式21)。
- 损失函数:结合BPR损失(公式24)与多任务目标(公式23),联合优化三个模块。
- 去偏推理:测试阶段通过TIE(公式27)生成最终推荐,超参数λ2控制去偏强度(公式28)。
4. 实验验证
- 数据集:Amazon八大类目(如Baby、Clothing),样本量1.6万至5.8万用户,交互稀疏度99.8%以上。
- 基线模型:对比BPR(非视觉)、VBPR(视觉基线)、AMR等。
- 评估指标:MRR、NDCG@50、HR@50。
- 结果:
- CausalRec在全部数据集上显著优于基线,NDCG平均提升21.9%-52.5%(如Toys类别提升52.5%)。
- 因果干预模块(CI)可泛化至VBPR等现有模型,使其NDCG提升14.7%-37.6%。
- 消融实验验证乘法融合(公式22)与多任务学习的必要性(图6)。
主要结论与价值
理论贡献:
- 首次提出视觉偏差的因果形式化定义,揭示其通过中介变量引入虚假关联的机制。
- 提出基于TIE的通用去偏框架,可适配现有视觉推荐模型。
应用价值:
- CausalRec在保持视觉信息有效性的同时,显著减少误推荐(如用户点击但未购买的商品)。
- 为电商平台提供高鲁棒性推荐工具,尤其适用于服装、家居等视觉敏感场景。
研究亮点
方法创新性:
- 首次将因果推断(反事实推理与干预)引入视觉推荐系统,解决传统协同过滤无法处理的固有偏差问题。
- 提出模块化多任务架构,分离视觉信号的“支持性”与“偏差性”。
实验严谨性:
- 覆盖八类大规模真实数据集,验证模型普适性。
- 通过超参数敏感性分析(图7),明确λ2对性能的影响规律。
其他价值
- 开源实现:基于Cornac框架,促进方法复现与扩展。
- 跨领域启示:因果分析框架可迁移至其他多模态推荐场景(如文本-视觉联合推荐)。
(全文共计约1500字)