分享自:

增强跨域推荐:利用基于人格的迁移学习与概率矩阵分解

期刊:expert systems with applicationsDOI:10.1016/j.eswa.2024.125667

这篇文档属于类型a,是一篇关于跨领域推荐系统的原创性研究论文。以下是针对该研究的学术报告:


一、作者与机构信息

本研究由Somdeep AcharyyaNargis Pervin*(通讯作者)合作完成,两人均来自印度理工学院马德拉斯分校(Indian Institute of Technology Madras)管理研究系。论文发表于期刊Expert Systems with Applications第263卷(2025年),文章编号125667,标题为《Enhancing Cross-Domain Recommendations: Leveraging Personality-Based Transfer Learning with Probabilistic Matrix Factorization》。


二、学术背景

研究领域与动机

本研究属于个性化推荐系统领域,聚焦于解决传统推荐系统的两大核心问题:
1. 数据稀疏性:传统协同过滤(Collaborative Filtering, CF)和基于内容的过滤(Content-Based Filtering)方法依赖用户历史行为数据,面临冷启动(Cold-Start)和稀疏性问题。
2. 跨领域适应性:现有推荐系统难以将用户特征(如性格)从一个领域迁移到另一个领域,导致新领域推荐效果不佳。

理论基础

  • 性格心理学:研究基于“大五人格模型”(Big Five Personality Traits),即开放性(Openness)、尽责性(Conscientiousness)、外向性(Extraversion)、宜人性(Agreeableness)和神经质(Neuroticism)。已有研究表明,用户性格与偏好显著相关(如Kassarjian, 1971; Finn, 1997)。
  • 迁移学习(Transfer Learning):通过源领域(Source Domain)数据(如TripAdvisor评论)预测目标领域(Target Domain)用户性格,解决跨领域数据缺失问题。

研究目标

  1. 开发一种从用户评论中自动推断性格分数的算法,替代传统问卷调查。
  2. 设计融合性格特征的矩阵分解模型(PEMF),提升推荐准确性。
  3. 构建跨领域推荐框架(PEMF-CD),通过迁移学习实现性格特征的领域迁移。

三、研究流程与方法

1. 数据收集与预处理

  • 数据集
    • 源领域:TripAdvisor数据集(1,098用户,26,386项,32,580条评论),包含用户性格分数(通过LIWC工具分析评论生成)。
    • 目标领域:Amazon四个子数据集(数字音乐、时尚、杂志订阅、视频游戏),总计超44,000用户和426,791条评论。
  • 预处理:去除停用词、URL,进行词形还原(Lemmatization)和词嵌入(Word2Vec)。

2. 性格分数预测模型

  • 混合策略(Mixing Strategy)
    1. 对源领域评论进行K-means聚类(6类),计算目标领域评论与每类簇的余弦相似度。
    2. 将目标评论合并至相似度最高的源簇,避免负迁移(Negative Transfer)。
  • BERT模型
    • 使用BERT-base(12层编码器)对混合评论生成联合嵌入(Joint Embedding)。
    • 为每个性格特质训练独立回归模型,预测目标领域用户性格分数。

3. 个性化推荐模型(PEMF)

  • 概率矩阵分解(PMF)改进
    1. 邻居构建:基于性格相似性(余弦相似度)和评分模式相似性,加权生成用户邻居集合(阈值γ=0.6–0.8)。
    2. 潜在特征更新:用户潜在特征融合邻居特征,公式为:
      [ U’ = \sum_{v \in Nu} S{u,v} Uv ]
      其中(S
      {u,v})为综合相似度(性格权重β=0.5)。
    3. 目标函数:引入邻居正则化项,优化潜在特征矩阵:
      [ L = \frac{1}{2} \sum (R_{u,i} - g(U_u I_i^T))^2 + \frac{\lambda_S}{2} |Uu - \sum S{u,v} U_v|^2 ]

4. 跨领域框架(PEMF-CD)

  • 迁移学习流程
    1. 源领域(TripAdvisor)性格分数用于训练BERT模型。
    2. 目标领域(Amazon)评论通过BERT预测性格分数,输入PEMF生成推荐。

四、主要结果

1. 性格预测性能

  • RMSE与MAE:在Amazon数据集上,性格预测误差较基线模型(如APAR、P2MF)降低最高达64.28%(RMSE)和76.7%(MAE)。

2. 推荐效果对比

  • TripAdvisor数据集:PEMF相比传统PMF,RMSE降低73.25%,MAE降低75.27%。
  • 跨领域实验
    | 数据集 | RMSE提升 | MAE提升 |
    |————–|———-|———|
    | 数字音乐 | 24.72% | 55.9% |
    | 时尚 | 64.28% | 76.7% |
    | 杂志订阅 | 48.79% | 67.6% |
    | 视频游戏 | 61% | 71.5% |

3. 关键发现

  • 性格相似性主导推荐:β≥0.5时性能最优,表明性格特征比评分模式更能反映用户偏好。
  • 邻居阈值影响:γ=0.6–0.8时模型效果最佳,过高会引入噪声,过低则忽略有效邻居。

五、结论与价值

科学价值

  1. 方法论创新:首次将性格迁移学习与PMF结合,解决跨领域推荐的数据稀疏性问题。
  2. 理论验证:实证表明性格相似性可替代传统协同过滤中的评分相似性。

应用价值

  • 商业场景:适用于电商、社交媒体等需跨领域推荐的平台,如根据用户在旅游平台的评论预测其对音乐或商品的偏好。
  • 技术扩展:框架可适配其他用户生成内容(如社交媒体帖子)。

六、研究亮点

  1. 混合策略与BERT:通过聚类和联合嵌入减少负迁移,提升性格预测精度。
  2. 动态邻居模型:融合性格与评分相似性,优化PMF的潜在特征更新机制。
  3. 全领域验证:在旅游、电商等多领域数据集上验证框架普适性。

七、其他贡献

  • 开源数据:使用的TripAdvisor和Amazon数据集均为公开数据,促进后续研究复现。
  • 基线对比:与13种基线算法(如PTUPCDR、UNICDR)对比,结果具有统计学显著性(p<0.01)。

此研究为跨领域个性化推荐提供了可扩展的理论框架和实用工具,未来可探索更多性格模型(如MBTI)与其他推荐算法的结合。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com