增强跨域推荐：利用基于人格的迁移学习与概率矩阵分解

分享自：
增强跨域推荐：利用基于人格的迁移学习与概率矩阵分解

期刊:expert systems with applicationsDOI:10.1016/j.eswa.2024.125667
这篇文档属于类型a，是一篇关于跨领域推荐系统的原创性研究论文。以下是针对该研究的学术报告：
一、作者与机构信息本研究由Somdeep Acharyya和Nargis Pervin*（通讯作者）合作完成，两人均来自印度理工学院马德拉斯分校（Indian Institute of Technology Madras）管理研究系。论文发表于期刊Expert Systems with Applications第263卷（2025年），文章编号125667，标题为《Enhancing Cross-Domain Recommendations: Leveraging Personality-Based Transfer Learning with Probabilistic Matrix Factorization》。
二、学术背景研究领域与动机本研究属于个性化推荐系统领域，聚焦于解决传统推荐系统的两大核心问题：
 1. 数据稀疏性：传统协同过滤（Collaborative Filtering, CF）和基于内容的过滤（Content-Based Filtering）方法依赖用户历史行为数据，面临冷启动（Cold-Start）和稀疏性问题。
 2. 跨领域适应性：现有推荐系统难以将用户特征（如性格）从一个领域迁移到另一个领域，导致新领域推荐效果不佳。
理论基础性格心理学：研究基于“大五人格模型”（Big Five Personality Traits），即开放性（Openness）、尽责性（Conscientiousness）、外向性（Extraversion）、宜人性（Agreeableness）和神经质（Neuroticism）。已有研究表明，用户性格与偏好显著相关（如Kassarjian, 1971; Finn, 1997）。
 
迁移学习（Transfer Learning）：通过源领域（Source Domain）数据（如TripAdvisor评论）预测目标领域（Target Domain）用户性格，解决跨领域数据缺失问题。
 
研究目标开发一种从用户评论中自动推断性格分数的算法，替代传统问卷调查。
 
设计融合性格特征的矩阵分解模型（PEMF），提升推荐准确性。
 
构建跨领域推荐框架（PEMF-CD），通过迁移学习实现性格特征的领域迁移。
 
三、研究流程与方法1. 数据收集与预处理数据集：
 源领域：TripAdvisor数据集（1,098用户，26,386项，32,580条评论），包含用户性格分数（通过LIWC工具分析评论生成）。
 
目标领域：Amazon四个子数据集（数字音乐、时尚、杂志订阅、视频游戏），总计超44,000用户和426,791条评论。
 
预处理：去除停用词、URL，进行词形还原（Lemmatization）和词嵌入（Word2Vec）。
 
2. 性格分数预测模型混合策略（Mixing Strategy）：
 对源领域评论进行K-means聚类（6类），计算目标领域评论与每类簇的余弦相似度。
 
将目标评论合并至相似度最高的源簇，避免负迁移（Negative Transfer）。
 
BERT模型：
 使用BERT-base（12层编码器）对混合评论生成联合嵌入（Joint Embedding）。
 
为每个性格特质训练独立回归模型，预测目标领域用户性格分数。
 
3. 个性化推荐模型（PEMF）概率矩阵分解（PMF）改进：
 邻居构建：基于性格相似性（余弦相似度）和评分模式相似性，加权生成用户邻居集合（阈值γ=0.6–0.8）。
 
潜在特征更新：用户潜在特征融合邻居特征，公式为：
 [ U’ = \sum_{v \in Nu} S{u,v} Uv ]
 其中(S{u,v})为综合相似度（性格权重β=0.5）。
 
目标函数：引入邻居正则化项，优化潜在特征矩阵：
 [ L = \frac{1}{2} \sum (R_{u,i} - g(U_u I_i^T))^2 + \frac{\lambda_S}{2} |Uu - \sum S{u,v} U_v|^2 ]
 
4. 跨领域框架（PEMF-CD）迁移学习流程：
 源领域（TripAdvisor）性格分数用于训练BERT模型。
 
目标领域（Amazon）评论通过BERT预测性格分数，输入PEMF生成推荐。
 
四、主要结果1. 性格预测性能RMSE与MAE：在Amazon数据集上，性格预测误差较基线模型（如APAR、P2MF）降低最高达64.28%（RMSE）和76.7%（MAE）。
 
2. 推荐效果对比TripAdvisor数据集：PEMF相比传统PMF，RMSE降低73.25%，MAE降低75.27%。
 
跨领域实验：
 | 数据集 | RMSE提升 | MAE提升 |
 |————–|———-|———|
 | 数字音乐 | 24.72% | 55.9% |
 | 时尚 | 64.28% | 76.7% |
 | 杂志订阅 | 48.79% | 67.6% |
 | 视频游戏 | 61% | 71.5% |
 
3. 关键发现性格相似性主导推荐：β≥0.5时性能最优，表明性格特征比评分模式更能反映用户偏好。
 
邻居阈值影响：γ=0.6–0.8时模型效果最佳，过高会引入噪声，过低则忽略有效邻居。
 
五、结论与价值科学价值方法论创新：首次将性格迁移学习与PMF结合，解决跨领域推荐的数据稀疏性问题。
 
理论验证：实证表明性格相似性可替代传统协同过滤中的评分相似性。
 
应用价值商业场景：适用于电商、社交媒体等需跨领域推荐的平台，如根据用户在旅游平台的评论预测其对音乐或商品的偏好。
 
技术扩展：框架可适配其他用户生成内容（如社交媒体帖子）。
 
六、研究亮点混合策略与BERT：通过聚类和联合嵌入减少负迁移，提升性格预测精度。
 
动态邻居模型：融合性格与评分相似性，优化PMF的潜在特征更新机制。
 
全领域验证：在旅游、电商等多领域数据集上验证框架普适性。
 
七、其他贡献开源数据：使用的TripAdvisor和Amazon数据集均为公开数据，促进后续研究复现。
 
基线对比：与13种基线算法（如PTUPCDR、UNICDR）对比，结果具有统计学显著性（p<0.01）。
 
此研究为跨领域个性化推荐提供了可扩展的理论框架和实用工具，未来可探索更多性格模型（如MBTI）与其他推荐算法的结合。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问