本文介绍了一篇发表于2020年7月5日至10日第58届计算语言学协会年会(ACL)的论文,题为《Graph Neural News Recommendation with Unsupervised Preference Disentanglement》(基于图神经网络的新闻推荐与无监督偏好解耦)。该研究由北京邮电大学计算机学院的Linmei Hu、Siyong Xu、Chen Li、Cheng Yang、Chuan Shi以及微软亚洲研究院的Nan Duan、Xing Xie、Ming Zhou共同完成。论文的主要目标是解决新闻推荐中的个性化问题,特别是在用户与新闻交互中隐含的高阶连接性和潜在偏好因素。
随着新闻信息的爆炸式增长,用户难以从海量信息中找到自己感兴趣的内容。传统的新闻推荐方法通常从新闻内容中学习用户和新闻的表示,但很少考虑用户与新闻交互中的高阶连接性。此外,现有方法未能解耦用户点击不同新闻的潜在偏好因素。因此,本文提出了一种新的图神经网络新闻推荐模型(GNUD),通过无监督偏好解耦来捕捉用户与新闻交互中的高阶关系,并解耦用户的潜在偏好因素,从而提高推荐的表达能力和可解释性。
本文的研究方法主要包括以下几个步骤:
用户-新闻交互建模:将用户与新闻的交互建模为一个二分图,用户和新闻分别作为图中的节点,用户点击新闻的行为作为边。通过图卷积网络(GCN)在图中传播信息,捕捉用户与新闻之间的高阶连接性。
新闻内容信息提取:使用两个并行的卷积神经网络(CNN)分别从新闻标题和新闻简介中提取特征,并通过全连接层将两者结合,生成新闻的初始表示。
偏好解耦:通过邻居路由算法(Neighborhood Routing Algorithm)动态识别用户点击新闻的潜在偏好因素,并将新闻分配到不同的子空间中,每个子空间对应一个特定的偏好因素。为了确保每个解耦的子空间独立反映一个孤立的偏好,本文设计了一个偏好正则化器(Preference Regularizer),通过最大化互信息来增强偏好因素与解耦表示之间的关系。
模型训练:通过多层图卷积网络堆叠,捕捉更高阶的邻居信息,并最终通过全连接层计算用户点击新闻的概率。模型的损失函数包括基础的点击预测损失和偏好正则化损失。
本文在两个真实世界的新闻数据集(Adressa-1week和Adressa-10week)上进行了实验,结果表明GNUD模型在AUC和F1指标上均优于现有的最先进新闻推荐方法。具体来说,GNUD在AUC上比最佳基线模型(如DKN和DAN)提高了6.45%,在F1上提高了7.79%。此外,通过对比不同变体的GNUD模型,本文验证了偏好解耦和偏好正则化器的有效性。
本文提出的GNUD模型通过捕捉用户与新闻交互中的高阶连接性,并解耦用户的潜在偏好因素,显著提升了新闻推荐的性能。该模型不仅提高了推荐的准确性,还增强了推荐结果的可解释性。本文的研究为新闻推荐领域提供了一种新的思路,特别是在处理用户多样化的偏好和复杂的交互结构方面具有重要的理论和应用价值。
本文还通过案例分析和参数分析,验证了模型的有效性和鲁棒性。例如,通过可视化用户的点击新闻,展示了不同子空间如何反映不同的偏好因素。此外,本文还探讨了不同超参数(如偏好因素数量、路由迭代次数等)对模型性能的影响,为后续研究提供了参考。
本文的研究为新闻推荐领域提供了一种新的解决方案,特别是在处理用户多样化的偏好和复杂的交互结构方面具有重要的理论和应用价值。