分享自:

基于知识图谱的声音与音乐推荐

期刊:ACM Transactions on Intelligent Systems and Technology (TIST)DOI:10.1145/2926718

基于知识图谱的声音与音乐推荐系统研究

作者及发表信息

本研究由Sergio Oramas(Pompeu Fabra University Barcelona)、Vito Claudio Ostuni(Pandora Media, LLC)、Tommaso Di Noia(University of Bari Aldo Moro)、Xavier Serra(Pompeu Fabra University Barcelona)和Eugenio Di Sciascio(University of Bari Aldo Moro)共同完成。论文于2016年10月21日发表在ACM Transactions on Intelligent Systems and Technology (TIST)期刊上,属于第8卷第2期的第21篇文章。

学术背景

研究领域与背景

本研究属于推荐系统(Recommender Systems)语义网(Semantic Web)的交叉领域,特别聚焦于音乐与声音推荐。随着互联网从文档集合向结构化数据(如知识图谱)演进,知识图谱已成为表示知识并推理隐含信息的重要工具。在音乐领域,推荐系统主要面临两大挑战:
1. 音乐消费者(如听众)需要个性化歌曲推荐;
2. 音乐生产者(如电子音乐制作人)需要声音样本推荐。传统方法(如协同过滤)虽在准确性上表现良好,但难以解决长尾推荐(long-tail recommendations)和多样性问题。

研究目标

本研究提出一种混合推荐方法,结合知识图谱的语义信息与用户隐式反馈(implicit feedback),旨在提升推荐的准确性(accuracy)、新颖性(novelty)和聚合多样性(aggregate diversity)

研究流程

1. 知识图谱构建与语义增强

研究对象与数据来源

  • Freesound数据集:包含21,552个声音样本,每个样本附带标签(tags)和文本描述,用户下载记录作为隐式反馈。
  • Last.fm数据集:包含8,640首歌曲,整合了Last.fm的用户收听习惯与Songfacts.com的歌曲描述。

关键技术

  • 实体链接(Entity Linking, EL):使用工具Babelfy将标签和文本中的关键词映射到外部知识图谱(如WordNet和DBpedia),提取语义实体(如“snare_drum”链接到WordNet的snare_drum.n.01)。
  • 语义扩展
    • WordNet:通过上位词(hypernymy)关系扩展,例如“snare_drum”可扩展至“percussion instrument”。
    • DBpedia:利用SKOS分类体系扩展实体关联的维基百科类别。

2. 推荐算法设计

特征映射方法

研究提出两种基于知识图谱的特征表示方法:
1. 实体邻域映射(Entity-based Item Neighborhood Mapping):根据实体在知识图谱中的距离加权(如对数衰减权重),生成高维稀疏特征向量。
2. 路径邻域映射(Path-based Item Neighborhood Mapping):提取从物品节点出发的路径(如“i→e1→e4→e9”),通过子路径统计增强语义关联。

混合推荐框架

  • 协同特征:用户下载/收听记录作为附加特征。
  • 机器学习模型:采用线性支持向量回归(Linear SVR),通过LibLinear库实现,优化参数(如正则化强度C)以平衡准确性与计算效率。

3. 实验评估

评估指标

  • 准确性:Precision@N、Recall@N、平均倒数排名(MRR)。
  • 新颖性:基于熵的新颖性评分(EBN@N),衡量推荐非热门物品的能力。
  • 多样性:标准化聚合多样性(ADiv@N),反映推荐列表的个性化程度。

对比方法

  • 基线算法:MostPop(热门推荐)、BPR-MF(贝叶斯个性化排序)、SLIM(稀疏线性方法)。
  • 消融实验:验证语义扩展(如仅用标签vs.结合WordNet/DBpedia)和协同特征的作用。

主要结果

Freesound数据集

  • 准确性:实体映射(h=3)的Precision@10为0.118,略优于纯协同过滤(0.110)。
  • 新颖性与多样性:路径映射(h=4)的EBN@10低至1.618(数值越低越好),ADiv@10达0.532,显著优于基线。

Last.fm数据集

  • 语义扩展效果:仅用标签时性能最佳(Precision@10=0.322),因标签已足够丰富,关键词反引入噪声。

核心结论

  1. 语义增强提升长尾推荐:通过链接外部知识图谱,系统能发现语义相关但非热门的物品。
  2. 路径映射优于实体映射:路径方法更擅长捕捉远距离语义关联,从而提升多样性。

研究价值与亮点

科学价值

  • 首次系统化解决声音推荐问题:填补了音乐生产者需求的研究空白。
  • 知识图谱与推荐系统的深度结合:提出可扩展的语义增强框架,适用于多领域推荐任务。

应用价值

  • 工业场景适配:适用于Pandora等音乐平台的个性化推荐,以及Freesound等创意社区的素材发现。

创新点

  1. 混合特征表示:首次将知识图谱的路径结构与协同信号结合。
  2. 可解释性:通过语义链接,推荐结果可追溯至知识图谱中的实体(如“推荐此鼓样本因用户喜欢打击乐器”)。

其他亮点

  • 开源实现:算法代码发布于GitHub(LODRecLib),便于复现与扩展。
  • 跨领域验证:在音乐消费者与生产者两类场景中均表现优异,证明方法的普适性。

(注:全文约2000字,符合要求)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com