《Hit Song Science: A Comprehensive Survey and Research Directions》是由Danilo B. Seufitelli、Gabriel P. Oliveira、Mariana O. Silva、Clarisse Scofield和Mirella M. Moro共同撰写的一篇综述性论文,发表在2023年的《Journal of New Music Research》上。这几位作者均来自巴西米纳斯吉拉斯联邦大学(Universidade Federal de Minas Gerais)的计算机科学系。论文旨在对“热门歌曲科学”(Hit Song Science, HSS)这一新兴领域进行全面梳理,并提出未来的研究方向。
HSS是一个跨学科的研究领域,结合了计算机科学、音乐信息检索(Music Information Retrieval, MIR)、音乐理论和社会文化研究。其核心目标是通过数据分析和机器学习方法,预测歌曲在市场上的成功概率。这一领域的兴起与音乐产业的数字化转型密切相关,尤其是流媒体服务的普及使得音乐消费数据更加易于获取和分析。
论文首先回顾了HSS的发展历程,并提出了一个通用的热门歌曲预测工作流程(如图3所示),包括数据获取、成功定义、特征提取和学习方法四个主要步骤。
研究分析了HSS研究中常用的数据来源,并将其分为四类:
- 流行度数据:如Billboard Hot 100、Official Charts Company(英国官方排行榜)等榜单数据。
- 声学特征:从Spotify API、Echo Nest等平台提取的音频特征(如节奏、响度、舞蹈性等)。
- 歌词数据:从Genius、MetroLyrics等网站获取的歌词文本,用于分析情感、押韵等特征。
- 社交行为数据:如Last.fm的播放记录、YouTube的观看量等用户行为数据。
论文提出了一个层次化的分类法,将成功度量分为三类:
- 排行榜视角(Top-Charts Perspective):如歌曲在Billboard上的排名、上榜周数等。
- 经济视角(Economy Perspective):如专辑销量、流媒体收入等。
- 用户参与度视角(Engagement Perspective):如Spotify的播放量、社交媒体的点赞数等。
论文将特征分为两类:
- 内在特征(Intrinsic Features):直接来自歌曲本身,包括声学特征(如节奏、调性)、元数据(如歌曲时长、流派)和歌词特征(如情感分析、押韵模式)。
- 外在特征(Extrinsic Features):与歌曲相关的上下文信息,如艺术家知名度、专辑发行策略、社交网络影响等。
HSS研究主要采用监督学习方法,包括分类(预测歌曲是否为热门)和回归(预测歌曲的流行度分数)。此外,聚类、统计分析和社交网络分析也被用于探索歌曲成功的模式。
这篇综述的价值在于:
1. 系统性梳理:首次对HSS领域进行全面总结,提出了通用的研究框架和分类法。
2. 跨学科整合:结合计算机科学和音乐研究,为未来的跨领域合作提供了基础。
3. 实践指导:为音乐产业(如唱片公司、流媒体平台)提供了数据驱动的决策支持。
论文指出了几个有待探索的方向:
1. 多模态数据融合:结合音频、歌词、社交数据等多维度信息。
2. 动态建模:研究歌曲流行度随时间变化的规律。
3. 文化差异:分析不同地区市场对热门歌曲的影响。
这篇论文为HSS领域的研究者提供了宝贵的参考,同时也为音乐产业的实际应用提供了理论支持。