分享自:

利用机器学习预测基于音频特征的Spotify音乐流行度

期刊:Springer Nature Switzerland AGDOI:10.1007/978-3-031-77075-3_23

学术研究报告:基于音频特征的Spotify音乐流行度机器学习预测研究

1. 研究作者与发表信息

本研究由Shubham Joshi(Symbiosis International University, Pune, India)、Neha Gupta(Symbiosis University of Applied Sciences, Indore, India)和Rupali Mahajan(Vishwakarma Institute of Information Technology, Pune, India)合作完成,发表于IC4S 2024会议论文集(LNICST 597卷,2025年由Springer Nature出版)。

2. 学术背景与研究目标

科学领域:本研究属于音乐信息检索(Music Information Retrieval, MIR)机器学习交叉领域,聚焦于数字音乐流媒体平台的流行度预测。
研究动机:随着Spotify等流媒体平台的用户增长(2018年达12亿流媒体播放量),音乐产业亟需数据驱动的方法预测歌曲流行度,以优化推荐系统、辅助艺术家创作及商业决策。
背景知识
- 音频特征(Audio Features):包括节奏(Tempo)、调式(Key)、能量(Energy)、舞蹈性(Danceability)等,这些特征通过Spotify Web API提取。
- 机器学习算法:如线性回归(Linear Regression)、随机森林分类器(Random Forest Classifier)和K均值聚类(K-means Clustering),用于分析特征与流行度的关联。
研究目标:开发高精度预测模型,通过音频特征判断歌曲是否成为热门,并揭示影响流行度的关键因素。

3. 研究流程与方法

数据集
- 数据来源:Spotify Web API,包含超过17万首歌曲的音频特征。
- 特征分类:
- 数值型特征(Numerical Features):如能量值(Energy,0-100)、声学度(Acousticness,0-1)、流行度(Popularity,0-100)。
- 虚拟特征(Dummy Features):如是否含明确歌词(Explicit,0/1)、调式(Mode,0为小调,1为大调)。
- 分类特征(Categorical Features):如艺术家名称、歌曲发行日期(YYYY-MM-DD)。

方法流程
1. 数据预处理
- 使用Standard Scaler(标准化模块)对特征归一化,解决不同特征量纲差异(如舞蹈性范围0-1,而时长可能达数百万毫秒)。
- 主成分分析(PCA):降维至2个主成分,便于可视化聚类分布。

  1. 模型构建与训练

    • K均值聚类:将歌曲按音频特征分组,探索潜在模式。
    • 线性回归模型:预测流行度与特征(如年份、能量值)的线性关系。
    • 随机森林回归器(Random Forest Regressor):通过多棵决策树集成提高预测鲁棒性,输入训练集(X_train, Y_train),输出平均误差(训练误差0.1254,测试误差0.136)。
  2. 模型评估

    • 混淆矩阵(Confusion Matrix)与10折交叉验证(10-fold Cross-validation)评估性能。
    • 关键指标:随机森林模型准确率达95.37%,F1分数0.83(Boosted Trees和神经网络表现相近)。

4. 主要结果与逻辑关联

  • 关键相关性发现(表5):
    • 年份(Year)与流行度绝对相关性最高(0.864),表明新歌更易流行。
    • 声学度(Acousticness,0.567)和能量(Energy,0.483)次之,说明高能量、低原声的歌曲更受欢迎。
  • 模型性能对比(表1):
    • 高斯朴素贝叶斯(Gaussian Naïve Bayes)准确率61.25%,优于逻辑回归(53.58%)和支持向量机(51.59%)。
  • 聚类可视化(图2-5):PCA降维后,散点图显示流行度与节奏(Tempo)存在非线性聚类分布,验证了非线性模型(如随机森林)的优势。

结果贡献
- 线性模型揭示特征与流行度的显性关系,而非线性模型(如随机森林)捕捉复杂交互作用,共同支持“多特征协同影响流行度”的结论。

5. 研究结论与价值

科学价值
- 首次系统验证了年份、能量等音频特征对Spotify歌曲流行度的预测效力,为MIR领域提供实证基础。
- 提出“Innovative Tunes”框架,结合多种机器学习算法,实现高精度(95.37%)预测。

应用价值
- 艺术家与制作人:可通过优化特定特征(如提高舞蹈性)提升歌曲市场潜力。
- 平台推荐系统:利用模型提前识别潜在热门歌曲,增强用户体验。

6. 研究亮点

  • 方法创新:融合聚类(无监督)与回归(有监督)方法,全面分析音频特征。
  • 数据规模:17万首歌曲的大样本分析,结果具有统计学意义。
  • 跨学科性:结合音乐理论与机器学习,为数字音乐研究提供新范式。

7. 其他有价值内容

  • 局限性:未纳入艺术家知名度等元数据,未来可结合深度学习进一步优化。
  • 扩展方向:如研究流派(Genre)预测(当前模型准确率46.9%,未达行业标准50%),需改进分类算法。

(报告总字数:约1500字)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com