本研究的作者包括:
- Sivasai Bhavanasi、Sahil Malla、V Manichetan、CVNJ Dhanush(均为印度维萨卡帕特南甘地技术大学计算机科学与工程系学生)
- Dr. B Prakash(印度维萨卡帕特南甘地技术大学计算机科学与工程系副教授)
该研究发表于 International Journal of Advances in Engineering and Management (IJAEM),2023年5月第5卷第5期(pp. 296-304),DOI: 10.35629⁄5252-0505296304,期刊影响因子6.18,ISO 9001:2008认证。
本研究属于音乐信息检索(Music Information Retrieval, MIR)与机器学习(Machine Learning, ML)的交叉领域,重点探讨如何通过音频特征预测歌曲的流行度。
在数字音乐时代,Spotify等流媒体平台积累了海量用户数据,但如何从音频特征中挖掘影响歌曲成功的因素仍是一个开放问题。音乐产业(如唱片公司、独立音乐人)需要科学方法预测新歌的市场表现,以优化投资和推广策略。
研究使用了Spotify提供的30,000首歌曲数据,包含以下特征:
- 基础信息:歌曲ID、名称、艺术家、专辑、发行日期等。
- 音频特征:舞蹈性(danceability)、能量(energy)、调性(key)、响度(loudness)、语音度(speechiness)、乐器度(instrumentalness)、现场感(liveness)、情感效价(valence)、速度(tempo)、时长(duration_ms)等。
使用Lasso回归(Lasso Regression)(α=0.6)筛选对流行度影响最小的特征,发现以下特征贡献较低:
- 调性(key)、调式(mode)、语音度(speechiness)、情感效价(valence)、速度(tempo)。
- 训练集MSE(均方误差):10.32,测试集MSE:11.21,表明模型表现一般。
研究对比了以下5种模型的预测效果(70%训练集,30%测试集):
| 模型 | 准确率(测试) | 精确率(测试) | 召回率(测试) |
|---|---|---|---|
| 随机森林(Random Forest) | 0.852 | 0.792 | 0.941 |
| 梯度提升(Gradient Boosting) | 0.866 | 0.817 | 0.845 |
| Bagging分类器 | 0.871 | 0.817 | 0.877 |
| XGBoost | 0.899 | 0.819 | 0.844 |
| 决策树分类器(Decision Tree) | 0.931 | 0.901 | 0.911 |
决策树分类器表现最佳,准确率达93.1%,适用于音乐流行度预测。
关键影响特征:
流派趋势:流行(pop)、电子(electronic)类歌曲更易成功。
最佳预测模型:决策树分类器(93.1%准确率),优于随机森林(85.2%)、XGBoost(89.9%)等。
本研究为音乐产业提供了数据驱动的决策工具,并推动了计算音乐学(Computational Musicology)的发展。