基于因子提取和模型融合的音乐流行度预测

分享自：

基于因子提取和模型融合的音乐流行度预测

期刊:2020 2nd International Conference on Economic Management and Model Engineering (ICEMME)DOI:10.1109/ICEME51517.2020.00214

【点击此处】阅读全文、收藏及针对性提问

本研究由Yutong Ge（华东师范大学统计学院）、Yutong Sun（多伦多大学文理学院）和Jiaqian Wu（华盛顿大学文理学院）合作完成，发表于2020年第二届经济管理与模型工程国际会议（ICEMME）论文集，会议论文DOI号为10.1109/ICEMME51517.2020.00214。
学术背景该研究属于音乐信息检索（Music Information Retrieval, MIR）与机器学习交叉领域，聚焦于音乐流行度预测这一商业价值显著的问题。研究背景基于两点核心观察：其一，音乐流行度直接关联其商业价值，全球录制音乐产业年收入达215亿美元（Watson等引用数据）；其二，现有预测方法多局限于单一因素（如歌词或音频特征），而Spotify等平台提供的多维特征（如”acousticness”、”danceability”等15项指标）尚未被系统整合。早期研究如Dhanaraj和Logan（2005）使用支持向量机（SVM）分析歌词与榜单关联性，但缺乏多因素协同分析能力。本研究旨在通过主成分分析（PCA）和模型融合（model blending）方法，构建高精度预测框架。
研究流程数据准备与预处理
数据源：Kaggle平台获取的Spotify Top 50热门音乐数据集（2019年）
 
清洗步骤：剔除缺失值，保留数值型特征，最终样本量为50首歌曲
 
关键特征筛选：通过相关性矩阵识别出与”popularity”最相关的三个特征——”valence”（情绪积极度）、”speechiness”（语言含量）和”beats per minute”（节奏速度）
 
降维处理（PCA）
技术实现：将12个原始特征通过PCA降维，设定主成分数n_components=3
 
验证指标：累计解释方差比达0.9，保留90%原始信息（图1所示）
 
创新点：首次在音乐预测中结合PCA与多模型融合
 
模型构建与验证
基础模型：
 决策树（Decision Tree）：MSE=35.757
 
随机森林（Random Forest）：MSE=18.808
 
K近邻（KNN）：MSE=18.599
 
融合模型：
 权重分配：随机森林(0.4)+决策树(0.3)+KNN(0.3)
 
性能指标：MSE降至4.96（表1与图2对比）
 
防过拟合：采用5折交叉验证（k=5），每组数据作1次验证集和4次训练集
 
主要结果特征相关性发现
“valence”（r=0.45）、”speechiness”（r=0.38）和节奏（r=0.32）与流行度呈显著正相关
 
PCA降维后三个主成分累计解释力达90%，验证了特征选择的合理性
 
模型性能突破
单一模型中随机森林表现最佳（MSE=18.808）
 
融合模型MSE较最优单一模型降低73.6%（4.96 vs 18.808）
 
预测值与实际值的散点图（图2）显示强线性相关（R²=0.89）
 
结论与价值科学价值：
 1. 提出”PCA+多模型融合”的创新框架，为解决高维音乐特征预测提供方法论范式
 2. 实证验证情绪特征（valence）对流行度的主导影响，补充了Ni等（2011）关于音乐趋势驱动因素的理论
应用价值：
 1. 为唱片公司提供商业化分析工具，可优化歌曲制作参数组合
 2. 预测模型可扩展至其他文化产品（如电影、短视频）的流行度分析
研究亮点方法创新性：首次将线性模型融合（公式1）应用于音乐预测领域，较传统单一模型误差降低显著
 
工程实用性：MSE=4.96的精度达到工业应用标准，优于Syed Muhammad Raza Abidi等（2020）在电影预测中的同类研究
 
数据洞察：发现非声学特征（如情绪参数）对流行度的解释力，挑战了Pachet和Roy（2008）”声学特征主导”的传统认知
 
扩展价值研究局限性在于样本量较小（n=50），但通过k-fold交叉验证提升了泛化能力。未来工作可结合深度学习模型（如LSTM）处理时序流行度数据，参考Martín-Gutiérrez等（2020）的多模态方法进一步优化预测精度。

上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com

【点击此处】阅读全文、收藏及针对性提问