基于脑电图的音乐聆听情感识别研究

分享自：
基于脑电图的音乐聆听情感识别研究

人工智能
信息科学
期刊:IEEE Transactions on Biomedical EngineeringDOI:10.1109/TBME.2010.2048568
【点击此处】阅读全文、收藏及针对性提问
此篇文章属于 类型a：单项原创研究报告型。以下是总结用简体中文撰写的内容：
基于EEG的音乐聆听中情绪识别研究报告综述本文旨在向中文学术界的研究人员介绍题为“EEG-Based Emotion Recognition in Music Listening”的研究，该研究发表于 IEEE Transactions on Biomedical Engineering （2010年7月, 第57卷第7期）。研究团队包括 Yuan-Pin Lin, Chi-Hong Wang, Tzyy-Ping Jung 等人，主要来自 National Taiwan University 和 University of California, San Diego 等学术机构。
学术研究背景及目标情绪被认为是一种高度复杂的认知功能，与多种脑电波活动相结合。当前传统的情绪识别方法多基于视觉和音频信号（如面部表情、语音语调和肢体动作），最近，基于生理信号的研究逐渐兴起。相对于外围生理信号（如心电图ECG、皮肤导电反应等），脑信号，尤其是通过脑电图（EEG, Electroencephalography）记录的大脑中枢神经活动，显示出在时间分辨率和情绪处理方面的独特优势。
虽然已有研究尝试利用EEG分类情绪状态，但其分类准确性受限，很多研究仅集中在特定的频段或电极位置，而没有系统探讨EEG光谱变化与情绪状态的对应关系。本研究旨在弥补这一缺口，系统探索音乐聆听过程中EEG特征与情绪的关联，并优化情绪分类系统，最终在脑机交互、多媒体应用及生物医学情境中实现情绪非侵入式评估。
具体目标包括： 1. 寻找情绪特异性的EEG光谱特征。 2. 测试不同分类器在情绪分类中的效果。
研究流程与实验设计数据采集与实验流程研究从26位健康受试者（男女比例为16:10，平均年龄24.4岁）中收集EEG数据。这些受试者多为非音乐专业的大学生，以避免音乐知识对实验的干扰。研究使用一个32通道的EEG设备，并按国际10-20电极系统布局。此外，过滤带宽设置为1-100 Hz，采样率为500 Hz，所有电极阻抗均低于10kΩ。
实验设计基于二维情绪模型（正负效价/高低唤醒度），选取四种基本情绪状态：喜悦（Joy），愤怒（Anger），悲伤（Sadness），愉悦（Pleasure）。实验选自16段奥斯卡电影中的配乐片段（每段持续30秒），作为引发特定情绪的刺激材料。参与者闭眼聆听音乐，分别进行4轮实验，每轮4首随机音乐片段。音乐片段之间插入15秒的静默休息，实验后通过FeelTrace工具对情绪标签进行主观标注，用于验证EEG的情绪分类。
数据处理与特征提取预处理：依据观察剔除明显的运动伪迹，获得无伪迹的EEG信号。
特征提取：利用短时傅里叶变换（STFT）分解EEG信号为频谱数据，并提取5个频段的光谱功率（Delta, Theta, Alpha, Beta, Gamma）。
特征种类：研究对以下四类特征进行系统性测试： PSD30：30个电极位置的光谱功率密度。
DASM12：12对对称电极间的功率差异性（Differential Asymmetry）。
RASM12：12对电极间的功率差异比例（Rational Asymmetry）。
PSD24：特定24个电极位置的光谱功率。
特征选择：基于F-score排序提取信息量较高的特征，并使用留特征剔除分析其对分类结果的影响。
数据分类文章对比了多层感知器（MLP）与支持向量机（SVM）两个机器学习分类器的性能： - SVM通过径向基函数（RBF）实现高维特征映射，并优化超平面以区分情绪类别。 - 使用10轮10折交叉验证方案，在每个受试者的全数据集上评估分类准确性。
核心结果与发现分类结果：
在最优条件下，SVM分类器结合DASM12特征取得了82.29%±3.06%的平均分类准确率，显著优于PSD30、RASM12等特征。
DASM12样本维度较低（60维）却表现最佳，显现了电极功率非对称性在情绪分类中的重要性。
特征选择：
通过F-score排序发现，顶排名的特征主要集中在额叶（Frontal）及顶叶（Parietal）的电极对，例如Fp1-Fp2、P3-P4等。
使用前30个特征能够达到接近于全特征的分类性能，显示出特征选择在减少计算成本上的显著意义。
研究亮点：
研究全面探讨了EEG光谱与情绪的系统对应性，进一步验证了额顶叶区域在情绪处理中的核心作用。
首次提出了基于DASM12的情绪非侵入式评估框架，并在音乐诱发情绪场景下实现了较高分类精度。
跨个体分析：
研究表明，跨个体的F-score排名特征在分类中亦有良好表现，显示出一定的普适性，为实际应用提供了良好的方向。
科学价值与未来应用此研究在情绪神经科学和人机交互领域具有重要意义。其科学价值在于： 1. 提供了音乐聆听情绪处理的EEG动力模型，为情绪认知机制研究提供了全新视角。 2. 为便携式、非侵入式情绪评估系统的开发奠定了基础。 3. 提出了基于SVM与DASM12的高效分类系统，有望应用于情绪感知的多媒体与生物医学实践场景。
然而研究未能完全分离音乐感知和情绪反应在EEG信号中的贡献。未来可进一步结合脑影像技术（如fMRI）扩展研究框架，同时对专业音乐家的EEG反应开展对比探索，为音乐认知科学提供更多启示。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问