分享自:

基于脑电图的音乐聆听情感识别研究

期刊:IEEE Transactions on Biomedical EngineeringDOI:10.1109/TBME.2010.2048568

此篇文章属于 类型a:单项原创研究报告型。以下是总结用简体中文撰写的内容:


基于EEG的音乐聆听中情绪识别研究报告综述

本文旨在向中文学术界的研究人员介绍题为“EEG-Based Emotion Recognition in Music Listening”的研究,该研究发表于 IEEE Transactions on Biomedical Engineering (2010年7月, 第57卷第7期)。研究团队包括 Yuan-Pin Lin, Chi-Hong Wang, Tzyy-Ping Jung 等人,主要来自 National Taiwan UniversityUniversity of California, San Diego 等学术机构。

学术研究背景及目标

情绪被认为是一种高度复杂的认知功能,与多种脑电波活动相结合。当前传统的情绪识别方法多基于视觉和音频信号(如面部表情、语音语调和肢体动作),最近,基于生理信号的研究逐渐兴起。相对于外围生理信号(如心电图ECG、皮肤导电反应等),脑信号,尤其是通过脑电图(EEG, Electroencephalography)记录的大脑中枢神经活动,显示出在时间分辨率和情绪处理方面的独特优势。

虽然已有研究尝试利用EEG分类情绪状态,但其分类准确性受限,很多研究仅集中在特定的频段或电极位置,而没有系统探讨EEG光谱变化与情绪状态的对应关系。本研究旨在弥补这一缺口,系统探索音乐聆听过程中EEG特征与情绪的关联,并优化情绪分类系统,最终在脑机交互、多媒体应用及生物医学情境中实现情绪非侵入式评估。

具体目标包括: 1. 寻找情绪特异性的EEG光谱特征。 2. 测试不同分类器在情绪分类中的效果。

研究流程与实验设计

数据采集与实验流程

研究从26位健康受试者(男女比例为16:10,平均年龄24.4岁)中收集EEG数据。这些受试者多为非音乐专业的大学生,以避免音乐知识对实验的干扰。研究使用一个32通道的EEG设备,并按国际10-20电极系统布局。此外,过滤带宽设置为1-100 Hz,采样率为500 Hz,所有电极阻抗均低于10kΩ。

实验设计基于二维情绪模型(正负效价/高低唤醒度),选取四种基本情绪状态:喜悦(Joy),愤怒(Anger),悲伤(Sadness),愉悦(Pleasure)。实验选自16段奥斯卡电影中的配乐片段(每段持续30秒),作为引发特定情绪的刺激材料。参与者闭眼聆听音乐,分别进行4轮实验,每轮4首随机音乐片段。音乐片段之间插入15秒的静默休息,实验后通过FeelTrace工具对情绪标签进行主观标注,用于验证EEG的情绪分类。

数据处理与特征提取

  • 预处理:依据观察剔除明显的运动伪迹,获得无伪迹的EEG信号。
  • 特征提取:利用短时傅里叶变换(STFT)分解EEG信号为频谱数据,并提取5个频段的光谱功率(Delta, Theta, Alpha, Beta, Gamma)。
  • 特征种类:研究对以下四类特征进行系统性测试:
    • PSD30:30个电极位置的光谱功率密度。
    • DASM12:12对对称电极间的功率差异性(Differential Asymmetry)。
    • RASM12:12对电极间的功率差异比例(Rational Asymmetry)。
    • PSD24:特定24个电极位置的光谱功率。
  • 特征选择:基于F-score排序提取信息量较高的特征,并使用留特征剔除分析其对分类结果的影响。

数据分类

文章对比了多层感知器(MLP)与支持向量机(SVM)两个机器学习分类器的性能: - SVM通过径向基函数(RBF)实现高维特征映射,并优化超平面以区分情绪类别。 - 使用10轮10折交叉验证方案,在每个受试者的全数据集上评估分类准确性。

核心结果与发现

  1. 分类结果

    • 在最优条件下,SVM分类器结合DASM12特征取得了82.29%±3.06%的平均分类准确率,显著优于PSD30、RASM12等特征。
    • DASM12样本维度较低(60维)却表现最佳,显现了电极功率非对称性在情绪分类中的重要性。
  2. 特征选择

    • 通过F-score排序发现,顶排名的特征主要集中在额叶(Frontal)及顶叶(Parietal)的电极对,例如Fp1-Fp2、P3-P4等。
    • 使用前30个特征能够达到接近于全特征的分类性能,显示出特征选择在减少计算成本上的显著意义。
  3. 研究亮点

    • 研究全面探讨了EEG光谱与情绪的系统对应性,进一步验证了额顶叶区域在情绪处理中的核心作用。
    • 首次提出了基于DASM12的情绪非侵入式评估框架,并在音乐诱发情绪场景下实现了较高分类精度。
  4. 跨个体分析

    • 研究表明,跨个体的F-score排名特征在分类中亦有良好表现,显示出一定的普适性,为实际应用提供了良好的方向。

科学价值与未来应用

此研究在情绪神经科学和人机交互领域具有重要意义。其科学价值在于: 1. 提供了音乐聆听情绪处理的EEG动力模型,为情绪认知机制研究提供了全新视角。 2. 为便携式、非侵入式情绪评估系统的开发奠定了基础。 3. 提出了基于SVM与DASM12的高效分类系统,有望应用于情绪感知的多媒体与生物医学实践场景。

然而研究未能完全分离音乐感知和情绪反应在EEG信号中的贡献。未来可进一步结合脑影像技术(如fMRI)扩展研究框架,同时对专业音乐家的EEG反应开展对比探索,为音乐认知科学提供更多启示。


上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com