分享自:

基于神经解码的音乐参与研究揭示张力释放动态机制

期刊:bioRxivDOI:10.64898/2026.01.15.699693

关于音乐聆听中神经参与度解码揭示张力-释放动态的研究报告

本研究由以Alice-Vivien Barchet(马克斯·普朗克人类认知与脑科学研究所、莱比锡大学)、Prachi Patel(哥伦比亚大学)、Claire Pelofi(纽约大学)等为核心的多机构研究团队共同完成。该研究于2025年1月15日以预印本形式发布于bioRxiv平台,标题为“Neural decoding of musical engagement reveals tension-release dynamics”。这是一项原创性的实证研究,旨在探索音乐聆听体验中一个核心但机制尚不明确的现象:音乐张力如何动态地塑造听者的神经参与度。

一、 学术背景与研究目的

音乐是人类普遍且自发的活动,能引发强烈的情感与愉悦感。音乐学家长期认为,音乐中的张力与释放动态是聆听体验的关键特征。这种动态源于音乐中不同层次特征(从低级的声学特征到高级的音乐结构)的相互作用,通过动态地吸引听者而处于音乐享受的核心。然而,尽管行为研究显示听者对张力的感知具有高度一致性,并且与音乐事件及生理指标(如皮肤电导)相关,但张力体验与其背后的神经机制——特别是与“参与度”相关的神经活动——之间的直接联系尚不清楚。先前研究未能充分解决张力感知体验与参与度的神经测量之间的关键连接。

本研究的核心科学领域横跨听觉神经科学、音乐认知与计算建模。其背景知识建立在几个关键支柱上:1) 音乐张力是一个多层次的感知现象,既受响度等低级声学特征驱动,也受和声进行等高级结构特征影响;2) 音乐期待(期望的满足或违背)是产生音乐情感和愉悦感的关键,并与张力动态紧密耦合;3) 听者的参与度或注意力可以使用神经解码技术进行客观测量,例如通过脑电图(EEG)或皮层脑电图(ECoG)信号解码对声音包络的追踪。

基于此,本研究旨在自然主义音乐聆听的背景下,刻画音乐张力动态与神经参与度之间的关系。具体目标包括:1) 验证听者对音乐张力的连续行为评分的可靠性;2) 探究张力评分与低层级(响度)、高层级(音乐意外性)音乐特征的相关性;3) 应用典型相关分析(Canonical Correlation Analysis, CCA)从EEG和ECoG信号中解码出时间分辨的神经参与度指标;4) 检验解码出的神经参与度是否与行为报告的张力动态相关;5) 在控制响度和音乐期待(意外性)的影响后,验证张力与神经参与度之间关系的特异性。

二、 研究流程与方法细节

本研究整合了行为实验、神经生理记录、计算建模和神经解码技术,包含两个主要实验,流程严谨而系统。

流程一:行为数据收集与张力评分可靠性验证。 首先,研究人员招募了正常听力的参与者。针对舒伯特的艺术歌曲,共收集了57名参与者的行为张力评分(后续因数据无效排除了2人)。对于其他乐曲(贝多芬、勃拉姆斯),行为数据与后续的EEG实验参与者相同(共10人)。在行为环节,参与者通过电脑屏幕上的滑块,实时、连续地报告他们在聆听音乐时所感知到的张力变化,从“最小张力”移动到“最大张力”。所有评分均进行了Z-score标准化,并计算了参与者间的平均值以用于后续分析。为确保行为数据的可靠性,研究计算了不同参与者张力评分之间的组内相关系数(ICC),并对比了平均张力评分与一个独立的计算模型(TenseMusic模型)的预测结果。该模型基于六种音乐特征预测人类张力评分,已在独立数据集上训练,作为外部验证基准。

流程二:神经生理数据采集与预处理。 研究包含两部分神经记录实验。第一部分是EEG实验,10名参与者(6男4女,中位年龄27岁)在另一个时段被动聆听之前评过分的那组西方古典音乐选段(贝多芬第五交响曲第一乐章、勃拉姆斯第一钢琴协奏曲第三乐章、舒伯特艺术歌曲),同时使用64通道BrainVision系统记录其EEG信号,采样率500 Hz。数据预处理包括:重参考为全脑平均、0.1-30 Hz带通滤波、陷波滤波去除工频干扰、利用独立成分分析(ICA)去除眼动伪迹,最后为适配CCA分析降采样至64 Hz。 第二部分是ECoG实验,数据来自3名因癫痫评估而植入立体定向电极的患者。他们聆听了与EEG实验相似的一组音乐选段(额外增加了奥芬巴赫的“康康舞曲”)。ECoG信号采样率为3000 Hz,并进行共平均参考。使用ECoG旨在获取具有更高时空分辨率的神经信号,以验证和拓展EEG的发现。

流程三:音乐特征提取与计算建模。 为探究张力体验的驱动因素,研究提取了两个关键的音乐特征:1) 响度:采用Zwicker方法计算随时间变化的响度,以量化低级声学强度。2) 音乐意外性:作为音乐期待的量化指标。研究使用了长期IDyOM(信息动力学音乐模型),这是一个经过广泛验证的统计模型,基于大量西方音乐语料库训练,用于计算音符的“意外性”。意外性值高表示该音符基于长期音乐风格知识而言是出乎意料的。研究特别区分了长期模型(基于对音乐风格的长期知识)和短期模型(仅基于同一乐曲内部的统计规律),并发现只有长期模型计算的意外性与张力相关。

流程四:神经参与度解码——典型相关分析(CCA)流程。 这是本研究的核心技术方法。研究人员采用了一种经过验证的CCA神经解码流程来量化听者对音乐信号的神经追踪强度,即“参与度”。具体工作流如下: 1. 刺激表征:首先,使用一个外周听觉系统计算模型对音乐音频进行处理,生成声谱图,然后通过跨频谱通道平均来提取声音包络。该包络经过Z-score标准化和1-10 Hz带通滤波。 2. 神经信号预处理:对EEG或ECoG数据进行空间滤波(主成分分析,PCA,保留60个成分)。 3. 时域滤波器组:将声音包络和预处理后的神经信号分别通过一个包含21个对数间隔滤波器(从2到128个样本)的时域滤波器组,产生多频带信号。 4. 神经信号降维:对滤波器组处理后的神经信号(21*60维)再次进行PCA,保留139个成分。 5. 典型相关分析(CCA):将滤波后的包络信号和降维后的神经信号进行CCA分析,寻找两者之间最大相关的线性组合(典型成分)。分析中考虑了声音包络相对于神经信号0到2秒的时间延迟(以涵盖神经反应滞后)。 6. 时间分辨参与度计算:为避免过拟合,采用10折交叉验证。使用第一对典型成分分别转换神经信号和声音包络信号。然后,在一个滑动时间窗(窗长5秒,步长1秒)内计算这两个转换后信号的斯皮尔曼相关系数。这个随时间变化的相关系数序列即为解码出的“时间分辨参与度”指标,反映了神经信号与音乐包络耦合强度的瞬时波动。 7. 可靠性检验:与行为数据类似,计算了不同个体解码出的参与度时间序列的ICC,以验证解码结果的可靠性。

流程五:统计分析与假设检验。 研究采用斯皮尔曼相关分析来检验以下关键变量之间的关系:平均张力评分、解码的神经参与度(EEG和ECoG分别计算)、响度、音乐意外性(长期IDyOM模型)。所有信号为减少自相关降至1 Hz。显著性通过1000次自助法(Bootstrapping)计算。 为了回答核心问题——张力与神经参与度的关系是否独立于基本的声学特征和音乐期待——研究进行了偏相关分析。具体而言,在计算张力评分与解码参与度的相关性时,控制了二者与“响度”和“音乐意外性”的共同方差。这是一种非常保守的分析策略,旨在剥离出张力体验与神经参与度之间独特的、超脱于单一音乐特征驱动的关系。

三、 主要研究结果及其逻辑关联

结果1:张力行为评分高度可靠且与音乐特征相关。 组内相关系数(ICC)分析显示,所有乐曲的个体张力评分都具有极高的参与者间一致性(舒伯特:ICC = .96;贝多芬:ICC = .88;勃拉姆斯:ICC = .87),这与先前研究一致,证实了音乐张力是一种显著且一致的感知体验。此外,平均张力评分与独立的TenseMusic计算模型的预测值呈中度到高度相关(相关系数r在0.43到0.65之间),进一步交叉验证了行为评分的有效性和对音乐结构的反映。 接下来,特征相关性分析发现:1) 在所有乐曲中,张力评分与响度均存在强相关,证实了低层级声学特征的基础性驱动作用。2) 更重要的是,张力评分与长期IDyOM模型计算的音乐意外性(即基于长期音乐知识的期待违背)也呈现显著相关。而基于短期模型的意外性则与张力无关。这一结果表明,音乐张力不仅由响度驱动,还与听者通过长期文化浸染获得的高层级音乐结构知识(长期期待)所产生的预测误差(意外性)紧密互动。

结果2:解码的神经参与度与行为张力高度相关。 对EEG和ECoG数据的分析均显示,个体解码出的参与度时间序列具有高可靠性(高ICC)。核心发现是,平均解码参与度(来自EEG和ECoG)与平均行为张力评分在所有测试的音乐片段中均呈现显著的正相关。这意味着,当听者报告感受到更高音乐张力时,其神经系统对音乐包络的追踪(耦合)也同步增强,即神经参与度更高。这一结果首次直接建立了主观张力体验与客观神经参与度指标之间的动态联系。

结果3:张力与神经参与度的关联在控制音乐特征后依然存在。 这是本研究最具说服力的发现之一。由于张力评分和解码参与度都与响度及音乐意外性相关,它们之间的关联可能仅是共享了这些音乐特征方差的结果。偏相关分析在控制响度和音乐意外性的影响后,重新检验了张力与神经参与度的关系。结果显示:1) 对于ECoG数据集,在四段音乐中的两段,张力与参与度之间的偏相关仍然显著。2) 对于EEG数据集,在三段音乐中的一段也发现了显著的偏相关(研究者认为EEG信噪比较低可能是其余片段未显著的原因)。这一结果至关重要,它证明张力体验与神经参与度之间的协同变化,不能完全由外部声学强度(响度)或音乐期待(意外性)的变化来解释。 两者之间存在一种超越单一音乐特征驱动的、特异性的内在联系。这表明,可能还有其他尚未被发现的音乐属性或内部认知过程共同驱动着主观张力体验和相应的神经参与动态。

四、 研究结论与价值意义

本研究通过结合行为评分、计算建模和神经解码技术,成功地刻画并验证了音乐张力-释放动态与听者神经参与度之间的紧密联系。主要结论如下:

  1. 音乐张力是连接音乐结构与神经参与度的关键中介:研究证实,音乐张力不仅仅是一种主观感受,它作为一种显著的感知现象,能够可靠地预测听者神经参与度的波动。张力-释放循环因此可以作为衡量音乐参与度的指标,并作为一个中间阶段,将音乐刺激特征转化为主观情感反应。
  2. 张力体验由多层级特征驱动,并特异性地关联于神经参与:张力既根植于响度等低层级声学特征,也整合了基于长期音乐知识的高层级期待处理。更重要的是,即便排除这些已知特征的影响,张力与神经参与度的内在关联依然存在,凸显了其作为复杂感知现象的独特性。
  3. 神经解码技术可客观量化音乐聆听中的动态参与:研究成功将用于解码言语注意的CCA方法拓展到连续音乐感知领域,获得了时间分辨率高、客观的神经参与度指标,为研究自然情境下的复杂听觉认知提供了有力工具。

本研究的科学价值在于:首先,它为解决“音乐如何吸引我们”这一根本性认知问题提供了新的神经证据和解释框架,揭示了张力动态在塑造持续性音乐参与中的核心作用。其次,它架起了音乐理论(张力、期待)、行为报告与神经生理指标之间的桥梁,深化了我们对音乐结构如何引发内部神经反应调制这一过程的理解。最后,方法学上展示了跨模态(行为、EEG、ECoG、计算模型)整合分析在揭示复杂认知现象中的威力。

在应用前景方面,这种对时间分辨参与度的量化方法,未来或可用于探索音乐偏好的个体差异,甚至作为诊断工具,评估个体对音乐奖赏处理的异常,这可能与某些临床状况(如快感缺乏)相关。此外,对驱动参与度的内外因素的理解,有助于开发更精准的计算模型,应用于个性化音乐推荐、音乐治疗或神经反馈等领域。

五、 研究亮点与创新性

  1. 研究问题的前沿性与重要性:直击音乐认知与情感的核心——张力与参与度的关系,填补了先前研究中行为体验与神经机制连接的证据空白。
  2. 方法学的严谨与创新性整合:创新性地将用于听觉注意解码的CCA流程应用于连续音乐刺激,并结合高时空分辨率的ECoG数据进行验证,增强了结论的可靠性。同时,系统性地整合了行为连续评分、计算音乐学模型(IDyOM)和神经解码,构成了一个完整的研究闭环。
  3. 发现的特异性与深度:不仅证实了张力与神经参与度的相关,更通过严格的偏相关分析,证明了这种关系在一定程度上独立于基础的响度变化和音乐期待,从而揭示了张力作为独立认知构造的神经相关性,这是本研究超越既往相关工作的关键进展。
  4. 跨层级的研究视角:从低级的声学特征(响度)到高级的认知过程(长期音乐期待),再到总体的感知现象(张力)和神经整体状态(参与度),研究贯穿了信息处理的多个层次,提供了对音乐感知较为全面的洞见。
上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com