调性语境下音乐音高的心理表征

分享自：
调性语境下音乐音高的心理表征

期刊:cognitive psychology
基于文档内容，本文档属于类型a：报告了一项单一的原创性研究。以下是针对该研究的学术报告。
卡萝尔·L·克鲁姆汉斯尔的音乐音高心理表征研究
作者与发表信息 本项研究由斯坦福大学的卡萝尔·L·克鲁姆汉斯尔博士主持并作为其主要完成者，研究成果以论文《The Psychological Representation of Musical Pitch in a Tonal Context》的形式，发表于1979年的学术期刊 cognitive psychology 第11卷，页码范围346-374。该研究得到了美国国立卫生研究院和国家科学基金会的资助。
学术背景与研究目的 本研究隶属于音乐认知心理学与心理声学的交叉领域。传统上，关于音高感知的心理物理学研究通常将单个音调或音对置于孤立或非音乐的背景下进行考察，研究者们普遍认为音高感知主要基于两个心理维度：音高高度（pitch height），与物理频率单调相关；以及音色（chroma），用以解释相隔八度的音调为何听起来相似，形成了所谓的“色环”或螺旋模型。然而，这些模型未能充分捕捉音乐在真实、有组织的上下文（即调性（tonality））中呈现的复杂关系。在西方音乐理论中，调性（如C大调）确立了一个中心音（主音（tonic）），其他音级根据与主音的亲疏关系形成层级结构：主音、三音、五音构成最稳定的大三和弦（major triad）；其他自然音阶（diatonic scale） 音级（如C大调中的D、F、A、B）次之；而非自然音阶（nondiatonic） 音级（即调外音，如C#、D#等）则最不稳定，具有向稳定音级解决的倾向。
克鲁姆汉斯尔博士意识到，此前的研究缺乏在明确音乐上下文（调性语境）中，对单个音调之间心理关系的系统性探索。同时，有证据表明听者能够提取调性结构，并且这种结构会影响记忆（例如，对调性旋律的记忆优于无调性旋律）。受罗施关于认知参照点研究的启发，她假设在调性语境中，与调性关系较疏远的音（非稳定音）在心理上会更类似于与调性关系密切的音（稳定音），反之则不然，这体现了音乐在时间上的动态倾向。
因此，本研究的核心目标是：探究在明确的调性语境下，具有音乐素养的听者如何心理表征音乐音高，以及这种表征如何反映音乐理论中的调性层级关系和动态特性。
研究流程详述 本研究包含四个相互关联的实验，均招募了同一批10名具有至少5年正式音乐训练（平均12.5年）的斯坦福大学本科生作为被试。所有听觉刺激均通过电子琴（Fartisa，使用长笛音色以接近正弦波）录制，并在隔音室中通过高质量音频设备播放。
实验一：调性语境下的音调相似性判断 这是研究的核心部分，旨在直接描绘音高心理表征的结构。 * 程序与刺激：每个试次开始时，会播放一段用于建立C大调调性的语境（context），共三种：C大三和弦、上行C大调音阶、下行C大调音阶。语境播放后，间隔2秒，接着依次呈现两个需要比较的音调（均取自C4到C5的八度范围内，共13个半音）。被试的任务是，在语境所暗示的调性系统中，判断第一个音与第二个音的相似程度（即关系的紧密程度）。评分采用1（非常不相似）到7（非常相似）的量表，强调判断的方向性。 * 设计与数据：所有有序音对（13×13，排除自身比较）均出现，构成一个试次块。每个语境类型有两个完整的试次块。最终，研究者将三种语境下的数据合并，得到一个13×13的平均相似性评分矩阵。 * 分析方法： 1. 描述性分析：分别绘制当第一个音为（a）大三和弦音、（b）其他自然音阶音、（c）非自然音阶音时，针对所有第二个音的相似性评分剖面图，直观观察模式。 2. 多维标度法（Multidimensional Scaling, MDS）：使用KYST程序对对称化后的相似性矩阵进行非度量多维标度分析，以揭示数据背后潜在的心理空间结构。 3. 不对称性分析：计算并检验相似性矩阵中非对称部分（如“音A对音B”与“音B对音A”的评分差异）的系统模式，比较不同类别音调（大三和弦音、其他自然音、非自然音）作为第一音和第二音时的平均评分差异。
实验二与实验三：延迟识别任务——调性对记忆稳定性的影响 这两个实验旨在检验从实验一衍生出的假设：在调性语境中，自然音的表征比非自然音更稳定，且非自然音在记忆中有向自然音偏误的倾向。 * 共同范式：采用延迟识别（delayed recognition） 任务。每个试次中，被试先听到一个标准音（standard tone, S），随后是一段由8个音组成的插入序列（interpolated sequence），最后是一个比较音（comparison tone, C）。被试需判断S与C是否相同，并以1（非常确定相同）到6（非常确定不同）的6点量表报告信心度。 * 关键操纵： * 序列类型：插入序列分为调性（tonal） 和无调性（atonal） 两种。调性序列设计为在特定音域内包含C大调音阶的所有音，强烈暗示C大调；无调性序列则通过对调性序列的最高和最低音进行半音改动而得到，破坏了调性结构。 * 标准音类型：S音分为C大调内的自然音（diatonic） 和非自然音（nondiatonic）。 * 实验间差异： * 实验二：插入序列中包含作为S音的自然音（即自然音在序列中得到了重复），但不包含作为S音的非自然音。这引入了“重复”的混淆变量。 * 实验三：为了解决上述混淆，插入序列经过修改，既不包含作为S音的自然音，也不包含作为S音的非自然音。这使得自然音与非自然音在记忆任务中处于平等的“未重复”条件，从而能更纯粹地检验调性语境本身的影响。 * 数据分析：将6点信心度评分转换为每个被试在每个实验条件下的记忆操作特征曲线（Memory Operating Characteristic, MOC），并计算曲线下面积作为记忆准确性的指标，随后进行方差分析和t检验。
实验四：音乐性判断校验 此实验用于验证实验二、三中对“调性”与“无调性”序列操纵的有效性。 * 程序：被试直接聆听实验二和三中使用的所有16段插入序列，并判断每段序列听起来有多“musical”（有音乐性/像音乐），使用1（完全没音乐性）到7（非常有音乐性）的量表评分。
主要结果详述 实验一结果： 1. 相似性模式：合并三种语境的数据后，相似性矩阵显示出清晰的调性层级结构。 * 当第一个音是自然音（特别是大三和弦音）时，它们与其他自然音的相似性评分显著高于与非自然音的评分。大三和弦内部各音之间（如C-E， C-G）表现出最高的相似性。 * 当第一个音是非自然音时，其相似性剖面图截然不同：评分普遍较低，且没有显示出对自然音或非自然音的偏好，大部分变异可由两个音之间的频率差异（音高距离）解释。 * 相似性矩阵的列和（反映第二个音的影响）比行和（反映第一个音的影响）方差更大，表明在判断中，第二个音的身份对评分的影响大于第一个音。 2. 多维标度结构：对对称化数据的三维标度分析得到了一个圆锥形结构（conical structure），压力值（stress）为0.108。在理想化的圆锥模型中：音调按音高顺序环绕圆锥表面排列；两个C音相距270度，体现了八度关联但非完全等同；大三和弦音（C， E, G, C‘）聚集在靠近圆锥顶点的最小圆周上；其他自然音（D, F, A, B）位于离顶点稍远的较大圆周上；而非自然音（C#， D#， F#， G#， A#）则散布在离顶点最远、半径最大的圆周上。这一结构直观地将音高高度、音色（环绕排列）、以及由调性决定的亲疏层级（到顶点的距离）整合在一起。 3. 相似性不对称性：发现了系统的非对称模式。具体而言：非自然音 → 自然音的相似性评分 > 自然音 → 非自然音的评分；其他自然音 → 大三和弦音的评分 > 大三和弦音 → 其他自然音的评分。这表明心理上，远离调性中心的音被认为更“像”靠近中心的音，而不是相反。
实验二与实验三结果： 1. 实验二：发现了序列类型（调性/无调性）与标准音类型（自然音/非自然音）的显著交互作用。在调性语境下，对自然音的记忆准确性显著高于非自然音；而在无调性语境下，这种差异减小。此外，整体上，自然音被误认为非自然音的情况，少于非自然音被误认为自然音的情况，这与实验一的不对称性模式一致。但由于自然音在序列中被重复，此结果可能混合了重复加强效应。 2. 实验三（消除了重复混淆）：交互作用依然显著，且模式更为清晰。在调性语境下，对自然音（C， G）的记忆准确性显著优于对非自然音（C#， F#， G#）的记忆，并且非自然音更多被误认为自然音。在无调性语境下，结果出现反转：对（原调性下的）非自然音的记忆反而略优于自然音。作者分析，这可能是因为无调性序列意外地暗示了其他调性，改变了音级的稳定性归属。此结果恰恰进一步支持了“音级的记忆稳定性取决于其在当前感知到的调性语境中的地位”这一核心观点。
实验四结果： 所有被设计为“调性”的序列，其音乐性评分均显著高于对应的“无调性”版本，证实了实验操纵的有效性。
研究结论与意义 本研究通过一系列精巧的实验证明，具有音乐素养的听者在调性语境下，其音高的心理表征远非简单的线性或对称模型所能描述。这种表征是一个复杂的、调性特异的层级结构，具体表现为： 1. 圆锥形心理空间：音高心理表征是一个三维圆锥形结构，同时编码了音高高度、音色（八度关联）以及由当前调性决定的音级功能亲疏关系。自然音级，特别是大三和弦音，在心理空间中更靠近一个中心参照点（圆锥顶点）。 2. 动态与非对称性：该表征具有动态特性。与调性关系较远的音在心理上更不稳定，表现为：（a）在相似性判断中，它们被认为更“趋向于”稳定音；（b）在记忆任务中，它们的表征更容易衰退或被同化到更稳定的自然音上。这种心理上的非对称性与音乐进行中不稳定音向稳定音解决的倾向相吻合。 3. 音乐感知的主动性：音乐感知不仅依赖于音调的声学属性，更依赖于听者主动将听到的音调与一个组织良好的、复杂的心理音高表征进行联系和匹配的过程。调性系统为该过程提供了认知框架。
本研究的科学价值在于，它首次通过心理物理学实验和数学模型（多维标度），为音乐理论中核心的、但较为抽象的“调性”与“音级功能”概念提供了实证支持与量化的心理描述模型（圆锥模型）。它将音高感知研究从孤立的元素分析，推进到了有组织的音乐上下文之中，强调了认知结构在音乐加工中的关键作用。其应用价值可为音乐教育（理解和声与旋律进行）、音乐心理学模型构建、乃至音乐信息检索和计算音乐学提供理论基础。
研究亮点 1. 开创性的研究视角：率先在严格控制下，于明确的调性语境中系统探究单个音调之间的心理关系，弥补了传统心理声学与真实音乐感知之间的鸿沟。 2. 精巧的实验设计：四个实验逻辑严密，层层递进。实验一直接测量表征结构；实验二和三通过记忆任务检验表征的动态稳定性，并通过改进设计（实验三）剥离了混淆变量；实验四则对核心操纵进行校验，体现了严谨的科学方法。 3. 新颖的发现与模型：揭示了音高相似性在调性语境中的系统非对称性，并通过对相似性数据的多维标度分析，提出了极具启发性的“音高心理表征圆锥模型”。该模型形象地整合了音高、音色和调性层级多个维度。 4. 连接理论与实证：成功地将音乐理论概念（调性、稳定性、解决倾向）转化为可检验的心理假设，并通过实验数据予以证实，架起了音乐学与认知心理学之间的桥梁。
其他有价值内容 文中还对当时存在的几种音高几何模型（如Drobish螺旋、Shepard双重螺旋、Longuet-Higgins二维阵列等）进行了评述，指出它们在解释调性特异效应上的不足，从而突出了本研究所发现圆锥模型的独特解释力。此外，作者讨论了两种解释不对称性的数学模型（Tversky的特征匹配模型和Krumhansl自己的距离-密度模型）与本研究数据的兼容性问题，指出单纯强调刺激“突显性”或空间“密度”可能不足以完全解释音乐语境中的不对称性，暗示了音乐认知中特有的“时间动态倾向”这一关键因素。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问