本文发表于2024年12月6日的《美国国家科学院院刊》(Proceedings of the National Academy of Sciences of the United States of America, PNAS),由来自美国加州大学伯克利分校Helen Wills神经科学研究所的Sangil Lee,北京大学心理与认知科学学院、北京IDG/麦戈文脑科学研究所的牛润轩(Runxuan Niu)、朱璐莎(Lusha Zhu),以及加州大学旧金山分校(UCSF)神经病学系、旧金山退伍军人事务医疗系统的Andrew S. Kayser和加州大学伯克利分校哈斯商学院的Ming Hsu共同完成。
研究背景与目标
欺骗是人类社会中普遍存在的行为。尽管对其神经机制的探索已有时日,但科学界长期以来对用于表征欺骗的生物学测量指标的有效性持怀疑态度。核心困境在于,欺骗行为总是伴随着一系列其他认知过程(如动机权衡、风险评估、社会规范违反引起的唤起、信念推断等),这些“混杂过程”(confounding processes)本身并非欺骗所特有,但可能被测量指标捕获,从而导致对“欺骗”这一构念(construct)的有效性威胁。这种对“结构效度”(construct validity)的担忧,尤其是“区分效度”(discriminant validity)的缺乏,使得相关研究长期处于科学边缘,也阻碍了我们对欺骗与诚实行为神经基础的深入理解。
近年来,随着功能性磁共振成像(fMRI)与机器学习模式分析技术(如多体素模式分析,MVPA)的结合,以及行为经济学中“信号博弈”(signaling games)范式的应用,为在更贴近现实的动机性欺骗情境下解码大脑状态提供了新工具。然而,这些方法构建的神经预测器(neural predictor)是否真正特异于欺骗过程,抑或仅仅是捕捉了那些与欺骗共现的混杂信号,仍然缺乏系统的检验方法。
为此,本研究旨在建立一套方法学与统计学工具,以系统性地检验并提高欺骗神经预测器的有效性。具体目标分为两步:第一,验证长期存在的怀疑,即检验基于欺骗数据训练的神经预测器,其预测能力在多大程度上源于非欺骗的混杂过程;第二,证明混杂信号的存在未必是致命的,通过发展新方法在保留任务相关信号的同时剔除混杂信号,从而提高神经预测器的有效性。
研究流程与方法
本研究主要包含以下几个关键环节:实验范式设计、神经数据采集与预测器构建、区分效度检验、以及混杂信号控制方法的开发与比较。
1. 实验范式:同构的信号博弈任务 为了分离欺骗特异的过程与共有的混杂过程,研究团队设计了一对“同构的”(isomorphic)信号博弈任务。在这两个任务中,参与者均扮演“发送者”(sender)角色,面对两个将金钱在自己和另一名“接收者”(receiver)之间进行分配的选项(一个对自己更有利,一个对对方更有利)。发送者能看到选项但无权选择,接收者有权选择但看不到选项,因此完全依赖发送者发送的信息(消息)来做决定。两个任务的核心区别在于消息的“真值”(truth value)属性: * 欺骗任务:发送者必须在两条可验证真伪的消息中做出选择(例如,“选项A会让你赚得比B多”)。选择与事实相符的消息即为诚实,反之则为欺骗。 * 控制任务:发送者的消息没有真值属性(例如,“我倾向于你选择选项A”)。选择推荐利己选项的消息是“自私的”(selfish),推荐利他选项的消息是“利他的”(altruistic)。 两个任务在参与者、策略空间和支付结构上完全相同,仅在消息的表述(表面标签)上不同。这种设计使得控制任务能够捕捉与欺骗任务共存的混杂过程(如自利动机、成本收益权衡、社会规范考量等),但本身不涉及欺骗。
研究共招募了40名健康参与者,其中33名(男性16名,平均年龄20.8岁)因行为数据具有足够变异性而被纳入最终分析。参与者同时完成欺骗任务和控制任务,其奖金取决于随机挑选的试次结果。
2. 神经数据采集与预测器构建 研究在参与者执行任务时采集了fMRI数据。数据分析在两个层面上进行: * 被试水平预测:为每个被试、每个任务条件(诚实/欺骗,或利他/自私)估计一个平均的脑活动图像。 * 试次水平预测:使用beta序列回归(beta-series regression)方法,为每个试次单独估计脑活动图像。 利用这些神经数据,研究团队首先构建了一个“朴素”(naïve)的神经预测器。他们采用留一被试交叉验证(leave-one-subject-out cross-validation)方法,使用阈值化偏最小二乘法(thresholded Partial Least Squares, t-PLS)算法,在欺骗任务的神经数据上训练一个全脑线性分类器,以区分欺骗与诚实行为。随后,将该训练好的预测器应用于留出被试的数据,测试其预测准确性。
3. 区分效度检验:交叉任务泛化测试 这是本研究验证预测器结构效度的核心步骤。为了检验朴素预测器是否特异于欺骗,研究者将其直接应用于控制任务的神经数据。如果这个“欺骗预测器”也能显著预测控制任务中的自私行为(即“过度泛化”,overgeneralization),则强有力地证明其预测能力至少部分来源于两个任务共享的混杂过程,而非欺骗特异过程,即其区分效度不足。
4. 混杂信号控制方法的开发与比较 在证实混杂信号存在后,研究团队探索了四种在训练中纳入控制任务数据以提高预测器区分效度的方法,并与朴素方法进行比较: * 区域移除法:在训练前,移除那些与控制任务行为显著相关的体素(即被认为携带强混杂信号的脑区)。 * 重标记法:将控制任务中的所有试次(无论自私还是利他)都重新标记为“诚实”试次,与欺骗任务中的“欺骗”试次一起训练分类器。此方法旨在迫使分类器寻找一个能区分欺骗与所有其他(自私+利他)试次的决策边界。 * 回归剔除法:利用两个任务试次可配对的特点,尝试从欺骗任务的神经数据中回归掉控制任务行为所解释的变异。 * 双目标调优法:本研究提出的新方法。该方法将问题构建为一个带约束的优化问题。除了主要目标(准确预测欺骗任务中的行为)外,强制增加第二个目标:使预测器在控制任务上的预测性能达到随机水平(即零泛化)。具体实现上,采用了一种简化的两步程序:先构建朴素预测器,然后使用格兰姆-施密特正交化(Gram-Schmidt orthogonalization)程序,将预测器的权重向量与从控制任务数据中估计出的“混杂协方差”(nuisance covariance)向量进行正交化处理,从而系统地剔除与混杂过程相关的信号成分。
此外,研究还设计了一个“高混杂”测试集,将欺骗试次与控制任务中的自私试次混合,直接测试修正后的预测器能否区分“欺骗”与“非欺骗但自私”的行为。这为正交化后区分效度的提升提供了正面证据。
在神经机制探索层面,研究还使用了搜索光(searchlight)MVPA方法,在全脑范围内识别能够解码欺骗的局部脑区,并检验这些脑区的预测信号是否也受到混杂过程的影响。
主要结果
1. 行为结果:参与者在两个任务中的行为存在显著差异。与控制任务相比,在欺骗任务中参与者选择发送自私(即欺骗)消息的比例显著降低(欺骗任务:54.6%,控制任务:61.9%)。这表明“需要说谎”这一情境本身影响了行为决策。同时,个体在欺骗任务中的欺骗倾向与在控制任务中的自私倾向相关性较弱,说明两个任务触及了部分可分离的心理过程。
2. 朴素神经预测器的表现与效度缺陷: * 预测准确性:朴素神经预测器在欺骗任务上表现良好,能够以显著高于随机水平的准确率区分欺骗与诚实行为(被试水平:78.8%;试次水平:曲线下面积AUC = 56.6%)。 * 区分效度不足:关键发现是,该欺骗预测器同样能够预测控制任务中的自私行为。将预测器应用于控制任务数据时,其输出的神经信号与自私选择呈显著正相关(被试水平 r=0.39,试次水平 r=0.084)。这表明预测器捕捉了大量两个任务共享的混杂信号。其程度之甚,以至于该预测器在控制任务上的分类准确率与其在欺骗任务上的准确率在统计上无法区分。
3. 不同混杂控制方法的比较结果: * 区域移除法、重标记法和回归剔除法虽然能在一定程度上降低对控制任务的预测(减少过度泛化),但都是以显著牺牲在欺骗任务上的原始预测准确性为代价。 * 双目标调优法表现突出:该方法在几乎完全消除过度泛化(与控制任务行为的相关系数降至接近零且不显著)的同时,最大程度地保留了在欺骗任务上的预测能力(试次水平AUC = 56.0%,仍显著高于随机水平)。这表明该方法能有效分离欺骗特异信号与共享的混杂信号。
4. “高混杂”测试的正面证据:只有经过双目标调优法修正后的预测器,能够以显著高于随机水平的准确率(AUC = 53.3%)区分欺骗试次与“非欺骗但自私”的试次。而其他方法(包括朴素预测器)在此测试中均表现不佳。这为双目标调优法真正提高了预测器的区分效度提供了强有力的正面支持。
5. 神经层面的发现: * 搜索光分析确认了前人在元分析中报告的与欺骗相关的脑区,如上前扣带皮层(superior anterior cingulate cortex)、额上回(superior frontal gyrus)等。 * 过度泛化在全脑范围内普遍存在,许多能预测欺骗的脑区也至少部分由控制任务共享的信号驱动。 * 应用双目标调优法进行后处理正交化后,不同脑区的表现各异:一些区域(如初级视觉皮层)的预测能力完全丧失,表明其初始预测能力完全由混杂信号驱动;而另一些区域(如上前扣带皮层、额上回)在正交化后仍保留了显著的预测能力,表明这些区域同时存在可分离的欺骗特异信号与混杂信号。
结论与意义
本研究首先证实了长期以来的科学担忧:基于fMRI和机器学习构建的欺骗神经预测器,其预测能力在很大程度上来源于与欺骗共现的非特异混杂过程(如自利动机、风险考量等),其区分效度存在严重缺陷。
更重要的是,研究发展并验证了一种名为“双目标调优”的新方法。该方法通过在预测器训练中引入强制性的第二目标(使其在控制任务上表现随机),能够有效地从神经信号中剔除混杂成分,从而构建出区分效度更高的、更可能反映欺骗特异过程的神经预测器。
研究的科学价值与应用潜力: 1. 为欺骗神经基础研究提供了更严谨的方法学基础:研究不仅指出了问题,更提供了解决方案。双目标调优法使研究者能够更可信地声称所测量的神经信号与欺骗构念本身相关,而不仅仅是其常见的伴随物。 2. 推动了认知神经科学中对复杂构念的分离:该方法论框架具有普适性。许多复杂的认知行为(如共情、认知控制、情绪体验)都涉及多个共现的子过程。本研究示范了如何利用同构任务和机器学习方法,系统地检验和提升神经测量指标对于特定目标构念的效度,为未来研究“认知构念的可分离性”打开了新的大门。 3. 对法医学应用具有启示意义:尽管距实际的法医应用仍有距离,但本研究朝着建立更科学、更严谨的神经测谎基础迈出了重要一步。它强调了在开发和评估任何基于大脑的检测方法时,进行严格的效度检验(尤其是区分效度)的极端重要性。
研究亮点
这项研究通过严谨的实验设计和创新的分析方法,在提升神经预测器有效性的方法论上取得了实质性进展,不仅对欺骗研究领域有重要贡献,也为整个认知神经科学中如何更纯净地测量复杂心理构念提供了宝贵的范例和工具。