本文旨在介绍Eric Spurlino于2025年在期刊《Experimental Economics》上发表的研究论文《Rationally Inattentive and Strategically (Un)sophisticated》。该研究是行为经济学与实验经济学领域的一项重要工作,特别是关注了理性疏忽(Rational Inattention) 与战略性复杂度(Strategic Sophistication) 两个理论在战略互动中的交叉点。研究首次通过实验方法,系统地考察了在信息获取成本高昂的战略博弈中,个体是否能够以及多大程度上能够预测并最优应对对手的信息获取行为。研究发现,个体在此类情境中表现出超乎寻常的低战略复杂度,其根源主要在于认知上难以预测对手的信息获取水平。这一发现挑战了现有理论中普遍假定参与者具备完全战略性复杂度的前提,并强调有必要将理性疏忽理论与“成本高昂的复杂性”理论在战略环境中进行整合。
研究的学术背景植根于行为经济学中两个已取得显著成功的分支:理性疏忽理论与战略性复杂度理论。
近年来,理论研究开始探讨一个或多个参与者可以(以一定成本)获取关于收益相关状态信息的博弈均衡问题。这些研究涵盖了议价、买卖、全局博弈和贝叶斯说服等多种具体情境。然而,这些理论模型普遍隐含了一个关键假设:参与者行为是完全战略性复杂的。这意味着,它们假定参与者完全理解对手的注意力成本,并能准确预测对手基于这些成本的最优信息获取策略。这些计算本身很可能是认知负荷极高的,却被默认所有参与者都能轻易完成。
本研究旨在填补这一空白,回答一个开放性问题:参与者在多大程度上能够预测并最优应对他人的信息获取行为? 作者选择了可能的最简单战略情境——一个双人交易博弈——来检验这一问题,以便给予受试者展现战略性复杂行为的“最佳机会”。
具体研究目标包括: 1. 检验受试者在此类战略博弈中预测对手信息获取的能力。 2. 检验受试者在获取自身成本高昂的信息时,最优应对对手信息获取的能力。 3. 通过外生操纵参与者自身及对手的注意力任务难度,并结合理性疏忽与层级-K理论构建新颖的理论模型来生成行为预测。 4. 探究观察到的行为背后可能的机制(例如,信念的准确性)。
研究采用在线实验方法,通过Prolific平台招募受试者,使用oTree软件实施。实验设计精巧,分为主实验(Main Treatment)和后续验证实验(Experiment Two)两部分。此处首先详述主实验的流程。
1. 实验总体结构与激励 实验总激励包括$10的固定参与费和$10的浮动奖金。浮动奖金通过“概率点”机制实现:受试者在实验各环节赚取的点数(0-100)直接转化为赢得$10奖金的概率。最终通过一个公开、可信的在线彩票机制兑现,以确保期望效用理论假设成立,且点数值可直接等同于效用值。
2. 第一部分:非战略性决策任务 * 目的:引入后续将使用的“真实努力”注意力任务,并测量个体在该任务上的基础能力。 * 任务内容:采用并改编自Dean和Neligh(2023)的“点阵任务”(Dot Task)。屏幕上呈现一个由红蓝圆点组成的方格。受试者需在30秒内判断是红点多(红格)还是蓝点多(蓝格)。判断正确得75点,错误得25点。 * 难度操纵:设计了两种显著不同的难度水平: * “100点”任务:10x10网格,共100个点,多数颜色比少数颜色多8个点(较易)。 * “225点”任务:15x15网格,共225个点,多数颜色比少数颜色多5个点(较难)。 * 流程:每个难度任务重复15轮,共30轮。为避免反馈影响,整个过程中不提供单轮对错反馈。任务分为6个区块,每个区块内网格类型固定。此举旨在为每个受试者针对每种任务难度,估算其状态依赖的随机选择数据(State-Dependent Stochastic Choice, SDSC),即在不同状态下选择“接受”或“拒绝”的概率分布。
3. 第二部分:战略性博弈(核心部分) * 博弈设置:两个参与者(红方和蓝方)决定是否接受一笔价值未知的交易。交易价值有两种可能状态(红交易或蓝交易),概率各为50%。只有当双方都接受时交易才达成。 * 若交易达成:交易颜色与参与者角色颜色匹配时,该参与者获得高收益(Vh=90点),对手获得低收益(Vl=10点);反之亦然。 * 若任一方或双方拒绝:双方均获得固定的外部选项收益(Vo=30点)。 * 关键设定:Vl < Vo < Vh,且 (Vl+Vh)/2 > Vo。这意味着交易在事前(平均而言)对双方都有利,但在事后总有一方受损。 * 信息获取:双方可同时获取关于交易状态的信息,但需付出成本。信息成本采用理性疏忽的标准设定,与通过信息减少的香农熵成线性关系。注意力成本参数λ由实验任务难度外生操控:执行“100点”任务意味着较低的注意力成本(λ较小),执行“225点”任务意味着较高的注意力成本(λ较大)。 * 实验设计与流程: * 受试者被随机分配为红方或蓝方角色,并在120轮单次博弈中与随机匹配的不同对手互动(无反馈)。 * 核心操纵:采用被试内设计,系统性地操纵两个变量:(1) 受试者自身的任务难度(“100点”或“225点”);(2) 对手的任务难度(“100点”或“225点”)。由此构成四种注意力设置组合。 * 120轮博弈分为8个区块,每个区块15轮。每个区块内,自身和对手的任务难度组合保持不变。四种组合各出现两个区块(顺序随机化)。 * 在区块5至区块8结束后,会进行信念诱发。受试者被要求以激励相容的二次计分规则,报告他们认为对手在刚刚结束的区块中,接受红交易和蓝交易的百分比。这旨在获取受试者对对手SDSC的信念。 * 理论预测模型:作者构建了一个结合理性疏忽与层级-K理论的模型来生成行为预测。 * 层级-0:假定对手不获取信息,以固定概率接受交易(SDSC中p[a|r] = p[a|b])。 * 层级-1:自身是理性疏忽的,但认为对手是层级-0(即不获取信息)。因此,其最优SDSC仅取决于自身的注意力成本λi,而与对手的成本λ-i无关。 * 层级-2:自身是理性疏忽的,且认为对手是层级-1(也是理性疏忽的)。因此,其最优SDSC同时是自身成本λi和对手成本λ-i的函数。具体而言,当对手成本较低(能力强)时,对手更倾向于只接受对其有利的交易,这会降低自己接受任何交易的预期收益,从而使自己的策略更偏向“拒绝”。 * 纳什均衡:双方SDSC互为最优反应,且信念正确。
4. 第三部分:其他测量与调查 * 11-20博弈:测量受试者在另一个经典游戏中的战略性复杂度,作为对照。 * 认知反思测试:测量受试者的认知能力。 * 策略调查:通过问卷了解受试者在实验中的策略,特别是他们是否以及如何考虑对手的任务难度。
1. 任务难度验证 数据分析确认了任务难度操纵的有效性。在非战略任务中,“225点”任务的平均正确率为61%,而“100点”任务为84%,差异显著。绝大多数受试者(100人中的88人)在较易任务上表现更好,表明两种难度具有普遍、一致的排序。
2. 战略性行为:对自身与对手成本的反应 * 对自身成本的反应显著:受试者行为强烈依赖于自身任务难度。当自身任务较易(成本低)时,他们能更好地辨别状态——更频繁地接受有利交易,更少地接受不利交易。当自身任务较难(成本高)时,他们接受有利交易的频率下降,接受不利交易的频率上升,辨别能力减弱。这与理性疏忽理论的预测一致。 * 对对手成本的反应微弱至无:关键发现是,受试者的SDSC几乎不受对手任务难度的影响。无论对手面对的是容易还是困难的任务,受试者接受有利和不利交易的概率在统计上均无显著差异。集群分析将100名受试者中的95人归类为行为模式接近“层级-1”的类型(即行为独立于对手成本),仅有5人表现出“层级-2”或更高级别的反应模式。这种极低比例的高战略复杂度类型,远低于其他博弈(如选美博弈)文献中通常报告的比例,体现了本研究情境的特殊认知难度。
3. 信念分析:战略性复杂度缺失的机制 * 信念基本正确但严重不精确:受试者普遍认识到对手会更多地接受对其有利的交易(信念差异为正),表明他们理解了博弈的基本结构。然而,他们严重低估了对手的信息获取程度和辨别能力。 * 数据对比:在实际行为中,面对“100点”任务的受试者,其接受有利与不利交易的差距接近50%。而受试者对对手行为的信念中,这一差距平均仅为26%。面对“225点”任务时,实际差距约为15%,而信念差距约为15-16%。 * 信念分布:大量受试者报告的信念显示,他们认为对手接受有利和不利交易的概率非常接近,这实质上等同于“层级-1”类型的信念(认为对手不获取信息)。这种信念可能是由于受试者确实持有错误信念,也可能源于他们对预测对手行为存在高度的“认知不确定性”,从而在行为上表现得如同对手不获取信息。 * 信念驱动行为:回归分析表明,将对手任务难度的虚拟变量替换为受试者自己报告的信念变量(无条件接受概率和有利/不利接受概率差)后,这些信念变量对受试者自身的行为有显著的预测力,且符号方向与理性疏忽理论的预测大致相符。这支持了以下机制:受试者本身可能是“理性疏忽”的,会根据自己的(错误)信念来调整信息获取策略;导致看似“非战略性”行为的主要原因是他们无法形成关于对手信息获取的准确信念或模型。
4. 后续实验验证:移除不确定性的影响 为了直接测试“信念不准确/不确定”是主要机制的假设,作者进行了第二个实验。 * 设计变更:受试者不再与真人对手匹配,而是与遵循固定、透明策略的电脑对手对战。电脑策略直接模拟了主实验中观察到的平均行为:“30:80”电脑(模拟“100点”对手,接受有利交易30%,不利交易80%)和“50:65”电脑(模拟“225点”对手,接受有利交易50%,不利交易65%)。 * 结果对比:在电脑对手实验中,受试者的行为发生了显著变化。当面对策略更具侵略性(“30:80”,相当于低注意力成本对手)的电脑时,受试者理性地将策略转向更侧重于“拒绝”——更多地减少接受不利交易的错误。当面对策略更温和(“50:65”,相当于高注意力成本对手)的电脑时,他们的策略则更侧重于减少拒绝有利交易的错误。 * 核心结论:一旦移除了关于对手行为的所有不确定性,受试者能够并确实会根据对手的策略(即模拟的注意力成本)系统地、理性地调整自己的信息获取策略。这强有力地证实,主实验中观察到的缺乏战略性复杂度的现象,并非因为受试者不具备理性疏忽的能力或实验激励不足,而恰恰是由于在战略环境中预测他人信息获取行为这一认知步骤异常困难。
本研究的主要结论是:在信息获取成本高昂的简单战略博弈中,个体表现出极其有限的战略性复杂度。这种局限并非源于个体无法根据激励调整自己的信息获取(他们对自己成本的反应证明了其“理性疏忽”能力),而是根源于一个特定的认知瓶颈——难以建模和预测对手的信息获取策略。受试者似乎跳过了这个高难度的认知步骤,转而将战略博弈简化为一个非战略的单人决策问题来处理。
研究的科学价值与应用意义在于: 1. 理论整合的必要性:研究结果强烈表明,有必要将理性疏忽理论与内生推理深度(Endogenous Depth of Reasoning, EDR) 理论或其他关于“成本高昂的复杂性”的理论结合起来,以更全面地建模战略环境中认知受限的行为。个体同时面临两种认知成本:获取信息的成本(理性疏忽)和进行战略推理的成本(EDR)。本研究暗示,当对手也能获取信息时,战略推理的成本尤其高昂。 2. 对现有理论模型的挑战与修正:研究批评了现有战略理性疏忽文献中普遍存在的“完全战略性复杂度”假设,指出该假设在涉及双方向信息获取的博弈中可能不成立。未来的理论模型需要考虑参与者对他人信息处理能力的建模局限。 3. 深化对“有限战略性思维”的理解:本研究将“有限战略性思维”的失败(Failure of Contingent Thinking, FCT)与信息成本环境联系起来,表明信息成本可能会加剧战略推理的失败。这与近期其他研究(如Jin等,2022)的发现相呼应。 4. 方法论贡献:研究成功地将“真实努力”注意力任务与战略博弈相结合,提供了一种在实验室中操纵和测量战略环境中信息获取成本的有效范式。在线实验的实施方式也规避了线下实验室可能带来的社交压力和时间感知干扰,更适合研究内生的注意力分配。