学术研究报告:生物与人工智能系统中的合作行为神经机制
作者及机构
本研究由Mengping Jiang(加州大学洛杉矶分校医学院神经生物学系)、Linfan Gu(同机构生物化学系)、Mingyi Ma、Qin Li、Jonathan C. Kao(电气工程与计算机科学系)及Weizhe Hong(生物工程系)共同完成,发表于*Science*期刊,2025年9月25日首次在线发布(DOI: 10.1126/science.adw8151)。
科学领域:本研究横跨神经科学与人工智能(AI)领域,聚焦于合作行为(cooperation)的神经机制与计算原理。合作行为在自然界普遍存在,对个体适应性与群体生存至关重要,但其背后的神经机制尚不明确。
研究动机:现有研究提示前扣带回皮层(anterior cingulate cortex, ACC)在合作中起关键作用,但其如何协调实时互动仍未知。同时,AI领域虽在单智能体强化学习上进展显著,但多智能体协作的神经动力学与生物系统的相似性未被探索。
研究目标:
1. 揭示小鼠通过互惠合作(mutualism-based cooperation)实现目标协调的行为策略与神经表征;
2. 解析ACC在合作决策中的因果作用;
3. 通过AI多智能体模型验证合作行为的跨系统普适性。
研究对象:C57BL/6J小鼠(雄性与雌性各半,共17对),训练其通过同步鼻触(nose-poke)获得共同奖励(水)。
实验设计:
- 任务范式:双鼠需在特定时间窗(0.75秒)内同步鼻触才能获得奖励(图1)。
- 对照实验:
- 非合作条件:双鼠独立鼻触获奖励;
- 单边合作条件:仅一鼠需同步鼻触;
- 不透明隔板条件:阻断视觉社交线索。
行为分析:
- 高绩效组(41%鼠对)通过主动协调(非计时策略)实现成功率显著高于随机水平(图1d-g)。
- 关键行为策略:
- 接近行为(approach):向鼻触端口移动;
- 等待行为(waiting):在社交区停留直至伙伴抵达;
- 互动行为(interaction):通过身体朝向调整实现动作同步(图3)。
神经记录:
- 钙成像技术:通过AAV5-hSyn-GCaMP7f标记ACC神经元,记录12,798个神经元活动(图2)。
- 结果:
- ACC神经元选择性编码成功鼻触(correct poke)与失败鼻触(miss poke)(图2f-h);
- 社交行为(如等待)激活特定神经元群,且其表征强度与合作绩效正相关(图3r)。
因果验证:
- 化学遗传抑制ACC(hm4di)降低合作指数,延长鼻触间隔(图5c-i);
- 光遗传抑制(stGtACR2)证实ACC在决策期(非奖励期)的关键作用(图5o-q)。
任务设计:基于强化学习(PPO算法)训练两智能体在模拟环境中同步“鼻触”获奖励(图6a)。
关键发现:
- 智能体自发涌现等待策略,通过调整距离差实现同步(图7a-c);
- 神经网络中伙伴位置表征增强,且与生物ACC类似,其编码强度预测合作成功率(图7g-h);
- 选择性神经元消融验证“等待”与“执行”神经元的功能特异性(图7p-s)。
科学意义:
1. 首次揭示ACC通过整合自我-伙伴信息驱动实时合作决策;
2. 提出“合作神经表征-行为策略-AI模型”的跨学科研究框架;
3. 为AI协作系统设计提供生物启发式原则。
应用价值:
- 为自闭症等社交障碍的神经机制研究提供新靶点;
- 推动多智能体机器人系统的自然交互算法开发。
其他价值:
- 补充实验证实水剥夺非合作必要前提(图S3i-l);
- 家庭笼行为分析排除高绩效鼠对的一般社交偏好影响(图S1m-s)。
(全文约2200字)