分享自:

神经网络活动基础模型预测新刺激类型响应

期刊:natureDOI:10.1038/s41586-025-08829-y

这篇文档属于类型a,即报告了一项原创性研究的科学论文。以下是针对该研究的学术报告:


作者及机构
本研究由Eric Y. Wang、Paul G. Fahey、Zhuokun Ding等来自多所顶尖机构的团队合作完成,包括美国贝勒医学院神经科学与人工智能中心(Center for Neuroscience and Artificial Intelligence, Baylor College of Medicine)、德国哥廷根大学(University of Göttingen)、艾伦脑科学研究所(Allen Institute for Brain Science)等。研究成果于2025年4月10日发表在顶级期刊《Nature》上,标题为《Foundation model of neural activity predicts response to new stimulus types》。

学术背景
研究领域为计算神经科学(computational neuroscience)与人工智能的交叉领域。传统神经活动模型受限于训练数据的分布范围,难以泛化到新刺激类型(如合成或参数化刺激)。近年来,基于海量数据训练的“基础模型”(foundation models)在自然语言处理等领域展现出强大的泛化能力,但尚未被应用于神经科学。本研究旨在构建小鼠视觉皮层的动态功能模型,通过基础模型框架预测神经元对任意自然视频的响应,并探索其跨小鼠、跨刺激域及解剖学特征的泛化能力。

研究流程与方法
1. 数据采集与预处理
- 研究对象:14只清醒行为小鼠的视觉皮层神经元,覆盖初级视觉皮层(V1)和多个高阶视觉区(如LM、AL、RL等),总计约135,000个神经元。
- 刺激类型:自然视频、静态自然图像、参数化刺激(如漂移Gabor滤波器、闪烁高斯点、方向性粉红噪声等)。
- 技术方法:双光子钙成像(two-photon calcium imaging)记录神经元活动,结合眼动追踪与行为监测(如跑步速度、瞳孔直径)。

  1. 模型架构设计
    研究团队开发了模块化人工神经网络(ANN),包含四个核心模块:

    • Perspective模块:通过光线追踪(ray tracing)校正小鼠视角差异,将刺激视频映射到视网膜坐标系。
    • Modulation模块:长短期记忆网络(LSTM)整合行为数据(如运动状态、瞳孔变化),调制神经活动。
    • Core模块:结合3D卷积(3D convolutions)与循环神经网络(LSTM),提取视觉-行为联合表征。
    • Readout模块:线性映射核心模块输出到单个神经元的响应,支持空间位置与特征权重的动态学习。
  2. 训练与验证

    • 基础模型训练:使用8只小鼠的约66,000个神经元数据(总计900分钟自然视频响应)训练共享的“Foundation Core”。
    • 迁移学习测试:冻结核心模块参数,仅微调新小鼠的Perspective、Modulation和Readout模块,验证其在小样本下的泛化能力。
    • 跨域预测:测试模型对未训练刺激域(如相干运动、噪声模式)的响应预测准确性。
  3. 解剖学关联分析
    结合MICrONS(Machine Intelligence from Cortical Networks)数据集,验证模型功能权重对神经元解剖类型(如兴奋性神经元亚型)、树突形态及突触连接的预测能力。

主要结果
1. 神经响应预测性能
- 在自然视频任务中,模型预测准确率(中位归一化相关系数ccnorm)达0.76,较此前最优模型提升25-46%。
- 仅需30分钟训练数据即可适配新小鼠,显著优于需60分钟数据的个体化模型(图3)。

  1. 跨刺激域泛化

    • 模型成功预测神经元对参数化刺激的响应,如漂移Gabor滤波器(ccnorm>0.55)和随机点运动图(图3d-g)。
    • 方向选择性(DSI)和空间调谐(SSI)的体内-体外估计高度一致(图4),验证了模型对经典功能特性的捕捉能力。
  2. 解剖学预测

    • 功能权重(readout weights)可区分视觉皮层区域(平衡准确率68%,图5d)和11种兴奋性神经元类型(平衡准确率32%,图5e)。
    • 在MICrONS数据中,模型预测的突触连接模式与真实解剖数据显著相关(见补充研究24,25)。

结论与意义
本研究首次将基础模型范式引入神经科学,构建了小鼠视觉皮层的功能“数字孪生”(digital twin)。其科学价值体现在:
1. 方法论创新:模块化ANN设计解决了跨个体、跨刺激域的泛化难题,为大规模神经建模提供了可扩展框架。
2. 理论突破:揭示了神经元功能与解剖特征的统计规律,支持“功能-结构”统一编码假说。
3. 应用潜力:模型可替代部分体内实验(如参数化调谐分析),加速神经编码研究;其开源代码(GitHub: cajal/fnn)推动领域协作。

研究亮点
- 数据规模:迄今最大的视觉皮层神经活动数据集(135,000神经元)。
- 跨域泛化:首次实现单一模型对自然视频与合成刺激的统一预测。
- 多模态关联:功能模型直接预测解剖特征,突破了传统单模态分析的局限。

其他价值
研究团队公开了全部数据(BossDB: microns-minnie)与算法,为后续研究如自由行为建模、全脑尺度仿真奠定了基础。文中提出的CVT-LSTM架构(卷积视觉Transformer-LSTM)也为时序-空间联合建模提供了新思路。


(注:实际生成文本约2000字,此处为精简示例。完整报告可进一步扩展实验细节、图表引用及技术参数。)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com