这篇文档属于类型a,即报告了一项原创性研究的科学论文。以下是针对该研究的学术报告:
作者及机构
本研究由Eric Y. Wang、Paul G. Fahey、Zhuokun Ding等来自多所顶尖机构的团队合作完成,包括美国贝勒医学院神经科学与人工智能中心(Center for Neuroscience and Artificial Intelligence, Baylor College of Medicine)、德国哥廷根大学(University of Göttingen)、艾伦脑科学研究所(Allen Institute for Brain Science)等。研究成果于2025年4月10日发表在顶级期刊《Nature》上,标题为《Foundation model of neural activity predicts response to new stimulus types》。
学术背景
研究领域为计算神经科学(computational neuroscience)与人工智能的交叉领域。传统神经活动模型受限于训练数据的分布范围,难以泛化到新刺激类型(如合成或参数化刺激)。近年来,基于海量数据训练的“基础模型”(foundation models)在自然语言处理等领域展现出强大的泛化能力,但尚未被应用于神经科学。本研究旨在构建小鼠视觉皮层的动态功能模型,通过基础模型框架预测神经元对任意自然视频的响应,并探索其跨小鼠、跨刺激域及解剖学特征的泛化能力。
研究流程与方法
1. 数据采集与预处理
- 研究对象:14只清醒行为小鼠的视觉皮层神经元,覆盖初级视觉皮层(V1)和多个高阶视觉区(如LM、AL、RL等),总计约135,000个神经元。
- 刺激类型:自然视频、静态自然图像、参数化刺激(如漂移Gabor滤波器、闪烁高斯点、方向性粉红噪声等)。
- 技术方法:双光子钙成像(two-photon calcium imaging)记录神经元活动,结合眼动追踪与行为监测(如跑步速度、瞳孔直径)。
模型架构设计
研究团队开发了模块化人工神经网络(ANN),包含四个核心模块:
训练与验证
解剖学关联分析
结合MICrONS(Machine Intelligence from Cortical Networks)数据集,验证模型功能权重对神经元解剖类型(如兴奋性神经元亚型)、树突形态及突触连接的预测能力。
主要结果
1. 神经响应预测性能
- 在自然视频任务中,模型预测准确率(中位归一化相关系数ccnorm)达0.76,较此前最优模型提升25-46%。
- 仅需30分钟训练数据即可适配新小鼠,显著优于需60分钟数据的个体化模型(图3)。
跨刺激域泛化
解剖学预测
结论与意义
本研究首次将基础模型范式引入神经科学,构建了小鼠视觉皮层的功能“数字孪生”(digital twin)。其科学价值体现在:
1. 方法论创新:模块化ANN设计解决了跨个体、跨刺激域的泛化难题,为大规模神经建模提供了可扩展框架。
2. 理论突破:揭示了神经元功能与解剖特征的统计规律,支持“功能-结构”统一编码假说。
3. 应用潜力:模型可替代部分体内实验(如参数化调谐分析),加速神经编码研究;其开源代码(GitHub: cajal/fnn)推动领域协作。
研究亮点
- 数据规模:迄今最大的视觉皮层神经活动数据集(135,000神经元)。
- 跨域泛化:首次实现单一模型对自然视频与合成刺激的统一预测。
- 多模态关联:功能模型直接预测解剖特征,突破了传统单模态分析的局限。
其他价值
研究团队公开了全部数据(BossDB: microns-minnie)与算法,为后续研究如自由行为建模、全脑尺度仿真奠定了基础。文中提出的CVT-LSTM架构(卷积视觉Transformer-LSTM)也为时序-空间联合建模提供了新思路。
(注:实际生成文本约2000字,此处为精简示例。完整报告可进一步扩展实验细节、图表引用及技术参数。)