神经网络活动基础模型预测新刺激类型响应

分享自：
神经网络活动基础模型预测新刺激类型响应

医学
信息科学
期刊:natureDOI:10.1038/s41586-025-08829-y
【点击此处】阅读全文、收藏及针对性提问
这篇文档属于类型a，即报告了一项原创性研究的科学论文。以下是针对该研究的学术报告：
作者及机构
 本研究由Eric Y. Wang、Paul G. Fahey、Zhuokun Ding等来自多所顶尖机构的团队合作完成，包括美国贝勒医学院神经科学与人工智能中心（Center for Neuroscience and Artificial Intelligence, Baylor College of Medicine）、德国哥廷根大学（University of Göttingen）、艾伦脑科学研究所（Allen Institute for Brain Science）等。研究成果于2025年4月10日发表在顶级期刊《Nature》上，标题为《Foundation model of neural activity predicts response to new stimulus types》。
学术背景
 研究领域为计算神经科学（computational neuroscience）与人工智能的交叉领域。传统神经活动模型受限于训练数据的分布范围，难以泛化到新刺激类型（如合成或参数化刺激）。近年来，基于海量数据训练的“基础模型”（foundation models）在自然语言处理等领域展现出强大的泛化能力，但尚未被应用于神经科学。本研究旨在构建小鼠视觉皮层的动态功能模型，通过基础模型框架预测神经元对任意自然视频的响应，并探索其跨小鼠、跨刺激域及解剖学特征的泛化能力。
研究流程与方法
 1. 数据采集与预处理
 - 研究对象：14只清醒行为小鼠的视觉皮层神经元，覆盖初级视觉皮层（V1）和多个高阶视觉区（如LM、AL、RL等），总计约135,000个神经元。
 - 刺激类型：自然视频、静态自然图像、参数化刺激（如漂移Gabor滤波器、闪烁高斯点、方向性粉红噪声等）。
 - 技术方法：双光子钙成像（two-photon calcium imaging）记录神经元活动，结合眼动追踪与行为监测（如跑步速度、瞳孔直径）。
模型架构设计
 研究团队开发了模块化人工神经网络（ANN），包含四个核心模块：
Perspective模块：通过光线追踪（ray tracing）校正小鼠视角差异，将刺激视频映射到视网膜坐标系。
 
Modulation模块：长短期记忆网络（LSTM）整合行为数据（如运动状态、瞳孔变化），调制神经活动。
 
Core模块：结合3D卷积（3D convolutions）与循环神经网络（LSTM），提取视觉-行为联合表征。
 
Readout模块：线性映射核心模块输出到单个神经元的响应，支持空间位置与特征权重的动态学习。
 
训练与验证
基础模型训练：使用8只小鼠的约66,000个神经元数据（总计900分钟自然视频响应）训练共享的“Foundation Core”。
 
迁移学习测试：冻结核心模块参数，仅微调新小鼠的Perspective、Modulation和Readout模块，验证其在小样本下的泛化能力。
 
跨域预测：测试模型对未训练刺激域（如相干运动、噪声模式）的响应预测准确性。
 
解剖学关联分析
 结合MICrONS（Machine Intelligence from Cortical Networks）数据集，验证模型功能权重对神经元解剖类型（如兴奋性神经元亚型）、树突形态及突触连接的预测能力。
主要结果
 1. 神经响应预测性能
 - 在自然视频任务中，模型预测准确率（中位归一化相关系数ccnorm）达0.76，较此前最优模型提升25-46%。
 - 仅需30分钟训练数据即可适配新小鼠，显著优于需60分钟数据的个体化模型（图3）。
跨刺激域泛化
模型成功预测神经元对参数化刺激的响应，如漂移Gabor滤波器（ccnorm>0.55）和随机点运动图（图3d-g）。
 
方向选择性（DSI）和空间调谐（SSI）的体内-体外估计高度一致（图4），验证了模型对经典功能特性的捕捉能力。
 
解剖学预测
功能权重（readout weights）可区分视觉皮层区域（平衡准确率68%，图5d）和11种兴奋性神经元类型（平衡准确率32%，图5e）。
 
在MICrONS数据中，模型预测的突触连接模式与真实解剖数据显著相关（见补充研究24,25）。
 
结论与意义
 本研究首次将基础模型范式引入神经科学，构建了小鼠视觉皮层的功能“数字孪生”（digital twin）。其科学价值体现在：
 1. 方法论创新：模块化ANN设计解决了跨个体、跨刺激域的泛化难题，为大规模神经建模提供了可扩展框架。
 2. 理论突破：揭示了神经元功能与解剖特征的统计规律，支持“功能-结构”统一编码假说。
 3. 应用潜力：模型可替代部分体内实验（如参数化调谐分析），加速神经编码研究；其开源代码（GitHub: cajal/fnn）推动领域协作。
研究亮点
 - 数据规模：迄今最大的视觉皮层神经活动数据集（135,000神经元）。
 - 跨域泛化：首次实现单一模型对自然视频与合成刺激的统一预测。
 - 多模态关联：功能模型直接预测解剖特征，突破了传统单模态分析的局限。
其他价值
 研究团队公开了全部数据（BossDB: microns-minnie）与算法，为后续研究如自由行为建模、全脑尺度仿真奠定了基础。文中提出的CVT-LSTM架构（卷积视觉Transformer-LSTM）也为时序-空间联合建模提供了新思路。
（注：实际生成文本约2000字，此处为精简示例。完整报告可进一步扩展实验细节、图表引用及技术参数。）
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问