这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:
本研究由来自Columbia University、University of Pennsylvania、Northwestern University及The International Brain Laboratory (IBL)的多位学者合作完成,主要作者包括Yizi Zhang、Yanchen Wang、Mehdi Azabou等,所有贡献者均标注为同等贡献(*equal contribution*)。研究发表于Proceedings of the 42nd International Conference on Machine Learning (PMLR 267),会议于2025年在加拿大温哥华举行。
研究领域:本研究属于系统神经科学(systems neuroscience)与机器学习交叉领域,聚焦于神经活动与行为之间的双向关系建模。
研究动机:传统的大规模神经数据分析方法仅能单向预测——或从行为预测神经活动(编码,encoding),或从神经活动预测行为(解码,decoding)。这种局限性阻碍了对神经-行为双向动态关系的全面理解。
科学问题:如何构建一个统一的、可扩展的模型,同时实现高精度的神经编码与解码?
目标:开发一种名为NEDS(Neural Encoding and Decoding at Scale)的多模态、多任务模型,通过创新的掩码策略(masking strategy)整合编码与解码任务,并验证其在跨动物数据集上的泛化能力。
核心创新:提出多任务掩码策略(multi-task-masking),交替应用以下四种掩码模式:
1. 神经掩码(neural masking):掩盖神经活动,从行为预测神经活动(编码任务)。
2. 行为掩码(behavior masking):掩盖行为变量,从神经活动预测行为(解码任务)。
3. 模态内随机掩码(within-modality masking):在单一模态(神经或行为)内随机掩盖并重建数据。
4. 跨模态随机掩码(cross-modal masking):跨神经与行为模态随机掩盖并联合重建。
模型实现:
- 架构:基于Transformer的多模态模型,包含独立的模态分词器(tokenizer)、共享的Transformer编码器和模态特定解码器。
- 关键设计:
- 引入旋转位置嵌入(rotary position embedding, RoPE)以捕捉时序信息。
- 使用会话特定嵌入(session embedding)适应多动物数据差异。
- 训练目标:通过混合损失函数(泊松负对数似然用于神经活动,均方误差/交叉熵用于行为变量)优化模型。
通过单独掩码行为变量,发现运动相关变量(轮速、胡须运动)对神经活动的解释力强于认知变量(选择、区块先验),与IBL既往研究一致(表1)。
意外发现:NEDS的神经元嵌入(neuron embedding)无需显式训练即可高精度预测神经元所属脑区(分类准确率83%),表明模型自发学习了脑区特异性表征(图4)。
此报告全面涵盖了研究的背景、方法、结果与意义,突出其创新性与潜在影响,可作为同行学者了解该工作的参考。