分享自:

神经群体解码的统一可扩展框架

期刊:37th conference on neural information processing systems (NeurIPS 2023)

这篇文档属于类型a,是一篇关于神经群体解码(neural population decoding)的原创研究论文。以下是详细的学术报告:


主要作者及机构

本研究由来自Georgia Tech、Mila、Université de Montréal和McGill University的多位研究者合作完成。第一作者为Mehdi Azabou,通讯作者为Mehdi Azabou和Eva L. Dyer。论文发表于*37th Conference on Neural Information Processing Systems (NeurIPS 2023)*。

学术背景

研究领域为计算神经科学(computational neuroscience)与深度学习(deep learning)的交叉领域。近年来,大规模预训练模型(如GPT)在自然语言处理等领域展现了强大的潜力,但在神经科学中,由于神经记录数据的异质性(如不同个体、不同实验条件下的神经元活动缺乏对应关系),构建统一的神经解码模型面临巨大挑战。本研究旨在开发一种可扩展的框架,整合多源神经记录数据,并通过预训练模型实现高效的神经活动解码。

研究流程

研究分为以下几个关键步骤:

  1. 数据收集与预处理

    • 研究整合了来自7只非人灵长类动物(nonhuman primates, NHPs)的158次神经记录会话(sessions),涵盖27,373个神经单元(units)和超过100小时的记录数据。
    • 数据来源包括运动皮层(primary motor cortex, M1)、前运动皮层(premotor cortex, PMD)和初级体感皮层(primary somatosensory cortex, S1)。
    • 任务类型包括中心-外展任务(center-out task, CO)和随机目标任务(random target task, RT),行为数据(如手部速度)与神经活动同步记录。
  2. 神经活动表征与标记化(tokenization)

    • 提出了一种新颖的“神经标记化”方法,将单个神经元的动作电位(spikes)转化为离散标记(tokens),保留神经活动的时间精细结构。
    • 每个标记包含两个信息:
      • 神经元嵌入(unit embedding):通过可学习的嵌入向量表示神经元身份。
      • 时间戳(timestamp):记录动作电位的发生时间。
    • 采用稀疏表征(sparse representation)提升计算效率,避免传统分箱(binning)方法的时间分辨率损失。
  3. 模型架构与训练

    • 基于PerceiverIO架构,设计了一种跨注意力(cross-attention)机制,将输入标记压缩为潜在标记(latent tokens),并通过自注意力(self-attention)块建模神经群体动态。
    • 引入旋转位置编码(rotary position encoding, RoPE)捕捉神经活动的相对时间关系。
    • 训练目标为解码行为变量(如手部速度),采用均方误差(MSE)损失函数。
  4. 模型评估与迁移学习

    • 在单会话(single-session)和多会话(multi-session)任务中测试模型性能,结果显示多会话预训练模型(如POYO-MP和POYO-1)显著优于单会话模型。
    • 提出“神经元身份识别”(unit identification)方法,通过冻结模型权重、仅学习新神经元的嵌入,实现少量样本(few-shot)的快速迁移。
    • 在未见过的动物和任务中(如Neural Latents Benchmark数据集),模型通过微调(fine-tuning)仍能保持高性能。

主要结果

  1. 单会话解码性能

    • 在100个单会话模型中,平均解码精度(R²)为0.9347(CO任务)和0.8402(RT任务),优于传统方法(如Wiener滤波器和GRU)。
  2. 多会话预训练的优势

    • POYO-MP模型(24层)在CO和RT任务中的R²分别达到0.9512和0.8738,且对小样本数据集的提升更为显著。
    • 模型规模(参数量)和数据量的增加均能提升解码性能,尤其是复杂任务(如RT)。
  3. 迁移学习的有效性

    • 在未参与训练的动物数据中,仅通过神经元身份识别即可达到接近单会话模型的性能(R²=0.9675 vs. 0.9682)。
    • 全模型微调后,解码精度进一步提升(R²=0.9708)。

结论与意义

  1. 科学价值

    • 首次实现了跨个体、跨任务的大规模神经解码模型,为神经科学中的“基础模型”(foundation model)提供了可行路径。
    • 揭示了神经群体活动的共享动力学特征,为理解大脑信息处理机制提供了新工具。
  2. 应用价值

    • 在脑机接口(brain-machine interfaces, BMIs)和神经疾病建模中具有潜在应用,可加速新数据集的解码与分析。
    • 开源模型(POYO-MP和POYO-1)为社区提供了重要资源。

研究亮点

  1. 方法创新

    • 提出基于稀疏标记化的神经活动表征方法,解决了传统分箱方法的局限性。
    • 设计了一种可扩展的Transformer架构,支持动态神经元数量的输入。
  2. 数据规模

    • 整合了迄今最大规模的跨实验室神经记录数据,涵盖多种行为和实验条件。
  3. 迁移学习框架

    • 通过神经元身份识别和微调策略,实现了对新数据集的快速适配,为神经解码的泛化性提供了新思路。

其他有价值内容

  • 论文附录详细分析了神经元嵌入空间的聚类特性,发现其能反映神经元的功能相似性。
  • 未来方向包括扩展至自监督学习(self-supervised learning)和更多脑区数据。

以上内容完整涵盖了研究的背景、方法、结果与意义,可作为学术交流的全面参考。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com