分享自:

具有多路复用率和首次脉冲时间编码的人工视觉神经元

期刊:Nature CommunicationsDOI:10.1038/s41467-024-48103-9

本文档属于类型a,即报告了一项原创性研究。以下是基于文档内容生成的学术报告:


人工视觉神经元的多重编码机制及其在自动驾驶中的应用

作者与机构
本研究的作者包括Fanfan Li、Dingwei Li、Chuanqing Wang、Guolei Liu、Rui Wang、Huihui Ren、Yingjie Tang、Yan Wang、Yitong Chen、Kun Liang、Qi Huang、Mohamad Sawan、Min Qiu、Hong Wang和Bowen Zhu。他们分别来自浙江大学、西湖大学、西安电子科技大学等机构。该研究于2024年发表在《Nature Communications》期刊上。

学术背景
本研究的主要科学领域是神经形态计算(neuromorphic computing)和人工视觉系统。人类视觉神经元通过事件驱动的尖峰信号进行高效通信,而传统的硅基图像传感器则依赖于帧驱动的方式,导致能量效率低下。这种生物系统与机器视觉技术之间的能量预算不匹配,促使研究人员开发人工视觉神经元,用于尖峰神经网络(Spiking Neural Network, SNN)。然而,现有的人工视觉神经元缺乏多重数据编码机制,限制了其在模拟生物视觉感知能力方面的表现。本研究旨在开发一种能够同时实现速率编码(rate coding)和首次尖峰时间编码(time-to-first-spike coding, TTFS)的人工视觉神经元,以提升SNN的计算能力和效率。

研究流程
研究流程包括以下几个主要步骤:

  1. 人工视觉神经元的设计与制造
    研究团队设计了一种基于In2O3光电突触晶体管和NbOx Mott忆阻器的人工视觉神经元。In2O3晶体管模拟生物视网膜中的光感受器,而NbOx忆阻器则模拟视网膜神经节细胞。这两种器件的集成使得人工神经元能够同时实现速率编码和TTFS编码。

  2. 器件特性测试
    研究团队对NbOx忆阻器和In2O3晶体管进行了详细的电学特性测试。NbOx忆阻器表现出优异的阈值开关特性,能够在高阻态和低阻态之间快速切换,且具有超过10^10次的循环耐久性。In2O3晶体管则表现出光电突触可塑性,能够通过光脉冲调节其电导。

  3. 多重编码机制的实现
    通过光脉冲和电脉冲的输入,研究团队测试了人工神经元的尖峰行为。结果表明,随着光强度的增加,尖峰频率从0.35 MHz增加到1.85 MHz,而首次尖峰时间从13.00 μs缩短到1.04 μs。这种速率和TTFS的融合编码机制能够高效地编码外部视觉信息。

  4. SNN模型的构建与测试
    研究团队构建了一个基于ResNet-18架构的SNN模型,并利用该模型对自动驾驶任务中的转向角和速度进行预测。模型采用了速率编码、TTFS编码和速率-时间融合编码(RTF coding)三种编码方式。测试结果表明,RTF编码在预测精度和能量效率方面均优于单一编码方式。

主要结果
1. 人工神经元的性能
人工神经元表现出优异的尖峰编码能力,尖峰频率和首次尖峰时间均可通过光强度进行调节。此外,该神经元具有低能量消耗(每尖峰1.06 nJ)和高耐久性(超过10^10次循环)。

  1. SNN模型的预测精度
    在自动驾驶任务中,RTF编码的SNN模型表现出最高的预测精度,其损失函数低于0.5。相比之下,速率编码和TTFS编码的模型在复杂路况下的预测精度较低。

  2. 多重编码机制的优势
    RTF编码结合了速率编码和TTFS编码的优点,能够在复杂视觉环境中实现快速和精确的感知。这种编码机制在自动驾驶、机器人视觉等应用中具有重要的潜在价值。

结论
本研究开发了一种能够同时实现速率编码和TTFS编码的人工视觉神经元,并通过SNN模型验证了其在自动驾驶任务中的高效性。该研究为开发高效尖峰神经形态硬件提供了新的思路,并展示了多重编码机制在复杂视觉感知中的潜力。

研究亮点
1. 新颖的人工神经元设计
通过集成In2O3光电突触晶体管和NbOx Mott忆阻器,研究团队实现了生物视觉系统的仿生模拟。

  1. 多重编码机制的成功实现
    速率编码和TTFS编码的融合使得人工神经元能够在复杂环境中高效处理视觉信息。

  2. 高效SNN模型的构建
    基于RTF编码的SNN模型在自动驾驶任务中表现出优异的预测精度和能量效率。

其他有价值的内容
研究团队还展示了人工神经元在动态视觉编码中的潜力,例如通过学习-遗忘行为模拟生物视觉系统的记忆机制。此外,该研究为未来开发更高效的神经形态计算硬件提供了重要的实验数据和理论支持。


这篇报告详细介绍了该研究的背景、流程、结果和意义,为相关领域的研究人员提供了全面的参考。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com