分享自:

人类视觉启发的模糊卷积神经网络

期刊:南通大学学报(自然科学版)DOI:10.12194/j.ntu.20241219002

顾苏杭、李晨阳和朱培逸等作者在《南通大学学报(自然科学版)》上发表了一篇题为“人类视觉启发的模糊卷积神经网络”的研究论文。该论文于2025年5月14日网络首发,研究机构包括盐城工学院电气工程学院和苏州工学院电气与自动化工程学院。该研究属于深度学习领域,特别是卷积神经网络(Convolutional Neural Networks, CNN)在图像分类中的应用。研究的背景是,尽管CNN在图像分类任务中表现出色,但图像数据中的不确定性会在特征提取过程中逐层传播,影响模型的分类性能。为了解决这一问题,作者提出了一种基于人类视觉启发的模糊卷积神经网络,旨在通过模拟人类视觉的处理机制,提升CNN的特征表示能力和分类性能。

该研究的主要目标是设计一种新的卷积神经网络架构,结合模糊逻辑技术,模拟人类视觉系统中的中央视觉和周围视觉机制,以增强特征提取的精确性和可解释性。具体来说,作者提出了一种包含中央视觉和周围视觉的卷积操作,中央视觉用于提取目标的主要特征,而周围视觉通过模糊规则推理增强目标特征的表示能力。通过这种方式,研究希望解决图像数据中的不确定性问题,并提升CNN的分类性能。

研究的工作流程包括以下几个主要步骤:首先,作者设计了基于中央视觉和周围视觉的卷积操作。中央视觉的卷积操作与传统CNN的卷积操作类似,用于提取目标的主要特征。而周围视觉的卷积操作则通过模糊规则推理实现,模糊规则基于0阶TSK(Takagi-Sugeno-Kang)模糊系统。模糊规则的生成通过固定模糊划分和随机组合高斯隶属度函数的策略实现,确保模糊规则具有良好的可解释性。其次,作者将模糊化的数据块与原始数据块进行融合,生成新的数据块,并在新的数据块上进行卷积操作,生成新的特征图。这一过程通过引入模糊逻辑技术,增强了特征提取的表示能力,并提升了卷积过程的可解释性。最后,作者在MNIST、17flowers和BreastMNIST数据集上进行了实验,验证了所提方法的有效性。

实验结果表明,所提出的模糊卷积神经网络在MNIST、17flowers和BreastMNIST数据集上的分类准确率分别为98.6%、89.0%和82.5%,均优于传统的CNN模型、基于随机生成权值的模糊卷积神经网络(ConvFNN)以及挤压与激励网络(SENet)。特别是在特征图可视化分析中,所提方法能够更全面地捕获目标的完整特征表达,并显著减少特征遗漏现象。此外,模糊逻辑技术的引入有效缓解了图像中的噪声干扰,使得网络提取的特征更加精确。

研究的结论是,所提出的模糊卷积神经网络通过模拟人类视觉系统中的中央视觉和周围视觉机制,结合模糊逻辑技术,有效提升了CNN的特征表示能力和分类性能。该方法不仅在理论上与NIN(Network in Network)等价,还通过模糊规则推理增强了卷积过程的可解释性。实验结果表明,该方法在图像分类任务中具有较高的准确性和鲁棒性,特别是在处理包含噪声和不确定性的图像数据时表现优异。

该研究的亮点在于其创新性地将人类视觉机制与模糊逻辑技术相结合,提出了一种新的卷积神经网络架构。这一方法不仅提升了CNN的特征提取能力,还增强了卷积过程的可解释性,为深度学习领域的研究提供了新的思路。此外,所提方法在多个公开数据集上的实验结果验证了其有效性,展示了其在图像分类任务中的广泛应用潜力。

该研究为深度学习领域提供了一种新的卷积神经网络设计思路,通过结合人类视觉机制和模糊逻辑技术,有效提升了图像分类任务的性能。该研究不仅具有重要的科学价值,还在实际应用中展示了广泛的应用前景。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com