分享自:

基于证据卷积神经网络的可信故障诊断与不确定性估计

期刊:IEEE Transactions on Industrial InformaticsDOI:10.1109/TII.2023.3241587

本文介绍了一项关于智能故障诊断的研究,题为《Trustworthy Fault Diagnosis with Uncertainty Estimation through Evidential Convolutional Neural Networks》,由Hanting Zhou、Wenhe Chen、Longsheng Cheng、Jing Liu和Min Xia等人合作完成,发表于2023年11月的《IEEE Transactions on Industrial Informatics》期刊上。该研究提出了一种基于证据理论(Evidence Theory)的卷积神经网络(Convolutional Neural Networks, CNNs)框架,旨在解决现有深度神经网络(Deep Neural Networks, DNNs)在开放世界场景中过度自信的问题,特别是在故障诊断任务中。

研究背景与动机

随着智能制造和数字化制造的发展,工业设备的健康监测变得尤为重要。传统的故障诊断方法通常基于封闭世界假设(Closed-World Assumption),即测试数据与训练数据来自相同的分布。然而,在现实应用中,测试数据可能包含训练数据中未见过的新故障类型,即分布外(Out-of-Distribution, OOD)样本。现有的DNNs在面对OOD样本时,往往会以高置信度错误分类,导致故障诊断结果不可靠。因此,如何在开放世界场景中实现可信的故障诊断,并估计预测的不确定性,成为了一个重要的研究课题。

研究方法与流程

本研究提出了一种基于证据理论的卷积神经网络(Evidential CNN),通过引入Dirichlet分布来替代传统的分类概率输出,从而实现对预测不确定性的估计。具体流程如下:

  1. 模型构建:研究选择了VGG网络(由Visual Geometry Group开发)作为基础结构,并在此基础上开发了一种改进的证据VGG网络(Evidential VGG, EVGG)。该网络不仅能够输出分类概率,还能通过证据理论生成Dirichlet分布,从而提供预测的不确定性估计。

  2. 损失函数设计:为了减少错误分类的证据支持,研究提出了一种风险校准的证据损失函数(Risk-Calibrated Evidential Loss Function)。该损失函数通过引入KL散度(Kullback-Leibler Divergence)作为惩罚项,减少了错误分类的证据支持,并优化了网络的权重。

  3. 实验验证:研究在两个公开的滚动轴承故障诊断数据集(CWRU和XJTU-SY)上进行了实验验证。实验结果表明,所提出的方法不仅能够准确分类已知故障类型,还能有效检测未知故障类型,并通过不确定性估计提供可信的诊断结果。

主要结果

  1. 已知类别的分类性能:在CWRU数据集上,所提出的EVGG模型在三个不同任务中的测试准确率分别达到了99.65%、99.96%和99.47%,平均不确定性分别为6.70%、4.47%和7.14%。在XJTU-SY数据集上,模型的平均准确率为99.56%,平均不确定性为5.73%。

  2. 未知类别的检测性能:在CWRU数据集上,模型对未知类别的检测准确率分别为90.22%、79.78%和86.78%,平均不确定性分别为52.58%、49.25%和52.61%。在XJTU-SY数据集上,模型对未知类别的检测准确率分别为86%、85.33%和78.17%,平均不确定性为34.31%。

  3. 与现有方法的对比:与现有的深度学习方法相比,所提出的EVGG模型在已知类别的分类准确率上表现更优,并且在开放集故障诊断(Open-Set Fault Diagnosis, OSFD)任务中表现出了更高的可靠性和鲁棒性。

结论与意义

本研究提出了一种基于证据理论的卷积神经网络框架,能够在开放集故障诊断任务中提供可信的故障诊断结果。通过引入Dirichlet分布和风险校准的证据损失函数,模型不仅能够准确分类已知故障类型,还能有效检测未知故障类型,并通过不确定性估计避免过度自信的错误分类。实验结果表明,该方法在滚动轴承故障诊断任务中表现出了优异的性能,具有较高的科学价值和实际应用潜力。

研究亮点

  1. 新颖的模型框架:本研究首次将证据理论引入卷积神经网络,提出了一种新的EVGG模型,能够在开放集故障诊断任务中提供可信的诊断结果。
  2. 不确定性估计:通过引入Dirichlet分布,模型能够估计预测的不确定性,从而避免过度自信的错误分类。
  3. 风险校准的损失函数:研究提出了一种风险校准的证据损失函数,能够减少错误分类的证据支持,并优化网络的权重。

未来研究方向

尽管本研究取得了显著的成果,但仍有一些局限性需要进一步研究。例如,VGG网络结构较为复杂,计算资源需求较高,未来可以开发更紧凑的网络结构以提高训练和测试速度。此外,模型中的误分类风险矩阵仍依赖于专家知识,未来可以通过数据驱动的方法进行优化。最后,该方法在实际工业设备中的应用还需要进一步验证,特别是在强噪声干扰环境下的表现。

参考文献

本文引用了大量相关文献,涵盖了深度学习、不确定性估计、故障诊断等领域的最新研究成果,为读者提供了丰富的背景知识和进一步研究的参考。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com