基于证据卷积神经网络的可信故障诊断与不确定性估计

分享自：
基于证据卷积神经网络的可信故障诊断与不确定性估计

期刊:IEEE Transactions on Industrial InformaticsDOI:10.1109/TII.2023.3241587
本文介绍了一项关于智能故障诊断的研究，题为《Trustworthy Fault Diagnosis with Uncertainty Estimation through Evidential Convolutional Neural Networks》，由Hanting Zhou、Wenhe Chen、Longsheng Cheng、Jing Liu和Min Xia等人合作完成，发表于2023年11月的《IEEE Transactions on Industrial Informatics》期刊上。该研究提出了一种基于证据理论（Evidence Theory）的卷积神经网络（Convolutional Neural Networks, CNNs）框架，旨在解决现有深度神经网络（Deep Neural Networks, DNNs）在开放世界场景中过度自信的问题，特别是在故障诊断任务中。
研究背景与动机随着智能制造和数字化制造的发展，工业设备的健康监测变得尤为重要。传统的故障诊断方法通常基于封闭世界假设（Closed-World Assumption），即测试数据与训练数据来自相同的分布。然而，在现实应用中，测试数据可能包含训练数据中未见过的新故障类型，即分布外（Out-of-Distribution, OOD）样本。现有的DNNs在面对OOD样本时，往往会以高置信度错误分类，导致故障诊断结果不可靠。因此，如何在开放世界场景中实现可信的故障诊断，并估计预测的不确定性，成为了一个重要的研究课题。
研究方法与流程本研究提出了一种基于证据理论的卷积神经网络（Evidential CNN），通过引入Dirichlet分布来替代传统的分类概率输出，从而实现对预测不确定性的估计。具体流程如下：
模型构建：研究选择了VGG网络（由Visual Geometry Group开发）作为基础结构，并在此基础上开发了一种改进的证据VGG网络（Evidential VGG, EVGG）。该网络不仅能够输出分类概率，还能通过证据理论生成Dirichlet分布，从而提供预测的不确定性估计。
损失函数设计：为了减少错误分类的证据支持，研究提出了一种风险校准的证据损失函数（Risk-Calibrated Evidential Loss Function）。该损失函数通过引入KL散度（Kullback-Leibler Divergence）作为惩罚项，减少了错误分类的证据支持，并优化了网络的权重。
实验验证：研究在两个公开的滚动轴承故障诊断数据集（CWRU和XJTU-SY）上进行了实验验证。实验结果表明，所提出的方法不仅能够准确分类已知故障类型，还能有效检测未知故障类型，并通过不确定性估计提供可信的诊断结果。
主要结果已知类别的分类性能：在CWRU数据集上，所提出的EVGG模型在三个不同任务中的测试准确率分别达到了99.65%、99.96%和99.47%，平均不确定性分别为6.70%、4.47%和7.14%。在XJTU-SY数据集上，模型的平均准确率为99.56%，平均不确定性为5.73%。
未知类别的检测性能：在CWRU数据集上，模型对未知类别的检测准确率分别为90.22%、79.78%和86.78%，平均不确定性分别为52.58%、49.25%和52.61%。在XJTU-SY数据集上，模型对未知类别的检测准确率分别为86%、85.33%和78.17%，平均不确定性为34.31%。
与现有方法的对比：与现有的深度学习方法相比，所提出的EVGG模型在已知类别的分类准确率上表现更优，并且在开放集故障诊断（Open-Set Fault Diagnosis, OSFD）任务中表现出了更高的可靠性和鲁棒性。
结论与意义本研究提出了一种基于证据理论的卷积神经网络框架，能够在开放集故障诊断任务中提供可信的故障诊断结果。通过引入Dirichlet分布和风险校准的证据损失函数，模型不仅能够准确分类已知故障类型，还能有效检测未知故障类型，并通过不确定性估计避免过度自信的错误分类。实验结果表明，该方法在滚动轴承故障诊断任务中表现出了优异的性能，具有较高的科学价值和实际应用潜力。
研究亮点新颖的模型框架：本研究首次将证据理论引入卷积神经网络，提出了一种新的EVGG模型，能够在开放集故障诊断任务中提供可信的诊断结果。
不确定性估计：通过引入Dirichlet分布，模型能够估计预测的不确定性，从而避免过度自信的错误分类。
风险校准的损失函数：研究提出了一种风险校准的证据损失函数，能够减少错误分类的证据支持，并优化网络的权重。
未来研究方向尽管本研究取得了显著的成果，但仍有一些局限性需要进一步研究。例如，VGG网络结构较为复杂，计算资源需求较高，未来可以开发更紧凑的网络结构以提高训练和测试速度。此外，模型中的误分类风险矩阵仍依赖于专家知识，未来可以通过数据驱动的方法进行优化。最后，该方法在实际工业设备中的应用还需要进一步验证，特别是在强噪声干扰环境下的表现。
参考文献本文引用了大量相关文献，涵盖了深度学习、不确定性估计、故障诊断等领域的最新研究成果，为读者提供了丰富的背景知识和进一步研究的参考。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问