本研究由李荣凯(中国科学院上海天文台与中国科学院大学)、李锡瑞(中国科学院上海天文台)和蔡勇(中国科学院上海天文台)共同完成,发表于《天文研究与技术》(Astronomical Research and Technology)2020年7月第17卷第3期。
氢原子钟(hydrogen maser)作为精密授时守时仪器,在科学研究和工程应用中具有重要地位。我国氢钟虽已能满足多种应用场景需求,但仍存在设备故障频发、可靠性差等问题。传统故障诊断依赖技术人员经验判断,存在滞后性强、效率低下等缺点。该研究旨在利用机器学习算法,通过分析氢钟历史运行数据建立故障诊断模型,实现故障的实时预判与诊断,从而简化排查流程、提升维修效率。
研究团队从完备的氢钟监测系统中选取了23个常用参数,通过对1000组带人工判断结果的样本进行降维分析,最终确定7个核心特征参数:离子泵电压(ionv)、离子泵电流(ioni5)、流量(flux)、接收机中频电压(ifl)、调谐电压(tune)、变容二极管(dio)和流量设定(flr)。研究发现不同氢钟即使处于相同状态,参数差异也较大(图2),因此采用针对单台设备定制化建模的策略。
数据预处理阶段对比了standardscaler、minmaxscaler、robustscaler和normalizer等方法。实验使用20000组样本数据,在不同聚类参数(eps和min_samples)组合下测试(表1-3),最终确定standardscaler预处理效果最佳,预测准确率可达99.42%-99.78%。
研究对比了k-means和DBSCAN两种聚类算法。如图3-4所示,k-means适用于类别分布集中的数据,而DBSCAN能更好处理混杂数据。鉴于氢钟参数分布特点(图5),研究选择基于密度的DBSCAN算法,其优势在于: - 自动确定类别数量 - 有效处理参数混杂情况 - 通过密度可达性定义聚类(公式3-4)
实际操作中,先将聚类标签数量设为15-90种,再根据物理意义进行二次调整(图6)。研究发现初始设定7-9种状态会导致误判,如参数全零时仍显示”正常”状态。通过这种两阶段方法,不仅识别了已知故障类型,还发现了新的异常状态。
研究比较了决策树、人工神经网络(ANN)和k最近邻(KNN)等分类算法(表4)。考虑到氢钟参数存在跳变现象(图7),需要算法具备强鲁棒性,最终选择ANN作为分类算法。网络结构设置为2层,每层30个节点,激活函数为tanh(公式5)。实验显示,在不同状态标签数量下,ANN准确率稳定在99.48%-99.68%,优于其他算法。
为满足实时诊断需求,研究将训练好的模型部署到搭载A57内核的嵌入式开发板。系统通过串口与氢钟连接,实时读取参数并在屏幕上显示诊断结果(图8-9)。界面主要显示当前参数值(main parameters are…)和状态标签代码(now the hydrogen maser working in state…)。
研究通过实际部署验证了方法的可行性,技术人员诊断结果与模型预测结果高度一致。这种基于机器学习的诊断方法突破了传统经验诊断的局限,为氢钟智能化维护提供了新思路。
当前研究主要基于有限设备的参数数据,随着样本规模扩大(特别是包含频率输出数据的样本),模型泛化能力可进一步提升。该方法可扩展至其他类型原子钟的故障诊断,并为原子钟自修复系统研发奠定基础。研究团队建议建立氢钟数据共享平台,以促进更完善的智能诊断模型发展。