分享自:

北京交通大学-RAO转向架故障诊断数据集深度教程

期刊:IEEE AccessDOI:10.1109/access.2025.3551603

BJTU-RAO转向架数据集:轨道交通故障诊断领域的重要公开数据集

作者及发表信息
本文由北京交通大学(Beijing Jiaotong University, BJTU)主导的多机构团队合作完成,通讯作者为IEEE高级会员Yong Qin教授。研究团队包括来自BJTU轨道交通控制与安全国家重点实验室、美国西新英格兰大学工业工程系、北京仪器仪表经济技术研究所、纽约大学坦登工程学院的学者。论文于2025年3月19日发表在IEEE Access期刊,数字对象标识符(DOI)为10.1109/ACCESS.2025.3551603。

学术背景与研究目标
轨道交通作为现代城市交通的核心,其安全性与可靠性至关重要。转向架(bogie)作为列车的关键子系统,其传动系统(包括驱动齿轮箱、轴箱和牵引电机)的健康状态直接影响列车运行安全。然而,现有公开故障数据集(如CWRU轴承数据集、PU轴承数据集等)多针对单一旋转部件(如轴承或齿轮),缺乏针对列车传动系统多组件耦合故障的高质量数据。为此,BJTU团队发布了全球首个面向列车传动系统的公开故障数据集——BJTU-RAO Bogie Datasets,旨在为故障诊断算法开发、预测性维护(predictive maintenance, PM)及算法评估提供标准化数据支持。

数据集的核心内容与构建方法
1. 实验平台设计
- 平台按1:2比例复现真实地铁转向架结构,包含三相异步电机、减速齿轮箱、轴箱及电液负载装置,模拟列车直线行驶与弯道工况。
- 传感器部署高度还原实际列车监测点,采集 24通道信号,包括三轴振动加速度(vibration acceleration)、三相电流(three-phase current)、转速(rotational speed)及声强(sound intensity),采样频率统一为64 kHz。

  1. 故障类型与工况覆盖

    • 故障模拟:通过人工损伤(如电火花加工、机械刻蚀)在电机、齿轮箱和轴箱上引入 51种健康状态(1种正常状态 + 50种故障状态),涵盖单故障(如齿轮断齿)、组件级复合故障(如齿轮箱轴承内圈故障与齿轮磨损共存)及系统级复合故障(如电机短路与轴箱轴承故障并发)。
    • 工况多样性:每种状态在 9种工作条件 下采集数据,包括不同电机转速(模拟列车速度变化)和横向载荷(0 kN、±10 kN,模拟直线与弯道受力)。
  2. 数据组织与公开性

    • 数据集以CSV文件存储,按健康状态标签分类,每个样本包含10秒时长数据。文件命名规范为:数据监测对象_健康状态标签_电机转速_横向载荷.csv
    • 数据可通过百度网盘或Google Drive公开下载,并已纳入中国国家标准GB/T 43555—2023《智能服务—预测性维护—算法评价方法》的测试数据库。

数据集的技术特点与优势
1. 专业性
- 实验平台设计基于真实转向架参数,传感器部署与列车实际监测点一致,确保数据工程适用性。
- 故障类型设计参考实际列车运维中的常见失效模式,如齿轮箱的齿根裂纹(root cracks)和轴承的电蚀损伤(electric discharge machining)。

  1. 全面性

    • 信号类型:同时包含振动、电流、声学等多源传感数据,支持多模态融合诊断(multimodal fusion)。
    • 故障复杂度:首次覆盖系统级复合故障,为研究耦合故障传播机制提供数据基础。对比现有数据集(如CWRU仅含轴承单点故障),BJTU-RAO在故障多样性和工况覆盖上显著领先。
  2. 应用验证

    • 该数据集已成功用于2024年全球可靠性与PHM会议(PHM Conference)的数据挑战赛,吸引160支国际团队参与。
    • 多项研究基于该数据集验证了新算法,例如:
      • Wang等提出的 精细化时移多尺度相位熵(refined time-shift multi-scale phase entropy) 框架,实现了轴箱轴承故障的高精度诊断。
      • Lin等开发的 信息融合增强域自适应注意力网络(IF-EDAAN),在无监督迁移诊断中取得突破。

科学价值与行业意义
1. 学术层面
- 填补了列车传动系统多组件故障数据集的空白,为复杂系统故障机理研究提供基准。
- 支持深度学习、图神经网络(graph neural network, GNN)等新兴算法在轨道交通领域的落地验证。

  1. 工业层面
    • 推动列车运维从“定期检修”向 预测性维护(PHM) 转型,降低非计划停运风险。
    • 为中国工业数字化转型提供技术范例,例如通过数字孪生(digital twin)实现故障实时预警。

创新亮点
- 全球首个列车传动系统公开数据集,涵盖多组件耦合故障与多工况数据。
- 高分辨率多传感同步采集(64 kHz采样率),保留高频故障特征。
- 标准化设计:数据标签与文件夹结构规范化,便于算法横向对比。

展望
团队计划持续扩展数据集,纳入更多实际运营中的故障模式(如润滑劣化、疲劳裂纹扩展数据),并探索数据驱动的全生命周期管理(life cycle management)方法。这一资源将加速轨道交通智能化研究的国际合作。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com