分享自:

基于Kolmogorov-Arnold网络的时间序列异常检测方法KAN-AD

期刊:Proceedings of the 42nd International Conference on Machine Learning

KAN-AD:基于Kolmogorov-Arnold网络的时间序列异常检测方法

作者与发表信息

本研究的核心作者包括Quan Zhou(中国科学院计算机网络信息中心)、Changhua Pei(中国科学院计算机网络信息中心/中国科学院大学杭州高等研究院)、Fei Sun(中国科学院计算技术研究所)等,通讯作者为Jianhui Li(南京大学)和Changhua Pei。该研究发表于2025年的Proceedings of the 42nd International Conference on Machine Learning (PMLR 267)

学术背景

研究领域:时间序列异常检测(Time Series Anomaly Detection, TSAD)是云计算服务和网络系统实时监控的核心技术,旨在快速识别异常以预防严重故障。传统基于预测模型的TSAD方法容易因过度拟合局部波动而失效。

研究动机:现有深度学习方法(如TimesNet、LSTMAE)在存在局部扰动(如瞬时峰值或骤降)时表现不佳。作者发现,有效的TSAD应通过平滑的局部模式建模“正常”行为,而非试图拟合所有细节。

理论基础
1. Kolmogorov-Arnold表示定理:任何多元连续函数可分解为有限个一元函数的组合。
2. 傅里叶级数特性:全局周期性建模能力优于局部化的B样条函数(B-spline)。

研究目标:提出KAN-AD,通过傅里叶级数替代B样条,结合轻量级学习机制,提升对局部扰动的鲁棒性。


研究方法与流程

1. 问题重构与算法设计

  • 核心思想:将时间序列建模转化为用平滑一元函数逼近,利用傅里叶级数的全局周期性抑制局部噪声。
  • 关键改进
    • 傅里叶级数替代B样条:傅里叶基函数(正弦/余弦)的平滑性避免过拟合。
    • 截断傅里叶展开:仅保留前n项以降低计算量,并通过差分消除趋势项干扰。
    • 周期性增强模块:引入多尺度周期函数(如cos(2πnit))以捕捉更细粒度周期模式。

2. 三阶段流程

  1. 映射阶段(Mapping Phase)

    • 将时间窗口输入分解为多个一元函数(傅里叶级数、原始时序、补充周期函数)。
    • 常数项消除模块:通过一阶差分和归一化,减少均值波动对系数估计的影响。
  2. 降维阶段(Reducing Phase)

    • 使用一维卷积神经网络(1D CNN)学习各函数的组合系数。
    • 网络结构:多层CNN + 批归一化(BatchNorm) + 高斯误差线性单元(GELU)激活函数。
    • 残差连接保留原始输入信息,增强数值稳定性。
  3. 投影阶段(Projection Phase)

    • 通过单层MLP预测未来行为,异常检测基于预测值与实际值的偏差。

3. 实验设计

  • 数据集
    • 单变量时间序列:KPI(互联网服务指标)、TODS(合成数据)、WSD(Web服务器指标)、UCR(多领域数据)。
    • 多变量时间序列:SMD、MSL、SWAT等5个基准数据集。
  • 基线方法:包括LSTMAE、FCVAE、TimesNet、Anomaly Transformer等10种SOTA模型。
  • 评估指标:事件F1(Event F1)、延迟F1(Delay F1)、AUPRC(精确率-召回率曲线下面积)。

主要结果

  1. 检测性能

    • 在单变量数据集上,KAN-AD平均事件F1提升15%(UCR数据集提升27%),参数量仅274个(比原始KAN减少80%)。
    • 多变量检测中,平均F1达0.9076,优于Transformer类模型(如Informer、Autoformer)。
  2. 效率优势

    • 推理速度比原始KAN快50%,训练参数量不足1000。
  3. 抗干扰性

    • 在含噪声训练数据(异常比例达40%)时仍保持稳定性能,而TimesNet等基线方法显著退化。
  4. 消融实验

    • 傅里叶级数的效果优于切比雪夫多项式(Chebyshev)和泰勒级数(Taylor)。
    • 常数项消除模块在KPI和UCR数据集上分别提升F1 0.1和0.05。

结论与价值

科学价值
- 提出首个基于Kolmogorov-Arnold网络的TSAD框架,通过函数分解理论将复杂时序建模转化为系数估计问题。
- 证明了傅里叶级数在时间序列平滑建模中的优越性,为后续研究提供新方向。

应用价值
- 适用于资源受限场景(如边缘计算),参数效率高(模型大小仅0.3KB)。
- 开源代码(GitHub)便于工业部署。


研究亮点

  1. 理论创新:将KAN与傅里叶分析结合,解决局部扰动敏感性问题。
  2. 方法轻量化:参数量仅为SOTA模型的1/1000,适合实时检测。
  3. 多场景验证:涵盖单变量/多变量、周期性/非周期性、清洁/噪声数据。
  4. 可解释性:函数分解机制直观展示正常模式的数学表达。

其他贡献

  • 提出延迟F1(Delay F1)和事件F1(Event F1)作为更合理的评估指标,避免传统Best F1因长异常段导致的分数膨胀问题。
  • 公开数据集和代码,推动领域标准化(https://github.com/cstcloudops/kan-ad)。
上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com