KAN-AD:基于Kolmogorov-Arnold网络的时间序列异常检测方法
作者与发表信息
本研究的核心作者包括Quan Zhou(中国科学院计算机网络信息中心)、Changhua Pei(中国科学院计算机网络信息中心/中国科学院大学杭州高等研究院)、Fei Sun(中国科学院计算技术研究所)等,通讯作者为Jianhui Li(南京大学)和Changhua Pei。该研究发表于2025年的Proceedings of the 42nd International Conference on Machine Learning (PMLR 267)。
学术背景
研究领域:时间序列异常检测(Time Series Anomaly Detection, TSAD)是云计算服务和网络系统实时监控的核心技术,旨在快速识别异常以预防严重故障。传统基于预测模型的TSAD方法容易因过度拟合局部波动而失效。
研究动机:现有深度学习方法(如TimesNet、LSTMAE)在存在局部扰动(如瞬时峰值或骤降)时表现不佳。作者发现,有效的TSAD应通过平滑的局部模式建模“正常”行为,而非试图拟合所有细节。
理论基础:
1. Kolmogorov-Arnold表示定理:任何多元连续函数可分解为有限个一元函数的组合。
2. 傅里叶级数特性:全局周期性建模能力优于局部化的B样条函数(B-spline)。
研究目标:提出KAN-AD,通过傅里叶级数替代B样条,结合轻量级学习机制,提升对局部扰动的鲁棒性。
研究方法与流程
1. 问题重构与算法设计
- 核心思想:将时间序列建模转化为用平滑一元函数逼近,利用傅里叶级数的全局周期性抑制局部噪声。
- 关键改进:
- 傅里叶级数替代B样条:傅里叶基函数(正弦/余弦)的平滑性避免过拟合。
- 截断傅里叶展开:仅保留前n项以降低计算量,并通过差分消除趋势项干扰。
- 周期性增强模块:引入多尺度周期函数(如cos(2πnit))以捕捉更细粒度周期模式。
2. 三阶段流程
映射阶段(Mapping Phase):
- 将时间窗口输入分解为多个一元函数(傅里叶级数、原始时序、补充周期函数)。
- 常数项消除模块:通过一阶差分和归一化,减少均值波动对系数估计的影响。
降维阶段(Reducing Phase):
- 使用一维卷积神经网络(1D CNN)学习各函数的组合系数。
- 网络结构:多层CNN + 批归一化(BatchNorm) + 高斯误差线性单元(GELU)激活函数。
- 残差连接保留原始输入信息,增强数值稳定性。
投影阶段(Projection Phase):
- 通过单层MLP预测未来行为,异常检测基于预测值与实际值的偏差。
3. 实验设计
- 数据集:
- 单变量时间序列:KPI(互联网服务指标)、TODS(合成数据)、WSD(Web服务器指标)、UCR(多领域数据)。
- 多变量时间序列:SMD、MSL、SWAT等5个基准数据集。
- 基线方法:包括LSTMAE、FCVAE、TimesNet、Anomaly Transformer等10种SOTA模型。
- 评估指标:事件F1(Event F1)、延迟F1(Delay F1)、AUPRC(精确率-召回率曲线下面积)。
主要结果
检测性能:
- 在单变量数据集上,KAN-AD平均事件F1提升15%(UCR数据集提升27%),参数量仅274个(比原始KAN减少80%)。
- 多变量检测中,平均F1达0.9076,优于Transformer类模型(如Informer、Autoformer)。
效率优势:
- 推理速度比原始KAN快50%,训练参数量不足1000。
抗干扰性:
- 在含噪声训练数据(异常比例达40%)时仍保持稳定性能,而TimesNet等基线方法显著退化。
消融实验:
- 傅里叶级数的效果优于切比雪夫多项式(Chebyshev)和泰勒级数(Taylor)。
- 常数项消除模块在KPI和UCR数据集上分别提升F1 0.1和0.05。
结论与价值
科学价值:
- 提出首个基于Kolmogorov-Arnold网络的TSAD框架,通过函数分解理论将复杂时序建模转化为系数估计问题。
- 证明了傅里叶级数在时间序列平滑建模中的优越性,为后续研究提供新方向。
应用价值:
- 适用于资源受限场景(如边缘计算),参数效率高(模型大小仅0.3KB)。
- 开源代码(GitHub)便于工业部署。
研究亮点
- 理论创新:将KAN与傅里叶分析结合,解决局部扰动敏感性问题。
- 方法轻量化:参数量仅为SOTA模型的1/1000,适合实时检测。
- 多场景验证:涵盖单变量/多变量、周期性/非周期性、清洁/噪声数据。
- 可解释性:函数分解机制直观展示正常模式的数学表达。
其他贡献