基于Kolmogorov-Arnold网络的时间序列异常检测方法KAN-AD

分享自：
基于Kolmogorov-Arnold网络的时间序列异常检测方法KAN-AD

期刊:Proceedings of the 42nd International Conference on Machine Learning
KAN-AD：基于Kolmogorov-Arnold网络的时间序列异常检测方法
作者与发表信息本研究的核心作者包括Quan Zhou（中国科学院计算机网络信息中心）、Changhua Pei（中国科学院计算机网络信息中心/中国科学院大学杭州高等研究院）、Fei Sun（中国科学院计算技术研究所）等，通讯作者为Jianhui Li（南京大学）和Changhua Pei。该研究发表于2025年的Proceedings of the 42nd International Conference on Machine Learning (PMLR 267)。
学术背景研究领域：时间序列异常检测（Time Series Anomaly Detection, TSAD）是云计算服务和网络系统实时监控的核心技术，旨在快速识别异常以预防严重故障。传统基于预测模型的TSAD方法容易因过度拟合局部波动而失效。
研究动机：现有深度学习方法（如TimesNet、LSTMAE）在存在局部扰动（如瞬时峰值或骤降）时表现不佳。作者发现，有效的TSAD应通过平滑的局部模式建模“正常”行为，而非试图拟合所有细节。
理论基础：
 1. Kolmogorov-Arnold表示定理：任何多元连续函数可分解为有限个一元函数的组合。
 2. 傅里叶级数特性：全局周期性建模能力优于局部化的B样条函数（B-spline）。
研究目标：提出KAN-AD，通过傅里叶级数替代B样条，结合轻量级学习机制，提升对局部扰动的鲁棒性。
研究方法与流程1. 问题重构与算法设计核心思想：将时间序列建模转化为用平滑一元函数逼近，利用傅里叶级数的全局周期性抑制局部噪声。
 
关键改进：
 傅里叶级数替代B样条：傅里叶基函数（正弦/余弦）的平滑性避免过拟合。
 
截断傅里叶展开：仅保留前n项以降低计算量，并通过差分消除趋势项干扰。
 
周期性增强模块：引入多尺度周期函数（如cos(2πnit)）以捕捉更细粒度周期模式。
 
2. 三阶段流程映射阶段（Mapping Phase）：
将时间窗口输入分解为多个一元函数（傅里叶级数、原始时序、补充周期函数）。
 
常数项消除模块：通过一阶差分和归一化，减少均值波动对系数估计的影响。
 
降维阶段（Reducing Phase）：
使用一维卷积神经网络（1D CNN）学习各函数的组合系数。
 
网络结构：多层CNN + 批归一化（BatchNorm） + 高斯误差线性单元（GELU）激活函数。
 
残差连接保留原始输入信息，增强数值稳定性。
 
投影阶段（Projection Phase）：
通过单层MLP预测未来行为，异常检测基于预测值与实际值的偏差。
 
3. 实验设计数据集：
 单变量时间序列：KPI（互联网服务指标）、TODS（合成数据）、WSD（Web服务器指标）、UCR（多领域数据）。
 
多变量时间序列：SMD、MSL、SWAT等5个基准数据集。
 
基线方法：包括LSTMAE、FCVAE、TimesNet、Anomaly Transformer等10种SOTA模型。
 
评估指标：事件F1（Event F1）、延迟F1（Delay F1）、AUPRC（精确率-召回率曲线下面积）。
 
主要结果检测性能：
在单变量数据集上，KAN-AD平均事件F1提升15%（UCR数据集提升27%），参数量仅274个（比原始KAN减少80%）。
 
多变量检测中，平均F1达0.9076，优于Transformer类模型（如Informer、Autoformer）。
 
效率优势：
推理速度比原始KAN快50%，训练参数量不足1000。
 
抗干扰性：
在含噪声训练数据（异常比例达40%）时仍保持稳定性能，而TimesNet等基线方法显著退化。
 
消融实验：
傅里叶级数的效果优于切比雪夫多项式（Chebyshev）和泰勒级数（Taylor）。
 
常数项消除模块在KPI和UCR数据集上分别提升F1 0.1和0.05。
 
结论与价值科学价值：
 - 提出首个基于Kolmogorov-Arnold网络的TSAD框架，通过函数分解理论将复杂时序建模转化为系数估计问题。
 - 证明了傅里叶级数在时间序列平滑建模中的优越性，为后续研究提供新方向。
应用价值：
 - 适用于资源受限场景（如边缘计算），参数效率高（模型大小仅0.3KB）。
 - 开源代码（GitHub）便于工业部署。
研究亮点理论创新：将KAN与傅里叶分析结合，解决局部扰动敏感性问题。
 
方法轻量化：参数量仅为SOTA模型的1/1000，适合实时检测。
 
多场景验证：涵盖单变量/多变量、周期性/非周期性、清洁/噪声数据。
 
可解释性：函数分解机制直观展示正常模式的数学表达。
 
其他贡献提出延迟F1（Delay F1）和事件F1（Event F1）作为更合理的评估指标，避免传统Best F1因长异常段导致的分数膨胀问题。
 
公开数据集和代码，推动领域标准化（https://github.com/cstcloudops/kan-ad）。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问