这篇题为《A hybrid deep learning model for lithium-ion battery state-of-health estimation using electrochemical impedance spectroscopy》的文档发表于2025年,发表在Elsevier旗下的期刊《Energy》上,卷号为339,文章编号为138974。文档报告了一项针对锂离子电池健康状态(State of Health, SOH)估计的单一原创性研究工作。以下是基于内容为您撰写的学术报告。
本研究报告由中国多个研究机构的研究人员合作完成。第一作者为长安大学能源与电气工程学院的吴春岭,通讯作者为清华大学核能与新能源技术研究院的贺湘明。合作单位包括长安大学、西安交通大学、西安思特普新能源技术有限公司以及清华大学。本研究旨在解决锂离子电池在实际复杂工况下健康状态准确估计的难题,提出了一个名为CNN-Att的新型混合深度学习模型,该模型利用电化学阻抗谱(Electrochemical Impedance Spectroscopy, EIS)数据实现端到端的高精度SOH估计。
从学术背景来看,本研究属于能源存储、电池管理和机器学习交叉领域。锂离子电池因其高能量密度和长寿命等优异电化学性能,在电动汽车和消费电子等领域得到了广泛应用。电池的健康状态(SOH)是其性能的关键指标,是电池管理系统(Battery Management System, BMS)进行安全预警和寿命管理的基础。然而,SOH无法直接测量,且电池的退化过程受温度、充放电倍率等多种因素影响,机理复杂,难以准确表征。传统的SOH估计方法主要分为基于模型的方法和数据驱动的方法。基于模型的方法,如电化学模型(Electrochemical Models, EMs)和等效电路模型(Equivalent Circuit Models, ECMs),或需要深厚的专业知识,或模型复杂、计算量大,且准确性往往有限。数据驱动方法,特别是机器学习方法,通过从大量数据中学习老化规律来规避复杂的内部机理建模,已成为主流。其中,支持向量回归(Support Vector Regression, SVR)、高斯过程回归(Gaussian Process Regression, GPR)、人工神经网络(Artificial Neural Networks, ANNs)及其变体如长短期记忆网络(Long Short-Term Memory, LSTM)、卷积神经网络(Convolutional Neural Network, CNN)等被广泛应用。然而,这些方法大多依赖于特定工况(如完整充放电循环)下提取的健康指标(Health Indicators, HIs),这类特征提取往往耗时耗力,且模型的泛化能力受特定操作条件限制,难以适应真实世界中复杂多变的场景。
电化学阻抗谱(EIS)作为一种非侵入性、非破坏性的检测技术,通过向电池施加不同频率的交流小信号扰动并测量其阻抗响应,能够在多个时间尺度上反映电池内部的电化学反应、界面现象和物质特性信息,为理解电池老化机理提供了丰富的多维度视角。相比于传统的电流电压数据,EIS包含更多与老化相关的内在信息。但是,EIS数据维度高、包含噪声,且其在线测量在激励信号生成、响应信号检测等方面面临挑战。此外,基于序列的循环神经网络在处理长序列EIS数据时,存在梯度消失/爆炸、计算时间长等问题。因此,开发一种能够高效、鲁棒地处理EIS数据,并准确估计SOH的方法具有重要的理论和应用价值。本研究的目标正是针对上述挑战,提出一个结合CNN和注意力机制(Attention Mechanism, Att)的混合深度学习模型(CNN-Att),利用EIS数据实现高精度、强鲁棒性的SOH端到端估计,为实际应用中的电池健康监测提供可靠的非侵入式解决方案。
研究工作的详细流程可以分为几个主要环节:数据来源与预处理、模型架构设计、实验设计与性能评估。
首先,在数据方面,本研究采用了剑桥大学卡文迪许实验室公开的一个数据集。该数据集包含了商用LR2032锂离子纽扣电池(LiCoO2/石墨)在三个温度(25°C, 35°C, 45°C)下、九个不同荷电状态(State of Charge, SOC)水平测得的EIS和容量数据。研究选用了在100% SOC(满电后15分钟)下采集的EIS数据,原因在于该状态下的数据相对更容易获取且更稳定。每个温度下使用了两个电池样本,共六个电池样本(编号:25C01, 25C02, 35C01, 35C02, 45C01, 45C02)。每个电池的循环数据按照循环进程进行划分:前60%的循环数据用于模型训练,后40%用于测试。EIS数据包含60个频率点(从0.02 Hz到20 kHz)的测量值,每个点包含四个参数:阻抗实部(Re(Z))、虚部(Im(Z))、幅值(|Z|)和相位角(θ)。因此,模型的输入是一个60(频率点)x 4(参数)的矩阵。
其次,模型架构设计是本研究的核心创新。研究者提出了一个名为CNN-Att的端到端架构,该架构由两个关键模块构成:局部信息感知器(Local Information Perceptron, LIP)和全局信息感知器(Global Information Perceptron, GIP),共同构成一个多视角信息感知器。LIP模块的核心是一个二维卷积神经网络(2D-CNN),其设计灵感在于自动从EIS数据中提取与SOH相关的局部特征。该模块首先通过2D-CNN层处理输入的EIS矩阵,利用卷积核的权重共享机制高效地捕捉输入数据中的空间(频率域)和通道(不同阻抗参数)信息。之后使用ReLU激活函数增强非线性表达能力,再通过平均池化层降低数据维度并保留关键信息,最后通过展平层将二维特征图转换为一维特征序列。LIP的优势在于能够自动提取特征,避免了传统手工特征工程的繁琐和可能的特征遗漏,同时卷积操作有助于抑制EIS测量中的噪声影响。GIP模块则建立在多头自注意力机制(Multi-Head Attention, MHA)之上,旨在捕获LIP提取的局部特征与电池容量(SOH)之间的长期依赖关系。自注意力机制允许序列中的任意两点直接建立联系,克服了循环神经网络在长序列建模中可能出现的梯度问题和串行计算瓶颈,支持并行计算,大大提高了效率。在GIP中,来自LIP的一维特征序列被分别投影为查询、键和值向量,通过计算缩放点积注意力得分,模型能够动态地关注对当前SOH估计最重要的特征组合。多个注意力头的输出被拼接并通过一个线性层融合。最后,经过MHA处理的数据由一个前馈网络(Feed Forward Network, FFN)进一步处理,最终输出电池容量的估计值,再根据公式(SOH = 当前最大可用容量 / 额定容量)计算得到SOH。整个CNN-Att模型的工作流程是:原始EIS数据经过预处理(如归一化)后,送入LIP进行局部特征增强和提取,得到的特征序列再输入GIP以建立全局长期依赖关系,最终由FFN输出SOH估计值。
第三,实验设计与性能评估环节系统性地验证了模型的有效性和优越性。实验主要从三个维度展开。首先,研究者比较了不同基础模型(1D-CNN, 2D-CNN, LSTM, Transformer)在使用完整四维EIS输入时的性能,以评估LIP(以2D-CNN为代表)和GIP(以Transformer的注意力机制为代表)各自组件的贡献。其次,为了探究输入数据冗余信息的影响,他们评估了仅使用两维输入(Re(Z)和Im(Z))时上述基础模型的性能变化。最后,将提出的CNN-Att模型与现有的先进混合模型(如CNN-LSTM和CNN-BiLSTM)进行对比,以验证其综合性能优势。性能评估采用了四个指标:均方根误差、平均绝对误差、平均绝对百分比误差和决定系数。理想情况下,前三者越接近0,后者越接近1,模型性能越好。
研究获得的主要结果在各个方面均支持了模型的优越性。
在基础模型对比中,结果清晰地显示,2D-CNN在从EIS数据中提取SOH相关局部特征方面优于1D-CNN,其SOH估计误差的均值和分布范围都更小。在建立老化特征与容量衰减的长期依赖关系方面,Transformer模型总体上优于LSTM,表现出更小的误差和更好的稳定性,而LSTM在部分电池样本上误差较大且分布分散。这一结果为后续集成2D-CNN和注意力机制提供了依据。
在输入数据配置对比中,一个有趣的发现是:尽管仅使用实部和虚部(二维)输入在理论上避免了冗余信息,但所有基准模型的性能(MAE, RMSE, MAPE升高,R²下降)普遍差于使用完整四维输入的情况。例如,Transformer模型的MAE平均恶化了46.08%。这表明,包含幅值和相位角的额外信息(尽管可由实部虚部推导得出)在实践中能有效提升模型的整体性能和学习能力,可能为模型提供了更丰富的、利于学习的表征形式。
最重要的结果来自CNN-Att模型与现有混合模型的对比。性能指标显示,CNN-Att在所有误差指标上均显著优于对比模型。其平均MAE低于0.49%,平均RMSE低于0.59%,而平均R²超过0.9。具体而言,与单独的2D-CNN和Transformer模型相比,CNN-Att的MAE分别降低了32.63%和34.45%;与CNN-LSTM和CNN-BiLSTM模型相比,MAE的降低幅度更是达到了65.62%和62.95%。误差分布图显示,CNN-Att的SOH估计误差主要集中在[-2%, +2%]区间内,且中位数接近零,表明其估计值紧密围绕真实值波动。而CNN-LSTM的误差分布倾向于高估真实SOH,CNN-BiLSTM的误差分布则更为分散,稳定性较差。研究还通过梯度加权类激活映射(Gradient-weighted Class Activation Mapping, Grad-CAM)方法可视化了对SOH估计结果影响关键的EIS数据区域。分析发现,对于大多数电池样本,EIS数据中的超高频区域和低频区域对模型的SOH估计有显著影响。这一发现为未来可能的模型轻量化提供了方向,即或许可以通过测量关键频点的EIS数据来简化模型。
本研究得出的核心结论是:成功提出并验证了一个基于多视角信息感知的CNN-Att混合深度学习模型,该模型能够有效利用EIS数据,实现锂离子电池SOH的高精度、强鲁棒性端到端估计。该方法的科学价值在于创新性地将CNN的局部特征提取能力与注意力机制的全局依赖建模能力相融合,为从高维、含噪的EIS数据中挖掘与电池老化深度相关的复杂映射关系提供了一种高效的计算框架。其应用价值则非常直接且重要:该模型突破了传统方法对特定充放电工况的依赖,仅需在特定SOC(如满电)下获取一次EIS“快照”,即可进行准确的SOH估计,这为电池管理系统实现非侵入式、在线健康监测提供了极具潜力的技术方案。模型在不同温度和不同电池老化阶段均表现出稳定的性能,尤其在对安全至关重要的电池寿命末期仍能保持高精度(SOH<80%时误差%),增强了其在真实场景中部署的可行性。
本研究的亮点主要体现在以下几个方面:第一,方法的新颖性。提出的CNN-Att模型是首个将CNN与注意力机制深度融合并专门用于EIS数据SOH估计的框架之一,其中的LIP和GIP模块设计思路清晰,功能互补。第二,模型的轻量化和高效性。相比于参数量庞大的CNN-LSTM等模型,CNN-Att仅需86.7万个可学习参数,同时得益于注意力机制的并行计算能力,具有更高的计算效率。第三,输入策略的实证发现。研究通过实验证实,使用包含冗余信息的完整四维EIS输入反而能带来更好的模型性能,这一发现对后续相关研究具有参考价值。第四,全面的实验验证。研究不仅与多种基准模型进行了对比,还深入分析了不同输入配置的影响,并使用Grad-CAM对模型决策依据进行了解释,增强了研究的可靠性和深度。第五,明确的工程应用导向。研究始终关注模型在实际应用中的挑战(如在线EIS测量限制),并在模型设计和验证中考虑了温度变化、寿命末期等现实因素,使其结论具有更强的实践指导意义。
最后,研究也坦率地指出了自身的局限性:一是使用的数据集规模相对有限,模型尚未在更广泛的电池类型上进行验证;二是目前方法依赖于100% SOC下的EIS数据,尚未实现变SOC条件下的精确SOH估计;三是输入使用了完整的EIS测量数据,未进一步提取关键参数信息以实现模型轻量化部署。作者在展望中表示,未来的工作将围绕扩展验证数据集、探索变SOC条件下的SOH估计以及研究从EIS数据中提取关键特征以实现模型进一步优化等方向展开。