分享自:

基于自适应Shapley嵌入神经网络集成和电化学阻抗谱的电池健康状态精确估计

期刊:applied energyDOI:10.1016/j.apenergy.2025.126799

关于《adaptive shapley-embedded neural network ensemble for accurate state of health estimation using electrochemical impedance spectroscopy》研究的学术报告

本报告旨在向中国学术界同行详细介绍一篇近期发表于能源领域顶级期刊《applied energy》的重要研究论文。该论文由加拿大西安大略大学机械与材料工程系的邢雪琪、闫彤彤(通讯作者)、夏旻(通讯作者)团队完成,已于2025年9月正式在线发表。研究聚焦于锂离子电池健康状态(State of Health, SOH)的精确估计,提出了一种创新的、基于可解释人工智能的集成学习框架,以应对在变温工况下进行SOH估计的挑战。以下是关于此项研究的详细报告。

一、 学术背景与研究目标

随着电动汽车、规模化储能及航空航天等领域的快速发展,锂离子电池因其高能量密度和长循环寿命而成为核心储能单元。电池管理系统(BMS)中的健康状态(SOH)估计对于确保系统运行的安全性与可靠性至关重要。SOH反映了电池相对于其初始容量的衰减程度,当其低于阈值时,电池便可能因安全或经济性原因需要更换。然而,SOH的衰减过程受到充放电协议、负载模式及环境温度等多种复杂因素的影响,尤其是在实际应用中广泛存在的温度变化,使得实现跨温度条件的鲁棒且准确的SOH估计成为一个持续的研究难题。

近年来,基于数据驱动的方法在SOH估计中受到广泛关注。电化学阻抗谱(Electrochemical Improved Spectroscopy, EIS)作为一种非破坏性、信息丰富的表征技术,因对电池内部降解过程高度敏感而展现出巨大潜力。EIS能够提供丰富的电化学过程信息,包括材料特性、界面现象和内部反应,从而实现对电池老化更深入的评估。同时,随着先进测量技术的发展,EIS数据的在线、快速获取正变得可行,为其在BMS中的实际应用铺平了道路。

然而,现有基于EIS的SOH估计方法面临两大核心挑战。首先,最有信息量的EIS频率点会因温度和电池个体差异而发生显著变化,这严重限制了模型的泛化能力。其次,现有研究常采用沙普利加性解释(Shapley Additive Explanations, SHAP)作为后验分析工具,以提高模型可解释性并辅助频率选择,但缺乏将SHAP值直接、有效地整合到模型决策机制中的方法,通常仍需依赖人工特征工程或主观阈值设定,可能引入偏差。

为解决上述挑战,本研究旨在提出一种自适应、可泛化的集成学习框架。其核心目标是:1) 开发一种新型神经网络结构,直接将SHAP值代表的领域知识嵌入模型架构,消除复杂特征工程的需求;2) 设计一种自适应加权集成策略,以动态融合针对不同电池个体训练的模型,从而实现对变温条件下电池SOH的准确、鲁棒估计。本研究首次在SOH-EIS领域将SHAP值直接作为神经网络连接权重进行嵌入,旨在提供一种兼具高精度、强泛化能力和内在可解释性的新视角。

二、 研究详细工作流程

本研究的工作流程系统而完整,主要包含以下几个核心环节:

1. SHAP值计算与特性分析: * 研究对象与数据来源: 研究使用了目前公开的最大规模锂离子电池EIS老化数据集。该数据集包含12个商用Eunicell LR2032电池(45mAh)在三种恒定环境温度(25°C, 35°C, 45°C)下的循环老化测试数据,共计超过20,000个EIS谱。每个谱在60个频率点(0.02 Hz至20 kHz)测量,包含实部和虚部信息。 * 数据处理与SHAP计算: 首先,将所有频率点的原始EIS数据(120维特征:60个实部 + 60个虚部)作为输入特征,电池的SOH作为输出标签。利用随机森林(Random Forest)模型建立从EIS到SOH的映射关系。随后,采用高效的TreeSHAP算法,为训练数据集中的所有样本计算每个EIS频率特征的SHAP值。SHAP值量化了单个特征对模型预测的贡献度。 * 关键分析: 通过对特定电池(如25C01)和不同温度下电池的SHAP值演化进行分析,研究提出了两个重要的命题: * 命题一: 与原始EIS谱相比,EIS的SHAP值在特定频段内能更准确地反映电池退化过程,与SOH显示出更高的相关性。分析发现,某些频段的SHAP值随SOH下降呈现渐进式变化,而原始EIS数据的变化则不够清晰一致。特别是,EIS虚部的SHAP值往往比实部包含更丰富的退化信息。 * 命题二: EIS的SHAP值在不同温度下表现出共有的和独特的“信息频段”。某些频段(如低频段)与电池退化在所有温度下均强相关(共有频段),而另一些频段(如特定高频段)的显著性则表现出温度依赖性,例如在高(低)温下变得更具信息性(独特频段)。这一发现揭示了温度与信息频段之间的交互作用,是构建泛化模型的关键动机。

2. SHAP嵌入式单层神经网络(SHAP-SLNN)的构建: * 模型原型设计: 本研究创新性地设计了一种SHAP嵌入式单层神经网络。该网络结构受极限学习机(Extreme Learning Machine, ELM)启发,包含输入层、单隐层和输出层。 * 核心创新点(嵌入机制): 与ELM随机初始化输入权重不同,SHAP-SLNN将计算得到的SHAP值直接作为输入层与隐层之间的连接权重进行固定。具体而言,对于训练电池A,取其前 l 个循环周期(研究通过实验确定l在10-20之间效果较佳)的SHAP值 {SHAP^A_1, SHAP^A_2, …, SHAP^A_l}。第 k 个隐层节点的输入权重即由第 k 个周期的SHAP向量 SHAP^A_k 设定。这一设计将反映退化重要性的领域知识直接“灌注”到网络架构中,无需手动特征选择。 * 模型训练: 网络的待训练参数仅为隐层到输出层的权重向量 W。通过最小化包含正则化项(防止过拟合)的损失函数 min_W ‖H_A W - SOH_A‖^2_2 + λ‖W‖_q 来优化 W。其中 H_A 是隐层输出矩阵,由固定SHAP权重、偏置和原始EIS输入通过Sigmoid激活函数计算得到。此过程有效结合了原始EIS数据和SHAP值蕴含的退化模式信息。

3. 基于凸优化的自适应集成策略: * 集成构建: 针对多个训练电池(例如,6个在25°C下老化的电池),分别构建和训练各自的SHAP-SLNN模型。每个模型都捕捉了其对应电池独特的退化行为及SHAP值模式。 * 动态权重优化: 对于一个新的测试电池,其前 q 个循环(研究显示q约50时效果良好)的EIS数据被用于动态优化集成权重。研究提出一个轻量级的凸优化模型来自适应地确定各基模型(SHAP-SLNNs)的权重 β = [β1, β2, …, βn]min_β ‖S̃OH β' - SOH_test‖^2_2, subject to Σβ_i = 1 其中,S̃OH 是各基模型对测试电池前 q 个周期的SOH预测值矩阵,SOH_test 是测试电池前 q 个周期的真实SOH值。该模型可通过拉格朗日乘子法高效求解。此策略使得集成模型能够根据测试电池早期表现,自动调整并融合各基模型的优势。 * 最终预测: 测试电池后续周期的SOH最终估计值为各基模型预测值的加权和:SOH_ensemble = β1 SOH^A + β2 SOH^B + … + βn SOH^N

4. 实验验证与对比分析: * 训练与测试方案: 研究设计了多种训练-测试方案以验证泛化能力。例如,方案一仅使用同一温度(25°C)下的电池数据训练SHAP-SLNNs,然后测试所有温度下的电池。方案二和三则使用多温度数据训练,并考察是否加入温度作为额外输入特征的影响。 * 对比基准: 研究进行了全面的对比实验,包括:1) 消融实验:对比单独的SHAP-SLNN、标准的ELM、随机森林模型;对比使用/不使用所提凸优化加权策略的集成模型;对比所提加权策略与相似度加权、准确度加权等传统方法。2) 与前沿方法对比:与多种浅层机器学习模型(弹性网络、支持向量回归、决策树、贝叶斯回归)和深度学习模型(全连接网络、卷积神经网络、门控循环单元)进行性能比较。3) 与迁移学习方法对比:与基于CNN和Transformer架构的多种微调策略(全微调、部分微调、仅头部微调)进行对比。 * 性能评估指标: 主要采用均方根误差(RMSE)和平均绝对误差(MAE)来量化SOH估计的准确性,并记录了模型的计算时间以评估效率。

三、 主要研究结果

1. SHAP值分析结果: 命题一和命题二得到了实验数据的充分支持。分析显示,对于不同电池,SHAP值确实突出了与退化强相关的特定频段。例如,0.04 Hz和0.03 Hz处EIS虚部的SHAP值被识别为多个电池共有的高贡献频率,这与电荷转移和扩散过程相关,是退化的关键指示。同时,SHAP值的分布图清晰地展示了信息频段随温度变化的模式,验证了温度依赖性的存在。这一结果为后续设计集成学习框架提供了直接的理论依据和动机:需要一种能同时利用共有模式和适应独特模式的机制。

2. SHAP-SLNN与集成框架的有效性验证: * 泛化能力卓越: 即使在最严格的训练方案一(仅用25°C数据训练)下,所提框架对在35°C和45°C下工作的测试电池也取得了高精度的SOH估计。六个测试电池(涵盖三种温度)的平均RMSE仅为1.04%,MAE为0.75%。这强有力地证明了框架强大的跨温度泛化能力。 * SHAP嵌入的有效性(消融实验): 单独的SHAP-SLNN模型在SOH估计上明显优于标准ELM和随机森林模型。这表明将SHAP值作为先验知识嵌入网络权重,显著提升了单层神经网络的表征能力和预测精度。 * 凸优化加权策略的优越性(消融实验): 应用所提凸优化加权策略的SHAP-SLNN集成模型,其性能远优于未加权的单模型、使用投票机制的随机森林集成,也显著优于使用相似度加权或准确度加权的集成方法。这证明了该自适应加权策略在动态融合多模型、适应新电池特性方面的有效性和必要性。 * 综合性能领先(与前沿方法对比): 所提框架在RMSE和MAE上全面超越了所有对比的机器学习和深度学习方法。与复杂的深度学习模型(如CNN、GRU)相比,本框架在取得更低误差的同时,计算成本(约3.5秒完成所有测试电池的模型构建与推理)大幅降低,实现了精度与效率的良好平衡。 * 优于迁移学习(与迁移学习方法对比): 所提框架在跨温度SOH估计上的表现,也优于基于CNN和Transformer的各种迁移学习/微调策略。这凸显了通过SHAP嵌入和自适应集成来捕捉跨域退化模式的独特优势,且其计算效率远高于需要大量微调训练的深度迁移学习模型。

3. 参数敏感性分析结果: * 随机森林参数: 用于计算SHAP值的随机森林模型的超参数(树的数量、最大深度、特征选择数、节点分裂最小样本数)对最终SOH估计性能有影响,但通过交叉验证选择合适参数后,RMSE可被控制在较低水平(%),表明框架对上游SHAP计算过程具有一定的鲁棒性。 * 框架关键参数 lq 研究表明,仅需前10-20个循环的SHAP值(l)来构建SHAP-SLNN,以及仅需前约50个循环的数据(q)来优化集成权重,即可获得高精度估计。这极大地降低了对数据量的依赖,增强了方法的实用性,因为早期数据往往更容易获取。

四、 研究结论与价值

本研究成功提出并验证了一种基于SHAP嵌入式神经网络自适应集成的锂离子电池SOH估计新框架。该框架的核心贡献在于: 1. 科学价值(方法学创新): 首次在SOH-EIS领域将SHAP值作为神经网络连接权重进行嵌入,创造性地将可解释性工具与模型架构设计相结合,为数据驱动模型融合领域知识开辟了新途径。所提的SHAP-SLNN模型和基于凸优化的自适应加权集成策略,为处理具有复杂时空变异性的工程问题(如电池老化)提供了新颖且高效的机器学习解决方案。 2. 应用价值(解决实际问题): 该框架有效解决了变温条件下SOH估计的泛化难题。其仅需少量早期循环数据即可实现高精度预测的特点,以及较低的在线计算成本,使其在电池管理系统(BMS)中具有显著的实际应用潜力。它为开发下一代智能、鲁棒、可解释的电池健康管理算法提供了强有力的技术支撑。 3. 重要观点: 研究揭示了EIS的SHAP值在不同温度下具有“共有”与“独特”信息频段的规律,这一发现不仅深化了对电池电化学老化与温度关联的理解,也直接指导了后续集成学习框架的设计,即通过多模型集成来同时捕获共性和个性。

五、 研究亮点

  1. 首创性方法: 首次提出并实现了将SHAP值作为神经网络初始连接权重的嵌入机制(SHAP-SLNN),在提升模型性能的同时,赋予其“内置”的可解释性。
  2. 强大的泛化性能: 所提集成框架在仅使用单温度数据训练的情况下,实现了跨宽温域(25°C至45°C)的准确、鲁棒SOH估计,平均误差低于现有先进方法。
  3. 精巧的集成策略: 提出了一种基于轻量级凸优化模型的自适应动态加权方法,能够根据测试电池的早期数据快速调整模型融合策略,避免了静态加权的不适应性。
  4. 理论与实践的紧密结合: 研究从对SHAP值的深入理论分析(提出两个命题)出发,指导了创新模型(SHAP-SLNN)和集成策略的设计,并通过大规模公开数据集进行了充分的实验验证,形成了从问题洞察到方法创新再到效果验证的完整闭环。
  5. 优异的综合性能: 在保持高估计精度(RMSE ~1%)的同时,兼顾了计算效率,其计算成本远低于复杂的深度学习模型,展现了在嵌入式BMS中应用的可行性。

六、 其他有价值内容

研究还通过详细的参数敏感性分析,为实际应用中如何设置相关超参数提供了指导。同时,论文坦诚地指出了当前工作的局限性,例如对离线EIS数据的依赖,以及未来需要在更宽温度范围和更多电池类型上进行验证。研究团队展望了未来工作方向,包括开发在线EIS采集系统、优化SHAP计算效率、以及为SOH预测增加不确定性量化模块等,这些都为后续研究指明了有价值的路径。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com