基于注意力机制的混合神经网络模型用于锂离子电池健康状态估计

分享自：
基于注意力机制的混合神经网络模型用于锂离子电池健康状态估计

信息科学
人工智能
工程学
航空航天工程
电气科学与工程
期刊:journal of energy storageDOI:10.1016/j.est.2023.107734
【点击此处】阅读全文、收藏及针对性提问
本文为您介绍的学术论文题为《A hybrid neural network model with attention mechanism for state of health estimation of lithium-ion batteries》（一种用于锂离子电池健康状态估计的带注意力机制的混合神经网络模型），由Aihua Tang、Yihan Jiang、Quanqing Yu（通讯作者）和Zhigang Zhang合作完成。作者团队来自重庆理工大学车辆工程学院以及哈尔滨工业大学（威海）汽车工程学院。该研究发表于Elsevier旗下的期刊《Journal of Energy Storage》第68卷，于2023年5月30日在线发布。
一、学术背景该研究属于锂离子电池健康管理与状态估计领域，具体聚焦于电池健康状态（State of Health， SOH） 的精准在线估计。随着全球推进“碳达峰”与“碳中和”目标，电动汽车（EVs）作为清洁交通技术被广泛接受，而锂离子电池（LIBs）是其核心部件。然而，电池在使用过程中不可避免地会发生老化和性能衰减。当性能恶化到一定程度时，可能因电池泄漏、绝缘劣化、局部短路等问题引发灾难性事故。因此，在电池管理系统（BMS）中准确评估SOH对保障电池系统的安全至关重要。
SOH通常以电池当前最大可用容量与额定容量的百分比来定义（SOH = Cmax/Cnorm × 100%），但它无法直接测量。传统的SOH估计方法主要分为基于模型的方法和数据驱动的方法。基于等效电路模型的方法虽然理论简单、计算量小，但精度受限；基于电化学模型的方法则参数辨识困难、计算复杂，且都难以在整个生命周期内应对复杂工况和老化机制实现精确估计。近年来，数据驱动方法，特别是机器学习和深度学习（DL），因其高精度和较低的计算复杂度而成为研究热点。然而，现有方法仍面临挑战：基于手工特征工程的方法（如从增量容量曲线、充放电曲线提取特征）往往流程复杂、对原始数据要求严格、泛化能力差；而基于深度学习的端到端方法虽然能自动提取特征，但模型训练过程繁琐、计算负担大，且难以克服不同类型、不同化学体系、不同工况下电池的不一致性问题。
本研究旨在解决上述问题，开发一种快速、可靠且适用性广的锂离子电池SOH估计方法。其核心目标是：1）避免复杂的人工特征提取过程，直接利用易于获取的充电电压片段作为模型输入；2）构建一个结合了卷积、注意力机制和序列处理能力的混合神经网络模型，以自动、高效地提取与电池退化高度相关的深层特征；3）利用迁移学习策略，实现在目标电池数据极少的情况下，对不同类型、不同工况电池进行高精度SOH估计。
二、详细工作流程本研究的工作流程主要包括五个环节：1）数据集准备与充电电压片段采样；2）混合神经网络模型构建；3）模型训练与验证（源数据集）；4）基于迁移学习的模型微调与验证（目标数据集）；5）性能评估与对比分析。
1. 数据集准备与充电电压片段采样 研究采用两个公开的电池老化数据集来验证所提方法的有效性：牛津大学电池智能实验室的Oxford数据集和NASA艾姆斯研究中心预测卓越中心的NASA数据集。这两个数据集包含不同类型、不同化学组成（阴极材料不同）和不同循环条件（温度、充放电协议）的电池，为检验模型的鲁棒性和泛化能力提供了良好基础。具体而言，Oxford数据集包含8个标称容量0.74Ah的锂离子电池（Cell 1至Cell 8），在40°C下进行1C恒流充电和动态放电。NASA数据集包含多组标称容量2Ah的电池（如B0005, B0029, B0055等），在24°C、43°C、4°C三种不同温度下进行循环测试。
输入特征设计是本研究的一个创新点。考虑到实际电动汽车应用中，放电曲线不确定性高、驾驶场景多变，而充电曲线相对稳定可控，且车辆充电可能始于任意荷电状态（SOC）并不一定充满，完整充电曲线难以获取。因此，研究提出直接使用部分充电电压曲线片段作为模型输入。为了研究不同数据条件对模型性能的影响，作者设计了两种采样模式，每种模式包含三种采样频率（10秒、20秒、30秒）： * 模式1：从充电电压3.81V（考虑实际充电起始点不固定，且观察到电压曲线在约3.8V后斜率明显增大）开始，采集30个电压点。 * 模式2：从同一电压点开始，采集60个电压点。 采用“a(b)”形式表示采样方法，其中a为总采样点数，b为采样频率。例如，60(10)表示以10秒为间隔采集60个点（总时长600秒）。通过这种方式，共产生了六种不同结构（30(10)， 30(20)， 30(30)， 60(10)， 60(20)， 60(30)）的充电电压片段作为模型输入。研究计算了这些电压片段的标准差与电池容量之间的皮尔逊相关系数，结果显示具有强相关性（例如Cell 1的60(10)片段相关系数达-0.989），证实了所选片段作为健康特征（HF）的有效性。
2. 混合神经网络模型（CNN-CBAM-LSTM）构建 本研究开发的核心模型被命名为CNN-CBAM-LSTM（文中简称为CL-CBAM），它是一个集成了卷积神经网络（CNN）、卷积块注意力模块（CBAM）和长短期记忆网络（LSTM）的混合结构。模型设计思路是分层次、有重点地提取和利用充电电压片段中的退化信息。 * 一维CNN层：作为特征提取器，负责从原始的充电电压序列中自动提取潜在的、与电池退化相关的局部特征。其局部连接和权重共享的特性增强了模型的鲁棒性，并避免了手工特征工程的低效性。 * 卷积块注意力模块（CBAM）：这是模型的关键创新组件。CBAM是一个轻量级的注意力模块，包含通道注意力模块（CAM）和空间注意力模块（SAM）。其工作流程是顺序进行的：首先，CAM对CNN输出的特征图进行操作，通过同时应用全局平均池化和最大池化，再经过一个共享的多层感知机，生成通道注意力权重。这决定了模型应该“关注”特征图中的哪些通道（即哪些特征检测器）。然后，将加权的特征图输入到SAM。SAM沿着通道维度分别进行最大池化和平均池化，将结果拼接后通过一个卷积层生成空间注意力权重。这决定了模型应该“关注”特征图在空间维度（即时间序列维度）上的哪些部分。通过这种“从通道到空间”的顺序注意力机制，CBAM能够抑制原始数据中的噪声干扰，并强化那些与输出（容量/SOH）高度相关特征的影响，从而提升特征提取的质量。 * LSTM层：接收经过CNN和CBAM加权处理后的特征序列。LSTM擅长处理序列数据并捕捉长期依赖关系，能够建模电池老化过程中的时序动态特性，包括处理容量再生等非线性波动现象。 * 全连接输出层：将LSTM的最终输出映射为电池的估计容量值，进而通过公式（1）计算SOH。
模型的主要结构参数包括：CNN卷积核大小为16，LSTM单元数为32，使用了Sigmoid和Tanh激活函数，并引入了Dropout层（比率为0.01）以防止过拟合。值得注意的是，尽管CL-CBAM模型层数更深（6层），但其参数量（5635）远少于传统的LSTM模型（20513），仅比未加注意力的CNN-LSTM模型（5361参数量）略多，体现了其设计的高效性。
3. 模型训练与验证（源数据集） 首先，使用Oxford数据集作为源数据集对CL-CBAM模型进行训练和验证。具体划分是：使用Cell 1和Cell 8的数据作为训练集，其余电池（Cell 2至Cell 7）作为测试集。训练过程中，模型的输入是历史充电电压片段以及对应的历史参考容量，输出是估计的容量。训练完成后，进入在线估计阶段，模型仅需新的充电电压片段即可预测当前周期的容量和SOH。
研究者系统测试了六种不同采样方法下模型的性能，并与传统的LSTM模型和CNN-LSTM模型进行了对比。评估指标采用均方根误差（RMSE）和平均绝对误差（MAE）。结果表明，CL-CBAM模型在所有采样条件下均表现出最优性能。例如，对于测试电池Cell 3，在采样模式2的60(20)条件下，其SOH估计的RMSE和MAE分别低至0.19%和0.15%。分析发现，在相同采样点数下，并非采样频率越高（间隔越密）或电压窗口越长（采样时长越长）效果越好。采样频率为20秒时通常能取得最佳平衡，因为过于稀疏的采样会丢失连续性，而过密的采样则可能包含过多冗余信息。这一发现对实际BMS应用中采样间隔的设置具有指导意义。更重要的是，即使在仅使用300秒充电数据（模式1，30点）的极端数据短缺情况下，模型依然能实现高精度估计（平均RMSE约0.31%， MAE约0.24%），证明了其在实际应用中的潜力。
4. 基于迁移学习（TL）的模型微调与验证（目标数据集） 为了验证模型对不同类型、不同工况电池的泛化能力，研究采用了迁移学习结合微调（Fine-Tuning， FT） 的策略。将Oxford数据集作为源域，NASA数据集作为目标域。具体流程如下： 1. 预训练：首先使用Oxford源数据集完整地训练CL-CBAM模型，使其学习到锂离子电池普遍的退化特征。 2. 模型迁移：将预训练好的模型（包括其权重和偏置）迁移到NASA目标电池的估计任务中。 3. 微调：采用“冻结核心层，仅重训练输出层”的策略。即冻结模型的输入层、CNN层、CBAM层和LSTM层，仅使用目标电池（如B0005、B0029、B0055，每个目标电池仅使用一个电池的少量早期循环数据）的数据对模型的输出全连接层进行重新训练。微调时采用比初始学习率更低的速率，以便在较小范围内调整参数，既保留了从源电池学习到的通用退化知识，又融入了目标电池的个性化特征。
此策略旨在以极低的额外数据收集成本（仅需目标电池的少量循环数据），克服因化学组成、循环温度等不同导致的电池不一致性问题。
5. 性能评估与对比分析 对于目标数据集（NASA电池），CL-CBAM模型在微调后表现优异。以电池B0005（24°C）、B0029（43°C）和B0055（4°C）为例，即使在B0055存在严重数据丢失和容量再生现象的情况下，模型仍能准确估计SOH并捕捉局部波动。在采样模式1的30(10)条件下，三者的平均RMSE分别为0.56%、0.90%和1.82%，MAE分别为0.46%、0.66%和1.31%。与未经注意力机制强化的CNN-LSTM模型相比，CL-CBAM模型在目标数据集上的平均RMSE降低了约20.6%；与参数量庞大的LSTM模型相比，RMSE降低了约21.7%。这证明了CBAM模块在提升模型特征选择能力和跨域泛化性能方面的关键作用。
三、主要结果本研究的主要结果可概括为以下三个方面：
验证了基于部分充电电压片段的端到端SOH估计的可行性：实验结果表明，直接使用从3.81V起始的、长度仅为300秒至600秒的充电电压片段作为输入，CL-CBAM模型即可在Oxford源数据集上实现高精度SOH估计，最佳RMSE和MAE分别达到0.17%和0.14%。这克服了对完整充电曲线的依赖，极大地增强了方法在实际电动汽车应用中的实用性。不同采样频率和电压窗口的对比实验为实际BMS的数据采集策略提供了参考依据（如20秒采样间隔可能是一个较好的平衡点）。
证明了CNN-CBAM-LSTM混合模型的优越性：在与传统LSTM和CNN-LSTM模型的对比中，CL-CBAM模型在源数据集和目标数据集上均展现出更高的估计精度和更强的鲁棒性。尽管模型结构更深，但参数量控制得当，计算效率高。CBAM模块通过通道和空间维度的顺序注意力分配，有效提升了模型对关键退化特征的聚焦能力，抑制了噪声，这是其性能提升的核心原因。同时，LSTM层确保模型能够处理电池老化过程中的时序动态和容量再生等复杂现象。
实现了基于迁移学习的跨电池类型/工况的SOH估计：通过“预训练+微调”的迁移学习策略，本研究成功地将从一种化学体系（Oxford电池）和工况（40°C恒温动态放电）中学到的知识，迁移应用于另一种化学体系（NASA电池）和多种温度工况（24°C， 43°C， 4°C）的电池SOH估计中。仅需目标电池的少量数据对输出层进行微调，即可实现高精度估计。这解决了因电池不一致性导致模型需要大量目标数据重新训练的问题，显著降低了模型开发和应用的成本。
四、研究结论与意义本研究成功开发了一种结合注意力机制的混合神经网络模型（CNN-CBAM-LSTM），用于锂离子电池的健康状态估计。该模型能够直接从部分充电电压曲线中自动提取健康特征，避免了复杂的人工特征工程流程。通过设计多种采样方法，降低了对数据完整性的要求，拓宽了方法的适用范围。研究利用两个公开的、具有不同电池类型和循环条件的数据集进行了全面验证。
科学价值与应用价值： * 方法论贡献：为数据驱动的电池SOH估计提供了一种新颖的、高效的深度学习框架。将CBAM注意力机制引入电池健康估计领域，并证明其能有效提升特征提取的针对性和模型的泛化能力。 * 技术实用性：所提方法对输入数据要求低（仅需部分充电电压片段），模型结构高效，且通过迁移学习策略减少了对目标电池数据量的需求，这使得其在复杂多变的实际电动汽车运行场景中具有很高的应用潜力。 * 解决关键问题：成功应对了电池不一致性、容量再生现象以及全生命周期复杂工况下SOH精确估计的挑战。
五、研究亮点输入创新：首次系统性地提出并验证了直接使用极短的部分充电电压片段（低至300秒）作为深度学习模型输入来实现高精度SOH估计的可行性，这更贴近电动汽车的实际使用场景。
模型结构创新：构建了CNN-CBAM-LSTM混合模型，创新性地将轻量级卷积块注意力模块（CBAM）引入电池健康估计领域。该模块通过“通道-空间”顺序注意力机制，实现了对关键退化特征的自适应强化，是模型性能超越传统结构的关键。
应用策略创新：成功应用了基于微调的迁移学习策略，仅用目标电池的极少数据即可使模型适应新的电池类型和循环条件，为解决电池不一致性这一行业难题提供了有效且低成本的解决方案。
综合性能优异：在保持模型参数规模相对较小、结构高效的同时，在源数据集和目标数据集上均取得了当时（与文中列举的同期其他方法相比）领先的估计精度（最佳RMSE 0.17%， MAE 0.14%），展现了卓越的精度-效率平衡。
六、其他有价值内容本研究还包含了对实验细节的充分描述，如电池数据的具体参数（表1）、采样方法的可视化说明（图3）、不同采样片段与容量的相关性分析（表2）、模型超参数设置（表5）以及详细的误差结果表格（表7， 表9）。这些内容为其他研究者复现或借鉴该方法提供了完整的信息。此外，作者在讨论部分对现象进行了深入分析（如解释为何20秒采样频率表现更佳），体现了研究的严谨性。最后，作者展望了未来研究方向，包括在更复杂、多变量的工况下实现SOH估计，以及基于先进深度学习技术预测不确定条件下的电池退化轨迹。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问