本研究报告介绍的是由 Xinghua Liu, Linxiang Zhou, Jiaqiang Tian*, Longxing Wu, Zhongbao Wei, Hany M. Hasanien, Peng Wang 等研究者共同完成的一项原创性学术研究。该研究于2025年8月16日被接受,并于2025年8月28日在线发表于 Journal of Energy Chemistry 期刊第112卷。论文标题为《Battery SOH enhanced solution: voltage reconstruction and image recognition response to loss of data scenarios》。
一、 研究背景与目标
本研究的核心科学领域是锂电池健康状态(State of Health, SOH)的智能估计,隶属于电池管理系统(Battery Management System, BMS)和预测与健康管理(Prognostics and Health Management, PHM)范畴。锂离子电池因其高能量密度等优点,已成为电动汽车、储能系统的关键部件。然而,电池在长期充放电循环中会发生不可逆的退化,其健康状态(SOH)是评估电池性能衰减、预测剩余寿命、保障系统安全运行的关键指标。
目前,基于数据驱动的SOH估计方法(如深度学习)因其不依赖复杂物理模型而受到广泛关注。然而,在实际应用中,此类方法面临两大主要挑战:第一,由于通信中断、传感器故障或环境干扰,关键的电池运行数据(尤其是充电电压数据)经常会发生缺失,这会严重影响后续模型的训练与预测精度。第二,传统的特征提取方法多依赖于人工经验设计,难以充分捕捉电池老化过程中复杂的非线性变化和时序依赖关系;而一维序列建模方法难以同时兼顾局部细节与整体趋势。
为此,本研究旨在解决上述问题,并提出了一种创新的解决方案。研究的目标是开发一种能够有效应对数据缺失场景、且能自动高效提取特征的电池SOH估计方法。具体而言,研究提出了一个集成了“电压数据重构”、“数据可视化”和“图像识别”的深度学习框架,以期在数据不完整的条件下,仍能实现高精度的电池健康状态估计。
二、 详细研究流程
本研究的工作流程清晰分为三个主要部分:数据预处理与重构、图像转换与标准化、模型构建与SOH估计。
第一部分:数据预处理与重构(基于LSGAN) 研究的对象是两类商用锂离子电池:LiNCA 电池(额定容量2.4 Ah)和 LiFePO4 电池(额定容量2.5 Ah)。研究团队设计了电池老化实验,使用高精度电池测试平台(Neware CT-4008T10V10A)在恒温(25°C)条件下对电池进行循环充放电测试。充电采用恒流-恒压(CC-CV)模式,放电采用恒定电流。在整个老化测试过程中,持续采集每个循环的充电电压时间序列数据以及对应的放电容量(用于计算真实SOH值,SOH = 当前循环放电容量 / 初始额定容量)。
为了模拟实际应用中数据丢失的情况,研究团队在完整的充电电压序列上人为制造了缺失段,设定了 10%、30%、50% 三种缺失率。为解决数据缺失问题,本研究没有采用简单的插值方法,而是引入了一种先进的生成式模型——最小二乘生成对抗网络(Least Squares Generative Adversarial Network, LSGAN) 来进行数据重建。LSGAN是对原始GAN的改进,它使用最小二乘损失函数替代了原始的Sigmoid交叉熵损失函数。这一改进使得训练过程更加稳定,收敛更快,生成的数据质量更高。LSGAN同样包含一个生成器(G)和一个判别器(D)。在本研究中,生成器的目标是学习从含缺失数据的序列中恢复出完整的、逼近真实数据的电压序列;判别器的目标是尽可能准确地区分“真实完整数据”和“生成器重建的数据”。通过两者的对抗博弈,最终训练出一个能够高质量重建缺失电压数据的生成器模型。研究将LSGAN与另一种常见的条件生成对抗网络(CGAN)进行了对比实验。
第二部分:图像转换与标准化(基于GAF) 获得重建的完整电压序列后,研究面临如何从中自动提取有效特征的挑战。本研究摒弃了传统的手工特征提取方式,提出了一种新颖的数据视角转换方法——格拉米角场(Gramian Angular Field, GAF)。GAF是一种将一维时间序列数据转换为二维图像表示的技术。其核心步骤是:首先将归一化后的时间序列值映射到极坐标系中(数值转换为角度,时间转换为半径);然后,通过计算不同时间点之间角度的三角函数和(Gramian Angular Summation Field, GASF)或差(Gramian Angular Difference Field, GADF),生成一个二维矩阵,该矩阵即被视为一张图像。这种转换方法的优势在于,它完全保留了原始时间序列的时间顺序特性以及数据点之间的相关性,并将复杂的非线性演化模式编码到了图像纹理中。生成的GAF图像(本研究使用了GASF和GADF)作为后续深度学习模型的输入。
第三部分:模型构建与SOH估计(基于Swin Transformer-LSTM) 对于转换得到的图像数据,本研究构建了一个新颖的混合深度学习模型,称为 Swin Transformer-LSTM (SwinT-LSTM) 模型,用于特征提取和回归预测。该模型结合了两种强大的网络架构的优势: 1. Swin Transformer:这是一种基于视觉Transformer的先进图像特征提取器。与标准Transformer相比,Swin Transformer引入了移位窗口(Shifted Window) 机制和分层结构,使其能够高效地处理高分辨率图像,同时捕捉从局部细节到全局结构的特征。在本研究中,Swin Transformer负责从GAF图像中自动提取丰富的空间-特征表示。 2. 长短期记忆网络(Long Short-Term Memory, LSTM):这是一种专为序列数据设计的循环神经网络,擅长捕捉长期依赖关系。在本研究中,将电池多个连续循环的Swin Transformer提取出的特征按时间顺序排列,形成一个特征序列,然后输入到LSTM网络中。LSTM负责学习电池健康状态随时间退化的动态趋势和时序模式。
最终,LSTM的最后一个隐藏状态被传递给一个全连接层,输出当前电池循环的SOH估计值。整个SwinT-LSTM模型以一种端到端的方式进行训练和预测。
为了验证所提方法的优越性,研究设计了多组对比实验。首先,在数据重建阶段,比较了LSGAN和CGAN在不同缺失率下的重建精度,使用决定系数(R²) 和平均绝对百分比误差(MAPE) 作为评价指标。其次,在SOH估计阶段,将提出的SwinT-LSTM模型与三种主流深度学习模型进行了对比,包括深度卷积神经网络(DCNN)、GoogLeNet和标准LSTM。评价指标为平均绝对误差(MAE) 和均方根误差(RMSE)。此外,为了模拟实际中数据极度匮乏的场景,研究还测试了在仅使用前50%的循环数据作为训练集(后50%作为测试集)的情况下,各模型的性能表现。所有实验均在相同的软硬件环境(Python 3.12.4, PyTorch 2.3.1)下进行,以确保公平性。
三、 主要研究结果
1. 电压数据重建结果: 实验结果表明,所提出的LSGAN方法在电池充电电压数据重建任务上显著优于CGAN方法。对于LiNCA和LiFePO4两种电池,在不同缺失率(10%, 30%, 50%)下,LSGAN重建数据的R²值更高(更接近1),MAPE值更低。例如,对于LiNCA电池在50%缺失率下,LSGAN的R²为0.9762,MAPE为1.22%;而CGAN的R²为0.9721,MAPE为1.47%。更高的R²和更低的MAPE表明LSGAN重建的数据不仅在整体趋势上,而且在局部数值上都更贴近真实数据,证明了其重建的准确性和保真度。这为后续的SOH估计提供了更完整、更可靠的数据基础。
2. SOH估计结果: 在SOH估计的对比实验中,提出的SwinT-LSTM模型在所有测试场景下都表现出了最佳的性能。 * 在70%数据训练场景下:无论是LiNCA还是LiFePO4电池,在10%、30%、50%缺失率条件下,SwinT-LSTM的MAE和RMSE均远低于其他对比模型。例如,对于LiNCA电池在50%缺失率下,SwinT-LSTM的MAE为0.88%,而DCNN、GoogLeNet和LSTM的MAE分别为1.83%、1.65%和1.29%。这表明即使在数据严重缺失并经过重建后,SwinT-LSTM模型仍能实现高精度估计。 * 在50%数据训练(高缺失场景模拟)下:结果同样令人信服。即使只使用前半段循环数据训练,SwinT-LSTM模型依然保持了最高的估计精度。例如,LiFePO4电池在50%缺失率下,SwinT-LSTM的MAE为0.107%,而对比模型的MAE在0.179%至0.249%之间。这证明了该模型在训练数据有限情况下的强大泛化能力和鲁棒性。
实验结果支持了以下逻辑链条:首先,LSGAN成功重建了缺失数据,提供了可用于模型训练的高质量输入(结果1)。接着,GAF将重建的一维序列转换为图像,有效保留了时序特征并提升了特征表达能力。最后,SwinT-LSTM模型充分利用了图像中的全局结构和局部细节(通过Swin Transformer),并结合了电池老化过程的时序动态(通过LSTM),从而实现了在各种数据缺失和训练数据比例条件下的精准SOH估计(结果2)。重建步骤的准确性是整个流程有效的前提,而先进的图像转换与模型架构是达成高精度估计的关键。
四、 研究结论与价值
本研究成功提出并验证了一种针对数据缺失场景的电池SOH估计增强解决方案。主要结论是:通过集成最小二乘生成对抗网络(LSGAN)进行数据重建、格拉米角场(GAF)进行数据可视化、以及Swin Transformer-LSTM(SwinT-LSTM)混合模型进行特征提取与回归预测,能够有效克服实际应用中数据不完整和特征提取困难的挑战,实现高精度、高鲁棒性的电池健康状态在线估计。
本研究的科学价值在于:第一,将生成对抗网络创新性地应用于电池时序数据的修复重建任务,为处理BMS中普遍存在的数据缺失问题提供了新的思路。第二,引入了GAF将时序数据图像化,并结合先进的视觉Transformer模型进行特征学习,这是一种跨模态的特征提取新范式,避免了手工特征的局限性,充分挖掘了数据中隐含的复杂模式。第三,构建的SwinT-LSTM混合模型巧妙结合了图像全局/局部特征提取与序列时序建模的优势,为时序预测问题提供了新的网络架构参考。
其应用价值十分显著:该方法能够提升电池管理系统在非理想数据条件下的可靠性和实用性,对于延长电池使用寿命、保障电动汽车和储能系统安全、实现精准的能源管理具有重要的现实意义。它为开发下一代智能、鲁棒的电池健康状态监测系统提供了可行的技术路径。
五、 研究亮点
六、 其他有价值内容
论文还讨论了所提方法的计算效率。虽然SwinT-LSTM模型由于其复杂的注意力计算,训练时间略长于DCNN、GoogLeNet和LSTM等对比模型,但考虑到其带来的显著精度提升,这种计算成本是可接受的。此外,作者在展望中指出,未来研究可以进一步扩展该方法对不同缺失模式(如随机缺失、连续块缺失)的适应性,并探索结合多源特征(如电流、温度)进行融合预测,以构建更高效、更准确的电池全生命周期健康管理系统。