基于数据预处理和长短期记忆神经网络的锂离子电池寿命预测

黄 凯1 丁 恒1 郭永芳2 田海建1

(1. 省部共建电工装备可靠性与智能化国家重点实验室(河北工业大学) 天津 300130 2. 河北工业大学人工智能与数据科学学院 天津 300130)

摘要 锂离子电池剩余使用寿命(RUL)可以评估电池的可靠性,是电池健康管理的重要参数。准确地预测电池的RUL可以有效提高设备的安全性并降低工作风险。该文提出一种自适应数据预处理结合长短期记忆神经网络(LSTM)的RUL预测框架。选取容量作为健康因子,数据预处理阶段,首先使用自适应双指数模型平滑方法减少容量回升现象产生的负面影响,然后通过自适应白噪声完整集成经验模态分解(CEEMDAN)对数据进行降噪;模型构建阶段,利用预处理后的数据训练得到用于RUL预测的LSTM模型。以NASA和CALCE公开数据集为研究对象进行算法性能测试,实验结果表明,所提方法鲁棒性好,能够提供精确的RUL预测结果。

关键词:锂电池 剩余使用寿命 自适应双指数模型平滑方法 自适应白噪声完整集成经验模态分解 长短期记忆神经网络

0 引言

锂离子电池因其能量密度高、自放电率低、循环寿命长、节能环保等优点被广泛应用于航空航天、电动汽车、电子设备和通信系统等众多领域[1-3]。然而,随着锂离子电池使用时间的增加,电池将会不可避免地老化,如果在失效前无法及时更换电池,将会导致设备运行异常并引起事故的发生。电池剩余寿命(Remaining Useful Life, RUL)指的是电池在性能退化到失效阈值之前剩余的充放电循环次数,是表征电池性能的一个重要指标。准确地预测电池RUL可以为电池的及时维修和更换提供参考,以实现对设备的预防性维护[4-5]

在现有文献中,电池RUL预测方法主要分为基于模型的方法和数据驱动方法。

基于模型的预测方法通过探究电池的物理化学反应和内部构造来建立动态模型,结合粒子滤波(Particle Filter, PF)及其衍生算法对参数进行估计,实现RUL预测[6-8]。但存在两个主要缺点阻碍了基于模型预测方法在实际应用中的可行性:①粒子滤波方法存在粒子贫化的问题,很容易导致RUL预测结果不准确;②由于电池内部反应机制过于复杂,建立精确的退化模型有很大难度[9-11]。相比之下,数据驱动方法操作简易、使用方便,可以有效地避免上述问题。

基于数据驱动的预测方法不需要考虑复杂的电化学特性,而是从原始数据中提取可以反映退化趋势的健康因子(电压、电流、电阻、容量等),通过智能算法进行学习并完成RUL预测。数据驱动方法主要包括支持向量回归(Support Vector Regression, SVR)、相关向量机(Relevance Vector Machine, RVM)、高斯过程回归(Gaussian Process Regression, GPR)及神经网络(Artificial Neural Network, ANN)等。文献[12]以容量和等压降放电时间作为健康因子,采用集成经验模式分解(Ensemble Empirical Mode Decomposition, EEMD)对健康因子进行预处理,以减少原始数据中容量回升和噪声的影响,引入相空间重构技术(Phase Space Reconstruction, PSR)优化输入序列,与SVR结合完成RUL预测。文献[13]采用期望最大化算法更新时变参数,结合RVM算法建立了多步预测模型。但由于RVM的高稀疏性,基于RVM的预测方法往往不够稳定。文献[14]通过对容量曲线的分析,从斜率、截距、峰值等不同尺度中提取四种退化特征,通过GPR算法进行建模并完成RUL预测。相比于长短期记忆神经网络(Long Short-Term Memory Network, LSTM),GPR算法的超参数调整过程较为复杂,且建模困难。文献[15]利用EEMD方法将电池的退化趋势分解成多个分量,然后采用自回归积分滑动平均模型(Autoregressive Integrated Moving Average, ARIMA)进行建模,从而获得RUL。文献[16]为模拟电动汽车实际工作情况,将锂离子电池置于振动应力下进行实验,提取等压降放电时间,建立了基于Elman神经网络的预测模型。相比LSTM神经网络,Elman神经网络在处理时间序列预测问题时不够稳定。文献[17]通过分析电池充电过程端电压曲线的变化规律,得到退化特征作为前馈神经网络(Feed Forward Neural Network, FFNN)输入完成RUL预测。

除了上述数据驱动方法外,深度学习在复杂系统建模中具有更好的学习能力,已成为电池健康管理的热点研究领域。LSTM是一种深度学习神经网络,由于结构的特殊性,更适合处理时间序列预测问题[18]。文献[19]对LSTM进行改进,设计了一个电池间可以共享信息的预测框架,加入恒定误差选择轮盘(Constant Error Carousel, CEC)隔绝噪声,建立SOH和RUL预测模型,但是对数据的预处理程度不够,使模型会受到原始数据噪声分量的干扰。文献[20]将双向LSTM应用在非生命周期数据集中,选取新的隐含层丢弃技术防止模型过拟合。文献[21]采用经验模态分解(Empirical Mode Decomposition, EMD)将容量数据分解为低频和高频两种分量,分别通过Elman和LSTM神经网络建模,并整合预测结果预测RUL,但并未考虑EMD本身的局限性,相比于自适应白噪声完整集成经验模态分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise, CEEMDAN),EMD更容易出现模式混合问题。文献[22-25]表明,CEEMDAN广泛应用于股票投资、生物医学、光伏发电等领域,可以与LSTM组合构成相对理想的预测模型。

基于上述分析可知,影响RUL预测精度的主要因素在于数据预处理技术和RUL建模方法。考虑到实际应用中容量回升问题,提出一种自适应数据预处理方法,结合LSTM建立了RUL预测模型。论文以容量作为健康因子,通过自适应双指数模型平滑方法(Adaptive Bi-exponential Model Smooth, ABMS)消除了容量回升现象,利用CEEMDAN分解出容量数据中的噪声分量,最终选择擅长时序预测的LSTM神经网络建立RUL预测框架。这种数据预处理方法既对容量进行了平滑处理,又保留了数据的原始特征,而且避免了噪声分量的影响,采用的LSTM神经网络对长时间依赖问题有更好的处理策略。实验结果表明,ABMS- CEEMDAN-LSTM可有效应用于电池RUL预测。

1 CEEMDAN和LSTM理论基础

1.1 CEEMDAN

CEEMDAN是基于EEMD和EMD的改进算法,具有模谱分离效果好、屏蔽迭代次数少、计算成本低等优点,常用于处理非平稳和非线性信号[26-28]。CEEMDAN具体步骤如下。

(1)向原始信号S(t)加入初始振幅为ε0的高斯白噪声ε0ωi(t),得到width=84.9,height=15.05width=55.9,height=15.05,使用EMD对width=22.05,height=15.05进行分解,得出第一阶段的i个模态分量width=23.65,height=15.6,对width=23.65,height=15.6取平均值得到第一个模态分量width=23.65,height=15.05

width=73.65,height=29.55(1)

(2)计算第一个残差。

width=80.1,height=16.65(2)

(3)用width=23.65,height=15.05表示经过EMD处理后得到的第k个模态分量,对信号width=74.2,height=15.05进行分解得到第二个模态分量为

width=142.45,height=29.55(3)

(4)对于width=51.6,height=14.5,计算第k个残差为

width=90.25,height=16.65(4)

(5)对信号width=77.9,height=15.05进行分解,得到第k+1个模态分量为

width=150.95,height=29.55(5)

(6)重复步骤(4)和步骤(5),直至最后的width=23.65,height=15.05无法分解,得到最终残差为

width=95.65,height=29.55(6)

式中,n为模态分量总数。

1.2 LSTM

LSTM是递归神经网络(Recurrent Neural Network, RNN)的一种改进版本,它克服了RNN梯度爆炸和梯度消失的缺点[29]。LSTM的神经元内部结构如图1所示,LSTM神经元由输入门、遗忘门和输出门三部分组成,这些门用于更新或丢弃历史信息,使LSTM具备了长期记忆能力,其原理公式为

width=103.1,height=15.6(7)
width=95.6,height=15.05(8)
width=112.9,height=16.65(9)
width=68.8,height=16.65(10)
width=103.1,height=15.05(11)
width=66.65,height=15.05(12)

式中,xtht分别为时间t对应的输入和隐藏状态;ftitot分别为遗忘门、输入门和输出门状态;width=12.9,height=15.05Ctht分别为待更新神经元和单元状态;WfWiWcWobfbibcbo分别为各个门权重矩阵和偏置项;σ为隐藏层中的Sigmoid激活函数。

width=162.75,height=87.75

图1 LSTM神经元内部结构

Fig.1 Internalstructure of LSTM neurons

2 基于自适应数据预处理和LSTM的预测方法

2.1 方法框架

本文提出的RUL估计框架如图2所示。

该框架涉及实现目标的三个主要阶段。

(1)选取容量作为反映RUL退化趋势的健康因子,通过自适应双指数模型平滑方法去除原始数据中由容量回升现象产生的波动,得到退化趋势相对平稳的容量序列。

(2)采用CEEMDAN分解平滑处理后的容量序列,得到可以反映退化主趋势的残差width=23.65,height=15.05和有限个模态分量width=25.25,height=15.05

(3)选取残差width=26.35,height=15.05组建训练样本集,结合LSTM神经网络建立容量前期与后期的映射关系,并对未知的容量序列进行预测。通过迭代预测得到起点后每一个循环的容量预测值,进而计算出锂离子电池RUL。

width=174,height=257.25

图2 本文提出方法的预测框架

Fig.2 Prediction framework of the paper

2.2 实验数据集介绍与分析

采用两种具有不同电极材料和放电环境的锂离子电池数据集验证本文算法的性能。

第一组数据来自NASA PCoE研究中心的公开数据集,选取其中的B5、B6、B7、B18号电池作为研究对象[30]。电池额定容量为2A·h,在室温下进行充放电过程:首先以1.5A恒定电流进行充电,直到达到4.2V截止电压;然后继续以恒压模式充电,直到充电电流降至20mA;最后以2A恒定电流进行放电,直到B5、B6、B7、B18电池电压分别降至2.7V、2.5V、2.2V和2.5V时停止。

第二组数据来自马里兰大学CALCE中心[31]。选取标号为A1、A2、A3的电池作为研究对象。每个电池的额定容量为0.9A·h,电池同样进行恒流、恒压充电与恒流放电过程。其中,恒流充电电流为0.45A,充电截止电压为4.2V,恒流放电电流为0.45A,放电截止电压为2.7V。

实验电池参数见表1,包括充电截止电压(Charging cut-off Voltage, CV)、放电截止电压(Discharging cut-off Voltage, DV)、恒流充电电流(Constant charging Current, CC)、放电电流(Discharging Current, DC)以及失效阈值(Failure Threshold, FT,也称故障阈值)。国际标准对锂离子电池性能测试的规定为:锂离子电池在常温((25±2)℃)下保持正常工作状态,当电池实际容量降至额定容量的80%以下时认为电池失效,为保证系统运行的安全和可靠性需对电池进行更换[32]。在许多研究中,失效阈值设定为额定容量的70%~80%[33-34]

表1 老化实验中的电池参数

Tab.1 Battery parameters in aging experiment

电池编号CV/VDV/VCC/ADC/AFT/(A·h) B54.22.71.521.4 B64.22.51.521.4 B74.22.21.521.45 B184.22.51.521.4 A14.22.70.450.450.72 A24.22.70.450.450.72 A34.22.70.450.450.72

NASA数据集中的描述文件将本集中电池的失效阈值设定为70%。同文献[35],B5、B6、B18号电池的失效阈值设定为1.4A·h,考虑到B7号电池容量没有下降到1.4A·h,选取1.45A·h作为其失效阈值。

同文献[36],CALCE数据集下电池A1、A2、A3的失效阈值定义为额定容量的80%(0.72A·h)。两组数据集的电池容量退化曲线如图3所示。

width=189,height=245.25

图3 电池容量退化曲线

Fig.3 Capacity degradation curves of batteries

2.3 RUL定义和模型评估标准

电池RUL定义为预测起点至电池寿命结束时的剩余可使用循环数。当电池实际容量退化至失效阈值时认为电池寿命结束,设定T为起始循环位置,width=20.4,height=15.05为实际状态下电池寿命结束时的所在周期数,电池RUL为[37]

width=69.85,height=15.05(13)

电池RUL预测值为

width=62.85,height=16.65(14)

式中,width=20.4,height=16.65为预测情况下电池寿命结束时的所在周期数。

采用绝对误差(Absolute Error, AE)、平均绝对误差(Mean Absolute Error, MAE)和方均根误差(Root Mean Square Error, RMSE)作为预测模型的评价准则,公式为

width=74.15,height=16.65(15)
width=101,height=29.55(16)
width=117.65,height=31.7(17)

式中,width=9.15,height=9.65为预测循环周期数;width=20.4,height=16.65为RUL预测值;x(i)为容量真实值;width=18.8,height=15.05为容量预测值。需要注意的是,RMSE是最综合的评价指标,它可以衡量预测曲线与实际退化趋势的贴合程度。RMSE越接近0,说明预测效果越好。

对于本文方法,为证明方法稳定性,加入90%置信区间(Confidence Interval, CI)作为评价准则。

width=87.05,height=14.5(18)

式中,U_CI为RUL90%置信区间的上限;L_CI为RUL90%置信区间的下限。U_CI和L_CI分别根据RUL的概率密度分布函数(Probability Density Function, PDF)确定。文中的PDF是ABMS-CEEMDAN-LSTM方法运行100次后的RUL预测分布。在100次运行条件下,只有本文方法能够得到PDF,其他对比方法均有部分预测曲线未下降至失效阈值,进而无法计算RUL,这从侧面反映出本文方法的鲁棒性较好。

90%置信区间的上界是PDF值为95%时横坐标对应的循环位置,置信区间的下界是PDF值为5%时横坐标对应的循环位置。

2.4 自适应双指数模型平滑处理

作为RUL预测最常用的健康因子,电池实际容量(最大放电容量)可以直接描述锂离子电池老化过程,因此本文选取容量作为反映RUL的退化特征。

如图3所示,容量与周期数之间的关系为非线性。因受电磁干扰、充放电倍率差异、外部环境变化以及化学反应等因素的影响,电池老化曲线存在容量回升现象,并且夹杂着噪声信号,这为模型的训练过程增加了难度。必要的数据预处理可以帮助模型在训练阶段更好地学习序列信息。

为了能够去除容量曲线中的不规律波动且保留数据的原始特征,本文提出自适应双指数模型平滑方法(Adaptive Biexponential Model Smooth, ABMS)。使用双指数模型的拟合曲线替代容量回升区间,达到对原始数据的选择平滑处理。ABMS原理如图4所示。

width=186,height=114

图4 ABMS处理方法原理

Fig.4 Schematic diagram of ABMS processing method

大量研究表明[38],双指数模型能够更准确地描述容量的下降趋势,表达式为

width=108.55,height=15.6(19)

式中,j为所在的循环位置;width=12.9,height=15.6为第j循环的容量拟合值;width=9.15,height=9.65width=9.15,height=12.9width=8.05,height=9.65width=9.65,height=12.9为参数。通过拟合工具箱得到四个电池容量数据的双指数模型拟合曲线。width=9.15,height=9.65width=9.15,height=12.9width=8.05,height=9.65width=9.65,height=12.9和曲线的拟合程度见表2。四条拟合曲线对应的RMSE分别为0.022 59、0.034 93、0.023 02和0.033 03,表明所得曲线的拟合效果很好。

表2 拟合曲线参数

Tab.2 Fitting curve parameters

电池编号abcdRMSE B51.573-0.1322-4.809×10-4-3.3770.022 59 B60.980 4-0.27120.529 70.045 960.034 93 B71.633-0.099 828.212×10-53.6030.023 02 B181.858-0.002 921.91×10-40.04820.033 03

以B5号电池为例,对原始容量数据进行分析,找出需要处理的波动区域和需要保留的平稳区域。从图4可以看出,“○”形拟合曲线部分对应的是波动所在循环区间,而实线部分对应平稳区域所在循环区间。将“○”形拟合曲线部分与原始数据单调递减区域进行拼接,完成对容量数据的自适应平滑处理,处理效果如图5所示。

width=186,height=99

图5 ABMS处理结果

Fig.5 ABMS processing result chart

经过ABMS方法处理后,电池容量曲线在保留数据原始特征的基础上消除了容量回升现象和异常值,这使降噪分解过程的工作量相对减少,使CEEMDAN方法专注于去除噪声分量,尽量保证数据预处理的稳定性,也减少了不确定因素对降噪过程的影响。

2.5 CEEMDAN降噪处理

为了减少噪声信号对容量数据的负面影响,采用CEEMDAN对信号进行分解,得到有限个模态分量和残差。以B5号电池为例,分解后的残差分量如图6所示,模态分量如图7所示。对四个电池分解分量与原始容量序列进行相关性分析,结果见表3。(其中,B6、B7号电池分解后未出现IMF5分量,故表3对应IMF5处用符号‘—’表示。)

width=185.25,height=99.75

图6 B5号电池分解后的残差

Fig.6 Residual after decomposition of B5 battery

width=195.75,height=203.25

图7 B5号电池分解后的模态分量

Fig.7 Modal component after decomposition of B5 battery

表3 分解结果与容量的相关系数

Tab.3 Correlation coefficient between decomposition results and capacity

分量B5B6B7B18 IMF10.022 90.047 50.007 90.042 0 IMF20.083 80.081 40.014 50.130 9 IMF30.016 10.052 70.037 80.034 3 IMF4-0.022 60.088 70.123 40.155 6 IMF50.004 6——0.246 3 残差0.994 00.991 10.990 40.980 6

由图7可以看出,B5号电池分解得到的模态分量与原始容量相关性极低且无规律性,都可被视为噪声信号。由表3可知,残差的相关系数比其他模态分量要大得多。从图6中可以看出,残差代表了电池的主要退化趋势。因此,本文选择分解后的残差作为降噪处理的最终结果。通过对数据流的平滑降噪处理,避免了局部分量的干扰。

2.6 基于LSTM的预测模型

对原始容量平滑降噪处理后,使用预测起点T将数据划分为训练集width=21.5,height=15.05和测试集width=18.8,height=15.05,分别为

width=128.95,height=31.15(20)

将训练数据划分为输入层和输出层,输入层单次输入数据量由滑动窗口L控制,训练集划分流程如图8所示。

width=216.75,height=158.25

图8 训练集划分流程

Fig.8 Training set partition process

LSTM神经网络训练和预测流程如图9所示,由于“门”结构的存在使LSTM可以自行判别和筛选过往信息流,进而完成对训练集的充分学习,最终建立了容量前期与后期的非线性映射关系,将训练过的LSTM模型表示为

width=153.15,height=16.65(21)

式中,width=18.25,height=16.65为下一循环的容量预测值。将测试集width=18.8,height=15.05作为输入数据代入式(21)进行迭代预测,得出起点T后每一循环的容量预测值,从而完成对RUL的计算。

width=180,height=251.25

图9 LSTM神经网络训练和预测流程

Fig.9 The flow chart LSTM neural network training and prediction

2.7 复杂度分析

采用大O表示法从时间和空间这两个方面对ABMS-CEEMDAN-LSTM方法进行复杂度分析。本文方法主要由三种算法构成:ABMS算法、CEEMDAN算法和LSTM算法。

2.7.1 时间复杂度

时间复杂度是指执行算法所需要的计算工作量,即时间增长趋势。

ABMS算法本质目的是筛除原始容量序列中的不合理区间,程序运行和数据量关联不大,执行时间基本恒定。忽略常量、低阶、系数后复杂度表示为常量阶O(1)。

CEEMDAN算法由于存在双重循环嵌套的原因,时间复杂度计为二次方阶O(n2),其中,n为需要处理的容量序列总长度。

LSTM算法在训练和预测过程中的循环数与容量序列长度呈线性关系,随着容量序列长度的增加,复杂度也随之线性增加。所以复杂度用线性阶O(n)表示。

对于本文方法,只保留最高阶项,最终时间复杂度的结果为O(n2),与容量序列长度的二次方呈正相关。

2.7.2 空间复杂度

空间复杂度是对算法在运行过程中临时占用存储空间的度量,表示算法的存储空间与处理数据规模之间的增长关系。

对于ABMS算法,算法执行过程所需要的临时空间不随着某个容量序列长度n的大小而变化,复杂度表示为O(1)。对于CEEMDAN算法和LSTM算法,算法执行过程会为变量分配空间,但不会因为加入循环而改变,所以复杂度表示为O(n)。只保留最高阶项,最终空间复杂度的结果为O(n)。

对于ABMS-CEEMDAN-LSTM,时间复杂度为二次方阶O(n2),说明运行的效率偏低,耗费时间较长,处理数据长度增加会导致运行时间的大幅度延长。但是本文中应用的数据长度适中,所以不会对时间复杂度产生较大影响。空间复杂度为线性阶O(n),在本文条件下,运行所占存储空间较少,效率较高。

综上所述,本文方法运行时消耗的时间和空间资源在可接受范围内,复杂度较好。

3 实验结果分析

为验证本文提出的ABMS-CEEMDAN-LSTM方法(M1)的可靠性,设计了三种对比方法。其中,M2为本文提出的自适应数据预处理方法与RVM的组合方法;M3直接采用未处理的容量数据对LSTM进行建模;M4为小波降噪(Wavelet Denoising, WD)与LSTM的组合方法。通过M2来展现LSTM在时序预测方面的准确性,M3和M4则用来说明本文提出的自适应数据预处理方法的优越性。

比较标准为AE、MAE、RMSE,通过NASA PCoE电池数据集和马里兰大学CALCE中心的电池数据集进行实验,每个测试电池设置两个或三个不同的预测起点,在电池数据和起点的多样性下均获得预测效果,检验提出方法的鲁棒性和适应性。起点T设置见表4,四种方法见表5。

表4 起点设置状况

Tab.4 Setting of starting point

电池编号B5B6B7B18A1A2A3 起点18080806513011085 起点210010010075160140100

表5 方法说明

Tab.5 Methods statement

方法描述 M1ABMS-CEEMDAN-LSTM M2混合RVM M3LSTM M4WD-LSTM

图10~图13分别为四种方法在NASA数据集下的RUL单次预测结果,图14~图16分别为M1、M2、M3方法在马里兰大学CALCE中心数据集下的RUL单次预测结果。NASA数据集下四种方法的评价指标对比见表6,B5、B6、B7号电池在90起点下的评价指标对比见表7,CALCE数据集下三种方法的评价指标对比见表8。为提高说服力,增设100次运行结果的RUL概率密度函数和90%置信区间,由于M2、M3、M4的部分运行曲线未下降至失效阈值,导致无法计算RUL,所以只添加M1方法的PDF如图10~图16所示,本文方法在所有运行条件下的RUL90%置信区间见表9。由于比较方法M2、M3、M4部分预测曲线并未到达失效阈值,未计算出RUL和AE,故表6~表8对应部分采用‘—’表示。

width=185.25,height=233.25

图10 B5号电池RUL预测结果

Fig.10 RUL prediction results of B5 battery

width=185.25,height=239.25

图11 B6号电池RUL预测结果

Fig.11 RUL prediction results of B6 battery

width=183.75,height=243.75

图12 B7号电池RUL预测结果

Fig.12 RUL prediction results of B7 battery

width=186.75,height=243

图13 B18号电池RUL预测结果

Fig.13 RUL prediction results of B18 battery

width=179.25,height=114.75

width=177.75,height=114

图14 A1号电池RUL预测结果

Fig.14 RUL prediction results of A1 battery

width=183.75,height=239.25

图15 A2号电池RUL预测结果

Fig.15 RUL prediction results of A2 battery

width=186.75,height=237

图16 A3号电池RUL预测结果

Fig.16 RUL prediction results of A3 battery

表6 四种方法在NASA数据集下的评价指标对比

Tab.6 Comparison of evaluation indexes of four methods in NASA data set

电池预测起点预测方法RUL预测值AEMAE(%)RMSE(%) B580M14941.662.00 M24053.584.81 M3——6.668.08 M462173.724.52 100M12721.461.83 M21878.2810.45 M345205.125.52 M43272.562.75 B680M12632.403.08 M241126.818.07 M359309.4110.67 M43674.655.55 100M1901.492.11 M232239.4010.28 M321126.657.35 M4452.923.75 B780M16851.211.76 M250133.654.15 M3——4.715.43 M4——2.573.28 100M14960.891.16 M229145.086.18 M3——2.903.54 M467241.772.22 B1865M13642.192.76 M218143.594.24 M3——3.343.93 M450182.152.59 75M12202.453.28 M2—2.783.28 M31397.008.35 M437152.743.19

表7 评价指标对比(起点为90)-NASA

Tab.7 Comparison of evaluation indexes (the starting point is 90) -NASA

电池预测方法RUL预测值AEMAE(%)RMSE(%) B5M13611.501.90 M224116.237.75 M34495.596.04 M44273.013.63 B6M12011.531.94 M234158.328.69 M329107.628.14 M42343.124.08 B7M15851.031.55 M2——3.384.01 M3——3.233.89 M469161.941.96

表8 评价指标对比-CALCE

Tab.8 Comparison of evaluation indexes-CALCE

电池预测起点预测方法RUL预测值AEMAE(%)RMSE(%) A1130M17540.741.37 M2——5.488.13 M37811.833.77 160M14450.801.00 M265163.985.84 M34722.725.24 A2110M17900.470.89 M2——3.996.92 M37900.661.74 140M14900.881.90 M2——6.659.41 M3——3.956.85 A385M14521.321.99 M2——5.028.41 M3——4.657.10 100M13111.182.45 M2——5.779.13 M32932.675.23

表9 本文方法在所有运行条件下的RUL90%置信区间(100次运行结果)

Tab.9 The 90% confidence interval (100 run results) of this method under all running conditions

电池预测起点90%置信区间 B580[35, 51][26, 40][16, 29] 90 100 B78090100[52, 73][41, 62][33, 50] A1130160[66, 85][36, 54] A385100[37, 49][24, 35] B68090100[16, 36][10, 23][3, 15] B186575[26, 37][15, 27] A2110140[70, 85][36, 53]

通过仿真结果和评价指标对比可概括规律如下:

(1)从图10~图16中可以看出,本文提出的方法预测趋势更接近真实的容量退化曲线,预测精度明显优于混合RVM、LSTM和WD-LSTM方法,观察PDF可知,M1方法预测效果十分稳定,大部分运行结果下的预测RUL都集中在真实值附近,曲线对容量趋势的跟踪效果理想。

(2)由表6~表8和图10~图16可知,不同的预测起点下预测效果会有一定差异,起点靠后情况下四种方法的预测结果明显优于起点靠前情况。起点后移意味着训练数据的增加,模型通过学习更多的循环数据,可以获得更精准的预测性能,跟踪趋势则会更趋近于老化曲线。值得注意的是,从两类电池预测结果可以看出,训练数据集的变动基本未对本文方法预测效果产生干扰,可以看出本文方法预测非常稳定。

(3)对于马里兰大学CALCE中心的电池数据集,三种方法的RUL预测曲线如图8所示。相比于下降趋势平缓的NASA数据集,A1、A2、A3号电池容量曲线下降坡度差异明显,趋势更加难以捕捉。由图14~图16、表8可知,基于ABMS-CEEMDAN-LSTM方法的容量预测值最接近真实值。而混合RVM方法和LSTM方法的容量预测曲线在大多数情况下无法对真实退化趋势做到有效跟踪,与实际值偏差较大。结果表明,在使用退化趋势不规律的放电数据集时,M1方法预测效果十分稳定,与M2方法、M3方法相比仍具有很大的优势。电池种类和预测条件的改变基本未对M1方法造成干扰,反映出M1方法具有很好的稳定性和适应性。

(4)由表6~表9和图10~图16可知,在不同种类电池和不同训练数据集下,本文提出的方法可以提供较为准确的RUL预测,预测曲线MAE和RMSE在2.45%和3.28%以内,最低为0.47%和0.89%。大部分条件下的RUL90%置信区间在可接受范围内,反映了RUL预测的精度和可信度。以B5号电池为例,在起点80、90、100下AE值为4、1、2,MAE值为1.66%、1.50%、1.46%,RMSE值为2.00%、1.90%、1.83%,三种指标均为同条件下最小。

值得一提的是,由于B7、B18电池容量主趋势变动幅度较大,导致该条件下M1预测结果MAE值和RMSE值均未达到最低值。但所有情况下M1的预测曲线与主趋势都非常接近,AE值均保持较低水平,表明本文方法可以更好预测电池RUL。

为进一步验证所提方法性能,与现有文献中提到的预测方法进行了比较,M5为遗传算法(Genetic Algorithm, GA)和极限学习机(Extreme Learning Machine, ELM)的组合方法[39];M6为蚁狮算法(Ant Lion Optimization, ALO)和SVR的组合方法[40];M7为基于Elman神经网络的预测方法[16],通过MAE和RMSE这两个指标来评估各方法性能。各方法的对比结果如图17和图18所示,采用B5、B6、B7号电池的退化数据作为它们的训练和验证集,预测起点设置为80和100。可以看出,ABMS-CEEMDAN-LSTM方法的MAE和RMSE在同条件下都是最小的,说明本文所提方法具有较高的预测精度。

width=174.75,height=108.75

width=174.75,height=110.25

图17 四种方法RUL预测结果MAE比较

Fig.17 MAE comparison of RUL prediction results of four methods

width=180.75,height=288.75

图18 四种方法RUL预测结果RMSE比较

Fig.18 RMSE comparison of RUL prediction results of four methods

4 结论

本文提出了一种由自适应数据预处理方法和LSTM神经网络组成的锂离子电池RUL预测框架。选取容量作为健康因子,采用自适应双指数模型平滑处理方法消除了原始数据中容量再生现象产生的波动,并使用CEEMDAN分解出容量中的噪声分量,通过预处理数据训练LSTM网络来构建RUL预测模型,选取NASA和CALCE实验数据集验证了该方法的可靠性,得出结论如下:

1)电池在工作过程中受到各种不确定因素的影响,使采集到的数据含有大量的噪声和波动。如果不进行数据预处理,直接采用原始数据进行建模,会使模型准确度大大降低,必要的数据预处理过程有助于提升预测模型的准确度。

2)LSTM神经网络更适合处理时间序列方面的问题,通过本文提出的自适应数据预处理方法,对原始容量数据进行平滑处理和降噪,使处理后的数据具有单调递减的平稳趋势。采用LSTM学习寿命前期的退化趋势来建立预测模型,并进行RUL预测,得到了更精确的结果。

3)选取两种开源数据进行实验,在不同预测起点下,采用不同算法组合多种实验方案验证本文方法的优越性和迁移性。实验结果表明,在相同预测条件下,ABMS-CEEMDAN-LSTM方法总能取得更好的预测效果,PDF和90%置信区间反映了本文方法的强鲁棒性,MAE和RMSE值分别保持在2.45%和3.28%以内,最低分别为0.47%和0.89%。

综上所述,ABMS-CEEMDAN-LSTM方法具有更高的RUL预测精度,降低了预测误差,具有更好的稳定性,为现有锂电池RUL预测研究提供了参考。

参考文献

[1] 王榘, 熊瑞, 穆浩. 温度和老化意识融合驱动的电动车辆锂离子动力电池电量和容量协同估计[J]. 电工技术学报, 2020, 35(23): 4980-4987.

Wang Ju, Xiong Rui, Mu Hao. Co-estimation of lithium-ion battery state-of-charge and capacity through the temperature and aging awareness model for electric vehicles[J]. Transactions of China Electrotechnical Society, 2020, 35(23): 4980-4987.

[2] 范兴明, 王超, 张鑫, 等. 基于增量学习相关向量机的锂离子电池SOC预测方法[J]. 电工技术学报, 2019, 34(13): 2700-2708.

Fan Xingming, Wang Chao, Zhang Xin, et al. A prediction method of li-ion batteries SOC based on incremental learning relevance vector machine[J]. TransactionsofChinaElectrotechnical Society, 2019, 34(13): 2700-2708.

[3] 郭永芳, 黄凯, 李志刚. 基于短时搁置端电压压降的快速锂离子电池健康状态预测[J]. 电工技术学报, 2019, 34(19): 3968-3978.

Guo Yongfang, Huang Kai, Li Zhigang. Fast state of health prediction of lithium-ion battery based on terminal voltage drop during rest for short time[J]. TransactionsofChinaElectrotechnical Society, 2019, 34(19): 3968-3978.

[4] 刘芳, 马杰, 苏卫星, 等. 基于自适应回归扩展卡尔曼滤波的电动汽车动力电池全生命周期的荷电状态估算方法[J]. 电工技术学报, 2020, 35(4): 698-707.

Liu Fang, Ma Jie, Su Weixing, et al. State of charge estimation method of electric vehicle power battery life cycle based on auto regression extended Kalman filter[J]. TransactionsofChinaElectrotechnical Society, 2020, 35(4): 698-707.

[5] 李超然, 肖飞, 樊亚翔, 等. 基于卷积神经网络的锂离子电池SOH估算[J]. 电工技术学报, 2020, 35(19): 4106-4119.

Li Chaoran, Xiao Fei, Fan Yaxiang, et al. An approach to lithium-ion battery soh estimation based on convolutional neural network[J]. TransactionsofChinaElectrotechnical Society, 2020, 35(19): 4106-4119: 1-10.

[6] Kaveh K S, Xin J, Giorgio R. Prediction of remaining useful life for a composite electrode lithium-ion battery cell using an electrochemical model to estimate the state of health[J]. Journal of Power Sources, 2021, 481: 1-10.

[7] Ji Yanju, Qiu Shilin, Li Gang. Simulation of second-order RC equivalent circuit model of lithium battery based on variable resistance and capacitance[J]. Journal of Central South University, 2020, 27(9): 2606-2613.

[8] Chen Lin, An Jingjing, Wang Huimin, et al. Remaining useful life prediction for lithium-ion battery by combining an improved particle filter with sliding-window gray model[J]. Energy Reports, 2020, 6: 2086-2093.

[9] 焦自权, 范兴明, 张鑫, 等. 基于改进粒子滤波算法的锂离子电池状态跟踪与剩余使用寿命预测方法[J]. 电工技术学报, 2020, 35(18): 3979-3993.

Jiao Ziquan, Fan Xingming, Zhang Xin, et al. State tracking and remaining useful life predictive method of Li-ion battery based on improved particle filter algorithm[J]. TransactionsofChinaElectrotechnical Society, 2020, 35(18): 3979-3993.

[10] Zhang Kai, Zhang Peng, Sun Canfei, et al. Remaining useful life prediction of aircraft lithium-ion batteries based on F-distribution particle filter and kernel smoothing algorithm[J]. Chinese Journal of Aeronautics, 2020, 33(5): 1517-1531.

[11] Qiu Xianghui, Wu Weixiong, Wang Shuangfeng. Remaining useful life prediction of lithium-ion battery based on improved cuckoo search particle filter and a novel state of charge estimation method[J]. Journal of Power Sources, 2020, 450: 1-13.

[12] Chen Liaogehao, Zhang Yong, Zheng Ying, et al. Remaining useful life prediction of lithium-ion battery with optimal input sequence selection and error compensation[J]. Neurocomputing, 2020, 414: 245-254.

[13] Wang Xiuli, Jiang Bin, Lu Ningyun. Adaptive relevant vector machine based RUL prediction under uncertain conditions[J]. ISA Transactions, 2019, 87: 217-224.

[14] Li Xiaoyu, Yuan Changgui, Wang Zhenpo. Multi-time-scale framework for prognostic health condition of lithium battery using modified Gaussian process regression and nonlinear regression[J]. Journal of Power Sources, 2020, 467: 1-12.

[15] Zhou Yapeng, Huang Miaohua. Lithium-ion batteries remaining useful life prediction based on a mixture of empirical mode decomposition and ARIMA model[J]. Microelectronics Reliability, 2016, 65: 265-273.

[16] Li Wenhua, Jiao Zhipeng, Du Le, et al. An indirect RUL prognosis for lithium-ion battery under vibration stress using Elman neural network[J]. International Journal of Hydrogen Energy, 2019, 44(23): 12270-12276.

[17] Wu Ji, Zhang Chenbin, Chen Zonghai. An online method for lithium-ion battery remaining useful life estimation using importance sampling and neural networks[J]. Applied Energy, 2016, 173: 134-140.

[18] Shahid F, Zameer A, Muneeb M. A novel genetic LSTM model for wind power forecast[J]. Energy, 2021, 223: 1-11.

[19] Li Penghua, Zhang Zijian, Xiong Qingyu, et al. State-of-health estimation and remaining useful life prediction for the lithium-ion battery based on a variant long short term memory neural network[J]. Journal of Power Sources, 2020, 459: 1-12.

[20] Yu Yong, Hu Changhua, Si Xiaosheng, et al. Averaged Bi-LSTM networks for RUL prognostics with non-life-cycle labeled dataset[J]. Neurocomputing, 2020, 402: 134-147.

[21] Li Xiaoyu, Zhang Lei, Wang Zhenpo, et al. Remaining useful life prediction for lithium-ion batteries based on a hybrid model combining the long short-term memory and Elman neural networks[J]. Journal of Energy Storage, 2019, 21: 510-518.

[22] Cao Jian, Li Zhi, Li Jian. Financial time series forecasting model based on CEEMDAN and LSTM[J]. Physica A: Statistical Mechanics and its Applications, 2019, 519: 127-139.

[23] Gao Bixuan , Huang Xiaoqiao , Shi Junsheng , et al. Hourly forecasting of solar irradiance based on CEEMDAN and multi-strategy CNN-LSTM neural networks[J]. Renewable Energy, 2020, 162: 1665-1683.

[24] Lin Yu, Yan Yan, Xu Jiali, et al. Forecasting stock index price using the CEEMDAN-LSTM model[J]. The North American Journal of Economics and Finance, 2021, 57: 1-14.

[25] Yao Liping, Pan Zhonglang. A new method based CEEMDAN for removal of baseline wander and powerline interference in ECG signals[J]. Optik - International Journal for Light and Electron Optics, 2020, 223: 1-13.

[26] Torres ME, Colominas MA, Schlotthauer G, et al. A complete ensemble empirical mode decomposition with adaptive noise[C]//2011 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Prague, 2011: 4144-4147.

[27] Wu Z, Huang N E. Ensemble empirical mode decomposition: a noise-assisted data analysis method[J]. Advances in Adaptive Data Analysis, 2009, 1(1): 1-41.

[28] Huang N E, Zheng S, Long S R, et al. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J]. Proceedings Mathematical Physical & Engineering Sciences, 1998, 454(1971): 903-995.

[29] Hochreiter S, Schmidhuber J. Long short-term memory[J]. Neural Computation, 1997, 9(8): 1375-1780.

[30] Saha B, KG. Battery data set. Battery data set. NASA Ames Prognostics Data Repository[DB/OL]. NASA Ames Research Center, Moffett Field, CA 2017, https://ti.arc.nasa.gov/tech/dash/groups/pcoe/prognostic-data- repository.

[31] Sun Xiaofei, Zhong Kai, Han Min.A hybrid prognostic strategy with unscented particle filter and optimized multiple kernel relevance vector machine for lithium-ion battery[J]. Measurement, 2021, 170: 1-14.

[32] Wang Haiyang, Song Wanqing, Zio E, et al. Remaining useful life prediction for lithium-ion batteries using fractional brownian motion and fruit-fly optimization algorithm[J]. Measurement, 2020, 161: 1-9.

[33] Wei Jingwen, Dong Guangzhong, Chen Zonghai.Remaining useful life prediction and state of health diagnosis for lithium-ion batteries using particle filter and support vector regression[J]. IEEE Transactions on Industrial Electronics, 2018, 65(7): 5634-5643.

[34] Li Naipeng, Lei Yaguo, Yan Tao, et al.A Wiener process model-based method for remaining useful life prediction considering unit-to-unit variability[J]. IEEE Transactions on Industrial Electronics, 2019, 66(3): 2092-2101.

[35] Severson K A, Attia P M, Jin N, et al.Data-driven prediction of battery cycle life before capacity degradation[J]. Nature Energy, 2019, 4(5): 383-391.

[36] Ma Guijun, Zhang Yong, Cheng Cheng, et al.Remaining useful life prediction of lithium-ion batteries based on false nearest neighbors and a hybrid neural network[J]. Applied Energy, 2019, 253: 1-11.

[37] Hu Yang, Piero B, Francesco D M. A particle filtering and kernel smoothing-based approach for new design component prognostics[J]. Reliability Engineering and System Safety, 2015, 134: 19-31.

[38] Zhang Xin, Miao Qiang, Liu Zhiwen. Remaining useful life prediction of lithium-ion battery using an improved UPF method based on MCMC[J]. Microelectronics Reliability, 2017, 75: 288-295.

[39] 陈则王, 李福胜, 林娅, 等. 基于GA-ELM的锂离子电池RUL间接预测方法[J]. 计量学报, 2020, 41(6): 735-742.

Chen Zewang, Li Fusheng, Lin Ya, et al. Indirect prediction method of RUL for lithium-ion battery based on GA-ELM[J]. Acta Metrologica Sinica, 2020, 41(6): 735-742.

[40] 王瀛洲, 倪裕隆, 郑宇清, 等. 基于ALO-SVR的锂离子电池剩余使用寿命预测[J]. 中国电机工程学报, 2021, 41(4): 1445-1457, 1550.

Wang Yingzhou, Ni Yulong, Zheng Yuqing, et al. Remaining useful life prediction of lithium-ion batteries based on support vector regression optimized and ant lion optimizations[J]. Proceedings of the CSEE, 2021, 41(4): 1445-1457, 1550.

Prediction of Remaining Useful Life of Lithium-Ion Battery Based on Adaptive Data Preprocessing and Long Short-Term Memory Network

Huang Kai1 Ding Heng1 Guo Yongfang2 Tian Haijian1

(1.State Key Laboratory of Reliability and Intelligence of Electrical Equipment Hebei University of Technology Tianjin 300130 China 2. School of Artificial Intelligence Hebei University of Technology Tianjin 300130 China)

Abstract The remaining useful life (RUL) of lithium-ion battery can evaluate the reliability of battery, which is an important parameter of battery health management. Accurate prediction of RUL of battery can effectively improve the safety of equipment and reduce the working risk. In this paper, a RUL prediction framework combined with the adaptive data preprocessing method and long-term and short-term memory neural network (LSTM) was proposed. Selecting capacity as the health factor, in the data preprocessing stage, the adaptive double exponential model smoothing method was used to reduce the negative effect of capacity recovery and the adaptive white noise integrated empirical mode decomposition (CEEMDAN) is used to suppress the noise. In the model constructing stage, the LSTM model was built for RUL prediction by training the preprocessed data. The NASA and CALCE open source data were selected to verify the performance of the proposed method. The experimental results show that it has good robustness and can provide RUL prediction results with high precision.

keywords:Lithium-ion battery, remaining useful life, adaptive bi-exponential model smooth method, the complete ensemble empirical mode decomposition with adaptive noise, long short-term memory network

DOI:10.19595/j.cnki.1000-6753.tces.210860

中图分类号:TM912

河北省自然科学基金资助项目(E2019202328)。

收稿日期 2021-06-14

改稿日期 2021-12-26

作者简介

黄 凯 男,1980年生,博士,副教授,硕士生导师,研究方向为储能与动力电池组测试与建模、电池组性能状态预测与可靠性估计。E-mail:huangkai@hebut.edu.cn

郭永芳 女,1979年生,博士,副教授,硕士生导师,研究方向为智能算法、锂离子电池建模与寿命估计。E-mail:guoyongfang@hebut.edu.cn(通信作者)

(编辑 赫蕾)