基于特征提取的锂离子电池健康状态评估及影响因素分析

顾菊平1,2 蒋 凌1 张新松3 华 亮3 程天宇3

(1.南通大学信息科学技术学院 南通 226019 2. 苏州科技大学电子与信息工程学院 苏州 215009 3. 南通大学电气工程学院 南通 226019)

摘要 健康状态(SOH)评估是电池管理系统的核心功能之一,是确保电化学储能系统安全稳定运行的重要前提。为解决现有评估模型精度不足、复杂度高与可解释性低的问题,提出一种基于特征提取的锂离子电池SOH评估及影响因素分析方法。首先,提出两个量化初始循环充电电压曲线和当前循环充电电压曲线相似性的新健康特征,即动态时间规整距离特征和Wasserstein距离特征;其次,采用CatBoost方法评估电池SOH,并引入SHAP方法分析各健康特征对评估结果的影响及特征间的耦合关系;最后,利用马里兰大学电池老化数据集中多块电池数据进行实验验证。实验结果表明,提出的SOH评估方法精度较高,平均误差均小于2.2%,且能定量解析SOH影响因素。

关键词:锂离子电池 健康状态 特征提取 CatBoost SHAP

0 引言

随着新能源并网规模的不断增大,储能在新型电力系统发、输、配、用环节的重要性日渐凸显[1-2]。其中,锂离子电池由于能量密度高、转化速率快、部署便捷与成本低等优势,成为新型电力系统中的主流储能系统之一[3]。锂离子电池健康状态(State of Health, SOH)能有效反映电池老化程度,实际运行中,依据设定阈值替换低SOH电池是保障电池储能系统安全、稳定运行的有效措施之一[4]。因此,SOH评估是电池管理系统(Battery Management System, BMS)的重要功能之一。

目前,锂离子电池SOH评估方法主要分为模型驱动方法和数据驱动方法两类。其中,模型驱动方法最早应用于SOH评估,其所基于的模型主要为电化学模型或等效电路模型。电化学模型通常采用偏微分方程描述电池内部的电化学过程,如固体电解质界面层膜的生长机制、锂离子和正负极活性材料的损失过程等,进而推导出电池SOH[5-7]。等效电路模型则是将电池抽象为电阻、电容等元件,并重组成电路,进而获取与电池一致的内外特性。等效电路模型参数优化是提高电池SOH评估效率的关键。文献[8]采用一阶等效电路模型模拟电池,利用频率尺度分离法,通过注入不同频率电流顺序估计模型关键参数。文献[9]采用随机变异蚁群优化算法对PNGV(the partnership for a new generation of vehicles)电池模型关键参数进行辨识。此外递推最小二乘法[10]、卡尔曼滤波[11-12]等方法也广泛用于电池模型参数辨识。总的来说,基于模型的电池SOH评估方法精度较高,但计算过程需消耗大量算力,在BMS中部署难度较大。

为解决实际应用场景中算法部署的难题,基于数据驱动的电池SOH评估方法吸引了研究者的广泛关注。与模型驱动方法相比,其无需深入刻画电池内部运行机理,仅通过循环迭代方式学习输入数据变化规律,便能给出精准的评估结果,灵活性更高[13-14]。基于数据驱动的电池SOH评估通常基于BMS采集的时序监测数据进行,因此,此类方法的核心是时序数据的分析与处理。文献[15]提出了一种循环神经网络,采用长短时记忆机制捕获充放电电压和电流时序数据中的多尺度特征,通过70组电池监测数据验证了SOH评估的有效性。在此基础上,文献[16]采用改进型门控循环单元卷积神经网络,将充放电曲线中的电压、电流和温度曲线作为网络输入,挖掘电池时序参量与SOH间的潜在关联。文献[17]系统地比较了三种典型神经网络及其变体在锂离子电池健康度评估的准确性和鲁棒性,实验表明长短时记忆神经网络评估性能最佳。针对实际场景中电池放电深度的随机性,文献[18]基于部分增量容量曲线采用深度置信网络对锂离子电池健康度进行评估,评估误差可降至2%以下。与此同时,为降低数据驱动模型计算复杂性,文献[19]提出了一种基于增量容量曲线和灰色关联度分析以及长短期记忆神经网络的锂离子电池健康状态估计方法。上述基于数据驱动的SOH评估方法通过挖掘电池监测数据潜在变化趋势,构建映射关系,实现了SOH的精准评估。但数据驱动方法大多依据梯度迭代优化确定内部参数,可解释性不足,在一定程度上阻碍了方法的工程应用。

为此,部分学者在提取BMS时序监测数据中电池健康特征的基础上,进行电池SOH评估,在降低复杂度的同时提升模型精度与可解释性。文献[20]基于电池充电曲线的几何形态提取8组健康特征,采用支持向量机实现了SOH估计。文献[21]基于电池低频阻抗谱提取了五组健康特征,实现了电池SOH的主动式评估。文献[22]对电池增量容量曲线形态进行分析,提取出二阶健康特征,采用灰度相关分析方法构建健康特征与SOH间的映射关系,提升评估结果的置信度。文献[23]分析了电池恒流充电过程电压的变化趋势,提取出9组与充电电流高度相关的健康特征,并采用集成学习方法实现健康特征的分层融合,提升了电池SOH的评估精度。文献[24]将等压降时间作为健康因子,提出基于改进轻量型梯度提升机的电池健康状态评估方法,降低数据离群值对预测精度的影响。高质量健康特征能够有效提升SOH的评估精度及置信度,但现有方法仅构建了电池健康特征与SOH间的映射,难以量化健康特征对SOH的影响,可解释性有待进一步提升。

针对上述问题,本文提出了一种基于特征提取的锂离子电池健康状态评估及影响因素分析方法:首先,基于电池充电电压曲线提取六组健康特征,其中,包含两个量化初始循环充电电压曲线和当前循环充电电压曲线的相似性的电池新特征,分别为动态时间规整(Dynamic Time Warping, DTW)距离和Wasserstein距离特征;其次,采用CatBoost模型评估电池SOH,并引入SHAP(Shapley additive explanations)分析方法明确健康特征对评估结果的影响及特征间的耦合关系;最后,通过马里兰大学电池老化数据集中的多块电池数据进行实验验证。实验及分析结果表明:与现有方法相比,本文提出SOH评估方法具有更高的精度与可解释性。

1 基于电池充电曲线的健康特征提取

1.1 健康特征提取框架

电池SOH可用电池的最大可用容量与标称额定容量的比值衡量,即

width=82.9,height=29.95(1)

式中,VSOH为电池SOH;Crated为电池额定容量;Cnow为当前电池的最大可用容量。额定容量Crated在电池出厂前就已完成测量与标定,而Cnow则需在电池充放电循环完成后进行测量。现有电池BMS大多只能监测电池充电电压、电流和温度等参量,难以直接测量电池的当前最大容量Cnow。因此,现有数据驱动方法通常将电池监测参量作为输入,构建映射模型,实现电池SOH的间接估计。受制于电池的应用场景,电池使用过程中放电深度随机,而充电过程则采用相对固定的恒流恒压充电(Constant Current Constant Voltage, CCCV)方法,充电过程的监测参量更适用于健康特征的提取。因此,本节基于电池充电曲线,设计了直接测量特征、二阶处理特征以及相似性特征提取流程,如图1所示,为后续电池SOH的评估与分析提供高质量健康特征。

1.2 直接测量特征提取

伴随充放电次数的增加,电池VSOH持续下降,充放电电压特征也发生改变。现有研究表明,充电电压曲线和电池容量衰退呈现出较强的一致性[25]。具体来说,当VSOH降低时,电池的恒流充电时长(Constant Current Charging Time, CCCT)与恒压充电时长(Constant Voltage Charging Time, CVCT)均会逐渐缩短。因此,可选取如图2所示充电电压曲线中CCCT和CVCT作为直接测量特征。

width=213.75,height=258.75

图1 电池健康特征提取流程

Fig.1 Battery health features extraction process

width=201,height=150.75

图2 锂离子电池充电电压曲线

Fig.2 Charging voltage curve of lithium-ion batteries

1.3 二阶处理特征提取

电池二阶处理曲线是通过对BMS采集的电池监测数据进行求导计算获取,例如电池容量增量(Incremental Capacity, IC)曲线、dV/dt曲线等。其中,图3所示恒流充电阶段的dV/dt曲线能够更直观地展现出锂电池充电过程中单位时间内电压的变化速率,且曲线形态伴随着SOH的退化同步发生改变。恒流充电阶段中,电池电压先在短时间内快速上升,期间上升速率逐渐降低,对应dV/dt曲线在t1阶段呈现由最大值快速回落。随后,电压保持较低速率缓慢上升至额定电压,对应dV/dt曲线在t2阶段呈现较长时间平稳区域,数值稳定在-0.000 1~0.000 2间。当SOH下降时,电池内部的正、负极活性材料和锂离子不断损失,导致电池荷电能力减弱,在充电过程中则体现为电压上升速率降低和稳定充电时长缩短。因此,可选取如图3中所示的充电电压变化率最大值(Maximum Value of dV/dt, CVTMAX)和恒压充电电压变化率平稳时长(Stable Time of dV/dt, CVTCT)作为二阶处理特征。

width=218.25,height=150.75

图3 锂离子电池充电电压变化率曲线

Fig.3 dV/dt curve of lithium-ion batteries

1.4 相似性特征提取

除直接测量特征和二阶处理特征之外,锂离子电池固有的内在参量,如欧姆阻抗、极化阻抗以及极化容量等,是电池内部电化学过程的显性体现,也是电池SOH的重要表征。但内在参量测量必须依赖专业量测设备,该类设备集成进入BMS的难度大、成本高,难以广泛应用于大量锂离子电池的SOH评估过程。相对而言,电压、电流和温度等参量则更容易获取,图4所示为锂离子电池充放电电压曲线。图中电池充电电压曲线随着循环周期增加呈现出规律性衰退,其衰退趋势与程度一定程度地反映了电池老化过程。为精准描述电压曲线衰退趋势与程度,本文分别从时序与概率分布角度分析电池充电阶段的电压数据,采用关联分析方法量化初始循环充电电压曲线和当前循环充电电压曲线的相似性,进而提取出有效的相似性特征。

width=197.25,height=159

图4 锂离子电池全生命周期充放电电压曲线

Fig.4 Full life cycle charge and discharge voltage curve of lithium-ion batteries

1.4.1 基于动态时间规整距离的健康特征

动态时间规整(DTW)方法是在时域中通过调整两条时序数据中各数据点的对齐方式获取最优匹配策略,进而计算出两组数据间的相似度,DTW值越小相似度越高。以图5给出的时序数据A={a1, a2, a3,×××, an}和B={b1, b2, b3,×××, bm}为例,DTW的目的是先基于两组时序数据构造所有规整路径,形成n×m阶的代价矩阵M,其第i行、第j列的元素Mij

width=186.55,height=20.65 (2)

width=198.75,height=69

图5 DTW匹配

Fig.5 DTW matching

其次,如图5中虚线所示,通过动态规划,依据边界性、连续性和单调性三个约束条件,从M11Mnm中寻找最佳规整路径,使得规整总成本最小[26]

最后,时序数据AB的DTW距离为最优规整路径的累计距离r(i, j),具体计算为

width=216,height=17.55 (3)

式中,r(i-1, j-1)为ai-1bj-1匹配时的子序列距离;r(i-1, j)为ai-1bj匹配时的子序列距离;r(i, j-1)为aibj-1匹配时的子序列距离。DTW算法从可能的三种拆分方式里选择距离最短的一种。依据式(3)循环迭代便可获得变量序列AB间的最优匹配,即DTW距离VDTM

width=60.1,height=15.05(4)

DTW方法通过先规划最佳规整路径,再计算距离的方法,有效挖掘时序数据间关联性,避免直接采用点对点计算欧式距离所导致的趋势错配问题。同时,充电曲线长度会伴随电池循环周期增加逐渐缩短,出现初始循环充电电压曲线和当前循环充电电压曲线长度不一致的现象。而DTW方法对数据长度没有严格要求,即使两组时序数据长度不一致,也能够依据最优匹配策略实现数据间相似性的有效度量。因此,DTW距离能够从时域角度计算出初始循环充电电压曲线和当前循环充电电压曲线的相似性,可作为表征电池SOH的相似性特征。考虑在实际应用中由于用户隐私问题,锂离子电池的初始循环充电电压曲线难以获取,本文预先使用多个同规格锂离子电池在实验室中测量初始循环充电电压曲线,再求取平均值作为该规格电池的标准初始循环充电电压曲线。

1.4.2 基于Wasserstein距离的健康特征

电池监测参量数据的相似性除去能在时域中体现之外,两者间的概率分布也存在一定的相似性。Wasserstein(WAS)距离就是用于度量两个概率分布间差异的方法,WAS距离值越小,概率分布差异性越小,曲线相似度越高。将其应用于初始循环充电电压曲线和当前循环充电电压曲线相似度度量中作为健康特征,需将两组曲线分别转换为概率分布vuvu间的WAS距离则可以表示为

width=137.75,height=23.15(5)

式中,W(v,u)为vu间的WAS距离;width=31.95,height=15.05vu所有可能的联合分布集合;inf为取所有可能的联合分布集合中的最小临界值函数;width=30.05,height=16.3为联合分布集合中每一个可能的联合分布width=9.4,height=11.9所对应样本xy距离‖x-y‖的期望值。在所有可能的联合分布中,其期望值的下界就是WAS距离。

1.5 异常特征值处理

BMS在监测电池全生命周期运行数据时由于传感故障或传输时延等问题会导致特征中出现异常点,即图6a所示电池全生命周期CCCT特征中红圆圈出的异常特征点。健康特征中此类异常点会导致后续评估方法精度出现波动,须采用异常点检测方法进行剔除,再通过补缺算法在剔除位置补出高置信度缺失值。

width=198,height=143.25

width=198,height=143.25

图6 电池CCCT健康特征异常值处理

Fig.6 Outlier handling process of battery CCCT health characteristics

针对上述健康特征中的异常值,本文采用局部异常因子(Local Outlier Factor, LOF)[27]指标进行异常值检测,样本的LOF指标值越大,是离群点的概率越高。剔除异常值后再通过拉格朗日插值法计算出缺失值,获取如图6b所示的异常特征值处理后健康特征。具体处理流程如下:

1)将一种健康特征视作单一集合,特征点则视作集合中样本。先获取样本pK近邻样本点,并计算K-邻近距离。接着计算出该样本的局部可达距离,进而求得局部可达密度,最后计算样本的LOF指标值为

width=90.15,height=30.05(6)

式中,L(p)为样本p的LOF值;flrd(pk)为样本pK邻域局部可达密度;flrd(p)为样本p的局部可达密度。当LOF值接近1,说明flrd(pk)和flrd(p)近似,样本p和周围点的密度近似,不是异常点;反之LOF指标越大,样本p为异常点的可能性越大。

2)循环测试每一种健康特征集合中的所有样本,并设定合适的LOF指标阈值。将大于阈值的样本判定为异常点,即该健康特征中的异常值。将该点数值置为空值,予以剔除。

3)针对电池健康特征中被剔除的异常值,采用拉格朗日插值法[28]对其进行补全,缺失位置的补缺值计算式具体为

width=112.05,height=31.95(7)

式中,G(X)为补全的缺失值;n为含缺失的时序数据长度;X为缺失点的循环周期;XiYi分别为时序数据的第i个循环周期和第i个特征值。

2 基于CatBoost和SHAP的锂离子电池SOH评估与分析

2.1 锂离子电池SOH评估与分析框架

高质量健康特征的提取可为电池SOH评估奠定基础,但健康特征与SOH间的映射关系及特征间的耦合关系复杂多变,显著提升了评估难度。因此,本节采用基于决策树的CatBoost模型构建电池健康特征与SOH间的映射,实现锂离子电池SOH的精确评估。在此基础上,采用基于SHAP的模型分析方法揭示健康特征耦合关系并分析其对评估结果的影响,具体评估与分析流程如图7所示。

width=222.75,height=227.25

图7 锂离子电池SOH评估与分析流程

Fig.7 Lithium-ion batteries SOH estimation and analysis process

2.2 基于CatBoost的锂离子电池SOH评估

现有电池型号多样、性能各异,导致相同充放电策略下电池的充电曲线仍然存在一定的差异。且伴随着SOH的下降,充电曲线对应的健康特征变化呈现出非线性。传统机器学习类方法难以在有限样本下实现SOH的精准快速评估。针对上述不足,本文选取CatBoost算法对锂离子电池SOH进行评估。

CatBoost是一种基于梯度提升决策树(Gradient Boosting Decision Tree, GBDT)改进的高效集成学习框架[29]。它继承了GBDT方法数据量依赖度低、可解释性强、鲁棒性高的优点,且超参数更少,泛化性能更强,适用于锂离子电池SOH的评估。

CatBoost作为集成学习类方法,基学习器采用对称型决策树。与常用决策树方法对比,对称型决策树的节点都使用相同的条件进行拆分,选择损失最低的特征分割并将其作用于所有级别的节点,形成对称的结构,从而减少超参数。此外,这种对称结构能够实现特征的二进制向量编码,可通过分布式计算大幅减少预测时间。同时,为解决GBDT方法普遍存在的预测偏移问题,CatBoost引入如图8所示的Ordered Boosting优化策略。

width=227.25,height=114.75

图8 Ordered Boosting优化策略

Fig.8 Ordered Boosting optimization method

Ordered Boosting优化策略中,为得到无偏梯度估计,CatBoost对每一个样本xi都采用除该样本外的所有样本经随机组合σ训练出对应的Mi模型,再使用Mi模型计算获取xi的梯度估计。避免了由大量相同训练数据导致的预测偏移,有效提升了泛化能力。

2.3 基于SHAP的模型可解释性分析

用于电池SOH评估的CatBoost属于黑箱模型,其通过挖掘输入特征的潜在特性,将低维特征映射至高维空间中,并在高维空间中完成分类或回归等任务。虽然黑箱模型的精度较高、泛化能力强,但却难以给出输入与输出间的数学解析公式,也无法解释哪种因素影响了模型的决策结果,使得所建立的模型可解释性不足,限制了电池SOH评估方法在储能系统BMS中的实际应用。因此,本文采用SHAP方法对CatBoost模型进行分析,获取不同健康特征对电池SOH的影响。

SHAP是一种基于合作博弈论的黑箱模型分析方法[30]。其通过构建不同的特征组合输入黑箱模型,再依据特征的存在与否比较模型输出变化,输出值的平均变化程度就能体现出该输入特征的重要性,进而可量化出该特征的影响力。SHAP将模型输出预测值定义为所有输入特征Shapley值之和,即

width=73.25,height=30.05(8)

式中,g(z)为模型输出的预测值;φ0为所有训练样本的预测均值,作为基础Shapley值;m为输入特征的数目;φj为每个特征对应的Shapley值,能够量化该输入特征对黑箱模型输出结果的影响程度。模型中输入特征xjφj(xj)可由式(9)得出。

width=190.35,height=31.3 (9)

式中,N{xj}为不包括xj的所有输入特征可能的集合;fx(S)为特征子集S的模型预测;width=47.6,height=16.3为特征子集S加上xj的模型预测。

3 算例验证与分析

3.1 锂离子电池数据及评价指标

本文采用马里兰大学CALCE电池团队采集的锂离子电池测试数据进行算例仿真与结果分析[31]。选用其中的CS2_35、CS2_36、CS2_37、CS2_38电池,其经过0.5倍电流和4.2 V电压标准CCCV充电和1倍电流恒流放电加速测试电池的老化过程。实验过程采用专用仪器实时监测了电池的循环次数、电压、电流、容量和内阻等参数,再依据式(1)便可获取如图9所示的四组电池全生命周期SOH。

width=201,height=146.25

图9 马里兰大学CALCE电池全生命周期SOH

Fig.9 Battery life cycle SOH provided by University of Maryland CALCE

为更好地量化所提方法的SOH评估精度,本文引入了方均根误差(Root Mean Square Error, RMSE)和绝对平均误差(Mean Absolute Error, MAE)指标来度量算法评估值与真实值间的误差,即

width=95.15,height=43.85(10)

width=92.65,height=28.15(11)

式中,yi为第i个充电周期下电池的真实SOH;width=10.65,height=15.05为第i个充电周期下模型评估的电池SOH;N为总充电循环次数。

3.2 算例评估及性能对比

在上述四组锂离子电池数据的基础上,本文采用留一验证方法制作训练集与验证集,即:每次选取一个电池的数据制作验证集,剩余电池数据作为训练集,重复4次直到每组电池数据都经过验证视作完成一次验证过程。将用于验证的电池充电数据提取为健康特征后,再输入训练好的CatBoost模型中获取该电池的健康状态评估结果,如图10所示。

为了验证提出方法的优越性,本文设置了多组对比实验。首先,将健康特征输入XGBoost、多层感知机(Multilayer Perceptron, MLP)和本文提出方法评估电池SOH。其次,选取常用于时序数据处理的深度学习模型,即循环神经网络(Recurrent Neural Network, RNN)、长短期记忆网络(Long Short-Term Memory, LSTM)和门控循环网络(Gated Recurrent Unit, GRU)多通道(Multi-channel)-LSTM等,将充电电压数据作为模型输入完成电池SOH的评估。上述模型均经过5次验证过程,对5次评估出的RMSE和MAE求取均值,结果见表1。

width=204.7,height=481.9

width=201.35,height=156

图10 电池SOH评估结果

Fig.10 Battery SOH estimation results

表1 不同方法下电池SOH评估精度对比

Tab.1 Comparison of battery SOH estimation accuracy with different methods

电池SOH评估模型RMSE(%)MAE(%)评估时间/s 全部健康特征+CatBoost(本文方法)2.201.160.003 39 直接测量特征+二阶处理特征+CatBoost2.441.220.003 20 健康特征+XGBoost2.421.330.005 64 健康特征+MLP2.611.350.007 52 充电电压曲线+RNN2.771.370.025 53 充电电压曲线+GRU2.671.410.098 92 充电电压曲线+LSTM2.861.560.121 89 Bayesian-LSTM[32]2.701.990.122 68 MC-LSTM[33]2.512.310.175 21 Transformer[34]2.461.410.065 55 TCN[35]2.471.641.060 52

本文所提方法取得了最佳SOH评估精度,5次评估平均RMSE和MAE仅为2.20%和1.16%。对比现有基于LTSM、自注意力(Transformer)、时间卷积网络(Temporal Convolutional Network, TCN)等主流时序深度学习模型所提出的改进型SOH评估方法[32-35],精度提升12%以上。对比将充电电压曲线直接作为输入的RNN、GRU、LSTM等时序深度学习模型,本文提出方法在保证了评估精度的前提下,可解释性更好。综上所述,在有限电池数据下,高质量健康特征提取方法能够更敏锐地捕获曲线数据变化,适用于电池SOH的评估。

此外,将相同六组健康特性输入XGBoost和MLP方法,以验证CatBoost方法的优越性。实验结果表明,基于CatBoost的SOH评估方法精度最高,证明该方法泛化能力更强,能更有效地抑制模型过拟合问题。将除相似性特征以外的四组健康特征作为模型输入时,模型评估精度出现明显下降,体现了相似性特征的有效性。

储能系统中BMS算力资源有限,为进一步评估算法在储能系统中的可实现性,本文基于Intel Xeon Silver 4210核心处理芯片搭建锂离子电池健康状态测试平台,采用Pytorch框架编译SOH评估方法,测试单次充放电循环SOH的评估时间,结果见表1。时序深度学习模型的训练和测试过程均需消耗大量算力,对比基于特征提取的评估方法计算效率显著降低,限制其在BMS中的实际应用。而在基于特征提取的评估模型中,由于CatBoost采用了对称二叉树作为基学习器,其单次评估时间仅为0.003 39 s,对比XGBoost和MLP方法预测速度提升40%以上,提升模型计算效率,使其适配更多类型储能系统BMS。

3.3 评估模型可解释性分析

为进一步分析健康特征的变化特性及其对模型的影响,并增强评估方法的可解释性,本文首先对相似性健康特征DTW和WAS进行分析,获取其在电池中对应的实际物理意义。相似性特征采用关联分析方法量化初始循环充电电压曲线和当前循环充电电压曲线的相似性,本质上反映了当前电池的退化程度。将其与专业仪器测量出的电池内阻对比,如图11所示,电池全生命周期中DTW和WAS两组特征值与内阻值变化趋势保持一致。两者均在前600次循环缓慢增加,当循环次数超过600时电池进入衰退期,电池SOH下降速率增大,内阻迅速增加,对应相似性特征也出现了加速上升趋势,整体趋势一致。因此,在电池SOH评估过程中,当缺少专业电池内阻测量设备或需快速对电池标定时,本文提出的两组相似性特征能够有效表征电池内阻参量的变化趋势,实现了SOH的快速评估。

width=222,height=141

width=219.75,height=141

图11 电池的相似性特征与内阻

Fig.11 Similarity features and internal resistance of battery

其次,为探究健康特征对电池SOH评估结果的影响程度,本文采用SHAP方法对CatBoost模型进行分析。获取各类特征Shapley值,通过取类内所有特征点Shapley值的绝对值,再求平均值,获取各类健康特征的平均Shapley值,用于表征健康特征对SOH评估结果的影响程度。

图12a所示的各健康特征平均Shapley值可得到影响电池健康状态的4个关键健康特征:CCCT、CVTCT、DTW和WAS,其中CCCT的影响程度最高。

width=210.75,height=237.75

图12 健康特征的Shapley值概要图

Fig.12 Summary of Shapley values for health features

在此基础上,针对各类健康特征的内部特征点绘制出Shapley值概要图,图12b中所示的散点为健康特征Shapley值分布情况,而Shapley值的大小表示该特征对电池SOH值的贡献度。其中CCCT和CVTCT对电池SOH造成正面影响,且伴随特征值增大Shapley值增大,对应电池SOH越高;DTW和WAS对电池SOH造成负面影响,随着特征值增大Shapley值逐渐减少,对应电池SOH越低;而其他健康特征对于电池SOH影响程度较小。

最后,为揭示各项关键健康特征对电池SOH评估的影响关系及健康特征间的耦合关系。本文详细分析了恒压充电时长、恒压充电电压变化率平稳时长与相似性特征对电池SOH的影响。

图13是由指定健康特征Shapley值绘制的散点图,其横轴为观测特征Fx,纵轴为观测特征Fx的SHAP值,而与观测特征关联度最强的交互特征Fy则用色度表达。其中图13a展示了DTW的Shapley值变化及其与CCCT特征间的关系。当DTW特征值小于400时Shapley值为正值,对SOH评估结果产生正向影响。且随着DTW特征值的增大而CCCT特征值减小,之间呈现出显著的负相关;图13b展示了CVTCT的Shapley值变化及其与CCCT特征间的关系。当恒压充电电压变化率平稳时长超过5 000 s时Shapley值转为正值,对SOH评估结果产生正向影响。且随着平稳时长的增加,恒压充电时长同步增加,之间呈现出正相关。上述分析结果表明,SHAP方法给出了不同类型健康特征对电池SOH的详细影响规律,提升了评估方法的可解释性,为方法在BMS中的实际应用提供了理论依据。

width=207.75,height=309.75

图13 主要健康特征的依赖关系

Fig.13 Dependency relationships of main health features

3.4 评估模型适用性分析

实际储能系统运行场景中,充电过程具有随机性,即充电初始荷电状态(State of Charge, SOC)并不一致,导致仅能获取部分充电电压曲线用于电池健康评估。为模拟电池在储能系统中的实际运行状况,分析评估方法在不同充电场景下的评估性能,本文选取了初始充电时刻电池SOC分别为10%、20%、30%、40%的四种充电情况进行实验,结果见表2。伴随着初始充电时刻电池SOC的变化,充电电压曲线不断缩短,本文所提出的评估模型准确度出现小幅下滑,但仍然能够满足锂离子电池健康状态评估需求,证明电池充电过程随机性对评估模型准确度产生的影响较小,模型适用性较强。

表2 不同充电起始荷电状态下模型评估精度

Tab.2 Evaluation accuracy of the model under different batteries SOC

初始充电时刻电池SOC(%)RMSE(%)MAE(%) 02.201.16 102.211.16 202.241.18 302.321.29 402.481.36

为进一步验证评估模型对不同规格锂离子电池健康状态评估的适用性,本文采用了同济大学新能源汽车工程中心所提供的锂离子电池数据进行实验[36]。选取标称容量为3.5 A·h的四块18650电池,在45℃循环温度、0.5倍电流和4.2 V电压标准CCCV充电和1倍电流恒流放电加速测试电池的老化过程。选取其中一块电池数据作为验证集,剩余电池数据作为训练集。将用于验证的电池充电数据提取为健康特征后,再输入训练好的CatBoost模型中获取该电池的健康状态评估结果,如图14所示。

经过5次重复验证过程,评估模型的平均RMSE和MAE仅为0.54%和0.49%,评估精度能够满足储能系统BMS的需求,也表明评估模型对多种不同规格电池具有较强适应能力。

width=198.75,height=156

图14 18650电池SOH评估结果

Fig.14 18650 battery SOH estimation results

4 结论

本文提出了一种基于特征提取的锂离子电池健康状态评估及影响因素分析方法。方法基于电池充电电压曲线提取了六组健康特征,即直接测量特征CCCT、CVCT,二阶处理特征CVTMAX、CVTCT和相似性特征DTW、WAS;构建了基于CatBoost和SHAP锂离子电池SOH评估与分析框架,实现了高精度、可解释的电池健康状态检测和安全评估,本文主要结论如下:

1)基于动态时间规整距离和Wasserstein距离获取的充电电压曲线相似性特征与电池内阻具有强相关性,可作为新型健康特征参与电池SOH评估。

2)将健康特征作为CatBoost的输入,实现了电池SOH评估,经过多块电池实验数据验证,评估精度对比现有方法提升12%以上,评估速度提升40%,且泛化能力更强。

3)基于SHAP方法量化各健康特征的贡献率和影响程度,揭示了特征间耦合关系,提升了模型的可解释性。分析结果表明CCCT、CVTCT、DTW和WAS特征是影响SOH评估的关键因素。其中CCCT与CVTCT对评估模型产生正面影响,DTW和WAS对评估模型产生负面影响。此外,CCCT与动态时间规整距离间呈现负相关,与CVTCT呈现正相关。

综上所述,本文提出方法具有较高的SOH评估精度、速度与可解释性,但由于本文电池数据是在固定充电条件下获取,并未考虑特定应用场景下电池的健康评估需求。锂离子电池在不同储能体系,如:车用储能系统、储能电站等,运行工况存在显著差异,后续研究将针对不同应用场景需求,制定适合的锂离子电池SOH评估方法,实现评估模型在多应用场景下的精准高效运行。

参考文献

[1] 宋天昊, 李柯江, 韩肖清, 等. 储能系统参与多应用场景的协同运行策略[J]. 电力系统自动化, 2021, 45(19): 43-51. Song Tianhao, Li Kejiang, Han Xiaoqing, et al. Coordinated operation strategy of energy storage system participating in multiple application scenarios[J]. Automation of Electric Power Systems, 2021, 45(19): 43-51.

[2] 吴珊, 边晓燕, 张菁娴, 等. 面向新型电力系统灵活性提升的国内外辅助服务市场研究综述[J]. 电工技术报, 2023, 38(6): 1662-1677. Wu Shan, BianXiaoyan, Zhang Jingxian, et al. A review of domestic and foreign ancillary services market for improving flexibility of new power system[J]. Transactions of China Electrotechnical Society, 2023, 38(6): 1662-1677.

[3] 李建林, 武亦文, 王楠, 等. 吉瓦级电化学储能电站研究综述及展望[J]. 电力系统自动化, 2021, 45(19): 2-14. Li Jianlin, Wu Yiwen, Wang Nan, et al. Review and prospect of gigawatt-level electrochemical energy storage power station[J]. Automation of Electric Power Systems, 2021, 45(19): 2-14.

[4] 骆凡, 黄海宏, 王海欣. 基于电化学阻抗谱的退役动力电池荷电状态和健康状态快速预测[J]. 仪器仪表学报, 2021, 41(9): 172-180. Luo Fan, Huang Haihong, Wang Haixin. Rapid prediction of the state of charge and state of health of decommissioned power batteries based on electro-chemical impedance spectroscopy[J]. Chinese Journal of Scientific Instrument, 2021, 41(9): 172-180.

[5] 武龙星, 庞辉, 晋佳敏, 等. 基于电化学模型的锂离子电池荷电状态估计方法综述[J]. 电工技术学报, 2022, 37(7): 1703-1725. Wu Longxing, Pang Hui, JinJiamin, et al. A review of soc estimation methods for lithium-ion batteries based on electrochemical model[J]. Transactions of China Electrotechnical Society, 2022, 37(7): 1703-1725.

[6] Markevich E, Salitra G, Aurbach D. Fluoroethylene carbonate as an important component for the formation of an effective solid electrolyte interphase on anodes and cathodes for advanced Li-ion batteries[J]. ACS Energy Letters, 2017, 2(6): 1337-1345.

[7] Wang Dafang, Zhang Qi, Huang Huanqi, et al. An electrochemical–thermal model of lithium-ion battery and state of health estimation[J]. Journal of Energy Storage, 2022, 47: 103528.

[8] Song Ziyou, Hou Jun, Li Xuefeng, et al. The sequential algorithm for combined state of charge and state of health estimation of lithium-ion battery based on active current injection[J]. Energy, 2020, 193: 116732.

[9] Jiang Zeyu, Li Junhong, Li Lei, et al. Fractional modeling and parameter identification of lithium-ion battery[J].Ionics, 2022, 28(9): 4135-4148.

[10] Guo Xiangwei, Kang Longyun, Yao Yuan, et al. Joint estimation of the electric vehicle power battery state of charge based on the least squares method and the Kalman filter algorithm[J]. Energies, 2016, 9(2): 100.

[11] He Hongwen, Xiong Rui, Guo Hongqiang. Online estimation of model parameters and state-of-charge of LiFePO4 batteries in electric vehicles[J]. Applied Energy, 2012, 89(1): 413-420.

[12] 赵靖英, 胡劲, 张雪辉, 等. 基于锂电池模型和分数阶理论的SOC-SOH联合估计[J]. 电工技术学报, 2023, 38(17): 4551-4563. Zhao Jingying, Hu Jin, Zhang Xuehui, et al. Joint estimation of the SOC-SOH based on lithium battery model and fractional order theory[J]. Transactions of China Electrotechnical Society, 2023, 38(17): 4551-4563.

[13] Zheng Yuejiu, Ouyang Minggao, Lu Languang, et al. Understanding aging mechanisms in lithium-ion battery packs: from cell capacity loss to pack capacity evolution[J]. Journal of Power Sources, 2015, 278: 287-295.

[14] 王萍, 弓清瑞, 张吉昂, 等. 一种基于数据驱动与经验模型组合的锂电池在线健康状态预测方法[J].电工技术学报, 2021, 36(24): 5201-5212. Wang Ping, Gong Qin, Zhang Jiang, et al. An online state of health prediction method for lithium batteries based on combination of data-driven and empirical model[J]. Transactions of China Electrotechnical Society, 2021, 36(24): 5201-5212.

[15] You G W, Park S, Oh D. Diagnosis of electric vehicle batteries using recurrent neural networks[J]. IEEE Transactions on Industrial Electronics, 2017, 64(6): 4885-4893.

[16] Fan Yaxiang, Xiao Fei, Li Chaoran, et al. A novel deep learning framework for state of health estimation of lithium-ion battery[J]. Journal of Energy Storage, 2020, 32: 101741.

[17] Li Kaiquan, Wang Yujie, Chen Zonghai. A comparative study of battery state-of-health estimation based on empirical mode decomposition and neural network[J]. Journal of Energy Storage, 2022, 54: 105333.

[18] Wang Yujie, Li Kaiquan, Peng Pei, et al. Health diagnosis for lithium-ion battery by combining partial incremental capacity and deep belief network during insufficient discharge profile[J]. IEEE Transactions on Industrial Electronics, 2023, 70(11): 11242-11250.

[19] 周才杰, 汪玉洁, 李凯铨, 等. 基于灰色关联度分析-长短期记忆神经网络的锂离子电池健康状态估计[J]. 电工技术学报, 2022, 37(23) : 6065-6073. Zhou Caijie, Wang Yujie, Li Kaiquan, et al. State of health estimation for lithium-ion battery based on gray correlation analysis and long short-term memory neural network[J]. Transactions of China Electrotechnical Society, 2022, 37(23): 6065-6073.

[20] Tian Jinpeng, Xiong Rui, Shen Weixiang. State-of-health estimation based on differential temperature for lithium ion batteries[J]. IEEE Transactions on Power Electronics, 2020, 35(10): 10363-10373.

[21] 孙丙香, 苏晓佳, 马仕昌, 等. 基于低频阻抗谱和健康特征融合的锂离子电池健康状态主动探测方法研究[J]. 电力系统保护与控制, 2022, 50(7): 23-30. Sun Bingxiang, SuXiaojia, Ma Shichang, et al. An active detection method of Li-ion battery health state based on low-frequency EIS and health feature fusion[J]. Power System Protection and Control, 2022, 50(7): 23-30.

[22] Li Xiaoyu, Wang Zhenpo, Zhang Lei, et al. State-of-health estimation for Li-ion batteries by combing the incremental capacity analysis method with grey relational analysis[J]. Journal of Power Sources, 2019, 410/411: 106-114.

[23] Liu Gengfeng, Zhang Xiangwen, Liu Zhiming. State of health estimation of power batteries based on multi-feature fusion models using stacking algorithm[J]. Energy, 2022, 259: 124851.

[24] 肖迁, 穆云飞, 焦志鹏, 等. 基于改进LightGBM的电动汽车电池剩余使用寿命在线预测[J]. 电工技术学报, 2022, 37(17): 4517-4527. Xiao Qian, Mu Yunfei, Jiao Zhipeng, et al. Improved LightGBM based remaining useful life prediction of lithium-ion battery under driving conditions[J]. Transactions of China Electrotechnical Society, 2022, 37(17): 4517-4527.

[25] 樊亚翔, 肖飞, 许杰, 等. 基于充电电压片段和核岭回归的锂离子电池SOH估计[J]. 中国电机工程学报, 2021, 41(16): 5661-5669. Fan Yaxiang, Xiao Fei, Xu Jie, et al. State of health estimation of lithium-ion batteries based on the partial charging voltage segment and kernel ridge regression[J]. Proceedings of the CSEE, 2021, 41(16): 5661-5669.

[26] Han Tian, Peng Qinke, Zhu Zhibo, et al. A pattern representation of stock time series based on DTW[J]. Physica A: Statistical Mechanics and Its Applications, 2020, 550: 124161.

[27] Markus Goldstein. FastLOF: An expectation maximization based local outlier detection algorithm[C]// Proceedings of the 21st International Conference on Pattern Recognition (ICPR2012), Tsukuba, Japan, 2012: 2282-2285.

[28] Huang Can, Li Fangxing, Zhan Lingwei, et al. Data quality issues for synchrophasor applications Part II: problem formulation and potential solutions[J]. Journal of Modern Power Systems and Clean Energy, 2016, 4(3): 353-361.

[29] 顾崇寅, 徐潇源, 王梦圆, 等. 基于CatBoost算法的光伏阵列故障诊断方法[J]. 电力系统自动化, 2023, 47(2): 105-114. Gu Chongyin, Xu Xiaoyuan, Wang Mengyuan, et al. CatBoost algorithm based fault diagnosis method for photovoltaic arrays[J]. Automation of Electric Power Systems, 2023, 47(2): 105-114.

[30] 郑心仕, 梁寿愚, 苏晓, 等. 基于贝叶斯方法与可解释机器学习的负荷特性分析与预测[J]. 电力系统自动化, 2023, 47(3): 56-68.Zhang Xinshi, Liang Shouyu, Su Xiao. Load characteristic analysis and forecasting based on Bayesian method and interpretable machine learning[J]. Automation of Electric Power Systems, 2023, 47(13): 56-68.

[31] Williard N, He Wei, Osterman M, et al. Comparative analysis of features for determining state of health in lithium-ion batteries[J]. International Journal of Prognostics and Health Management, 2020, 4(1): 1-7.

[32] Meng Huixing, GengMengyao, Han Te. Long short-term memory network with Bayesian optimization for health prognostics of lithium-ion batteries based on partial incremental capacity analysis[J]. Reliability Engineering & System Safety, 2023, 236: 109288.

[33] Choi Y, Ryu S, Park K, et al. Machine learning-based lithium-ion battery capacity estimation exploiting multi-channel charging profiles[J]. IEEE Access, 2019, 7: 75143-75152.

[34] Luo Kai, Zheng Huiru, Shi Zhicong. A simple feature extraction method for estimating the whole life cycle state of health of lithium-ion batteries using transformer-based neural network[J]. Journal of Power Sources, 2023, 576: 233139.

[35] 周航, 程泽, 弓清瑞, 等. 基于TCN编码的锂离子电池SOH估计方法[J]. 湖南大学学报(自然科学版), 2023, 50(4): 185-192. Zhou Hang, Cheng Ze, Gong Qingrui, et al. SOH estimation method of lithium-ion battery based on TCN encoding[J]. Journal of Hunan University (Natural Sciences), 2023, 50(4): 185-192.

[36] Zhu Jiangong, Wang Yixiu, Huang Yuan, et al. Data-driven capacity estimation of commercial lithium-ion batteries from voltage relaxation[J]. Nature Communications, 2022, 13(1): 1-10.

Estimation and Influencing Factor Analysis of Lithium-Ion Batteries State of Health Based on Features Extraction

Gu Juping1, 2 Jiang Ling1 Zhang Xinsong3 Hua Liang3 Cheng Tianyu3

(1. School of Information Science and Technology Nantong University Nantong 226019 China 2. School of Electronic & Information Engineering Suzhou University of Science and Technology Suzhou 215009 China 3. School of Electrical Engineering Nantong University Nantong 226019 China)

Abstract State of health (SOH) estimation is the key function of battery management systems and an important prerequisite for ensuring the safe and stable operation of electrochemical energy storage systems. There are several major problems with existing estimation methods, such as low accuracy, and high complexity. In addition, the interpretability of the estimation model is often ignored resulting in poor reliability of SOH estimation. Recently, some methods extract health features from battery charging curves for SOH estimation to mitigate these problems but most of them suffered from uninformative features and complex features correlation. To bridge the gap, this paper customizes a method that combines estimation and influencing factor analysis of lithium-ion batteries' state of health based on feature extraction.

Firstly, six health features were extracted from the charging curve of lithium-ion batteries, including two new similarity features. they are proposed to quantify the similarity between the initial cycle charging voltage curve and the current cycle charging voltage curve, namely the dynamic time warping distance and the Wasserstein distance. Secondly, the CatBoost method is applied to estimate battery SOH, it is an efficient ensemble learning framework based on gradient boosting decision tree. Finally, the Shapley additive explanations (SHAP) method is introduced to analyze the impact of health features on the estimation results and the coupling relationship between features. The proposed method can further improve the interpretability of the method on the premise of ensuring the accuracy of SOH estimation.

Validation experiments are conducted using multiple batteries from the University of Maryland battery aging dataset. The results show that the proposed SOH estimation method has high accuracy with the average RMSE and MAE are only 2.20% and 1.16%. Compared with the existing methods, the estimation accuracy is improved by more than 12%, and the speed is increased by more than 40%. In addition, the method can still achieve accurate evaluation for batteries with different initial charging SOC and different capacities, which proves that the proposed method has strong adaptability. Finally, the analysis of the evaluation results shows that the similarity feature can effectively characterize the changing trend of the internal resistance in batteries. The CCCT and CVTCT in the health feature have a positive impact on the battery SOH, and DTW and WAS have a negative impact on the battery SOH, and there is a linear coupling relationship between health features.

The following conclusions can be drawn from the analysis: (1) The similarity features obtained based on dynamic time warping distance and Wasserstein distance have a strong correlation with the battery internal resistance, and can be used as new health features for battery SOH estimation. (2) Multiple battery data verification experiments show that the battery SOH estimation accuracy of the CatBoost method has been improved by more than 12% compared to existing methods, and its generalization ability is stronger. (3) The contribution rate and influence degree of each health feature were quantified by the SHAP method, which revealed the coupling relationship between features and improved the interpretability of the model. The analysis results showed that CCCT, CVTCT, DTW and WAS characteristics were the key factors affecting SOH assessment. Among them, CCCT and CVTCT have a positive impact, while DTW and WAS have a negative impact on the estimation model. In addition, there is a negative correlation between the constant current charging time and the dynamic time warping distance features and a positive correlation with the stable time of dV/dt.

keywords:Lithium-ion batteries, state of health, features extraction, CatBoost, Shapley additive explanations (SHAP)

DOI:10.19595/j.cnki.1000-6753.tces.231085

中图分类号:TM911

国家自然科学基金智能电网联合基金(U2066203)、国家自然科学基金(61973178)和江苏省重点研发计划(产业前瞻与关键核心技术)(BE2021063)资助项目。

收稿日期 2023-07-10

改稿日期 2023-08-10

作者简介

顾菊平 女,1971年生,教授,博士生导师,研究方向为电力设备态势感知、电机及控制等。E-mail:gu.jp@ntu.edu.cn

蒋 凌 男,1995年生,博士研究生,研究方向人工智能技术在电力态势感知中的应用。E-mail:ntujiangling@163.com(通信作者)

(编辑 郭丽军)