基于双向长短期记忆网络和注意力机制的质子交换膜燃料电池衰退行为预测

（1. 郑州大学电气与信息工程学院郑州 450000 2. 安徽大学电气工程与自动化学院合肥 230601）

摘要质子交换膜燃料电池（PEMFC）的寿命和性能衰退是当前燃料电池技术研究中的一个重要课题。对燃料电池电压衰退行为进行准确预测有利于提前分析燃料电池的运行状态，以提高系统的运行性能和可靠性。针对燃料电池电压衰退行为预测的问题，该文提出一种基于双向长短期记忆网络（Bi-LSTM）和注意力机制（Attention）的模型。该模型首先选取能够表现燃料电池衰退行为的特征数据作为输入，利用Bi-LSTM提取数据中的长期依赖关系；其次通过注意力机制增强关键特征的权重分配；最后得到PEMFC的衰退预测结果。该文基于同济大学的燃料电池开源数据进行实验，并与其他一些经典模型进行预测性能的对比实验。测试结果表明，所提模型的方均根误差仅为0.006 1 V，实现了高精度的衰退行为预测。与传统神经网络模型如卷积神经网络相比，所提的Bi-LSTM-At模型在预测精度和稳定性方面均有显著优势，预测精度提高了23%，能够精确地进行PFMFC电池的衰退行为预测。进一步地，通过交叉验证实验，证明了所提模型不论是预测运行早期还是运行末期的衰退行为均表现出较好的鲁棒性。该研究为燃料电池的健康状态监控和剩余寿命评估提供了有效的技术支持。

关键词：质子交换膜燃料电池衰退行为预测双向长短期记忆网络注意力机制

0 引言

质子交换膜燃料电池（Proton Exchange Mem- brane Fuel Cell, PEMFC）是一种高效、清洁的燃料电池发电装置[1-2]。PEMFC以氢气和氧气为反应物，利用电化学反应将化学能直接转化为电能，实现了污染物的零排放或低排放[2]。PEMFC具备很高的研究和使用价值，如今，它被广泛地应用于储能、交通等领域，是燃料电池汽车上应用最广泛的燃料电池[3]。PEMFC装置因其高能量密度以及无电解质腐蚀等优点，被视为后石油时代最具潜力的能源替代技术之一[4]。由于PEMFC装置性能会发生暂时或永久性退化[5]，一旦出现衰退情况，会对其性能和使用寿命造成重大影响，因此对PEMFC衰退行为进行预测具有重要意义，同时也是巨大的挑战。

燃料电池的衰退行为受到多种因素影响，主要包括以下两个方面：一是膜电极衰退及失效[6-7]，尤其是在较高温度下，质子交换膜会发生快速降解，进一步缩短燃料电池寿命，加快燃料电池衰退行为；二是PEMFC内部局部故障，如燃料电池内部水管理故障等会引起性能衰退甚至电池系统损坏[8-9]。因此，对燃料电池衰退行为预测需要考虑多种因素，并且存在一定挑战。当前，燃料电池衰退行为预测方法主要分为基于机理模型的预测方法、基于数据驱动的方法及混合方法。

基于机理模型预测方法主要根据PEMFC负载条件、材料特性、老化以及物理失效机制等来实现对燃料电池衰退行为的预测。文献[10]描述了基于热力学和电极动力学的机理退化模型，开发了一个基于降解机制的PEMFC剩余寿命预测模型。文献[11]提出了一种质子交换膜燃料电池的耐老化控制策略，将燃料电池最大功率识别集成至剩余寿命预测中。文献[12]提出一种基于自适应卡尔曼滤波算法的半经验模型，能够准确预测PEMFC的剩余寿命。文献[13]提出了一种扩展卡尔曼滤波方法。基于健康监测数据，用于燃料电池健康预测，有助于了解燃料电池健康状态的变化。文献[14]提出了一种基于频域卡尔曼滤波和电压退化的模型，在频域上预测PEMFC的衰退行为。

混合方法是结合了模型预测方法和数据驱动方法优势的衰退行为预测策略[15]。文献[16]使用了混合方法，首先根据自适应神经模糊推理算法预测长期退化趋势，之后通过基于半经验降解模型和自适应无迹卡尔曼滤波算法实现了PEMFC剩余使用寿命估计。文献[17]提出一种基于考虑电压恢复情况的物理模型与自适应卡尔曼滤波器结合，并与添加注意力机制的门控循环单元（Gated Recurrent Unit, GRU）模型结合对电池整体退化情况进行预测。文献[18]提出了一种基于自适应卡尔曼滤波和神经网络相结合的混合预测方法来预测PEMFC的性能退化。

由于衰退行为具有高度的非线性和时间依赖性，仅通过传统的机理建模方法难以全面准确地刻画其演化过程，故需引入数据驱动方法进行预测。基于数据驱动的估计，即通过机器学习和深度学习技术，提取数据特征并对衰退行为进行预测[19]。文献[20]提出了一种基于长短期记忆循环神经网络（Long Short-Term Memory, LSTM）的PEMFC寿命预测方法，实现了快速准确的寿命预测。文献[21]使用基于Time2vec和卷积网络的算法提取了时间序列的周期性和时间、空间的相关性，进行PEMFC剩余寿命预测。文献[22]提出一种集成卷积（Convolu- tional Neural Network, CNN）网络和深度神经网络（Deep Neural Network, DNN）的模型，基于PEMFC图像和性能数据预测性能和最佳工艺条件。文献[23]通过基于时变滤波经验模式分解提取数据特征，再利用Mogrifier-LSTM模型预测PEMFC性能退化。文献[24]提出一种结合小波阈值去噪方法的正则化堆叠长短期记忆网络的模型，进行PEMFC性能衰减预测。然而，这些研究主要基于电压老化数据预测燃料电池退化，没有充分地考虑电流作为PEMFC负载状态动态表征的关键作用。事实上，电流提供外部工况信息，电压提供内部状态信息，两者结合可构建更全面的健康状态表征。

双向长短期记忆网络（Bidirectional Long Short- Term Memory, Bi-LSTM）作为一种改进的循环神经网络，不仅能够捕获时间序列数据中的长期依赖关系，还可以同时提取过去和未来的特征信息，为复杂时序数据的分析提供了有力支持。本文提出了一种基于Bi-LSTM和注意力机制的PEMFC衰退行为预测模型。该模型以电流-电压时序双特征数据作为输入，两者的协同作用使得模型能够更精准地捕捉退化机制、降低误判风险，从而为燃料电池的寿命预测和健康管理提供科学依据。利用Bi-LSTM提取燃料电池运行数据中的时间依赖关系，并通过注意力机制加强关键特征的表达能力，以实现对PEMFC衰退行为的精确建模。通过与传统神经网络模型和其他深度学习模型的对比实验，验证了所提模型的有效性和优越性。添加K折交叉验证体现了所提模型的稳定性和鲁棒性，添加了不同时间步的多步预测验证了本文模型对电压衰退行为的长期预测能力。本研究为PEMFC的健康状态监控和剩余寿命评估提供了一种新的技术手段，也为燃料电池的维护和优化设计提供了科学依据。

1 燃料电池老化数据分析

燃料电池老化数据分析主要包括在不同条件下对燃料电池性能随时间变化的监测和分析，以了解其老化趋势。本节通过观察燃料电池的极化表现以分析燃料电池大致性能衰退情况，并且进行数据清洗以建立电压衰退行为预测数据集，了解燃料电池性能表现和系统可靠性分析。

1.1 质子交换膜燃料电池数据集

本文使用的数据来自同济大学公开的质子交换膜燃料电池数据集[25]。数据集主要采用了武汉理氢科技有限公司生产的商业质子交换膜燃料电池，采用欧盟协调测试协议，也被称为燃料电池动态负载循环（Fuel Cell-Dynamic Load Cycle, FC-DLC）[26]，在Greenlight 20测试站上进行了PEMFC的动态耐久性测试和极化特性测试，并收集了长期动态耐久性测试数据和极化特征测试数据。

数据集中，耐久性测试共运行了1 000 h，按照FC-DLC要求记录数据[25]。单个FC-DLC周期电流负载和电压值变化如图1a所示，完整数据集电压数据如图1b所示。

1.2 电池极化表现

极化是指电池在工作过程中，由于电池内部各种复杂的物理和化学反应作用，导致实际电压偏离平衡电压的现象，并且伴随着难以避免的电压损失，从而降低了电池的整体健康状态[27]。图2a展示了燃料电池在电流上升模式下不同时间的极化曲线对比；图2b展示了燃料电池在电流下降模式下不同时间的极化曲线对比。实验中极化曲线环境如下：操作温度为85℃；阳、阴极相对湿度为50%和85%；阳、阴极化学计量为2和3.5；阳、阴极压强均为110 kPa。由图2可以发现，两种电流负载模式下，随着时间的推移，电池的极化曲线均出现明显的下移，反映了电池性能正逐渐衰减。图3a展示了燃料电池在电流上升模式下经过12 h停机休息后的不同时间极化曲线对比；图3b展示了燃料电池在电流下降模式下经过12 h停机休息后的不同时间极化曲线对比。与停机前相比，随着时间推移，电池电压衰减现象更为明显，在电流负载大于20 A时，电压退化现象更显著。

1.3 数据清洗

单个FC-DLC循环包括35个运行工步，分别在1.76 A、4.42 A、9.48 A、10.37 A、14.81 A、20.70 A、29.59 A、35.53 A等多种电流负载下进行测试，其中包括29个在城市电流负载条件下的数据和6个在郊区电流负载条件下的数据[28]。

为了确保原始数据的准确性并减少误差，对原始数据集进行一定的平滑处理：在单个FC-DLC循环的每个工步中，对于同样电流设置值对应的数据，选择倒数第3个～倒数第7个数据并计算均值，作为每个工步数据处理的最终值。

2 预测模型构建

2.1 输入特征选取

燃料电池在运行过程中，许多因素都可能对燃料电池本身性能产生影响，并且影响程度不一，因此选择合适的输入特征极为重要。通常从电池运行历史数据中选择和提取与衰退行为密切相关的参数，常见的输入特征包括电流、电压、功率、阴极阳极进出口温度、阴极阳极露点温度、阴极阳极气体流量、阴极阳极压力等。为准确描述燃料电池的工作状态并较好地捕捉燃料电池衰退行为，同时考虑到实际运行中数据采集的便捷性，本文仅使用典型电池行为参数——电流和电压作为燃料电池衰退行为的预测输入特征。

2.2 模型结构

2.2.1 双向长短期记忆网络Bi-LSTM

Bi-LSTM网络是一种基于长短期记忆网络的时间序列预测方法，它结合了双向模型和LSTM的门控机制，由两个独立的LSTM网络构成，其中前向LSTM是从序列的开头到结尾逐步处理数据，反向LSTM是从序列的结尾到开头逐步处理数据。每个时刻的隐藏状态由前向LSTM和反向LSTM的输出共同组成，因此Bi-LSTM能同时提取输入序列过去和未来的信息。Bi-LSTM网络结构如图4所示。

LSTM是一种特殊类型的循环神经网络（Recurrent Neural Network, RNN），能够学习长期依赖关系，在较长的时间跨度内捕捉序列中的依赖关系[29]。与传统RNN相比，LSTM更注重于解决在处理长序列数据时遇到的梯度消失或者梯度爆炸问题。LSTM网络结构如图5所示，其中记忆单元是整个LSTM网络的核心，负责在整个序列处理过程中保持和更新长期依赖信息。单元内部引入的三个关键门控机制——遗忘门、输入门和输出门，有效地缓解了梯度消失和梯度爆炸问题。

遗忘门

的作用是决定从单元中丢弃哪些信息，主要通过Sigmoid激活函数进行控制，使 width=11,height=13.95

输出的取值范围在[0, 1]内，1表示完全保留，0表示完全遗忘。其公式为

输入门

由两部分组成：一个Sigmoid函数决定哪些值会被写入单元，一个tanh函数更新候选值向量，两者结合决定哪些新信息会被写入单元中。函数公式为

式中，

为当前时刻的候选细胞状态。

将遗忘门

和输入门

的结果相结合，并更新单元状态，公式为

输出门

决定单元输出信息，并通过tanh函数对输出值进行缩放，其公式为

式中，

、

分别为遗忘门输出、输入门输出、输出门输出、内部状态以及隐藏状态； width=15,height=15

、

、

分别为对应门控部件的权重矩阵； width=12,height=15

、

为对应矩阵的偏置向量；s、tanh分别为Sigmoid激活函数和双曲正切函数。

Bi-LSTM与LSTM相比，Bi-LSTM能够同时考虑序列的前向信息和反向信息，增强了对双向上下文信息的捕捉能力，可以更全面地捕捉输入的上下文的特征，使其在处理复杂序列数据时的表现更加出色，被广泛应用于语言处理、语音识别、时间序列预测等领域。

2.2.2 注意力机制Attention

尽管Bi-LSTM能够有效捕获时序特征序列的前后依赖关系，但是较长的序列会导致Bi-LSTM无法完全捕捉长距离上下文信息，从而精准建模早期特征与末期衰退结果间的关联性。为此，本文引入注意力机制（Attention）中的自注意力机制（Self- Attention），通过计算输入序列中每个元素与其他元素的相关性，来捕捉序列中的全局依赖关系。

自注意力机制的核心概念是引入权重分数来衡量不同元素的重要性。首先将输入序列 width=21,height=11

（n为序列长度，d为嵌入维度）通过线性变换得到查询（Query）、键（Key）和值（Value）矩阵：

式中，

、

、

分别为可训练的查询、键、值的权重矩阵。通过对查询矩阵Q和键矩阵K进行点积运算，计算两者的相似度，并对结果进行缩放；然后对缩放后的矩阵进行归一化（Softmax）操作得到注意力权重；最后将其应用于值矩阵V得到加权输出，公式为

式中，

为键矩阵K的维度。

本文自注意力机制评分函数选择加性注意力，与点积注意力相比，主要引入非线性变换，增强学习更复杂的查询与键之间的能力，公式为

式中，

为可训练的权重向量； width=12,height=12

表示矩阵进行广播相加运算。

2.3 模型构建

本文所构建的基于双向长短期记忆网络-注意力机制（Bi-LSTM-Attention, Bi-LSTM-At）模型主要由输入层、隐藏层和输出层组成。将从0～600 h的数据作为训练集，从600～1 000 h的数据作为测试集。其中输入层选取的输入序列为电流和电压，隐藏层包括Bi-LSTM层和全连接层。Bi-LSTM层数是模型构建的一个重要参数，较高的层数会增加模型的复杂性。为了减轻计算负担，本文选择添加两个Bi-LSTM层，并将LSTM的神经元数目设置为64。为了防止模型训练过程的过拟合现象，在每个Bi-LSTM层后添加Dropout层。本文丢弃率均设置为0.2，即有20%的神经元会被随机丢弃。在Bi-LSTM层后添加注意力机制并指定激活函数为ReLU（Rectified Linear Unit），有利于帮助模型专注于重要特征，帮助模型更好地捕捉输入序列的重要信息。最后添加全连接层，神经元数设置为32，并采用ReLU激活函数。输出层仅输出电压值，根据输出电压值分析PEMFC的衰退行为。表1所示为本文模型相关超参数设置。

在模型训练过程中，为了提高模型的训练效率、优化模型的预测性能，并有效避免模型过拟合以及因不当学习率设置导致的收敛问题，本文采用了早停法（EarlyStopping）、最优模型检查法和自适应学习率调整法等方法解决。三种方法相辅相成，使模型训练过程更加高效、稳定，并且提升了模型的整体性能。

本文所构建的模型架构如图6所示。

3 结果与对比

3.1 评价指标

为了评估本文提出的Bi-LSTM-At模型的预测性能，本文选择决定系数（R2）和方均根误差（Root Mean Square Error , RMSE）两个评价指标。在模型性能评估中，R2和RMSE是两种常用的评价指标，它能够从不同角度衡量预测结果与实际值之间的差异，从而全面评估模型的准确性与稳定性。

R2用于衡量模型对观测数据的拟合程度，越接近1，说明模型对数据的拟合效果越好；越趋近于0或为负值时，说明模型的预测结果越差，其计算公式为

式中，

为第i个原始数据值； width=11,height=15

为第i个所提模型的预测值； width=10,height=13.95

为原始数据值的均值；n为数据数量。

RMSE用于衡量模型预测值与实际值之间的偏差，反映了预测结果误差的整体水平。RMSE越小，说明模型预测的误差越小，性能越好，其公式为

R2和RMSE两种评价指标的结合使用，有利于更全面地评估模型性能，有效验证模型在不同评价维度下的稳定性和准确性：R2能够反映模型的拟合程度，而RMSE则直接反映模型的预测误差。

3.2 实验细节

本文所有模型均使用Tensorflow2.11.0在Python3.9.10上进行，采用相同的数据集，且输入特征保持一致：所提模型和对比模型的训练次数保持一致，且采用相同参数的早停策略，防止模型发生过拟合现象及训练次数过多导致训练时间和资源的浪费。对于实验结果，采用相同的评价指标，即决定系数（R2）、方均根误差（RMSE）来衡量模型的预测性能。

3.3 模型预测结果

本节应用了所构建的Bi-LSTM-At模型预测，对PEMFC电池的衰退行为进行预测。将训练集的电流和电压作为输入，进行模型训练：将测试集的电流和电压作为输入，利用训练好的模型进行预测，并将预测结果与测试集数据进行对比，结合评价指标（R2和RMSE），对模型的预测准确性和稳定性进行详细分析。

Bi-LSTM-At模型预测结果如图7所示。从图7a所示的部分时间测试集的原始数据和预测数据对比结果可以看出两者形状相似，拟合结果较好，但是在初始时间也就是在低电流负载状态下，预测误差较中高电流负载状态下有所增加，但增加幅度有限。从局部放大图像可以看出，低电流负载状态下，模型预测性能和预测精度也比较优异。从图7b所示的模型损失值随训练次数的变化情况可以发现，模型在第10次训练左右开始收敛，并且始终维持一个较低的损失值，说明所提方法能够快速收敛，并且拟合程度较好。模型预测的R2为0.994 7，RMSE为0.006 1 V，均达到了很高的水平，这说明本文所提出的模型可以较好地拟合数据集。

3.4 模型对比分析

为了进一步验证本文模型的预测性能，本节将本文提出的Bi-LSTM-At模型与以下多个模型进行对比：Transformer、双层LSTM、双层LSTM-At、单层CNN、单层CNN-At、双层CNN、双层CNN-At、CNN-单层LSTM、CNN-单层LSTM-At、CNN-双层LSTM-At、Bi-LSTM，共计11个模型，并确保对比模型之间存在关联的网络的结构和超参数一致，如：单层CNN、单层CNN-At、CNN-单层LSTM、CNN-单层LSTM-At、CNN-单层LSTM、双层CNN- LSTM-At的CNN层及LSTM层超参数均一致；双层LSTM、双层LSTM-At、Bi-LSTM及本文所提模型对应的LSTM层超参数均一致。所有模型超参数均通过试错法选取或者网格搜索最优超参数后选取，且训练集和测试集与前文相同。绘制模型预测结果与损失值图像，并将评价指标（R2和RMSE）与本文提出模型进行对比。

由于预测结果包括全部预测时间段的原始电压与预测电压对比，很难在一张图中清晰地展示模型预测结果，因此，图8选取了本文模型、Transformer以及CNN-LSTM-At三个典型模型展示整体预测结果对比，将本文模型与其他11个对比模型的部分时间段预测结果放入图9中展示，并且选取了差异较大的时间段进行局部放大对比。

从图8全部测试集结果可以发现，本文模型拟合结果较好；Transformer模型在高电压部分拟合结果比较稳定，但是要高于原始电压值，而低电压部分拟合不如本文模型；CNN-LSTM-At模型在全部电压值拟合结果方面均不如本文模型。从图9中作为对照的其他11个模型原始和预测电压值的部分时间对比结果可以发现，其他模型的预测电压值和原始电压值并不能完全重合或者重合部分较少，说明其他模型拟合效果不如本文所提模型。

从图10a中作为对照的其他11个模型的训练集损失值变化图可以发现训练集损失值在第10次训练后曲线逐渐趋于平缓。从图10b中测试集损失值的变化趋势图可以发现，第10次训练后有7种模型的损失值曲线趋于平缓，第20次训练后大部分模型损失值曲线趋于平缓，且损失值维持在一个较低的水平。训练集和测试集损失值在同样训练次数时相差不多，说明模型没有发生过拟合现象。

表2总结了本文模型与其他11个模型的评价指标。可以看出，本文所提方法不论是决定系数还是方均根误差均为最小，RMSE低至0.006 1 V，R2为0.994 7。对于其他模型来说，双层CNN网络结果明显优于单层CNN网络，RMSE和R2均有明显改善，预测准确度提高了约110%；CNN-双层LSTM-At网络结果也要略优于CNN-单层LSTM-At网络，预测准确度约提升了18%，说明具有更多隐藏层的神经网络能在一定程度上提高模型的预测性能，比单层神经网络预测更为精确，误差也更小。同时，添加注意力机制对于大部分模型来说，能够较为明显地改善预测性能和准确性。例如，双层LSTM-At模型与没有添加注意力机制的双层LSTM模型相比，预测准确度提升了高达35%。而对于少部分模型，如单层CNN模型和双层CNN模型，可能由于CNN模型本身已经提取的重要特征和注意力机制作用的结果重合，从而无法显著提升预测性能。与其他神经网络相比，本文所提出的Bi-LSTM-At模型提供了极佳的预测性能，能够较好地预测PEMFC电池的衰退行为。

上述部分典型模型的复杂性在表3中进行了比较，本文选择模型的总参数量和训练时间作为体现模型复杂度和实时性的评估指标。

从表3中可以发现，Bi-LSTM-At模型总参数量为387 202，相较于传统的Bi-LSTM（378 945）略有增加，但远高于其他模型。这一参数量水平对于捕捉燃料电池衰退行为中的复杂时序关系来说是合理且必要的，体现了所提模型极高的复杂度。相比于双层LSTM模型，不论是模型复杂度，还是训练时间，所提模型均有更优的指标。引入注意力机制后，虽然模型预测性能提升有限，但不仅提高了模型的复杂度，并且极大地降低了训练时间，提高了训练效率，这说明引入注意力机制后，模型捕捉关键特征的能力显著提升，具有更加有效的信息筛选能力。所提模型在保证高预测准确度（R2=0.994 7）的同时，具备相当高的复杂度和较低的训练时间，既满足了高精度预测需求，又具备较好的实时性，为实际燃料电池健康状态监控和剩余寿命预测提供了有力的技术支持。

3.5 不同预测步长条件下Bi-LSTM模型的预测结果

对于实际运行中的燃料电池，单步预测对下一个时间步的燃料电池电压进行预测，能够在短期预测中获得较高的准确度，但是无法满足对实际燃料电池剩余使用寿命进行长期评估的需求。因此，本节在本文模型的基础上，进一步引入多步预测的实验验证，针对不同时间步燃料电池电压衰退情况进行预测，完善了对燃料电池长期进行性能预测的验证。

在原有Bi-LSTM-At模型参数结构不变的基础上，修改了网络的输出层，使其能够同时输出未来多个时间步的预测值。分别选择预测时间步为5、10、15、20、60，表4展示了单步预测及多步预测的评价指标对比，包括R2、RMSE和平均绝对误差（Mean Absolute Error, MAE）。实验结果表明，在进行单步预测时，模型能够在短期预测中达到极高的精度和拟合效果，随着预测步长逐渐增大，模型的误差有所增加，这表明随着时间步的增加，误差逐渐累积，模型的长期预测精度有所降低。当预测步长达到T=60时，RMSE达到0.025 3 V，MAE为0.017 7 V，R2降至0.909 2，虽然相比单步预测误差明显增加，但R2仍保持在较高水平，说明模型在较长的时间跨度内仍能捕捉到总体的电压衰退趋势，具有较好的长期预测能力，体现了本文模型在长期预测中较好的预测性能和精度，为燃料电池长期使用寿命评估提供了可靠支持。

3.6 模型稳定性分析

本节采用K折交叉验证方法对所提出的Bi- LSTM-At模型在燃料电池电压衰退行为预测的稳定性进行深入分析，通过交叉验证，可以有效评估模型在不同数据划分下的预测性能，从而检测模型对不同数据划分的鲁棒性及稳定性。

K折交叉验证是一种常用的模型评估方法，将原始数据集均分为k个互斥的子集，在每次实验中，选择其中一个作为验证集，其余k-1个作为训练集，重复k次，将最终得到的k次实验的性能指标进行平均，从而获得对模型泛化能力和总体性能的有效评估。

本研究选取k=5，即均匀地将数据集分为5个子集，分别标注为第1～5组，方便针对不同训练集和验证集模型观察预测性能，针对每次交叉验证实验，均采用相同的超参数设置，并引入早停策略以避免过拟合。5次交叉验证各折评价指标对比见表5，Fold1～5分别表示第1～5次验证实验，验证集依次为第1～5组，训练集分别为除验证集外的其余4组数据。从表5中可以发现，本文所提模型在各折验证中的R2和各项误差指标均保持在较窄的波动范围内，例如，R2在0.995 2～0.997 3范围内波动，均值为0.996 1，RMSE在0.004 4～0.005 8 V范围内波动，均值为0.005 1 V，表明模型在不同子集的较为一致和优异的预测性能，并且不论验证集选择燃料电池运行早期阶段，还是运行末期阶段，模型均能较好地进行预测，验证了模型具有较高的稳定性和鲁棒性，为该模型在实际燃料电池运行时电压衰退行为的预测提供了有力的支持。

3.7 注意力机制引入对预测性能的影响

为了进一步验证引入注意力机制带来的优势，本节详细比较了Bi-LSTM和Bi-LSTM-At两个模型的预测误差分布结果，Bi-LSTM-At和Bi-LSTM的绝对误差分布对比如图11所示。从图11a和图11b中可以发现，本文模型的绝对误差分布明显要优于Bi-LSTM模型，并且异常值个数要远少于Bi-LSTM模型，本文模型大多数预测结果处于较低的绝对误差区域（≤0.006 V），并且在高电压附近绝对误差明显小于Bi-LSTM模型，图11c显示了两个模型绝对误差的累计分布，可以发现，54.2%的Bi-LSTM-At预测结果的绝对误差低于0.004 V，而Bi-LSTM预测结果的绝对误差低于0.004 V的占51.7%，87.2%的Bi-LSTM-At预测结果的绝对误差低于0.01 V，而Bi-LSTM的这一结果是85.8%。本文模型在每个绝对误差下的分布均优于Bi-LSTM模型，这一结果验证了引入注意力机制可以提高模型的预测性能，即使原模型的预测性能已经优于大部分模型。不仅如此，由表3可以发现，添加注意力机制后在略微提高模型复杂度的同时大幅度降低了训练时间，提高了训练效率，既满足了高精度预测需求，又具备较好的实时性，体现了本文所提模型引入注意力机制后带来的优异性能。

4 结论

本文提出了一种基于Bi-LSTM和注意力机制的PEMFC电池衰退行为预测模型，引入电流-电压时序双特征数据作为输入，对输入进行归一化和联合学习，通过Bi-LSTM双向提取时间序列信息中的长期依赖关系，然后通过注意力机制动态分配不同特征的权重，增强了对关键信息的捕捉能力，精准捕捉关键特征，有效提高燃料电池衰退行为预测的精度和稳定性，实现了对燃料电池电压衰退行为的全面刻画。在实验中，本文所提出的Bi-LSTM-At模型与其他先进模型相比均表现出较高的预测精度，验证了模型的有效性。通过交叉验证证明了所提模型对不同燃料电池运行阶段的电压衰退行为均具有良好的预测性能，具有较好的稳定性和鲁棒性。通过进行不同时间步的多步预测，验证了所提模型对燃料电池长期电压衰退行为进行长期预测的有效性。最后通过添加注意力前后的误差分布对比实验，验证了注意力机制对提高模型预测性能的有效性。实验结果表明，无论是对不同运行阶段还是长期预测任务中，所提模型均表现出较高的预测精度和鲁棒性，对燃料电池健康状态监控和剩余寿命预测提供了有效技术支持。未来可以进一步探讨不同特征组合对模型的预测性能的影响，结合更多实际数据优化模型结构，以进一步提高模型的预测性能。

[1] 吴字强, 王伟, 黄亮, 等. 燃料电池稳态输出功率与效率的双目标优化[J]. 电源学报, 2019, 17(2): 32-39.

Wu Ziqiang, Wang Wei, Huang Liang, et al. Bi- objective optimization for steady-state output power and efficiency of fuel cell[J]. Journal of Power Supply, 2019, 17(2): 32-39.

[2] 王博斐, 肖浩哲, 李国豪, 等. 基于控制目标的氢-电混动系统能量管理策略综述[J]. 发电技术, 2023, 44(4): 452-464.

Wang Bofei, Xiao Haozhe, Li Guohao, et al. A review of energy management strategy for hydrogen- electricity hybrid power system based on control target[J]. Power Generation Technology, 2023, 44(4): 452-464.

[3] YangDuo, Wang Siyu, Liao Yuefeng, et al. An online energy management strategy for fuel cell vehicles based on fuzzy Q-learning and road condition recognition[J]. IEEE Transactions on Intelligent Transportation Systems, 2024, 25(9): 12120-12130.

[4] 袁铁江, 计力, 田雪沁, 等. 考虑燃料电池汽车加氢负荷的电-氢系统协同优化运行[J]. 电力系统自动化, 2023, 47(5): 16-25.

Yuan Tiejiang, Ji Li, Tian Xueqin, et al. Synergistic optimal operation of electricity-hydrogen systems considering hydrogen refueling loads for fuel cell vehicles[J]. Automation of Electric Power Systems, 2023, 47(5): 16-25.

[5] 徐冰, 张敏, 杨文涛, 等. 质子交换膜燃料电池基于老化特征的剩余使用寿命混合预测方法[J]. 电工技术学报, 2025, 40(17): 5703-5714.

Xu Bing, Zhang Min, Yang Wentao, et al. PEMFC Hybrid prediction method for remaining useful life based on aging characteristics[J]. Transactions of China Electrotechnical Society, 2025, 40(17): 5703- 5714.

[6] 任洲洋, 王皓, 李文沅, 等. 基于氢能设备多状态模型的电氢区域综合能源系统可靠性评估[J]. 电工技术学报, 2023, 38(24): 6744-6759.

Ren Zhouyang, Wang Hao, Li Wenyuan, et al. Reliability evaluation of electricity-hydrogen regional integrated energy systems based on the multi-state models of hydrogen energy equipment[J]. Trans- actions of China Electrotechnical Society, 2023, 38(24): 6744-6759.

[7] 赵洪山, 潘思潮, 马利波, 等. 基于分类回放双延迟贝叶斯深度确定性策略梯度的燃料电池温度控制[J]. 电工技术学报, 2024, 39(13): 4240-4256.

Zhao Hongshan, Pan Sichao, Ma Libo, et al. Control of fuel cell temperature based on classified replay twin delayed Bayesian deep deterministic policy gradient[J]. Transactions of China Electrotechnical Society, 2024, 39(13): 4240-4256.

[8] WangYujie, Yang Xingliang, Sun Zhengdong, et al. A systematic review of system modeling and control strategy of proton exchange membrane fuel cell[J]. Energy Reviews, 2024, 3(1): 100054.

[9] Flick S, Schwager M, McCarthy E, et al. Designed experiments to characterize PEMFC material proper- ties and performance[J]. Applied Energy, 2014, 129: 135-146.

[10] Chen Hong, Zhan Zhigang, Jiang Panxing, et al. Whole life cycle performance degradation test and RUL prediction research of fuel cell MEA[J]. Applied Energy, 2022, 310: 118556.

[11] Bressel M, Hilairet M, Hissel D, et al. Model-based aging tolerant control with power loss prediction of Proton Exchange Membrane Fuel Cell[J]. Interna- tional Journal of Hydrogen Energy, 2020, 45(19): 11242-11254.

[12] Liu Hao, Chen Jian, Zhu Chuyan, et al. Prognostics of proton exchange membrane fuel cells using a model- based method[J]. IFAC-PapersOnLine, 2017, 50(1): 4757-4762.

[13] Bressel M, Hilairet M, Hissel D, et al. Extended Kalman filter for prognostic of proton exchange memb- rane fuel cell[J]. Applied Energy, 2016, 164: 220-227.

[14] Ao Yunjin, Laghrouche S, Depernet D, et al. Proton exchange membrane fuel cell prognosis based on frequency-domain Kalman filter[J]. IEEE Trans- actions on Transportation Electrification, 2021, 7(4): 2332-2343.

[15] 方德宇, 楚潇, 刘涛, 等. 基于数据-模型驱动的锂离子电池健康状态估计[J]. 电气工程学报, 2022, 17(4): 20-31.

Fang Deyu, Chu Xiao, Liu Tao, et al. Research on health assessment method of lithium-ion battery based on data-model hybrid drive[J]. Journal of Electrical Engineering, 2022, 17(4): 20-31.

[16] Liu Hao, Chen Jian, Hissel D, et al. Remaining useful life estimation for proton exchange membrane fuel cells using a hybrid method[J]. Applied Energy, 2019, 237: 910-919.

[17] Wu Hangyu, Wang Wei, Li Yang, et al. Hybrid physics-based and data-driven prognostic for PEM fuel cells considering voltage recovery[J]. IEEE Trans- actions on Energy Conversion, 2024, 39(1): 601-612.

[18] Pan Rui, Yang Duo, Wang Yujie, et al. Performance degradation prediction of proton exchange membrane fuel cell using a hybrid prognostic approach[J]. International Journal of Hydrogen Energy, 2020, 45(55): 30994-31008.

[19] 丁恒, 黄凯, 田海建. 基于VMD和ISSA-ELM的锂离子电池剩余使用寿命预测[J]. 电源学报, 2024, 22(6): 188-198.

Ding Heng, Huang Kai, Tian Haijian. Prediction of remaining useful life of lithium-ion battery based on VMD and ISSA-ELM[J]. Journal of Power Supply. 2024, 22(6): 188-198.

[20] Liu Jiawei, Li Qi, Chen Weirong, et al. Remaining useful life prediction of PEMFC based on long short- term memory recurrent neural networks[J]. International Journal of Hydrogen Energy, 2019, 44(11): 5470- 5480.

[21] ZhouNing, Cui Benyu, Zhou Jianxin. Transformer- based prediction of the RUL of PEMFC[C]//2022 3rd International Conference on Information Science, Parallel and Distributed Systems (ISPDS),Guangzhou, China, 2022: 345-348.

[22] Shin S, Kim J, Lee S, et al. Multimodal data-driven prediction of PEMFC performance and process condi- tions using deep learning[J]. IEEE Access, 2024, 12: 168030-168042.

[23] Yu Yang, Yu Qinghua, Luo Runsen, et al. A predictive framework for PEMFC dynamic load performance degradation based on feature parameter analysis[J]. International Journal of Hydrogen Energy, 2024, 71: 1090-1103.

[24] 汪建锋, 王荣杰, 林安辉, 等. 质子交换膜燃料电池退化预测方法[J]. 电工技术学报, 2024, 39(11): 3367-3378.

Wang Jianfeng, Wang Rongjie, Lin Anhui, etal. Degradation prediction method of proton exchange membrane fuel cell[J]. Transactions of China Electro- technical Society, 2024, 39(11): 3367-3378.

[25] Zuo Jian, Lv Hong, Zhou Daming, et al. Long-term dynamic durability test datasets for single proton exchange membrane fuel cell[J]. Data in Brief, 2021, 35: 106775.

[26] Bloom I, Walker L K, Basco J K, et al. A comparison of fuel cell testing protocols—a case study: protocols used by the U.S. Department of Energy, European Union, International Electrotechnical Commission/Fuel Cell Testing and Standardization Network, and Fuel Cell Technical Team[J]. Journal of Power Sources, 2013, 243: 451-457.

[27] Xie Wenlong, Guo Peng, Gao Xinlei. Elucidating the rate limitation of lithium-ion batteries under different charging conditions through polarization analysis[J]. Journal of Energy Storage, 2024, 82: 110554.

[28] Zuo Jian, Lü Hong, Zhou Daming, et al. Deep learning based prognostic framework towards proton exchange membrane fuel cell for automotive applica- tion[J]. Applied Energy, 2021, 281: 115937.

[29] 马飞越, 李澳, 吴诚威, 等. 基于LSTM-MIV神经网络的SF6断路器触头电寿命预测[J]. 高压电器, 2024, 60(2): 69-77.

Ma Feiyue, Li Ao, Wu Chengwei, et al. Electrical life prediction for contact of SF6 circuit breaker based on LSTM-MIV neural network[J]. High Voltage Apparatus, 2024, 60(2): 69-77.

Prediction of Degradation Behavior in Proton Exchange Membrane Fuel Cells Based on Bi-Long Short-Term Memory and Attention Mechanism

（1. School of Electrical and Information Engineering Zhengzhou University Zhengzhou 450000 China 2. School of Electrical Engineering and Automation Anhui University Hefei 230601 China）

Abstract The lifetime and performance degradation of proton exchange membrane fuel cells (PEMFCs) are critical factors limiting their widespread application. At the same time, this issue represents one of the core research topics in the field of fuel cell technology. Accurately predicting the voltage degradation behavior of fuel cells not only aids in a deeper understanding of their degradation mechanisms but also facilitates the prediction and analysis of their operational states, thereby significantly enhancing system reliability and performance stability. An analysis of PEMFC aging data reveals that the aging process exhibits high nonlinearity and time dependency, making it challenging to comprehensively characterize the degradation process using traditional modeling methods. To address the difficulty of predicting PEMFC voltage degradation, this paper proposes a prediction model for fuel cell degradation behavior that integrates a bidirectional long short-term memory network (Bi-LSTM) with the attention mechanism.

The proposed model first selects features that reflect the degradation behavior of fuel cells as inputs. It utilizes the Bi-LSTM to extract long-term dependencies from the data and predict temporal sequence information, fully capturing the dynamic characteristics of the degradation behavior. Subsequently, the attention mechanism enhances the weight allocation of key features, ultimately yielding PEMFC degradation prediction results. During model training, to improve training efficiency, optimize prediction performance, and effectively avoid overfitting and convergence issues caused by improper learning rate settings, the paper employs techniques such as early stopping, optimal model checkpointing, and adaptive learning rate adjustment. This study uses the PEMFC aging dataset from Tongji University, with the first 60% of the data serving as the training set and the remaining 40% as the test set, to conduct model training and testing. Systematic comparative analyses with other classical neural network models (e.g., convolutional neural networks) are also performed.

Experimental results demonstrate that the proposed Bi-LSTM-Attention (Bi-LSTM-At) model exhibits outstanding prediction performance, achieving a root mean square error (RMSE) of only 0.006 1 V. The prediction accuracy improves by 23% compared to traditional neural network models, enabling precise prediction of PEMFC degradation behavior. Through multi-step prediction experiments, the proposed model has been verified to capture the overall voltage degradation trend even over extended periods, demonstrating strong long-term predictive capability. This indicates that the model achieves excellent forecasting performance and accuracy in long-term predictions. Moreover, the proposed model can accurately predict degradation behavior in both the early and late stages of operation, reflecting robust performance. This robust predictive ability provides effective technical support for fuel cell health monitoring and remaining useful life assessment. Based on the experimental results and comparisons with existing traditional algorithms, the following conclusions are drawn: (1) The proposed method converges rapidly and exhibits excellent fitting performance. (2) Compared with conventional Transformer and LSTM models, this method shows significant advantages in terms of prediction accuracy and overall model performance. (3) The introduction of the attention mechanism significantly enhances the prediction performance and accuracy of most models; compared to the Bi-LSTM model, incorporating the attention mechanism substantially reduces training time. (4) The method features a simple structure and is easy to implement, with strong real-time performance and stability, thereby achieving superior prediction accuracy for time-dependent data.

Keywords：Proton exchange membrane fuel cell, degradation behavior prediction, bidirectional long short-term memory, attention mechanism, time-series analysis

国家自然科学基金青年基金项目（62303424, 62503001）和河南省科技攻关项目（242102241050）资助。

杨朵女，1994年生，副教授，硕士生导师，研究方向为新能源汽车与储能系统建模、控制与能量管理。

E-mail: yangduo@zzu.edu.cn

李民策男，1997年生，讲师，研究方向为燃料电池混合动力系统能量管理。