适用于大规模光伏电站的电磁暂态细粒度并行仿真方法

（1. 新能源电力系统全国重点实验室（华北电力大学）北京 102206 2. 输变电装备技术全国重点实验室（重庆大学）重庆 400044）

摘要大规模光伏电站的电磁暂态精细化仿真是观测其详细内部特性的重要手段，支撑内部故障溯源、场站与系统间振荡等研究。现有对光伏电站的仿真未深入考虑建模方式、并行仿真方法与硬件间的交互关系，难以兼顾规模、精度和效率，为此该文提出一种深度融合等值建模和图形处理单元（GPU）技术的电磁暂态细粒度并行仿真方法。首先，根据GPU软硬件的架构特点，设计模块化光伏系统并行计算程序基本逻辑。其次，考虑换流器闭锁模式，利用开关函数模型实现光伏单元交、直流侧解耦划分，基于割集矩阵实现交流侧端口等效，将光伏单元整合为集群等效模型参与系统解算。最后，利用GPU单指令多数据特点，在各光伏单元独立解算任务的粗粒度并行基础上，叠加元件内部更新过程的细粒度并行，将海量模块化光伏单元同阶矩阵进行高效批处理，进而实现大规模光伏电站的元件级细粒度并行仿真。对比GPU仿真平台与PSCAD/EMTDC的仿真结果，验证了所提并行方法的仿真精度和加速比。

关键词：大规模光伏电站等值建模细粒度并行仿真图形处理单元（GPU）

0 引言

大规模光伏电站在构建新型电力系统中占据重要地位[1]，截至2024年底，我国光伏装机规模已达8.4亿kW，高居世界首位[2]。随着光伏等新能源的大规模并网，电力系统呈现高比例新能源和高比例电力电子设备的“双高”特性。

电磁暂态仿真能够表征新型电力系统的多时间尺度宽频特性，刻画了电力电子设备的动态响应过程，是掌握系统运行规律的关键手段[3-5]，为场站内部异常工况[6-7]、场站与系统间振荡[8]等问题的研究提供分析工具。

然而，光伏电站的发电单元具有节点数目众多、开关状态复杂等特点，随着场站中光伏单元数目的大幅增加，电磁暂态仿真中高阶时变网络的求解势必面临“维数灾”问题[9]。现有仿真手段难以兼顾规模、精度和效率，因此亟须研究面向大规模光伏电站的电磁暂态建模和高效仿真方法。

现有研究多从等值建模和并行仿真两方面出发，在确保模型准确性的前提下，提高光伏电站的仿真规模。等值建模主要包括元件解耦、平均值建模、倍增等值以及戴维南/诺顿等效建模等方法。元件解耦通过端口电气信息交互实现网络解耦，会产生单步长的延时误差[10-12]。平均值建模无法对大规模光伏电站的宽频特性进行全貌化仿真[13]。大规模新能源场站仿真中的主流等值方法为“以少代多”的倍增等值[14]。通过外特性[15]、机组参数[16]、环境变量[17]、控制策略[18]等分群指标对机组进行划分后再分别进行等值聚合，聚合方法主要包括容量加权法[19]和参数辨识法[20]等。但单一因素聚合通常仅能反映固定场景下的场站特性，聚合后各独立发电单元的内部信息无法再被获取，难以全面反映场站特性。戴维南/诺顿等效建模方法通过节点消去实现矩阵规模的大幅降低，再通过反演求解实现内部特性的溯源，已在模块化电力电子设备[21-22]和大规模光伏电站[23-24]中得到深入研究，其为一种更为灵活且不会引入额外误差的等值建模方法。等值建模的本质是对系统高阶节点导纳矩阵进行降阶，以此从模型层面实现仿真效率的提升。

并行仿真包括仿真算法设计和软硬件协同设计两个层次。算法方面根据需求选取传输线解耦[25-26]、节点分裂法[27]等分网算法，通常可满足多类型场景的分网并行需求。软硬件协同设计方面，图形处理单元（Graphics Processing Unit, GPU）是专业工作站以及个人计算机中常见的计算资源，通过设计与之配合的建模与仿真算法，能够有力支撑大规模光伏电站的并行仿真计算[28]。

现有GPU仿真研究大多针对电力系统中海量基础元件模型进行多线程并行求解[29-32]，或在网络解算中将其视作高效的线性代数计算工具[33]。文献[34]基于延迟插入法（Latency Insertion Method, LIM）对大规模电力系统进行细粒度并行化仿真以解决大量耦合器件带来的计算负担，但LIM对电路拓扑结构有严格限制。

针对大规模新能源场站，文献[35]在文献[34]的基础上，对快速和常规动态系统进行细粒度建模，实现各子系统的全局细粒度求解，但由于整体仿真流程基于蛙跳法求解，系统中的所有元件模型均需重新建模。CloudPSS电磁暂态仿真云平台提出了面向异构众核处理器的电磁暂态细粒度并行算法，该平台已实现海量基础元件的建立，具有较强的通用性，但其需要借助云端的异构计算芯片，对光伏电站仿真仍基于平均值建模和倍乘等值的思路[36]。文献[37-38]对模块化多电平换流器中开关组的非线性过程进行研究，通过人为引入时延来达到GPU对任务独立性的要求，在换流器子模块间进行网络解算的并行实现。文献[39]主要关注光伏阵列中所有光伏组串的非线性暂态过程，海量光伏单元与多端直流电网间通过单步长延时实现解耦，其会带来延时误差，难以保证仿真稳定性。总体而言，GPU具备强大的并行计算能力，但应用于大规模光伏电站时，尚未深入考虑等值建模、并行仿真与GPU计算资源间的协同配合方法。

为此，本文提出一种硬件与算法协同交互的细粒度GPU并行仿真方法，通过换流器解耦、交流侧端口等效等手段对光伏单元进行建模，同时深入融合所提出等值建模方法和GPU并行仿真技术，实现大规模光伏电站的精细化加速仿真。

1 GPU硬件架构与CUDA并行程序设计

本节首先介绍CPU软硬件架构，说明GPU在大规模并行计算问题中的优势，同时阐明统一计算设备架构（Compute Unified Device Architecture, CUDA）与GPU硬件间的映射关系，最终依据CUDA的抽象结构给出大规模光伏电站并行程序的设计要点。

1.1 GPU软硬件架构

大规模科学与工程计算任务通常可分解为多个子任务，利用海量计算资源实现并行计算，以显著提高计算效率。并行程序被执行时，首先由主机端CPU进行初始化，同时对设备端GPU数据进行调用管理，然后通过主机端与设备端之间的数据传输将数据并行的程序段发送并加载在设备端。

在软件方面，NVIDIA公司开发了能使GPU解决复杂计算问题的CUDA，并通过集成C或C++语言实现并行程序的开发。在硬件方面，GPU硬件架构以流式多处理器（Streaming Multiprocessor, SM）为可扩展单元，通过对其复制形成构建块的形式来实现GPU的硬件并行。

CUDA以线程束为单位对线程进行管理，每个线程束含有32个线程，并对应一个线程束调度器。并行程序的核函数根据SM资源的可用性进行动态调度，被分配在可用的SM上并行执行。

1.2 CUDA并行程序设计

CUDA是一种用于实现并行程序的编程工具，其无需使用GPU专用的汇编语言。在使用CUDA进行并行程序设计时，需要从CUDA的线程层级与内存层级进行考虑，图1为CUDA的抽象结构。

在CUDA线程层级中，网格、块和线程分别对应硬件架构中的GPU、SM和核心。一组线程构成一个线程块，一组线程块构成线程网格。网格内的所有线程在多数据输入的同时执行相同的指令，要求核函数中实现完全的数据独立和统一的处理流程，这与GPU的单指令多数据（Single Instruction Multiple Data, SIMD）架构相适配，本文对大规模光伏电站的仿真方法设计将遵循这一概念。

在CUDA内存层次中，每个线程拥有自己的寄存器和本地内存。设备端内存无法直接访问主机内存，因此所有需要GPU处理的数据必须首先复制到设备的全局内存中。全局内存的访问效率较低，而共享内存能被线程块中的所有线程访问，且访问速度远快于全局内存，所以合理地使用有限的共享内存可以显著优化程序性能。

大规模光伏电站的模块化特性显著，单元内部的电路解算相对独立，利用GPU实现并行仿真能够大幅提升其在不同工况下的仿真速度。依据CUDA线程与内存层次的特点，本文对细粒度并行仿真方法的程序设计主要体现在以下两个方面：

（1）遵循并利用GPU的SIMD架构特点，在各单元独立解算任务的粗粒度并行基础上，叠加单元内部更新过程的细粒度并行，将网络解算过程抽象为矩阵求解，实现海量同阶矩阵的高效并行计算。

（2）全面考虑大规模光伏电站中海量元件的统一多线程并行更新模式，优化共享内存资源配置，提高计算和内存访问的并行度，利用CUDA流和批处理操作提升矩阵计算吞吐量，从而实现仿真效率和规模的提高。

2 适用于并行仿真的大规模光伏电站等值建模方法

本节首先介绍光伏电站拓扑及光伏单元内部的电路结构，通过换流器解耦、交流侧端口等效及光伏单元间整合等方式对光伏电站模型进行合理简化，以实现适用于并行仿真的大规模光伏电站精细化等值建模。

2.1 光伏电站拓扑

大规模光伏电站是由大量结构相同的发电单元经短传输线汇集的新能源发电系统。光伏电站具有典型的模块化特征，相较于模块化多电平换流器（Modular Multilevel Converter, MMC）、电力电子变压器（Power Electronic Transformer, PET）等典型模块化电力电子设备，光伏电站的单元数庞大且单元内部级联的设备众多。工程中大规模光伏电站主要由链式、环式以及辐射式三种拓扑组合而成，其拓扑结构如图2所示。

光伏发电单元是光伏电站的最小拓扑模块，其由光伏阵列、直流Boost电路、换流器、LC型滤波器以及单元变压器等多个关键设备级联组成。

对应光伏发电单元的一次拓扑结构，二次控制系统主要包括逆变器稳态运行控制、故障穿越运行控制、直流升压电路最大功率点跟踪（Maximum Power Point Tracking, MPPT）控制、Chopper支路保护控制等。同时为考虑光伏场站的并网过程，需设计场站级的启动及协调控制。上述控制方法对光伏电站的正确运行来说尤为重要，同时会引入多个开关器件。随着场站规模的扩大，海量高阶时变矩阵的计算求解将显著增加计算资源的消耗。

2.2 考虑闭锁模式的2L-VSC开关函数解耦模型

换流器连接交直流侧网络，实现DC-AC间的转换。大量开关支路位于直流侧，导致网络矩阵随开关状态的改变而改变，无法通过矩阵预存等方式对高阶矩阵计算进行预处理。通过对换流器进行解耦建模，可实现交直流网络的合理划分。

两电平电压源换流器（2-Level Voltage Source Converter, 2L-VSC）的电路结构如图3所示，三相共包含6个IGBT/二极管反并联开关组Sk（k=1, 2,…, 6），Lm为滤波电感。

通常每相上、下桥臂只有一个开关组导通，因此每相上下桥臂开关组之间满足

式中，开关函数sip、sin分别为每个桥臂所对应的IGBT/二极管开关组导通状态；下标i代表相序，A、B、C相序分别对应a、b、c， width=48,height=15

；下标p和n分别表示i相所对应的上桥臂和下桥臂。开关导通时，s=1，关断时，s=0。

由此可得交流侧电气量与直流侧电气量间关系式[23]为

式中，DT为仿真步长；vab、vbc、vca为线电压；ia、ib、ic为相电流；idc为直流电流；vdc为直流电压。式（2）、式（3）左右两侧均为同一个时刻的电气量，由于直流侧电容的容值与交流侧电感的感值较大，可以引入单步长延时，进行ii(t)≈ii(t-DT)，vdc(t)≈vdc(t-DT)近似，最终实现交直流侧解耦，其等效电路如图4所示。

上述开关函数解耦模型仅适用于换流器正常工作模式，但在某些情况下，如换流器闭锁模式，换流器端口间没有电流通路，换流器内部呈现高阻状态，端口间没有明确的电压电流关系。本节基于支路断路状态模拟，对开关函数解耦模型进行修正，使其适用于闭锁模式下的换流器仿真，修正思路如图5所示。

换流器的闭锁模式本质上是内部断路、端口悬空的一种状态。在图5所示的等效电路中，可通过设置电流源与电压源的值，模拟支路的状态，由此实现换流器闭锁模式的模拟。

对于左侧的等效电流源端口，在闭锁模式下将等效电流源的电流值置零（idc=0），可模拟左侧端口的开路状态。对于右侧的等效电压源端口，以右侧最上面的支路为例，介绍端口闭锁状态的实现。该支路左侧的电压Un1是由电压源决定的，右侧电压Un2由右侧网络决定。设置电压源的电压值跟随右侧网络电压（Un1=Un2），同时将电感经梯形积分、离散化后伴随电路的诺顿等效电流源的电流值置零（Ihis=0），模拟该支路的断路状态。

2.3 光伏单元精细化等效建模

光伏阵列由大量光伏电池串并联而成，光伏阵列模型采用计算更为详细的单二极管五参数模型[40]，可将其视作受控电流源。换流器开关函数解耦模型可交互交直流侧的信息，实现交直流侧网络的独立求解。图6为两极式光伏发电单元交直流侧解耦的电路结构。

值得注意的是，为考虑单元及场站级的控制，需对光伏阵列出口开关、光伏单元并网开关、Chopper支路开关等进行精细化建模，其在图6中进行了相应的简化。利用二值电阻模型等效开关器件，并对电感、电容、变压器等元器件进行离散化，得到网络解算中的离散化电路。

交流侧网络主要包括LC型滤波器及变压器等元件，节点数与支路数较多，除了使用节点电压方程简化矩阵以外，还可以使用割集矩阵方程获取简化电路。由于树支的选取是多样的，可以选择关键支路作为树支，从而快速获取电路中的重要电气参数，如电容的电压、电流及变压器的绕组电压、电流等。

为了描述电路的所有基本割集，以基本割集为行、支路为列，列写KCL和KVL方程可得

式中，Q为电路的总割集矩阵；Ub、Ib分别为支路电压、电流向量；Ut为树枝电压向量。

考虑到离散化电路中存在的电导和支路电流源，可由式（5）列写Ib。

式中，Yb为支路导纳矩阵；Ub为支路电压向量；Js为支路注入电流源；Jec为外部注入电流。

再将式（5）代入式（4）得到割集电压方程为

式中，Yt为割集导纳矩阵；Jt为割集电流源列向量。

交流侧端口等效过程中，若干条树支只由外部节点构成，用UtEX表示，其他树支只能以内部节点构成，用UtIN表示。按式（6）列写割集电压方程，并重写其为分块矩阵形式后展开可得

根据式（7）用外节点树枝电压UtEX表示内节点树枝电压UtIN为

再将式（8）代回式（7）并整理得到

对于辐射式场站拓扑结构，各光伏单元并联为光伏集群，可通过式（10）获得集群端口等效模型，集群与单元的端口等效模型具有相同的结构。

上述等值建模方法本质上通过解耦、端口等效和单元间整体合并等方式，对系统超高阶网络矩阵进行多次分块，同时场站中各光伏单元可独立进行解算，满足并行计算对任务独立性的要求，因此所提出的建模方法与GPU硬件间具有良好的适配性。

3 大规模光伏电站并行仿真实现

本节首先说明光伏电站所包含元件模型的多线程并行更新方法；其次介绍了矩阵计算批处理过程，以处理海量高阶矩阵求解带来的计算负荷；最后展示了大规模光伏电站的整体并行实现流程。

3.1 元件模型的多线程并行更新

光伏发电单元中包含多个线性无源元件（Linear Passive Element, LPE），如电阻、电感、电容等。电容和电感通常使用梯形积分法构建相应的离散化伴随等效电路，其一般形式为等值电导并联历史电流源，LPE上流过的电流均表示为

式中，Geq为等值电导；Ih(t-Dt)为历史电流源，对于不同的LPE，Geq的计算和Ih(t-Dt)的更新方式不尽相同，可见

式中，

、

分别为电容和电感的等值电导； width=44,height=17

、

分别为电容和电感的历史电流源，其更新均与上一时步元件两端的电压、电流有关。图8为所设计的LPE多线程并行实现流程。

同时，一个光伏发电单元中含有多个开关组，可以使用二值电阻进行等效。值得注意的是，GPU中没有复杂的分支预测机制，所以在开关元件模型的多线程并行实现时，需考虑同一线程束中会发生的线程束分化问题。开关元件模型的等值电导可由式（14）计算，在程序中不以if语句判断的形式实现。

式中，s为开关元件的导通/关断信号；Gon、Goff分别为导通、关断条件下开关元件的等值电导。断路器也可通过类似的计算实现模型的建立。

3.2 矩阵计算批处理

对于如式（8）与式（9）所示的交流侧端口等效与反解更新过程，以及直流侧网络节点电压方程求解，由于各光伏单元的内部结构相似，各过程分别为阶数相同的海量矩阵计算。

在高性能矩阵计算中，尤其是在使用GPU进行并行计算时，直接采用每个线程计算结果矩阵中一个元素的传统方法往往无法充分利用GPU的计算资源，特别是线程块中的共享内存。图9为矩阵乘法批处理的相关过程，采用矩阵分块技术并结合共享内存优化能有效提升矩阵乘法的计算性能。

矩阵计算批处理与大规模光伏电站的强模块化特征不谋而合。利用CUDA流可实现多个独立计算任务的重叠执行，矩阵计算批处理可并行处理多个同阶矩阵，显著提高海量光伏单元的解算效率。

3.3 大规模光伏电站的整体并行实现

大规模光伏电站的整体并行实现如图10所示。整体解算过程遵循经典电磁暂态分析程序的仿真流程，仿真实现依赖于各仿真步长间频繁的迭代求解。为避免CPU与GPU之间的固有通信延时拖慢整体仿真进程，CPU首先执行初始化和配置等工作，并将仿真的相关数据传递给GPU，GPU完成整个仿真过程，最后将结果返回至CPU并输出相应波形。

在每个仿真步长开始时，上一仿真步长中系统整体网络解算（核函数7）求解得出的相关电气量参与控制系统求解（核函数1），控制系统求解主要有以MPPT控制算法为主的DC-DC变流环节和以电压电流双环控制为主的并网逆变器控制环节两个部分，同时包含场站级的启动及协调控制等内容。

由于光伏单元交流侧的端口等值过程，内部电气信息反解（核函数2）成为基本元件更新过程（核函数3）的先决条件。当光伏单元中所有基本元件更新完成后，可获得各支路的等值电导和历史电流源，用于后续的网络求解。

对于海量光伏单元的直流侧网络，直流侧网络解算（核函数4）通过式（15）的求解。

式中，YDC、Yg-DC分别为直流侧网络的节点导纳矩阵和支路导纳矩阵；JDC、Jbranch-DC分别为直流侧网络的节点电流向量和支路电流向量；VDC为直流侧网络节点电压向量。

对于海量光伏单元的交流侧网络，集群等效电路通过光伏单元端口等值（核函数5）和光伏集群等值（核函数6）获取，参与最终的系统整体网络解算（核函数7）。

控制系统求解（核函数1）在单元间实现并行，基于控制系统的链式求解过程，各单元的控制解算被分配到对应的线程中进行计算。基本元件更新（核函数3）通过3.1节所述的元件模型多线程并行实现，单元中设备的更新过程可在单元间实现并行，而场站中海量基本元件更新过程可以使用统一的核函数进行处理。内部电气信息反解（核函数2）、直流侧网络解算（核函数4）、光伏单元端口等值（核函数5）可抽象为海量同阶矩阵计算过程，使用CUDA基本线性代数子程序库cuBLAS中提供的cublasDgemmBatched、cublasDmatinvBatched等批处理函数进行计算。交直流侧解耦后，交、直流侧网络解算满足任务独立性要求，可以使用CUDA Stream实现任务间的并行流处理。上述整体并行过程通过CUDA C编程实现，并行程序的核函数被分配在可用的SM上并行执行，为模块化新能源场站的GPU并行实现提供一定的参考。

4 仿真验证

为验证所提等效模型能否准确仿真不同实际工况以及所提基于GPU的并行仿真方法的有效性，本文基于PSCAD/EMTDC平台搭建辐射式大规模光伏电站测试系统，如图11所示。

场站测试系统由n个光伏集群组成，每个光伏集群中包含m个光伏单元，各集群中的光伏单元汇集后经短传输线送出功率，再经35 kV/220 kV高压汇流变压器汇入220 kV交流电网，整体仿真步长设置为2.5 ms。光伏单元参数见附表1，光伏电站系统参数见附表2。

4.1 单元精度测试

为验证所提等效模型的准确性，同时避免黑盒控制对模型的影响，首先测试单个光伏单元的模型精度。本文选取在PSCAD/EMTDC平台中利用分立元件搭建的详细模型（Detail Model, DM）和所提出的等效模型（Equivalent Model, EM）进行测试对比。

测试系统中光伏单元采用跟网型控制，逆变器于0.08 s解锁，直流电压继续上升至设定值，后续继续解锁Boost升压电路，同时闭合光伏阵列的出口开关使其接入网络，MPPT开始工作，最后进入稳定运行状态。单元出口处于5 s发生三相短路故障，持续时间为0.1 s。

图12为光伏单元换流器出口处有功功率Punit和无功功率Qunit的波形对比，DM与EM波形在各工况下吻合程度良好。EM可以准确地反映逆变器闭锁与解锁、光伏阵列投入、故障期间的功率变化。光伏阵列投入与三相短路故障期间，有功功率的峰值误差分别为0.09%和0.26%。

同时为说明本文所提出模型能够保留单元内部特性，对比使用DM和EM仿真得到的单元直流母线电压vdc，如图13所示。从波形对比可以看出，EM可以准确仿真不同工况下单元内直流母线电压。换流器解锁过程中直流母线电压的峰值误差为0.10%，光伏阵列投入过程中的最大相对误差为0.49%，故障期间的最大相对误差为1.81%。

根据波形对比结果可知，EM不仅可以准确仿真光伏单元的外部特性，同时不会损失内部电气信息的仿真精度。

4.2 场站精度测试

本文通过对比PSCAD/EMTDC平台（简称PSCAD）和所提出基于GPU的并行仿真平台（简称GPU）的场站仿真结果，验证所提仿真方法的准确性。场站精度测试主要包括环境变化测试和暂态故障测试。

4.2.1 环境变化测试

环境变化测试时，测试系统内的发电集群数n=4，每个集群中的光伏单元数m=4。各集群的初始环境温度为25℃，初始辐照度为1 000 W/m2。环境变化主要指温度、辐照度变化，当光伏场站并网后达到稳态时，设置环境变化发生于6 s，各集群中环境变化情况见附表3。

图14为不同环境变化情况下各集群中光伏阵列输出功率的波形对比，GPU与PSCAD波形在不同环境变化情况下吻合程度良好。光伏阵列输出功率的最大相对误差为1.00%、0.74%、1.80%和1.65%。

根据波形对比结果可知，所提基于GPU的并行仿真方法可以准确反映温度、辐照度变化下不同集群中的单元内部电气信息。在单元间存在差异时，所提仿真方法仍然具有较高的仿真精度。

4.2.2 暂态故障测试

暂态故障测试时，搭建百MW级光伏场站进行仿真，测试系统内的发电集群数n=4，每个集群中的光伏单元数m=25。系统侧于5 s发生A相短路故障，持续时间为0.1 s。

图15为光伏投入后至故障解除期间场站输出功率的波形对比，从波形可以看出，GPU与PSCAD波形在各工况下吻合度良好。光伏阵列投入与A相短路故障期间，有功功率的峰值误差分别为0.21%和0.30%。

根据波形对比结果可知，所提基于GPU的并行仿真方法可以准确反映大规模光伏场站的系统特性与暂态响应，在暂态故障工况下实现精确仿真。同时，所提出并行仿真平台中包含光伏场站模型解算、控制解算以及系统整体解算，均具有较高的准确性。

4.3 仿真效率验证

仿真效率对比的测试系统依据图11所示的典型大规模光伏电站，系统内发电集群数n设置为4，通过改变每个集群中的光伏单元数m测试所提仿真方法的效率，仿真时间设定为1 s。

PSCAD/EMTDC平台测试所用的CPU型号为12th Gen Intel(R) Core (TM) i7-12700H 2.30 GHz，所提出并行仿真方法布置于个人计算机的GPU上，所用GPU型号为NVIDIA GeForce RTX 4060 Laptop GPU。PSCAD平台耗时通过其自带的Runtime Messages得出，GPU程序通过CUDA提供的Event进行计时。表1为PSCAD平台与GPU平台在不同集群内光伏单元数下的仿真耗时与加速比。

根据表1可知，当每个集群中光伏单元数量m= 8时，加速比为2.6，当m=32时，加速比达到144.1。随着集群中光伏单元数的增加，GPU平台的仿真耗时呈低比例增长的趋势，而PSCAD平台的仿真耗时急剧增加。随着光伏电站系统规模的不断扩大，所提细粒度GPU并行仿真方法能更为显著地提升仿真效率。值得注意的是，随着系统规模的增大，PSCAD平台难以对超高阶网络进行解算，当每个集群中光伏单元数为64时，PSCAD平台的仿真耗时通过拟合得出。

当每个集群中的光伏单元数较少时，GPU平台的仿真效率相对PSCAD平台的加速效果不明显，甚至可能效率更低。其主要原因在于，在矩阵规模较小的情况下，GPU的并行处理能力可能无法得到充分利用，同时由于启动、数据传输、调度与并行化开销等固有耗时，导致其性能不如CPU。控制解算与系统整体网络解算是串行过程，会削弱本文所提出的光伏场站细粒度并行方法带来的加速效果。

由于无法通过PSCAD的整体仿真耗时对各部分解算任务的仿真用时进行量化分析，为进一步验证本文提出的仿真方法在计算效率上的优势，基于所提出等值建模方法实现的光伏电站仿真程序被部署在上述型号的CPU中，以此分析基于GPU的细粒度并行仿真方法带来的额外效率提升。图16为本文主要关注的一次部分海量光伏单元网络解算过程的单步仿真时间对比。

由图16可知，基于CPU进行大量光伏单元电磁暂态仿真的单步计算时间基本呈线性增长趋势，所提出基于GPU的细粒度并行仿真方法的计算时间明显小于基于CPU的算法计算时间，且呈低比例增长趋势。随着测试系统规模的增大，GPU并行计算的优势得以展现，使得GPU版本相较于CPU版本更加高效。同时，本文使用个人计算机的GPU资源进行加速比测试，所提细粒度并行仿真方法可应用于GPU并行计算专用处理器（如NVIDIA Tesla V100 GPU）中，实现更为可观的加速效果。

5 结论

本文对大规模光伏电站的电磁暂态高效仿真方法进行研究，深度融合精细化等值建模方法与GPU硬件资源，提出一种基于GPU的电磁暂态细粒度并行仿真方法。主要结论如下：

1）基于支路断路状态模拟，使得换流器开关函数模型适用于闭锁模式仿真，通过换流器解耦、交流侧端口等效及光伏单元间整合等方式对光伏电站模型进行合理简化，所提出等效模型具有良好的仿真精度和内部信息溯源能力，在光伏单元与场站精度测试中，与PSCAD/EMTDC仿真结果间的相对误差均在3%以内。

2）利用GPU的SIMD架构特点，在各光伏单元独立解算任务的粗粒度并行基础上，叠加单元内部统一多线程更新的细粒度并行，利用CUDA流和批处理操作提升矩阵计算吞吐量，实现单元间海量同阶矩阵的高效并行计算，显著提升了大规模光伏电站的仿真效率。

[1] 丁明, 王伟胜, 王秀丽, 等. 大规模光伏发电对电力系统影响综述[J]. 中国电机工程学报, 2014, 34(1): 1-14.

Ding Ming, Wang Weisheng, Wang Xiuli, et al. A review on the effect of large-scale PV generation on power systems[J]. Proceedings of the CSEE, 2014, 34(1): 1-14.

[2] 国家能源局. 我国风光发电利用率保持95%以上[EB/OL]. (2024-12-20). https://www.nea.gov.cn/ 20241220/b3b2e87dc3a945b684e364ca6e420866/c. html.

[3] 虞竹珺, 赵争鸣, 施博辰, 等. 基于刚性检测的电力电子系统自适应仿真算法[J]. 电工技术学报, 2023, 38(12): 3208-3220, 3247.

Yu Zhujun, Zhao Zhengming, Shi Bochen, et al. An adaptive simulation method for power electronics systems based on stiffness detection[J]. Transactions of China Electrotechnical Society, 2023, 38(12): 3208-3220, 3247.

[4] 周斌, 汪光森, 李卫超, 等. 基于FPGA的电力电子系统电磁暂态实时仿真通用解算器[J]. 电工技术学报, 2023, 38(14): 3862-3874.

Zhou Bin, Wang Guangsen, Li Weichao, et al. An FPGA-based general solver for electromagnetic transient real-time simulation of power electronic systems[J]. Transactions of China Electrotechnical Society, 2023, 38(14): 3862-3874.

[5] 王守相, 张春雨, 赵倩宇. 基于FPGA的新能源低压直流配电系统暂态实时仿真研究[J]. 电工技术学报, 2024, 39(17): 5365-5378, 5393.

Wang Shouxiang, Zhang Chunyu, Zhao Qianyu. Research on transient real-time simulation of new energy low-voltage DC distribution system based on field programmable gate array[J]. Transactions of China Electrotechnical Society, 2024, 39(17): 5365- 5378, 5393.

[6] 王小宇, 刘波, 孙凯, 等. 光伏阵列故障诊断技术综述[J]. 电工技术学报, 2024, 39(20): 6526-6543.

Wang Xiaoyu, Liu Bo, Sun Kai, et al. A review of photovoltaic array fault diagnosis technology[J]. Transactions of China Electrotechnical Society, 2024, 39(20): 6526-6543.

[7] 马铭遥, 王泽澳, 马文婷, 等. 基于时空特征的光伏电站草木阴影遮挡故障诊断[J]. 电工技术学报, 2025, 40(3): 832-841.

Ma Mingyao, Wang Zeao, Ma Wenting, et al. Vegetation shading fault diagnosis in photovoltaic power stations based on temporal-spatial characteri- stics[J]. Transactions of China Electrotechnical Society, 2025, 40(3): 832-841.

[8] 高本锋, 邓鹏程, 梁纪峰, 等. 光伏电站与弱交流电网间次同步交互作用路径及阻尼特性分析[J]. 电工技术学报, 2023, 38(24): 6679-6694.

Gao Benfeng, Deng Pengcheng, Liang Jifeng, et al. Analysis of path and damping characteristics of subsynchronous interaction between photovoltaic plant and weak AC grid[J]. Transactions of China Electrotechnical Society, 2023, 38(24): 6679-6694.

[9] Mahseredjian J, Dinavahi V, Martinez J A. Simulation tools for electromagnetic transients in power systems: overview and challenges[J]. IEEE Transactions on Power Delivery, 2009, 24(3): 1657-1669.

[10] 易姝娴, 袁立强, 李凯, 等. 面向区域电能路由器的高效仿真建模方法[J]. 清华大学学报(自然科学版), 2019, 59(10): 796-806.

Yi Shuxian, Yuan Liqiang, Li Kai, et al. High- efficiency modeling method for regional energy routers[J]. Journal of Tsinghua University (Science and Technology), 2019, 59(10): 796-806.

[11] Yu Siqi, Zhang Shuqing, Han Yingduo, et al. A pulse- source-pair-based AC/DC interactive simulation approach for multiple-VSC grids[J]. IEEE Transactions on Power Delivery, 2021, 36(2): 508-521.

[12] 高晨祥, 丁江萍, 许建中, 等. 输入串联输出并联型双有源桥变换器等效建模方法[J]. 中国电机工程学报, 2020, 40(15): 4955-4965.

Gao Chenxiang, Ding Jiangping, Xu Jianzhong, et al. Equivalent modeling method of input series output parallel type dual active bridge converter[J]. Pro- ceedings of the CSEE, 2020, 40(15): 4955-4965.

[13] 张元觉. 基于平均化建模的光伏发电系统低电压穿越控制仿真研究[D]. 长沙: 湖南大学, 2018.

Zhang Yuanjue. Simulation study on low voltage ride-through control of photovoltaic power generation system based on averaging modeling[D]. Changsha: Hunan University, 2018.

[14] Chao Pupu, Li Weixing, Liang Xiaodong, et al. A comprehensive review on dynamic equivalent modeling of large photovoltaic power plants[J]. Solar Energy, 2020, 210: 87-100.

[15] Chao Pupu, Li Weixing, Peng Simin, et al. Fault ride-through behaviors correction-based single-unit equivalent method for large photovoltaic power plants[J]. IEEE Transactions on Sustainable Energy, 2021, 12(1): 715-726.

[16] Ding Yawen, Gao Fei, Jiang Yingwei, et al. Clustering of photovoltaic power stations based on the improved AP clustering algorithm[C]//IECON 2023-49th Annual Conference of the IEEE Industrial Electronics Society, Singapore, Singapore, 2023: 1-6.

[17] 潘学萍, 张源, 鞠平, 等. 太阳能光伏电站等效建模[J]. 电网技术, 2015, 39(5): 1173-1178.

Pan Xueping, Zhang Yuan, Ju Ping, et al. Equivalent modeling for photovoltaic power station[J]. Power System Technology, 2015, 39(5): 1173-1178.

[18] 潘学萍, 王卫康, 黄桦, 等. 考虑机网动态交互作用的光伏场群等值建模[J]. 电力自动化设备, 2023, 43(3): 80-85, 109.

Pan Xueping, Wang Weikang, Huang Hua, et al. Equivalent modeling of PV station groups considering dynamic interaction between PV and power grid[J]. Electric Power Automation Equipment, 2023, 43(3): 80-85, 109.

[19] Remon D, Cantarellas A M, Rodriguez P. Equivalent model of large-scale synchronous photovoltaic power plants[J]. IEEE Transactions on Industry Applications, 2016, 52(6): 5029-5040.

[20] 屈星, 李欣然, 盛义发, 等. 面向广义负荷的光伏发电系统等效建模研究[J]. 电网技术, 2020, 44(6): 2143-2150.

Qu Xing, Li Xinran, Sheng Yifa, et al. Research on equivalent modeling of PV generation system for generalized load[J]. Power System Technology, 2020, 44(6): 2143-2150.

[21] Gnanarathna U N, Gole A M, Jayasinghe R P. Efficient modeling of modular multilevel HVDC converters (MMC) on electromagnetic transient simulation programs[J]. IEEE Transactions on Power Delivery, 2011, 26(1): 316-324.

[22] 高晨祥, 林丹颖, 韩林洁, 等. 双有源桥型电力电子变压器电磁暂态实时低耗等效模型[J]. 电力系统自动化, 2024, 48(8): 195-206.

Gao Chenxiang, Lin Danying, Han Linjie, et al. Electromagnetic transient real-time low-consumption equivalent model of dual active bridge based power electronic transformer[J]. Automation of Electric Power Systems, 2024, 48(8): 195-206.

[23] 郭临洪, 夏仕伟, 李昇蔚, 等. 面向大规模光伏电站实时仿真的单元级精细化建模方法[J]. 中国电机工程学报, 2024, 44(8): 2978-2990.

Guo Linhong, Xia Shiwei, Li Shengwei, et al. Refined real-time simulation modeling at the unit level for large-scale PV power stations[J]. Proceedings of the CSEE, 2024, 44(8): 2978-2990.

[24] Xia Shiwei, Xu Jianzhong, Guo Linhong, et al. Real- time modeling method for large-scale photovoltaic power stations using nested fast and simultaneous solution[J]. IEEE Transactions on Industrial Electro- nics, 2025, 72(3): 2679-2689.

[25] Armstrong M, Marti J R, Linares L R, et al. Multilevel MATE for efficient simultaneous solution of control systems and nonlinearities in the OVNI simulator[J]. IEEE Transactions on Power Systems, 2006, 21(3): 1250-1259.

[26] Hui S Y R, Fung K K, Christopoulos C. Decoupled simulation of DC-linked power electronic systems using transmission-line links[J]. IEEE Transactions on Power Electronics, 1994, 9(1): 85-91.

[27] 岳程燕, 周孝信, 李若梅. 电力系统电磁暂态实时仿真中并行算法的研究[J]. 中国电机工程学报, 2004, 24(12): 5-11.

Yue Chengyan, Zhou Xiaoxin, Li Ruomei. Study of parallel approaches to power system electromagnetic transient real-time simulation[J]. Proceedings of the CSEE, 2004, 24(12): 5-11.

[28] Subedi S, Rauniyar M, Ishaq S, et al. Review of methods to accelerate electromagnetic transient simu- lation of power systems[J]. IEEE Access, 2021, 9: 89714-89731.

[29] Zhou Zhiyin, Dinavahi V. Parallel massive-thread electromagnetic transient simulation on GPU[C]// 2015 IEEE Power & Energy Society General Meeting, Denver, CO, USA, 2015: 1.

[30] Debnath J K, Gole A M, Fung W K. Graphics- processing-unit-based acceleration of electromagnetic transients simulation[J]. IEEE Transactions on Power Delivery, 2016, 31(5): 2036-2044.

[31] Sun Jingfan, Debnath S, Saeedifard M, et al. Real- time electromagnetic transient simulation of multi- terminal HVDC-AC grids based on GPU[J]. IEEE Transactions on Industrial Electronics, 2021, 68(8): 7002-7011.

[32] Gao Haixiang, Chen Ying, Xu Yin, et al. A GPU- based parallel simulation platform for large-scale wind farm integration[C]//2014 IEEE PES T&D Con- ference and Exposition, Chicago, IL, USA, 2014: 1-5.

[33] Duan Tong, Dinavahi V. A novel linking-domain extraction decomposition method for parallel electro- magnetic transient simulation of large-scale AC/DC networks[C]//2021 IEEE Power & Energy Society General Meeting (PESGM), Washington, DC, USA, 2021: 1.

[34] 陈蔚然, 徐晋, 汪可友, 等. 基于分块延迟插入法的三相输电网络细粒度并行化电磁暂态仿真[J]. 中国电机工程学报, 2022, 42(7): 2577-2588.

Chen Weiran, Xu Jin, Wang Keyou, et al. Fine- grained parallel electromagnetic transient simulation of three-phase transmission network based on block latency insertion method[J]. Proceedings of the CSEE, 2022, 42(7): 2577-2588.

[35] 王啟国, 徐晋, 汪可友, 等. 新能源电力系统细粒度并行与多速率电磁暂态仿真[J]. 电力系统自动化, 2024, 48(3): 113-121.

Wang Qiguo, Xu Jin, Wang Keyou, et al. Fine-grained parallel and multi-rate electromagnetic transient simulation for power system with renewable energy[J]. Automation of Electric Power Systems, 2024, 48(3): 113-121.

[36] 陈颖, 高仕林, 宋炎侃, 等. 面向新型电力系统的高性能电磁暂态云仿真技术[J]. 中国电机工程学报, 2022, 42(8): 2854-2864.

Chen Ying, Gao Shilin, Song Yankan, et al. High- performance electromagnetic transient simulation for new-type power system based on cloud computing[J]. Proceedings of the CSEE, 2022, 42(8): 2854-2864.

[37] Zhu Ruimin, Lin Ning, Dinavahi V, et al. An accurate and fast method for conducted EMI modeling and simulation of MMC-based HVDC converter station[J]. IEEE Transactions on Power Electronics, 2020, 35(5): 4689-4702.

[38] Lin Ning, Dinavahi V. Exact nonlinear micro- modeling for fine-grained parallel EMT simulation of MTDC grid interaction with wind farm[J]. IEEE Transactions on Industrial Electronics, 2019, 66(8): 6427-6436.

[39] Lin Ning, Cao Shiqi, Dinavahi V. Comprehensive modeling of large photovoltaic systems for hetero- geneous parallel transient simulation of integrated AC/DC grid[C]//2021 IEEE Power & Energy Society General Meeting (PESGM), Washington, DC, USA, 2021: 1.

[40] Chan D S H, Phang J C H. Analytical methods for the extraction of solar-cell single- and double-diode model parameters from I-V characteristics[J]. IEEE Transactions on Electron Devices, 1987, 34(2): 286- 293.

Electromagnetic Transient Fine-Grained Parallel Simulation Method for Large-Scale PV Power Station

（1. State Key Laboratory of Alternate Electrical Power System with Renewable Energy Sources North China Electric Power University Beijing 102206 China 2. State Key Laboratory of Power Transmission Equipment Technology Chongqing University Chongqing 400044 China）

Abstract As an essential tool for analyzing the internal characteristics of the large-scale photovoltaic (PV) power station, the detailed electromagnetic transient (EMT) simulation supports research on fault detection and diagnosis within the station and oscillation analysis between the station and the grid. However, existing research fails to consider the interaction between modeling methods, parallel simulation, and hardware resources, facing challenges in balancing accuracy, simulation efficiency, and scale.

This paper proposes a fine-grained EMT parallel simulation method that deeply integrates the equivalent modeling with GPU implementations. Firstly, the parallel computing program of the modular PV system is designed based on the GPU’s software and hardware architecture. Then, the switch function model of the inverter, accounting for the blocking state, is used to decouple the AC and DC electric networks. The AC side network is simplified based on the cut-set matrix, and the equivalent model of the PV cluster is obtained by integrating the PV units. Finally, based on the single instruction multiple data (SIMD) technique of GPU, the independent solution of each PV unit provides the overall coarse-grained parallelism, supporting the fine-grained parallelism of the internal element updating.

In the accuracy test of the PV unit, the detailed model (DM) built by the components in PSCAD/EMTDC is compared with the proposed equivalent model (EM). During the input of PV array and three-phase short-circuit fault, the peak errors of active power are 0.09% and 0.26%, respectively. In the accuracy test of the PV station, the simulation results of the PSCAD/EMTDC (PSCAD) and the proposed GPU-based parallel simulation platform (GPU) are compared. In the environmental change test, the maximum relative errors of the output power of the PV array in each cluster are less than 2%. In the transient fault test, the peak errors of active power are 0.21% and 0.30% during the input of the PV array and the A-phase short-circuit fault. For the comparison of execution time and speedup, the proposed simulation method has a significant performance improvement. When the number of PV units within the station is 256, the speedup of the proposed simulation method reaches 983.2.

In the accuracy tests of PV units and PV stations, EM can accurately simulate various operating states, including converter blocking/deblocking, PV array connection, and transient faults. Moreover, EM not only precisely replicates the external characteristics of PV units but also maintains accuracy in internal electrical information. Compared with PSCAD/EMTDC, the relative errors are all within 3%. For the execution time and speedup comparison, the proposed simulation method demonstrates a significant performance improvement. In addition, the substantial performance improvement is attributed to the deep integration between the proposed modeling methods and GPU implementations.

In summary, this paper attempts to improve the simulation efficiency of large-scale PV power stations by the parallel EMT simulation that deeply integrates the modeling methods with GPU implementations. The proposed simulation method is highly applicable to renewable energy systems and power electronic devices with a modular feature.

keywords：Large-scale photovoltaic power station, equivalent modelling, fine-grained, parallel simulation, graphics processing unit (GPU)

曹书豪男，2001年生，博士研究生，研究方向为大规模新能源场站电磁暂态建模及高效仿真技术。E-mail: shuhao0614@ncepu.edu.cn

许建中男，1987年生，教授，博士生导师，研究方向为高压直流输电和直流电网技术等。E-mail: xujianzhong@ncepu.edu.cn（通信作者）