面向共享电动汽车的用户助推与充电协同调度

陈 中 万玲玲 张梓麒

(东南大学电气工程学院 南京 210096)

摘要 城市区域共享型电动汽车(ECSS)优化调度需要解决越发突出的用户用车需求与网点车辆供需不平衡、网点车辆充电与电网运行状态不匹配等问题。该文提出面向共享电动汽车的用户助推方案与充电优化的协同调度方法。首先,设计融合了认知和动机助推策略框架的面向强、弱助推场景的用户助推方案,并采用披露-模糊综合评价方法(r-FCEM)评估助推方案的用户响应度,通过助推引导用户还车至理想网点以解决车辆平衡调度问题;然后,基于计及经济性和低碳性的共享电动汽车充电优化模型,设计助推和充电优化协同调度下的ECSS环境,与深度Q网络(DQN)智能体交互,通过模拟用户-运营商-电网三者交互,对车辆的助推方案和充电优化策略进行协同求解,以解决充电匹配问题;最后,通过调研和算例,验证了所提方法能在满足用户选择自由权的基础上以非强制策略提高用户响应度,提升了运营商经济效益,降低了电网负荷波动。

关键词:共享电动汽车系统 车辆供需平衡 充电状态匹配 助推 充电控制

0 引言

共享电动汽车(Electric Car-Sharing, ECS)作为共享经济的组成部分,对于缓解城市交通拥堵、降低碳排放具有重要意义[1]。共享电动汽车系统(Electric Car-Sharing System, ECSS)涉及用户、运营商、电网等多主体,目前多采用单程网点式运营模式,且ECSS不同于家用汽车的“人-车”固定模式,用户可在运营商规定的任意网点进行取还车[2],运营商安排网点内车辆接入电网充电。随着ECSS规模的不断扩大,将面临派单、充电、停车和区域调度等多项任务的共同挑战[3],主要考虑存在“用车需求-车辆供应不平衡”的车辆再平衡调度和“车辆充电-电网运行状态不匹配”的充电调度两个问题。

车辆再平衡调度解决用户随机、潮汐出行可能引发的ECS在一些网点堆积、一些网点耗尽的用车需求-车辆供应的不平衡问题,以满足用户出行需求,提高用户使用ECSS的满意度。车辆调度分为运营商自行调度和引导用户响应调度两种类型。运营商自行调度是在配置和运营阶段通过优化网点布局、订单择优调度和车辆转运等方法实现再平衡[4],存在时滞性和成本过高等问题。用户响应调度是通过各种引导策略让用户将车还到指定理想网点以实现系统再平衡,可作为运营商调度的辅助调度方法。主流做法是考虑用户为完全理性用户,采用较高的折扣或者补贴等价格激励类引导策略[5-9],并基于经济性指标的最大效用理论制定用户调度策略,存在经济成本高和强制性等问题[10]。助推理论(Nudge theory)[11]由R. H. Thaler及其团队提出,并在2017年获得诺贝尔经济学奖。助推通过精心设计的环境巧妙形成无形推力,采用非强制、低成本的助推策略引导用户无感响应[12-13]。文献[14]采用助推引导电动汽车用户充电行为,验证了助推的有效性,并据此建立日前用户响应模型,结果显示助推能提高充电计划的用户参与度。本文将助推引入ECSS车辆调度,普适地从动机和认知出发制定低成本、非强制的助推策略[15],引导用户自然响应调度。

充电调度首先需要协同车辆调度解决车辆的可用性问题,以满足用户出行需求。文献[16]提出了一种多阶段车辆迁移优化算法,设计Gurobi求解器和充电优先级排序相结合的求解方法,希望能完成车辆调度和充电问题协同求解,实现收益最大化。文献[17]基于网络流模型,考虑配套充电优化决策,建立共享电动汽车优化调度混合整数线性模型,提高运营商收益与用户的满意度。文献[18]基于流体车辆调度模型和多服务器M/M/s充电队列模型构建联合求解框架,提高车辆利用率,降低用户等待时间。然而,目前研究的充电控制并没有考虑到ECS在网点无序充电可能会引发车辆充电的负荷峰谷状态与电网的峰谷状态、新能源出力状态不匹配现象,加剧电网负荷波动[19-22],产生ECSS充电负荷与电网运行状态不匹配问题,因此充电调度还应考虑充电-电网运行状态的匹配问题。一般考虑“车-网”互动的充电调度方法有分时电价(Time of Use tariffs, ToU)方法[23-26]和建设“光储充一体站”方法[27-30]。本文考虑用户、运营商、电网多方需求,对用户助推和车辆充电优化进行协同求解,解决车辆调度和充电调度问题。

本文以城市单程网点式ECSS为研究对象,以解决车辆供需不平衡、充电与电网运行状态不匹配两个问题为切入点,探索行为经济学中的助推方法在共享电动汽车领域的应用,提出面向城市共享电动汽车的用户助推及充电优化协同调度方法。首先,基于实际调研获取用户还车点选择的主要影响因素,从动机和认知的助推框架出发设计面向强、弱助推场景的助推方案,采用披露-模糊综合评价方法(revealed Fuzzy Comprehensive Evaluation Method, r-FCEM)对助推方案的用户响应度进行评估。助推引导用户参与车辆调度,将车辆归还至供不应求、低电价、低碳的理想网点。然后,基于计及充电经济性和低碳性的充电优化控制模型,在深度强化学习环境中模拟用户、运营商、电网三者交互,对助推和充电优化进行协同求解,获得ECSS调度计划,验证了所提方法在满足用户自由选择权的基础上,能以非强制策略提高用户响应度、提升运营商经济性、降低电网负荷波动,解决车辆调度和充电优化调度问题。

1 面向车辆调度的用户助推方案设计

自然情况下用户往往遵循便利原则,直觉倾向于选择与目的地距离最近的默认网点作为还车点。运营商采用助推进行车辆调度是提高运营效益的主要策略,也是在保证用户自由选择权的基础上满足出行需求,提高用户满意度的主要实现方法。车辆调度通过用户响应助推实现。设计融合认知和动机助推策略框架的面向强、弱场景的助推方案,对用户还车点选择进行引导,改变车辆在各网点的分布,期望以低成本、非强制的助推手段提升还车网点选择过程中的用户响应度,实现车辆调度。决策变量是针对每个用户订单的助推力度参数,可以视为实时求解问题。

1.1 用户响应助推影响因素分析

本文通过引导用户还车网点选择实现车辆调度,获得用户在还车网点选择时主要影响因素是用户助推方案设计和用户响应度评估的前提。

从用户个人特征(包含性别、年龄和用车频率)和出行方案相关的影响因素(下车后步行距离、出行折扣优惠、绿色低碳积分奖励、助人系数、网点评价)出发,基于实际问卷调查研究不同影响因素对用户还车网点选择影响因素的隶属度。用户还车网点选择及其影响因素的问卷题设见附表1。

本次调查面向群体间方差较小的高校学生,共收集有效问卷155份,可认为其具备代表性。针对该量表问卷进行信度和效度分析,得信度系数Cronbach's width=10.5,height=10.5为0.862,效度的抽样适用性(Kaiser-Meyer-Olkin, KMO)检验KMO值为0.693,Bartlett球形检验值为0.005,验证了问卷结果具有可靠性和有效性。信度和效度分析方法见附录,根据问卷结果获得各影响因素隶属度见附表2。由问卷调查结果可知,下车后步行距离是用户还车网点选择的最主要影响因素,其次为出行折扣优惠、绿色低碳积分奖励、助人系数和网点评价。此外,问卷调查发现,在不同步行距离水平中其余影响因素隶属度有所差异,可通过分离下车后步行距离这一影响因素构建若干个关于步行距离差的情景,并对其余影响因素作用下的用户响应度进行研究。

设计面向用户的还车网点选择界面含两个待选还车网点D1和D2,示意图如附图1所示。D1为距用户到达点坐标步行距离最短网点,D2为步行距离次最短网点。无助推自然状态下,用户往往通过直觉判断选择将车归还至网点D1。理想网点为D1时对应弱助推场景,为D2时对应强助推场景。网点以下车后步行距离差为参考指标,构建待选网点间下车后步行距离差为0~1 km,1~2 km,2~3 km共三种情景,各情景下对应的待选网点D1和D2距离取值范围如图1所示。

width=183,height=147

图1 各情景待选网点步行距离取值范围

Fig.1 The range of the walking distance of selected stations under each situation

1.2 用户响应助推策略框架

基于用户响应助推主要影响因素分析,从认知和动机两个助推策略框架出发,组合设计所有助推策略形成用户响应助推方案,提高用户将车归还至理想网点的概率,引导用户响应ECSS车辆调度。助推方案设计流程如图2所示。

width=183,height=159

图2 助推方案设计流程

Fig.2 Flow chart of nudging scheme design

从认知助推框架出发,提出包括默认选项助推、示范性规范助推、信息助推的助推策略。从动机助推框架出发,提出包含激发用户环保动机和经济获益动机的助推策略。

1)默认选项助推。由于“现状偏差”现象[31],用户通常选择默认推荐选项。表达为:在用户还车网点选择界面上设置理想网点为默认推荐选项,诱导用户选择。

2)示范性规范助推。社会环境中其他人的选择可以塑造个体对环境的解读和认知。向用户展示网点助人系数(u1)以及他人对网点的评价等级(u2)信息,为个体决策提供依据。u1对应表达为:在理

想网点还车可为更多人提供共享电动汽车使用机会,理想网点取1,其余取0;u2对应表达为:其他用户对待选网点的评价等级为高/中/低。评价等级取决于网点自身属性。

3)信息型助推。改变现有信息的呈现形式能够让人们更有效地接受和利用信息。在默认情况下仅对部分因素指标进行披露,减少冗余信息的干扰,表达为:仅展示部分因素指标对应的表达;用户有机会获得并查看全部信息,但是需要付出额外的“点击”代价实现全披露,表达为:展现所有因素指标对应的表达。

4)环保动机助推。使用ECS属于亲环境出行行为[32]。可以给予响应低碳网点调度的用户一定的绿色低碳积分奖励(u3),提升用户对ECSS车辆调度上环保意义的关注,使用户获得自身满足感。u3对应表达为:在理想网点还车可获得低碳积分ag分,理想网点为低碳网点时agwidth=39,height=15.75,为待求参数,其余网点为ag=1。

5)经济获益动机助推。从经济获益动机出发,运营者选择让利给予响应调度的用户一定折扣优惠奖励(u4),诱发用户的自主获益动机。u4对应表达为:在理想网点还车可获得费用折扣ap。理想网点apwidth=39,height=15.75,为待求参数,非理想网点为ap=1。

1.3 用户助推方案设计

本文设计面向车辆调度的用户助推方案,适用于待选还车网点至到达点坐标为0~3 km的场景。具体助推方案见表1。

表1 用户助推方案设计

Tab.1 Design of user nudging scheme

助推框架助推框架下的策略涉及的影响因素指标助推方案表达 弱助推(理想D1)强助推(理想D2) 认知默认选项—推荐D1推荐D2 示范性助人系数(u1)u1 (D1)=1 u1 (D2)=1 网点评价(u2)u2(D1)u2(D2) 动机环保低碳积分(u3)u3 (D1)=agu3 (D2)= ag 经济获益折扣优惠(u4)u4 (D1)= apu4 (D2)= ap 认知信息型—默认u1默认u1、u3 全披露u1、u2、u3、u4

助推方案设计从车辆供需平衡角度出发,考虑车辆供需,期望达到如下效果:

1)若车辆供需情况为D1车辆不足D2供需平衡,自然直觉下用户选择D1,此时通过顺应用户直觉的弱助推,进一步提高用户归还车辆至D1站点的意愿,缓解供不应求。

2)若车辆供需情况为D2车辆不足而D1供需平衡甚至供求冗余,但用户直觉选择D1,此时通过违背用户直觉的强助推,引导用户选择站点D2作为还车点,缓解供求冗余。

助推方案设计从车辆充电与电网运行状态匹配角度出发,考虑充电经济性、低碳性,期望达到如下效果:

1)若待选网点D1、D2电网充电电价存在差异,运营商通过助推引导用户将车辆归还至低电价的电网供求宽松网点,降低车辆充电成本。

2)若待选网点D1、D2中存在低碳网点,运营商将车辆引导至低碳网点,促进新能源就地消纳。

运营商在制定助推方案时综合考虑车辆供需、充电经济性、低碳性,选择合适的助推力度作为助推参数,并在默认披露时针对强、弱场景展示不同的因素指标,助推将车辆引导至供不应求、低电价、低碳的理想网点。用户助推力度参数通过本文第3节助推与充电优化协同调度求解获得。

2 用户助推方案响应度评估方法

用户响应度代表用户响应车辆助推调度方案的概率,其大小是衡量用户助推方案有效性的主要指标,间接反映用户的还车网点选择情况。目前的主流评价模型包含层次分析法、秩和比法、模糊综合评价法、TOPSIS优劣解距离法[33-36]。面向车辆调度的助推方案用户响应度评估考虑多个影响因素指标,且非完全理性用户的行为决策涉及“风险偏好”和“损失厌恶”等现象,具有相对不确定性,属于多目标模糊决策环境。基于模糊综合评价方法(Fuzzy Comprehensive Evaluation Methods, FCEM)引入披露矩阵为r-FCEM方法,对不同步行距离差情景下助推方案的用户响应度进行定量评估。

width=82.5,height=15.75{助人系数,网点评价,低碳积分奖励,折扣优惠}为因素集,表示对目标问题的n个影响因素,本文中n=4。对于有多个助推力度水平的影响因素ui,可以ui,j表示力度为j的因素ui。本文中,u3,ju4,j分别指不同助推力度j的低碳积分奖励和折扣优惠。

width=78.75,height=16.5为评价矩阵,表示对目标问题的m个模糊评价等级,本文m=5。

width=80.25,height=16.5为权重集,表示各因素重要性分配,满足width=36.75,height=18,一般采用模糊统计试验确定。需要统计每一位抽样用户xp对因素ui是否为还车网点选择的影响因素的确切判断。本文中,不同步行距离差情景下的权重集有所不同,需要根据理想网点和默认网点的下车后步行距离差找到对应的情景,获得对应的权重矩阵。

width=198,height=15.75width=36,height=15.75为模糊关系矩阵表示width=33,height=12的模糊关系,统计每一位用户xp在响应车辆调度时评价对影响因素ui的影响水平认定为vl的确切判断。本文中,需要不同的折扣优惠力度和低碳积分力度获得对应的隶属度矩阵。

本文设计的助推方案涉及因素指标的部分披露与全披露。以width=81,height=15.75为披露矩阵,表示n个影响因素的披露情况,width=41.25,height=15.75width=66.75,height=15width=25.5,height=15.75表示披露因素指标uiwidth=27.75,height=15.75表示不披露。

评价权重矩阵width=13.5,height=16.5更新为

width=160.5,height=42 (1)

式中,width=12,height=12表示叉乘;width=6,height=8.25表示点乘。则车辆调度的助推方案的用户响应度为

width=198,height=107.25

在本文所述的弱助推场景下,默认披露P=[1 0 0 0],强助推场景下默认披露P=[1 0 1 0],用户付出“点击”代价后查看全部指标全披露时P=[1 1 1 1]。

3 用户助推与充电优化协同调度求解

不失一般性,假设运营网点分布如图3所示,按功能将城市分为工业区、商业区和居民区三种区域类型,各区域下设多个网点,其中包含多个装配了光伏发电设备的低碳运营网点。在助推中,用户将车辆归还至低碳网点可获得低碳积分。

本文提出助推和充电优化协同调度方法能充分挖掘ECSS的能量时空转移特性[37-38],引导车辆归还至供求不足、低电价、低碳网点,并在网点内进行有序充电,协同解决供需不平衡问题、充电-电网运行状态不匹配问题,满足用户出行需求、运营商经济效益、电网平抑波动三者需求。

width=170.25,height=174.75

图3 运营网点及助推车辆调度示意图

Fig.3 Distribution of operating station and vehicle scheduling diagram

3.1 面向充电调度的充电优化方法

运营商采用充电优化调度既是提高运营效益的重要策略,也是响应电网平抑波动的主要实现方式。

运营网点车辆的供能单元有电网和光伏。电网在各区域采用独立的分时电价调度各区域内所有电力用户的用电行为。一般网点车辆向电网购电充电,低碳网点车辆优先就地消纳光伏出力充电。充电优化调度主要通过车辆响应经济性充电调度计划实现,决策变量为所有车辆各时段充电功率,可以视为日前求解问题。

1)充电过程的等式约束

width=143.25,height=45

式中,width=20.25,height=18为一个充电时间间隔结束时刻的SOC;width=12,height=15.75为一个充电时间间隔开始时刻的SOC;width=9,height=12为充电效率;width=10.5,height=15.75为当前充电间隔内的平均充电功率;width=10.5,height=15.75为一个充电时间间隔;width=16.5,height=15.75为ECS电池容量;te为ECS退出电网时刻;t为一个充电时间间隔的开始时刻;width=18,height=10.5为充电功率变换最短时间间隔,设置为1 h。

2)充电需求以及用户出行需求约束

width=88.5,height=46.5 (4)

式中,width=12,height=15.75为ECS退出电网时刻的SOC;width=12,height=15.75为退出电网时刻期望的最低SOC;width=12,height=15.75为用户出行里程焦虑平均阈值;width=9,height=13.5为百公里耗电量;DL为用户出发、到达网点间行程距离;tb为ECS接入电网时刻。

3)充电过程的蓄电池安全约束

width=150,height=31.5 (5)

式中,PmaxPmin分别为电池能承载的最大充电功率和最小充电功率;width=12,height=15.75为ECS接入电网时刻的SOC;gmaxgmin分别为适应极端运行情况下ECS的最大和最小SOC。

4)变压器安全运行约束

变压器下属网点的充电功率总和不超过变压器的最大运行功率,即

width=95.25,height=30 (6)

式中,kv为网点v中接入电网的车辆总数;width=16.5,height=16.5为车辆kt时刻的瞬时充电功率;width=13.5,height=16.5为接入变压器width=10.5,height=10.5下网点v的充电总功率;width=12,height=16.5为变压器width=10.5,height=10.5的最大运行功率约束。

基于电动汽车待充电量边界模型[26],引入待充电量width=50.25,height=15.75以及剩余时间width=36.75,height=15.75,可将约束式(4)、式(5)转换为各时段width=39,height=15.75充电功率约束式(7)。

width=49.5,height=16.5 (7)

式中,width=13.5,height=12.75width=13.5,height=12.75分别为充电功率的上、下限。

width=31.5,height=16.5的极限状态,要满足在width=25.5,height=15.75时间内均以最大功率充电才能“恰好”满足退出电网时刻车辆充电至期望电量。在width=31.5,height=16.5的极限状态,要满足在width=25.5,height=15.75时间内即使以最小功率充电,车辆SOC也不超过蓄电池安全最大约束。则有

width=198,height=71.25 (8)

低碳网点的光伏出力应当优先满足网点车辆充电需求。当光伏出力无法满足网点内车辆的充电需求时,运营商需按照各区域分时电价向电网购电。仅当光伏出力过剩时,可以依据分时电价向电网售电,一般的售电价格为购电分时电价的80%[27],光伏发电存在平均成本[38],为光伏用电成本。定义网点c与电网交易的电量为

width=94.5,height=30 (9)

式中,kc为网点c中可接入电网的车辆总数;Pt,k为网点c中第k辆车在t时刻的充电功率;ppv,t为低碳网点在t时刻的出力;Gc为网点c是否为低碳网点的标志,Gc=1表示网点c为低碳网点,否则Gc=0。width=30,height=15.75表示光伏出力不足,向电网购电qcwidth=25.5,height=15.75表示光伏出力过剩,向电网售电-qc

引入阶跃函数,则网点ct时刻的充电成本width=16.5,height=16.5

width=162,height=16.5 (10)

式中,ft,c为网点c当前时刻t的区域分时充电单价; fpv为光伏发电的平均成本;width=20.25,height=15.75为阶跃函数,当 x≥0时,u(x)=1,否则u(x)=0。

运营商安排车辆有序充电目标函数为

width=112.5,height=28.5 (11)

式中,rev,tt时段各区域充电支出;C为系统网点总数,本文中C=30。

运营商考虑充电经济性、低碳性安排停放车辆进行有序充电,充分挖掘能量时间转移潜力。

3.2 基于DQN的助推与充电优化调度协同求解

为了求解并验证助推和充电优化协同调度的有效性,基于深度Q网络(Deep Q Network, DQN)实时求解车辆调度的助推力度参数,并将充电调度的充电功率视为ECSS运营环境内置参数,构建助推和充电优化调度协同下的ECSS运营环境,与用户助推DQN智能体进行交互。训练完成后,在ECSS环境中DQN智能体协同粒子群算法(Particle Swarm Optimization, PSO)求解充电调度计划,实现助推与充电优化协同求解。

3.2.1 用户助推DQN智能体设计

DQN算法是深度强化学习基础算法,对状态维度高、动作空间小、环境状态不确定性高的问题具有高效性,能避免过拟合问题。在DQN训练完成后,可通过ECSS环境与充电调度计划协同求解,降低求解模型的时间复杂度。

DQN算法对值网络更新[39],有

width=132,height=54 (12)

式中,width=10.5,height=13.5为当前Q值网络;width=13.5,height=13.5为目标Q值网络,DQN训练时以固定频率Ngapwidth=10.5,height=13.5width=13.5,height=13.5进行更新;att时刻根据Q选择Q值最大的动作;θθ-分别为Qwidth=13.5,height=13.5网络的权重系数;width=28.5,height=15.75t+1时刻状态;yj为长期累积奖励,是评估width=13.5,height=13.5的变量;rj为即时奖励; g 为学习率。

1)DQN智能体状态

width=123.75,height=16.5 (13)

式中,c为两个待选网点的编号;Ts,c为网点c上停放车辆的总数;Ab,c为网点c上停放可预约车辆数;t为当前时刻,width=39,height=13.5

2)DQN智能体动作

width=132,height=16.5 (14)

式中,width=33,height=16.5为助推力度的离散动作空间,width=74.25,height=16.5

3)DQN智能体奖励函数

width=117,height=16.5 (15)

式中,width=17.25,height=15.75为运营商采用折扣优惠助推时的让利支出,为助推成本;rparking为超停费;width=17.25,height=15.75为完成用户订单获得的租赁收入,订单成功时width=60,height=15.75,由基础服务费用b和里程费用width=20.25,height=15.75构成,其中width=10.5,height=10.5为里程单价,订单失败时width=40.5,height=16.5,为订单损失惩罚。

3.2.2 助推与充电优化协同调度的ECSS环境设计

用户助推DQN智能体和助推与充电优化协同调度下的ECSS运营环境交互,模拟真实运营情况下用户-ECSS运营商-电网三主体交互过程,实现助推与充电协同,训练流程如图4所示。

1)运营商-用户通过租赁服务交互

通过用户订单信息OdOp和车辆信息PKWP交互模拟租赁服务,以满足用户出行需求为前提,采用助推引导车辆至供不应求、低电价、低碳网点,实现车辆调度。

用户向运营商提交出行原始订单Od,运营商向用户提供车辆租赁服务,DQN智能体求得出行折扣优惠和低碳积分助推力度参数,形成最终助推方案,由r-FCEM评估引导用户选择目标还车网点,得到用户出行借还车方案Op

width=135,height=41.25 (16)

式中,o为订单编号;ts为用户出发时间;width=31.5,height=15.75width=31.5,height=15.75分别为出发、到达点坐标;width=10.5,height=15.75为用户的披露意愿,width=40.5,height=15.75width=27,height=15.75分别为借、还车网点编号;width=12,height=15.75为借车网点车辆停放车位编号。

width=228,height=282

图4 助推和充电优化协同调度求解流程

Fig.4 Flow chart of nudging and charging optimization collaborative scheduling solution process

用户出发和到达点坐标由用户出行和到达概率分布抽样生成。存在最短出行距离限制LT

width=118.5,height=20.25 (17)

考虑到各网点可充电停车位有限,以车辆是否位于指定充电停车位为划分依据,将车辆信息分别记录于停车信息矩阵PK和全局缓存矩阵WP,由此可获得ECSS网点车辆信息。

width=173.25,height=33

式中,PK,c,p为网点c上第p个停车位上的车辆信息;WP,k为未在停车位的车辆k的信息,车辆k可能正在行驶或者由于网点车位已满无法停入指定停车位;cn为车辆编号;t0为最早可预约时间;ts为离开网点c的时间,若ts>0则该车属于已预约状态,ts<0属于可预约状态,ts=0表示车位无车;width=30,height=15.75分别为最早可预约时刻、离开时刻的SOC;width=60,height=15.75width=18,height=15.75为全局缓存矩阵的最大容量;ta为用户到达网点时间;width=12,height=15.75为用户出行时车辆SOC。

2)运营商-电网通过充电服务交互

通过车辆信息矩阵中SOC状态更改模拟充电服务,运营商以保证车辆可用性为前提,考虑充电经济性控制车辆充电功率,实现充电优化调度。

ECSS环境中每24 h的交互过程为智能体与环境交互的一个回合,执行流程如下。

(1)回合开始初始化。抽样获得N个用户原始订单,并按照出发时间ts升序排序。初始化订单信息PKWP,日前充电调度计划,t=1,o=1。

(2)提取原始订单信息Oo,d

(3)有序充电控制。若tst+1,执行步骤(4)~步骤(6);否则,考虑充电经济性对所有车辆进行充电控制,获得t+1时刻车辆的ge并更新车辆信息PKWP,进入下一时段t=t+1。

(4)借车网点分配。根据订单信息Oo,d按照就近原则分配距离width=30.75,height=15.75最近的借车网点上的车辆。

(5)助推参数求解。从环境中提取智能体状态信息输入DQN智能体中,获得助推参数apag

(6)还车网点分配。根据坐标width=31.5,height=15.75分配最近的待选还车网点D1、D2,结合还车点D1、D2的网点评价信息和距离差值对应的情景信息CJwidth=10.5,height=15.75width=12,height=16.5width=12,height=16.5参数,获得助推方案,根据APR矩阵,使用r-FCEM计算用户响应度模拟用户选择还车点,生成用户出行方案Op,修改对应借、还车点车辆信息矩阵,获取奖励值ruser,并将订单累加至该时段的订单分配信息矩阵。

(7)o=o+1,step=step+1,若oN,重复步骤(2)~步骤(6),否则进入下一回合,重复步骤(1)~步骤(6)至DQN训练完成。

4 算例

4.1 基于问卷的用户助推方案合理性测试

根据1.3节助推方案,设计用于测试助推方案合理性的“共享电动汽车用户还车网点选择”问卷调查。为模拟用户真实的使用场景,并为共享电动汽车运营系统引入助推的实际应用提供基本设计思路,问卷在三种下车后步行距离差的情景下分别设置六种不同还车网点选择展示界面,情景1展示界面如图5所示,情景2、3分别如附图2、附图3所示。通过问卷统计不同展示界面下用户还车点选择情况。

1)场景1:空白对照。设置D1为默认选项,仅展示步行距离。

width=168.75,height=480

图5 还车网点选择问卷展示界面(情景1)

Fig.5 Electric car-sharing return outlet selection questionnaire display interface (situation 1)

2)场景2:默认选项助推。设置D2为默认选项,仅展示步行距离。

3)场景3:信息披露助推。设置D1为默认选项,展示步行距离,全披露展示“助人系数”“低碳积分”“网点评价”“折扣优惠”。

4)场景4:默认选项助推+信息披露助推。设置D2为默认选项,展示步行距离,全披露展示“助人系数”“低碳积分”“网点评价”“折扣优惠”。

5)场景5:信息披露助推+强调助推。设置D1为默认选项,展示步行距离,带突出强调全披露展示“助人系数”“低碳积分”“网点评价”“折扣优惠”。

6)场景6:默认选项助推+信息披露助推+强调助推。设置D2为默认选项,展示步行距离,带突出强调全披露展示“助人系数”“低碳积分”“网点评价”“折扣优惠”。

本次调查面向社会人员,共收集问卷1 008份。各情景下用户还车网点选择见表2。

表2 用户还车网点选择

Tab.2 Return station chosen by user

情景下车后步行距离/km不同场景下用户选择概率(%) 123456 1D1187.8073.1746.3436.5939.0234.15 D21.512.226.8353.6663.4160.9865.85 2D10.7586.3372.6653.4238.5241.2236.87 D2213.6727.3446.5861.4858.7863.13 3D10.595.5276.6371.5169.1959.5647.38 D22.754.4823.3728.4930.8140.4452.62

不失一般性,从情景1的问卷调查结果出发进行分析。

对比场景1和场景2、场景3和场景4、场景5和场景6,可知,在同样的展示信息下,用户将车归还至默认还车网点的响应概率分别增加了14.63、9.75、4.87个百分点,可得结论:设置默认推荐网点选项是有效的助推策略。

对比场景1和场景3、场景2和场景4,可知,在同样的默认选项情况下,助推用户选择网点D2,用户响应概率分别增加了41.46、36.58个百分点,可得结论:经过助推方案能有效引导用户将车归还至理想网点,本文所提助推方案能有效提升用户响应度。

对比场景3和场景5、场景4和6,可知,在同样的默认选项、助推方案展示下,助推用户将选择网点D2,用户响应概率分别增加了7.32、2.44个百分点,可得结论:经过突出强调显示,能够有效提升用户注意力,确保助推方案响应度验证的数据有效性。

由上述问卷调查结果可知,本文的用户还车网点选择助推方案设计能有效提升用户响应度,具有一定的合理性。

4.2 基于问卷的r-FCEM相关参数提取

根据问卷调查提取得到r-FCEM所需参数AR等矩阵见附表3。根据上述参数,使用本文第2节所提的r-FCEM用户响应度评估方法得到各种助推策略组合下的助推方案与待选网点的用户响应度对应关系如图6所示。采用平行坐标轴图可以表示“高维”因变量取值下网点的用户响应度。根据助人系数区分强、弱助推场景。助人系数取0时为弱助推场景,对应图中红色虚线曲线;助推系数取1为强助推场景,对应图中蓝绿色实线曲线。

width=189,height=156.75

图6 助推方案与用户对待选网点的响应度对应关系

Fig.6 Mapping between nudging schemes and user responsiveness of the selected station

由结果可知,在弱助推场景中,本文所提助推方案提高了用户顺应自然选择最短网点D1的概率,弱助推有效。在强助推场景下,助推也大大提高了用户响应助推选择次最短网点D2的概率,强助推有效。助推方案评估方法具有合理性。

4.3 用户助推与充电优化协同调度有效性验证

为了验证本文所提面向共享电动汽车调度的用户助推与充电优化协同方法的有效性,研究一个边长为10 km的正方形运营区域,网点总数30个,网点编号C1~C30,区域内车辆总数为500辆,一日订单总量2 500。仅在出发网点无可用车时认为订单失败。运营区域内各网点分布如图3所示,各功能区分时电价和基础负荷曲线如附图4所示,光伏出力曲线如附图5所示。设计运营系统与电动汽车基本参数见表3。

表3 运营系统基本参数

Tab.3 Basic parameters of operation system

参数数值 基础服务费b/元5 里程费用a/(元/km)3 最短行程限制LT/km5 电动汽车容量Qev/(kW·h)40 充电功率上下限[Pmin,Pmax]/(kW/h)[0,11] SOC上下限[gmin,gmax](%)[10,90] 里程焦虑平均阈值ga(%)30 充电效率h0.9 车辆能耗x/[kW·h/(100km)]20 光伏平均成本fpv/[元/(kW·h)]0.2

基于运营系统基本参数,在Matlab2023a软件内搭建DQN智能体和ECSS环境并进行离线训练,智能体相关训练参数见附表4。

算例中设置如下四种对比场景。

场景一:运营商对用户进行助推,安排车辆有序充电。

场景二:运营商对用户进行助推,安排车辆无序(恒功率)充电。

场景三:运营商不对用户进行助推,安排车辆有序充电。

场景四:运营商不对用户进行助推,安排车辆无序(恒功率)充电。

首先获得助推和无助推下典型网点的车辆数以及出行、到达量见表4,据此可论证助推对供需不平衡问题和充电优化问题的影响。

表4 助推与无助推下典型网点车辆数量变化

Tab.4 Order transaction under nudge and no nudge

时段/h助推无助推助推无助推电网电价/[元/(kW·h)]助推无助推光伏发电量/(kW·h)助推无助推 C13C24C21C27C21C27C21C27C5C6C5C6C5C6 1272721210.30.3222322231.26×10-120812812 2292821220.30.3222322232.04×10-100812813 3302821220.30.3222322222.14×10-80812813 4352821220.30.3222322221.43×10-60712713 5402821220.30.3222322226.14×10-50711712 6422820210.30.3222322220.001 670710811 7422417190.30.8201820190.028 910891212 8391713150.30.8193923190.313 600691520

(续)

时段/h助推无助推助推无助推电网电价/[元/(kW·h)]助推无助推光伏发电量/(kW·h)助推无助推 C13C24C21C27C21C27C21C27C5C6C5C6C5C6 939111090.30.8173622182.113 830692123 10378730.30.8103818148.719 400882623 11425760.80.31136181021.559 850862623 1244916101.50.3838181431.385 370121722 1339110131.50.3040201328.362 6102301823 1450828121.50.302419923.197 6901801821 155042111.50.823415825.074 120802219 1631187101.50.81618181322.508 690202012 1750230271.50.8050142512.289 300330188 18502842401.51.5294413223.955 52500082 19503337501.51.50175200.765 78100021 20442836501.51.517114190.090 9703011 21382335501.51.516133220.006 7301100 22331835501.51.515163220.000 31302101 23321734500.80.814162229.23×10-602201 24311634500.80.814153211.73×10-704202 出行量/辆1741339597——7517473113——75126549 到达量/辆178122108144——6716654111——7125739

而后获得四个算例场景下,系统整体运营情况和求解时间见表5,各区域车辆分布、负荷曲线如图7所示。据此研究单一助推、单一充电优化、助推和充电优化协同调度对ECSS系统的影响。

表5 各种场景下的运营情况和计算时间

Tab.5 Operations under nudge and no nudge

场景一场景二场景三场景四 订单成交量2 429 2 429 2 298 2 298 负荷方差1.286×1071.303×1071.263×1071.275×107 租赁效益/元99 725.08 99 725.08 95 920.70 95 920.70 充电效益/元-20 017.82 -20 372.96 -18 865.72 -19 206.50 运营效益/元79 707.26 79 352.13 77 054.97 76 714.20 求解时间/s22 124.9732.4324 846.1416.32

4.3.1 用户助推对供需平衡问题的有效性分析

助推引导用户还车点选择,改变各网点车辆分布,考虑各网点用户出行需求的差异性,用户助推影响供需不平衡主要体现在两个方面。

1)用户助推缓解供不应求现象

典型的,选择表4中网点C13为研究对象。C13位于商业区内,初始状态车辆少,按照最短原则分配至C13的用户订单多,出行需求高。无助推情况下,归还至C13的车辆较少,出行量大于到达量,存在供不应求现象。助推情况下,助推引导用户选择C13作为还车点,归还至C13的车辆大幅提升,该网点车辆库存增加,进而促进出行订单量增加。说明助推可以引导用户选择供不应求的网点为还车点,提高订单成交量,缓解供不应求现象。

width=179.25,height=282

width=171.75,height=264.75

图7 用户助推与充电优化结果展示

Fig.7 User nudging and charging optimization results

2)用户助推缓解供求冗余情况

典型的,选择表4中网点C24为研究对象。C24位于居民区内,按照最短原则分配至C24的用户订单少,出行需求较低。无助推情况下,归还至C24的车辆大于出行量,存在供求冗余现象。助推情况下,助推引导用户选择另一待选网点作为还车点,减少冗余网点的车辆补充,则归还至C24的车辆有所降低,该网点车辆库存减少,但是订单量基本不变。说明助推可以合理分配网点冗余车辆,几乎不影响冗余网点的订单成交量,缓解供求冗余现象。

4.3.2 用户助推对充电控制问题的有效性分析

助推引导用户选择还车点,改变各网点车辆分布。考虑充电经济性、低碳性,助推影响车辆充电优化主要体现在两个方面。

1)用户助推引导车辆至低电价网点

典型的,选择表4中网点C21、C27为研究对象。C21、C27分别位于商业区、居民区内,各区域电网分时电价曲线存在差异,一般情况下居民区电网电价低于商业区充电电价。电网充电电价较高的网点所在区域电网供求紧张,此时为电网负荷曲线的“峰”时段,若选择高电价网点为还车点会加剧该网点的负荷状态不匹配现象,增加充电成本。反之,电网充电电价较低的网点所在区域电网供求宽松,此时为电网负荷曲线的“谷”时段,若选择低电价网点为还车点可以缓解电网的运行状态不匹配现象。无助推情况下,用户按照自然意愿将车辆归还至C21和C27,C27的出行量、到达量大于C21。助推情况下,运营商助推用户将车辆归还至低电价C27,C27的车辆出行量和到达量显著提高。说明助推引导用户将车辆归还至低电价网点,从而降低充电成本和电网负荷方差,缓解充电与电网运行状态不匹配现象,提高运营经济性。

2)用户助推引导车辆至低碳网点

典型的,选择表4中网点C5、C6为研究对象。C5、C6均位于工业区内,其中C6为一般网点,C5为装备了光伏发电设备的低碳网点。车辆在低碳网点利用光伏出力充电,充电成本较低且具有低碳效益。无助推情况下,用户按照自然意愿将车辆归还至C5和C6,C5、C6的出行量和到达量没有显著差异。助推情况下,运营商助推引导用户将车辆归还至低碳网点C5,C5的车辆出行量和到达量显著提高,而C6订单出行和到达量降低。说明助推引导车辆前往低碳网点充电,从而促进车辆就地消纳新能源出力,降低充电成本和电网负荷方差,缓解充电与电网运行状态不匹配现象,提高运营经济性。

4.3.3 用户助推与充电优化协同对运营经济性的提升分析

ECSS运营环境包括通过用户与运营商交互的租赁服务以及运营商和电网交互的充电服务,三方共同作用影响运营经济性。算例中设置的四种场景的运行结果见表5和图7。

首先,研究单一充电调度对ECSS运营系统的影响,对比表5和图7中场景一与场景二、场景三与场景四结果。可知在助推、无助推情况下采用单一充电调度可以降低充电成本、电网负荷方差,提高运营经济效益。因为在充电调度中ECSS在充电单价较高的高峰时段,电网供求紧张,安排减少车辆充电量;在充电单价较低的低谷时段,电网供求宽松,安排车辆增加充电量;在平时段,电网供求相对平衡,ECSS根据本身运营状况安排车辆充电实现经济运行。综上所述,ECSS可采用单一充电优化实现充电调度,缓解ECSS充电与电网运行状态不匹配问题,降低电网的负荷波动,提升运营商充电服务效益。

其次,研究单一助推调度对ECSS运营系统的影响,对比表5和图7中场景一与场景三、场景二与场景四结果,可知在有序充电、无序充电情况下采用单一助推调度均可以提高订单成交量、租赁服务收入,提高运营经济效益。因为在0:00—6:00、20:00—24:00用户出行量较低,各区域车辆分布基本不发生变化,助推效果不显著;6:00—12:00用户从居民区和商业区向工业区转移,为出行早高峰期,工业区车辆大幅增长,助推调度车辆在区域内的网点均衡分布,保证下一阶段用户出行需求;在12:00—16:00助推用户从工业区向商业区和居住区转移;在16:00—20:00助推用户从工业区向商业区和居民区转移。综上所述,ECSS可采用单一助推调度改变车辆在各网点的分布情况,缓解车辆供需不平衡现象,提高订单的成交量,提升运营商租赁服务效益。

最后,研究助推和充电优化协同调度对ECSS运营系统的影响,对比表5和图7中场景一、二、三、四结果可知,仅在采用助推和有序充电优化协同调度的场景中,运营商订单成交量最高,运营效益达到最大值。单一的充电调度能够通过安排车辆有序充电提高运营收入,但是由于存在供需不平衡问题,用户订单成交量较低,影响用户使用ECSS出行的满意度以及使用体验。而单一的助推调度能通过提高订单成交量提高运营效益,同时ECSS出行耗能也有显著提升,充电负荷需求增大,需要从电网获取更多的能量,但是由于缺少有序充电控制,负荷方差增大,导致“峰上加峰”,充电与电网运行状态不匹配状态问题加剧,充电成本增加。综上所述,通过本文所提助推和充电优化协同调度方法,即在助推场景下考虑充电优化,既能显著提升用户订单成交量,保障用户出行需求,提升用户出行满意度,又能帮助电网降低负荷方差,通过助推和充电优化协同调度,实现运营商经济效益最大化。

4.4 算法有效性分析

根据表5,对比各场景下的计算时间,可以发现模型的求解时间主要取决于充电优化调度。这是因为助推调度求解采用DQN求解,环境状态发生细微变化时不需要重新训练,可以直接实时快速地求解每一步的车辆调度方案,时间复杂度用大O表示法表示为O(Ln2),L为神经网络层数,n为每层的神经元个数。充电调度采用PSO算法获得充电优化调度计划,每次都需要迭代求解,计算的时间复杂度为O(NM),N为粒子数目,M为迭代次数。一般Ln均远小于NM,因此协同求解模型的时间复杂度为O(NM)。

进一步,为了验证本文所提基于DQN的助推力度参数求解方法的有效性,选择TD3(twin delayed deep deterministic policy gradient)算法、PSO算法作为对比,得到各算法求解助推与充电优化协同调度的对比结果见表6,采用大O表示法表征各算法的时间复杂度。

表6 算法对比结果

Tab.6 Algorithm solution results comparison

助推求解方法DQNTD3PSO 训练期时间复杂度O(Ln2+B)O(3Ln2+B)O(NM) 训练期平均计算时间/s93.5678.1284.688 平均求解时间/s9.15811.84884.688 订单成交量/个2 4292 3972 402 运营效益/元79 707.26477 707.35878 216.023

由表6可得,TD3和DQN均属于深度强化学习算法,在训练期用时较长,时间复杂度高。但是训练完成后,可以直接使用DQN和TD3进行快速求解,且两种算法计算时间相差不大。但是TD3适用于连续动作问题,而本文所求解的助推力度参数属于离散动作,因此采用TD3方法的模型求解订单成交量和运营效益指标效果均略差于DQN。

PSO属于群体智能算法,求解时需要反复迭代,时间复杂度较高,求解时间对比DQN和TD3都较长。此外,车辆调度问题涉及用户出行行为不确定性以及用户对助推方案的不确定性响应问题,求解模型复杂,PSO算法更容易出现局部拟合的问题。因此相比于TD3和PSO算法,采用DQN算法作为助推参数求解算法与充电调度协同求解,在求解时间、求解效果上更具有优势,更具有实用性。

5 结论

本文针对城市共享电动汽车系统运营过程中出现的车辆供需不平衡的车辆调度问题以及充电与电网运行状态不匹配的充电调度问题展开研究。得到以下结论:

1)在供需平衡的车辆调度层面,提出采用融合认知和动机助推的用户响应助推策略框架,设计了针对强、弱助推场景的默认信息披露和全披露的用户响应助推方案。通过助推引导用户将车辆从供应冗余点调度至供不应求网点,提高运营商租赁服务收入和用户满意度。

2)在充电优化的充电调度层面,既通过助推引导用户将车辆归还至低电价、低碳网点,又通过利益驱动的车辆有序充电优化控制方法,减少电网负荷方差、促进新能源消纳,降低运营商充电服务的支出。

3)采用助推和充电优化的协同调度能够以低成本、非强制助推策略提高订单成交量,保障用户出行需求,减少电网负荷波动,全方位提高运营商运营经济性。

本文提出的面向共享电动汽车调度的用户助推及充电优化协同方法,是行为经济学在共享电动汽车领域学科交叉的探索。后续在助推层面,将扩大问卷调查对象范围、增加问卷数量,进一步考虑如何验证实际应用的可行性和有效性;在算法层面,考虑在规模化ECSS运营情况下如何精细化建模,并寻找更优的算法使其更适配规模化场景。

附 录

附表1 用户出行网点选择及其影响因素调查题设

App.Tab.1 Quetionnaires on user′s choice of return stations and its influencing factors

影响因素因素水平问卷题设 个人特征年龄25以下/25-35/35以上您的年龄为以下哪个范围? 性别男/女您的性别是? 用车频率高(>7)/中(3~7)/低(0~2)您一周内使用共享电动汽车的频率? 出行方案相关步行距离0~1 km/1~2 km/2~3 km当下车后步行距离为以下不同水平时您是否会认为某个影响因素会是您在选择还车点时的考虑因素? 出行折扣0/0.05/0.15/0.25您对于影响因素...为以下水平时对您在选择还车点时影响程度的评价为:(选项:高、较高、一般、较低、低)? 网点评价高/低 助人系数高/低 绿色低碳奖励0/3/5/10

附表2 各影响因素隶属度水平

App.Tab.2 Membership degree of each influencing factor

影响因素下车后步行距离出行折扣优惠绿色低碳积分奖励助人系数网点评价 隶属度0.866 70.466 70.366 7 0.333 30.133 3

附表3 各影响因素隶属度水平r-FCEM相关参数

App.Tab.3 Parameters of r-FCEM

AR U(ui,j)Ri 情景1[0.15 0.05 0.35 0.45]u10.35 0.25 0.20 0.15 0.05 u 20.40 0.20 0.10 0.15 0.05 u 3,10.50 0.25 0.15 0.05 0.05

(续)

AR U(ui,j)Ri 情景2[0.05 0.05 0.25 0.65]u 3,20.75 0.12 0.08 0.03 0.02 u 3,20.80 0.14 0.03 0.02 0.01 u 3,20.90 0.06 0.02 0.02 0.01 情景3[0.03 0.02 0.10 0.85]u 4,10.65 0.15 0.10 0.05 0.05 u 4,20.75 0.12 0.08 0.03 0.02 u 4,30.80 0.14 0.03 0.02 0.01 u 4,40.90 0.06 0.02 0.02 0.01

附表4 DQN助推智能体参数

App.Tab.4 Parameters of DQN nudge agent

参数数值 神经网络尺寸(Number of Neurons)24 采样时间(Sample Time)/s1 折扣因子(Discount Factor)0.99 学习率(Learn Rate)10-3 经验回放集合尺寸(Experience Buffer Length)108 批量大小(Mini Batch Size)64 目标平滑因子(Target Smooth Factor)0.5 梯度阈值(Gradient Threshold)1

width=198,height=96

附图1 待选网点示意图(L1L2L3L4

App.Fig.1 Schematic diagram of the network to be selected (L1L2L3L4)

width=189,height=181.5

width=189.75,height=377.25

附图2 ECS还车网点选择问卷展示界面(情景2)

App.Fig.2 ECS return outlet selection questionnaire display interface (situation 2)

问卷调研是一种常见的数据收集方法,对于量表类问卷,分析其可信性和有效性是保证其靠谱性和有效性的重要一步,即需要对问卷进行信度和效度分析[40-41]。如果问卷的信度和效度比较好,证明问卷的数据可靠性和有效性比较高,可以用来做后续的建模分析。

width=183,height=182.25

width=183,height=376.5

附图3 ECS还车网点选择问卷展示界面(情景3)

App.Fig.3 ECS return outlet selection questionnaire display interface (situation 3)

width=213,height=237.75

width=213,height=113.25

附图4 各区域基础负荷与分时电价及光伏出力

App.Fig.4 Base load and time-of-use price and photovoltaic power for all areas

width=146.25,height=122.25

附图5 光伏出力曲线

App.Fig.5 Curves of a photovoltaic power

1)信度分析。信度指可靠度、一致性或者稳定性,信度系数越大则表示问卷测量的结果可信程度越大。一般采用Cronbach’s width=10.5,height=10.5信度系数进行效度分析,计算结果在0~1之间,计算公式为

width=78,height=30.75 (A1)

式中,n为量表中题项的总数;width=12,height=15为第i题得分的题内方差;width=12,height=15为全部题项总得分的方差。从式(A1)中可以看出,width=10.5,height=10.5系数评价的是量表中各题项得分间的一致性,属于内在一致性系数。这种方法适用于态度、意见式问卷(量表)的信度分析。当a>0.8,可认为信度系数非常好;当0.7≤a≤0.8时,则表示问卷量表的某些项目需要重新设计题项;当a<0.7时,则表示问卷量表需要大范围重新设计题项。

2)效度分析。效度指有效性,效度越大则表示问卷测量越能显示其所要测量的特征。一般通过结构效度因子分析预期变量与题项的对应关系,包括抽样适用性(Kaiser-Meyer-Olkin, KMO)检验和Bartlett球形检验(p值)。KMO用于检查变量间的偏相关性,KMO值在0.9以上极适合做因子分析,0.8以上适合做因子分析,0.7以上尚可,0.6以上勉强可以,0.5以上不适合,0.5以下非常不适合。实际运用中,在0.7以上,效果比较好;在0.5以下时,不适合应用因子分析。Bartlett球形检验用于判断相关矩阵是否为单位阵,p<0.05,不服从球形检验,应拒绝各权变量独立的假设,即变量间有较强相关;p>0.05时,服从球形检验,各变量相互独立,不能做因子分析。

参考文献

[1] 朱学杰. 国内汽车共享行业发展现状及趋势探讨[J]. 科技创新与应用, 2016, 6(29): 75-76.

Zhu Xuejie. Discussion on the development status and trend of domestic car sharing industry[J]. Technology Innovation and Application, 2016, 6(29): 75-76.

[2] 刘彬彬. 共享汽车租赁点运营特性分析与车辆调度研究[D]. 北京: 北京交通大学, 2020.

Liu Binbin. Analysis of operation characteristics of shared car rental points and research on vehicle scheduling[D]. Beijing: Beijing Jiaotong University, 2020.

[3] Ferrero F, Perboli G, Rosano M, et al. Car-sharing services: an annotated review[J]. Sustainable Cities and Society, 2018, 37: 501-518.

[4] 王宁, 田航奇, 郭家辉. 电动共享汽车动态调度问题应用综述[J]. 同济大学学报(自然科学版), 2023, 51(9): 1469-1478.

Wang Ning, Tian Hangqi, Guo Jiahui. Literature review of dynamic relocation problem for electric shared vehicles[J]. Journal of Tongji University (Natural Science), 2023, 51(9): 1469-1478.

[5] Balac M, Ciari F, Axhausen K W. Modeling the impact of parking price policy on free-floating carsharing: case study for Zurich, Switzerland[J]. Transportation Research Part C: Emerging Technologies, 2017, 77: 207-225.

[6] Jorge D, Molnar G, Correia G. Trip pricing of one-way station-based carsharing networks with zone and time of day price variations[J]. Transportation Research Part B-methodological, 2015, 81: 461-482.

[7] Di Febbraro A, Sacco N, Saeednia M. One-way car-sharing profit maximization by means of user-based vehicle relocation[J]. IEEE Transactions on Intelligent Transportation Systems, 2019, 20(2): 628-641.

[8] Nguyen T K, Hoang N H, Vu H L. A unified activity-based framework for one-way car-sharing services in multi-modal transportation networks[J]. Transportation Research Part E: Logistics and Transportation Review, 2022, 157: 102551.

[9] 王家玉, 牟振华, 申栋夫, 等. 面向共享汽车自调度的还车奖惩方案仿真[J]. 交通科技与经济, 2023, 25(3): 31-39.

Wang Jiayu, (Mou/mu) Zhenhua, Shen Dongfu, et al. Simulation of vehicle return reward and punishment schemes for sharing vehicle self-scheduling[J]. Technology & Economy in Areas of Communications, 2023, 25(3): 31-39.

[10] 陈鸿菲, 辛自强. 助推, 促进, 由心而治——社会治理的三种心理学路径[J/OL]. 中国社会科学报, 2018:6. http://sscp.cssn.cn/xkpd/xlx/201803/t20180319_ 3879452.html.

Chen Hongfei, Xin Ziqiang. Nudging, promoting and governing by heart - three psychological paths of social governance[J/OL]. Chinese Journal of Social Sciences, 2018: 6. http://sscp.cssn.cn/xkpd/xlx/201803/ t20180319_3879452.html.

[11] Thaler R H, Sunstein C R. Nudge: improving decisions about health, wealth, and happiness[M]. New Haven: Yale University Press, 2008.

[12] 何贵兵, 李纾, 梁竹苑. 以小拨大: 行为决策助推社会发展[J]. 心理学报, 2018, 50(8): 803-813.

He Guibing, Li Shu, Liang Zhuyuan. Behavioral decision-making is nudging China toward the overall revitalization[J]. Acta Psychologica Sinica, 2018, 50(8): 803-813.

[13] 刘欢, 隋晓阳, 黄元娜, 等. 行为经济学在养老储蓄领域的助推应用[J]. 心理科学进展, 2019, 27(3): 417-427.

Liu Huan, Sui Xiaoyang, Huang Yuanna, et al. The nudging role of behavioral economics in retirement savings decisions: current situation and future prospects[J]. Advances in Psychological Science, 2019, 27(3): 417-427.

[14] Zhang Ziqi, Chen Zhong, Gümrükcü E, et al. A nudge-based approach for day-ahead optimal scheduling of destination charging station with flexible regulation capacity[J/OL]. IEEE Transactions on Transportation Electrification, 2024: 1. https://ieeexplore.ieee.org/ document/10381875.

[15] 傅鑫媛, 辛自强, 楼紫茜, 等. 基于助推的环保行为干预策略[J]. 心理科学进展, 2019, 27(11): 1939-1950.

Fu Xinyuan, Xin Ziqiang, Lou Zixi, et al. Nudging strategies for pro-environmental behavior[J]. Advances in Psychological Science, 2019, 27(11): 1939-1950.

[16] Wang Ning, Tian Hangqi, Wu Gang, et al. Shared travel demand forecasting and multi-phase vehicle relocation optimization for electric carsharing systems[J]. Transportation Letters, 2024, 16(9): 1002-1017.

[17] 程瑜, 邰宇峰, 丁肇豪, 等. 基于网络流的共享电动汽车优化调度[J]. 电工技术学报, 2022, 37(增刊1): 145-152.

Cheng Yu, Tai Yufeng, Ding Zhaohao, et al. Optimal scheduling of shared electric vehicles based on network flow[J]. Transactions of China Electro-technical Society, 2022, 37(S1): 145-152.

[18] Guo Ge, Xu Tao. Vehicle rebalancing with charging scheduling in one-way car-sharing systems[J]. IEEE Transactions on Intelligent Transportation Systems, 2022, 23(5): 4342-4351.

[19] 毛玲, 张钟浩, 赵晋斌, 等. 车-桩-网交融技术研究现状及展望[J]. 电工技术学报, 2022, 37(24): 6357-6371.

Mao Ling, Zhang Zhonghao, Zhao Jinbin, et al. Research status and prospects of fusion technology of vehicle-charging pile-power grid[J]. Transactions of China Electrotechnical Society, 2022, 37(24): 6357-6371.

[20] 胡泽春, 宋永华, 徐智威, 等. 电动汽车接入电网的影响与利用[J]. 中国电机工程学报, 2012, 32(4): 1-10, 25.

Hu Zechun, Song Yonghua, Xu Zhiwei, et al. Impacts and utilization of electric vehicles integration into power systems[J]. Proceedings of the CSEE, 2012, 32(4): 1-10, 25.

[21] 高赐威, 张亮. 电动汽车充电对电网影响的综述[J]. 电网技术, 2011, 35(2): 127-131.

Gao Ciwei, Zhang Liang. A survey of influence of electrics vehicle charging on power grid[J]. Power System Technology, 2011, 35(2): 127-131.

[22] 蔡黎, 商冰洁, 高乐, 等. 电动汽车有序充电研究与应用综述[J]. 南方电网技术, 2023, 17(11): 97-107, 129.

Cai Li, Shang Bingjie, Gao Le, et al. Review of research and application on orderly charging of electric vehicles[J]. Southern Power System Technology, 2023, 17(11): 97-107, 129.

[23] 徐俊俊, 程奕凌, 张腾飞, 等. 计及充电行为特征与可调性的电动汽车集群优化调度[J]. 电力系统自动化, 2023, 47(23): 23-32.

Xu Junjun, Cheng Yiling, Zhang Tengfei, et al. Optimal scheduling of electric vehicle clusters considering characteristics and adjustability of charging behavior[J]. Automation of Electric Power Systems, 2023, 47(23): 23-32.

[24] 丁乐言, 柯松, 张帆, 等. 考虑出行需求和引导策略的电动汽车充电负荷预测[J]. 电力建设, 2024, 45(6): 10-26.

Ding Leyan, Ke Song, Zhang Fan, et al. Forecasting of electric-vehicle charging load considering travel demand and guidance strategy[J]. Electric Power Construction, 2024, 45(6): 10-26.

[25] 韩丽, 陈硕, 王施琪, 等. 考虑风光消纳与电动汽车灵活性的调度策略[J]. 电工技术学报, 2024, 39(21): 6793-6803.

Han Li, Chen Shuo, Wang Shiqi, et al. Scheduling strategy considering wind and photovoltaic power consumption and the flexibility of electric vehicles[J]. Transactions of China Electrotechnical Society, 2024, 39(21): 6793-6803.

[26] 周志强, 张金江, 薛费青, 等. 基于线性规划的电动汽车有序充电调度方法[J]. 电子测试, 2021(21): 97-100, 87.

Zhou Zhiqiang, Zhang Jinjiang, Xue Feiqing, et al. Electric vehicle orderly charging scheduling method based on linear programming[J]. Electronic Test, 2021(21): 97-100, 87.

[27] 薛贵挺, 汪柳君, 刘哲, 等. 考虑碳排放的光储充一体站日前运行策略[J]. 电力系统保护与控制, 2022, 50(7): 103-110.

Xue Guiting, Wang Liujun, Liu Zhe, et al. Day-ahead operation strategy of an integrated photovoltaic storage and charging station considering carbon emissions[J]. Power System Protection and Control, 2022, 50(7): 103-110.

[28] 胡代豪, 郭力, 刘一欣, 等. 计及光储快充一体站的配电网随机-鲁棒混合优化调度[J]. 电网技术, 2021, 45(2): 507-519.

Hu Daihao, Guo Li, Liu Yixin, et al. Stochastic/robust hybrid optimal dispatching of distribution networks considering fast charging stations with photovoltaic and energy storage[J]. Power System Technology, 2021, 45(2): 507-519.

[29] 韩丽, 陈硕, 王施琪, 等. 考虑风光消纳与电动汽车灵活性的调度策略[J]. 电工技术学报, 2024, 39(21): 6793-6803.

Han Li, Chen Shuo, Wang Shiqi, et al. Scheduling strategy considering wind and photovoltaic power consumption and the flexibility of electric vehicles[J]. Transactions of China Electrotechnical Society, 2024, 39(21): 6793-6803.

[30] 徐同庆, 王树彪, 赵浩君. 计及光伏消纳与光储充配置的配电网联合优化策略[J]. 电气工程学报, 2025, 20(1): 271-280.

Xu Tongqing, Wang Shubiao, Zhao Haojun. Joint optimization strategy containing photovoltaic consumption and photovoltaic-storage-charging configuration in distribution network[J]. Journal of Electrical Engineering, 2025, 20(1): 271-280.

[31] Kahneman D, Knetsch J L, Thaler R H. Anomalies: the endowment effect, loss aversion, and status quo bias[J]. Journal of Economic Perspectives, 1991, 5(1): 193-206.

[32] 童瑞咏, 毛保华, 魏润斌, 等. 碳达峰目标下的汽车电动化碳减排效果研究[J]. 公路交通科技, 2023, 40(2): 238-245.

Tong Ruiyong, Mao Baohua, Wei Runbin, et al. Study on carbon emission reduction effect of automotive electrification under goal of carbon peaking[J]. Journal of Highway and Transportation Research and Development, 2023, 40(2): 238-245.

[33] 傅碧天. 城市共享交通行为的公众偏好、影响因素及碳减排潜力研究: 以上海为例[D]. 上海: 华东师范大学, 2018.

Fu Bitian. Study on public preference, influencing factors and carbon reduction potential of urban shared traffic behavior—a case study of Shanghai[D]. Shanghai: East China Normal University, 2018.

[34] Saysel A K, Barlas Y. A dynamic model of salinization on irrigated lands[J]. Ecological Modelling, 2001, 139(2/3): 177-199.

[35] Guo H C, Liu L, Huang G H, et al. A system dynamics approach for regional environmental planning and management: a study for the Lake Erhai Basin[J]. Journal of Environmental Management, 2001, 61(1): 93-111.

[36] 米雪. 基于运营数据的共享汽车用户综合评价及车辆调度研究[D]. 北京: 北京交通大学, 2021.

Mi Xue. Research on comprehensive evaluation of shared car users and vehicle scheduling based on operational data[D]. Beijing: Beijing Jiaotong University, 2021.

[37] 万玲玲, 陈中, 王毅, 等. 考虑能量时空转移的城市规模化共享电动汽车充放电优化调度[J]. 电力建设, 2023, 44(6): 135-143.

Wan Lingling, Chen Zhong, Wang Yi, et al. Optimal charging and discharging scheduling of urban large-scale shared electric vehicles considering energy temporal and spatial transfer[J]. Electric Power Construction, 2023, 44(6): 135-143.

[38] Hu Banshao, Tang Junqing, Tong De, et al. Revealing spatiotemporal characteristics of EV car-sharing systems: a case study in Shanghai, China[J]. Travel Behaviour and Society, 2024, 36: 100808.

[39] 罗恒, 严晓, 王钦, 等. 充电场站光储充控制策略[J]. 储能科学与技术, 2022, 11(1): 275-282.

Luo Heng, Yan Xiao, Wang Qin, et al. Charging and discharging strategy of battery energy storage in the charging station with the presence of photovoltaic[J]. Energy Storage Science and Technology, 2022, 11(1): 275-282.

[40] Mnih V, Kavukcuoglu K, Silver D, et al. Human-level control through deep reinforcement learning[J]. Nature, 2015, 518: 529-533.

[41] 蒋小花, 沈卓之, 张楠楠, 等. 问卷的信度和效度分析[J]. 现代预防医学, 2010, 37(3): 429-431.

Jiang Xiaohua, Shen Zhuozhi, Zhang Nannan, et al. Reliability and validity analysis of questionnaire[J]. Modern Preventive Medicine, 2010, 37(3): 429-431.

[42] 亓莱滨, 张亦辉, 郑有增, 等. 调查问卷的信度效度分析[J]. 当代教育科学, 2003(22): 53-54.

Qi Laibin, Zhang Yihui, Zheng Youzeng, et al. Reliability and validity analysis of questionnaire[J]. Contemporary Educational Science, 2003(22): 53-54.

Nudging Users and Charging Optimization for Electric Car-Sharing System Scheduling

Chen Zhong Wan Lingling Zhang Ziqi

(School of Electrical Engineering Southeast University Nanjing 210096 China)

Abstract Electric car-sharing (ECS), as a component of the sharing economy, is of great significance in alleviating urban traffic congestion and reducing carbon emissions. Electric car-sharing system (ECSS) involves multiple entities such as users, operators and power grids. At present, one-way network operation mode is mostly adopted. Users can pick up and return vehicles at any network specified by the operator, and the operator arranges for vehicles in the network to connect to the power grid for charging. The optimal scheduling of urban electric car-sharing system is needed to solve the increasingly prominent problems such as imbalance between user demand and station cars supply, and mismatch between cars charging and grid operation status. Current strategies for vehicle scheduling are high-cost and coercive, while charging scheduling only ensures vehicle availability, lacking consideration of the impact of vehicle charging on the grid. Addressing these issues, the application of low-cost, non-coercive nudging methods from behavioral economics in the field of ECSS was explored and a coordinated user nudging and charging optimization scheduling method for urban shared electric vehicles was proposed .

Firstly, at the level of vehicle scheduling with supply and demand balance, nudging was used to guide user dispatch. Based on actual surveys, the main factors influencing users' choice of return points were identified, and nudging schemes for strong and weak scenarios were designed based on a framework of motivational and cognitive nudges. The revealed fuzzy comprehensive evaluation method (r-FCEM) was used to evaluate the user responsiveness to the nudging schemes, determining the probability of users participating in vehicle dispatch, thereby relocating vehicles from surplus supply points to stations with high demand, and improving operators' rental service income. And then we tested the feasibility of the nudging scheme and found that the design of the nudging scheme for users' choice of return stations can effectively improve user responsiveness and has a certain degree of feasibility.

Secondly, for the charging scheduling problem, nudge guided users to return vehicles to low-cost, low-carbon stations, and charging optimization model considering economic and low-carbon factors was designed. Based on deep Q network (DQN), an ECSS operating environment was constructed to simulate the interactions among users, operators, and the grid. After training process, coordinated solutions for nudging and charging optimization were obtained. This resulted in a dispatch plan for vehicle scheduling and a charging schedule for charging optimization.

The research first examined the number of vehicles and the travel and arrival volumes at typical stations under nudged and non-nudged scenarios, demonstrating the impact of nudging on supply-demand imbalance and charging optimization issues. It was found that user nudging can alleviate phenomena of under-supply and surplus, guiding vehicles to low-cost, low-carbon stations. Then, four scenarios were set up, revealing that single vehicle scheduling and charging scheduling alone offer limited improvement to the economic benefits of ECSS. It is necessary to solve nudging and charging scheduling in a coordinated manner to enhance user responsiveness through non-coercive strategies, reduce grid load fluctuations, and comprehensively improve the economic efficiency of operators while addressing vehicle scheduling and charging optimization problems.

Future work on nudging will expand the scope and number of questionnaire surveys to further validate the feasibility and effectiveness of practical applications. Algorithmically, future research will focus on refined modeling for large-scale ECSS operations and seek better algorithms to adapt to large-scale scenarios.

Keywords:Electric car-sharing system (ECSS), supply and demand balance of car, match of charging and grid status, nudge, charging control

中图分类号:TM74

DOI:10.19595/j.cnki.1000-6753.tces.240756

国家自然科学基金资助项目(52077035)。

收稿日期 2024-05-10

改稿日期 2024-08-15

作者简介

陈 中 男,1975年生,教授,博士生导师,研究方向为电动汽车与能源互联网智能互动、人工智能在电力系统中的应用等。

E-mail:chenzhong_seu@163.com(通信作者)

万玲玲 女,2000年生,硕士研究生,研究方向为电动汽车与能源互联网智能互动。

E-mail:seu_ee_wll@163.com

(编辑 赫 蕾)