论文3

基于分层式全局优化的插电式燃料电池混合动力汽车实时
互联网分布式能源管理策略
待解决：1.百度地图 api 是否能替代实车测试中的先导车
2.表的 cycle 是什么
摘要(待补充)
随着全球环境污染和能源短缺问题的不断升温，新能源汽车
提出了一种用于插电式燃料电池混合电动汽车（PHEV）的互联网分布式能源管理策略（ID-
EMS），以此实时减少和优化全球能源消耗和电池损耗问题。 ID-EMS 利用云计算构建分层结构
EMS，其顶层结构在云服务器上搜索全局优化的电池充电状态（SOC），以指导底层的机载模糊控
制器。从理论上分析顶层随机动态规划（SDP）算法的计算复杂性，给出了实时算法的发展过程。
此外，还介绍了一个互联网分布式车辆在环（ID-VIL）的仿真平台，通过道路驾驶试验来评估所提
出的 ID-EMS 的实时性能。还测试了一些极端条件，如重计算负载和网络故障。实验结果表明
ID-EMS 可以处理极端条件并实时逼近全局优化解。
关键词：插电式燃料电池混合动力汽车、互联网分布式能源管理策略、云计算、实时性能分析、
车在环仿真
1. 绪论
1.1 研究背景
当下，环境污染和能源短缺是全世界所面临的最迫切的问题之一，化石能源供应量（含煤电和
气电等二次化石能源）“意外”大幅下降给经济运行、企业生产和民众生活带来的严重“震荡”，
以及化石能源价格暴涨导致一些企业成本高企而陷入困境甚至破产的局面。而全球汽车保有量正持
续上涨，因此导致能源消耗和原油供给之间的矛盾日益突出。2022 年起,世界油气市场处于供需紧
平衡状态,能源价格延续着此前的上涨趋势。不断升温的俄乌冲突局势导致原本就处在供需紧平衡
中的能源市场供给再度趋紧[1]。根据国际相关统计数据得知，目前全球交通用油比例高达百分之六
十二以上，将会导致在不久后出现石油严重短缺问题[2]。因此，为减少并解决环境污染和能源紧缺
问题，新能源汽车应运而生。在面对能源危机的压力下，各国接踵实施相关政策鼓励发展新能源汽
车，我国也陆续出台了多项战略方针，把新能源汽车列为现阶段重点发展产业之一。
在新能源汽车车型里，PHEV 兼备纯电动汽车（ElectricVehicles，EV）和传统 HEV 的优势。相
对纯电动汽车，其具有传统燃油和动力电池叠加的续航能力，能够更好的满足用户较远距离的驾驶
需求；与 HEV 相比，其电池容量更大，并且可以通过廉价电网对电池进行电量补充，最大限度的
降低燃油消耗，因此得到了企业、汽车科研机构以及政府的大力支持[3]。
插电式混合动力汽车（PHEV）具有外部充电插头和比传统混合动力汽车（HEV）更大的电气
部件（即动力电池），因此应该使用更多的电力而不是进行燃油消耗。为此，应在汽车总行程结束
时将电池耗尽至最低允许水平，这对能量管理策略（EMS）提出了更高的要求。此外，PHEV 电源
的维护和更换成本较高，已经阻碍了其应用。这意味着能源经济性和电池健康状态（SOH）的平衡
应同等重视。因此，PHEV 的 EMS 应具有强大的功能以满足各种目标，并且能灵活调整以适应变
化的行驶条件。换言之，应该利用 EMS 结合不同的控制算法来优化多目标（如节能、减排和电池
寿命保护）的动力传动系统操作。
1.2 PHEV 研究现状
1.2.1 PHEV 发展历史及现状
混动汽车兴起于美国第二次石油危机，丰田是较早踏足混动汽车领域的企业之一，美国、日本、
德国等国家对于 PHEV 的研究较早，技术也较为成熟。1900 年，费迪南德-保时捷设计了 Lohner-
Porsche Mixte【10】，该车使用电动机为车轮提供动力，并使用内燃机进行发电。20 世纪 70 年代，
美国能源部开始资助 PHEVs 的研究，作为其减少对外国石油依赖的努力的一部分。2007 年正式展
出插电式混合动力汽车的雪佛兰 Volt，于 2010 年起开始在市场推广，其零百加速约 9.2 s，油耗约
为４ L/100 km 【4】。之后福特 C-emergi，凯迪拉克 CT6 等 PHEV 车型相继研发成功，开始逐步占
领全球市场。同期丰田旗下最典型的一款 PHEV 车型普锐斯（Prius）也正式上市。【5】PHEV 汽
车产品的不断发展迭代的背后是电池、电机、发动机等一些相关核心部件的技术进步以及配套充电
设施的不断完善。三菱欧蓝德 PHEV 是另一款流行的 PHEV。这款 SUV 拥有一个 13.8 千瓦时的锂

离子电池组和两个电机，每个车轴上各有一个。电池可提供长达 24 英里的纯电动续航里程，后续
里程内燃机接管。该车的系统总输出功率为 221 马力，从 0 到 60 英里/小时只需 7.6 秒。【11】供应
PHEV 产品的中国自主品牌供应商主要有比亚迪、吉利、长城、长安、奇瑞、广汽 Aion、传祺等，
价格多集中在 15-20 万元，主打高性价比，节能高效是主要卖点。供应插电混动车型产品的中国合
资品牌供应商主要有上汽大众、上汽通用、广汽本田等，除了一汽奥迪等高端车型以外，多集中在
15-25 万元区间。外资品牌在混动技术路线上存在一定的分歧，部分车企选择纯电路线为核心路线，
加快对旗下燃油和混动车型的替换，其余车型则是兼顾纯电和混动路线，部分日系车企将混动视为
中短期核心路线。目前，PHEV 仍在加速发展，关于 PHEV 的研究和开发主要集中在改进电池技术
增加续航里程和降低成本几个方面上。
1.2.2 PHEV 结构分类及特点
根据混合度（驱动电机功率占整车功率比例）可以将 PHEV 分为混合度小于等于 5%的微混、
混合度 20%左右的轻混、混合度 30%-40%的中混以及混合度大于 40%的重混【6】。混合度越大电
机功率越大，电池电能也越大，但是耗油量越少。PHEV 系统架构由电机、电控、逆变器、直流斩
波器、电池、油箱、充电器等部分构成，按照发动机的耦合方式和驱动系统的结构不同可以分为串
联式、并联式和混联式三种形式。
(1) 串联式插电混合动力构型
串联式 PHEV 的结构如图 1 所示[7]。串联式 PHEV 具有如下特点[8]：1）汽车由动力电池提供
驱动力，当动力电池的能量不足时，发动机带动发电机发电，发电机将电能输送给电动机，电动机
直接驱动汽车。2）类似于普通串联式油电混合动力汽车，发电与车轮之间没有机械连接，发动机
可一直工作在最佳工况点附近，避免了发动机的怠速和低速运转工况，提高了发动机的效率，减少
了废气排放。增程式电动汽车（EREV）的工作原理与串联式 PHEV 非常类似，但两者是有本质区
别的。串联式 PHEV 是由普通油电混合动力汽车派生出来的，具有普通油电混合动力汽车的大部分
特点，只是将功率型电池更换为比容量更大的能量型电池，使动力电池有足够的能量，保证汽车在
纯电动模式下的行驶里程更长。增程式电动汽车是由纯电动汽车派生出来的，由于汽车增加了增程
器，所以称为增程式电动汽车。所谓的增程器，就是一台小型发动机，用于发电，以提高纯电动汽
车的续驶里程，避免频繁地停车充电。当动力电池的能量充足时，汽车进入纯电动模式，由电动机
驱动汽车行驶；当动力电池所储存电量无法满足纯电动工况时，增程器（发动机）起动，通过发电
机对动力电池充电，在汽车依然由电动机驱动的前提下增加续驶里程[9]。
发电机逆变器蓄电池
发动机
电动机
减速器机械连接
电连接
功率输出
车轮
图 1 串联式 PHEV 结构
(2) 并联式插电混合动力构型
并联式 PHEV 的结构如图 2 所示。其特点类似于并联式普通油电混合动力汽车。发动机和电动
机相互独立，既可以采用电动机单独驱动汽车，实现纯电动行驶，又可以采用发动机单独驱动汽车
行驶，在功率需求较大时可以由发动机和电动机联合驱动汽车行驶。发动机和变速器通过耦合器进
行机械连接，发动机所提供的动力和由动力电池-电动机所提供的动力在原驱动系统的某一处会合
[4]。
逆变器蓄电池
发动机耦合器电动机
机械连接
减速器
电连接
功率输出
车轮
图 2 并联式 PHEV 结构
(3) 混联式插电混合动力构型
如图 3 所示混联式插电混合动力构型主要由发动机、动力耦合装置、驱动电机、逆变器、动力
电池、发电机等部分组成。混联式混合动力汽车综合了串联式与并联式两种驱动形式的优点，其三
个动力源之间具有更多的动力匹配方式，车辆具有多种工作模式，从而保证了混合动力系统在复杂
工况下仍能实现最佳动力匹配，进而达到最大限度节能减排的目的。是当前研究的热点构型。混合
发电机逆变器蓄电池
发动机行星齿轮电动机
机械连接
电连接
电动机功率输出
减速器
车轮
结构是发动机与电机可以在串联和并联两种模式之间去转换，在速度低的时候主要是电机工作，在
加速时转换为串联模式，与发动机共同工作，动力的性能比较好，但是架构较为复杂，并且成本比
串联和并联昂贵。
图 3 混联式 PHEV 结构
1.3 EMS 研究现状
1.3.1 能量管理概述与分类
混合动力汽车的能量管理策略是一种确定如何在发动机和电动机之间最佳地分配功率需求以及
如何控制电池的充放电的方法，以便在保持车辆性能的同时最大限度地减少燃料消耗和排放[12]。
在过去十年左右的时间里，人们发表了大量以能量管理技术为主题的研究.如图 4 所示，文中将这些
方法分为三种类型：基于规则、基于优化、以及基于学习的方法.需要强调的是，由于各类方法存
在各自的优缺点，可以通过不同方法之间的协同工作实现更好的控制效果，因此各类方法之间并不
是完全独立。【13】PHEV 的 EMS 可分为两大类：基于规则的 EMS 和基于优化的 EMS。
图 4 能量管理技术分类
1.3.2 基于规则的能量管理策略
基于规则的能源管理策略使用预定义的规则或逻辑，根据某些输入或条件确定系统的最佳运行
模式或功率分配。【14】通常用于混合动力汽车传动系统，其中的规则可以基于电池的充电状态、
基于规基于参恒温器、功率跟随、
数标定的策略有限状态机
基于规则确定性策略
基于频率解耦低通滤波器、小波变
的策略换
确定性动态规划
DP （DDP）、随机动态
规划（SDP）
离线优化
PMP PMP
基于优化
遗传算法(GA)、粒子
启发式搜索群优化（PSO）、模
拟退火（SA）
博弈论（GT）、二次
其他
规划（QP）
能量管理策略
传统EMS、自适应
ECMS
EMS、预测EMS
在线优化
确定性MPS、自适应
MPC
MPC、随机MPC
鲁棒控制、时域拟谱
其他法（PSTD）、滑模控
制
分类监督学习
基于学习监督学习
回归监督学习
非监督学习聚类
Q-learning、Dyna、
经典强化学习
Sarsa
强化学习
深度强化学习 DQL、DDPG、TD3
车速、道路坡度等因素。基于规则的能源管理策略具有简单、易于实施和快速计算的优点[19]。
基于规则的控制策略包括基于确定性规则的方法和基于模糊逻辑规则的方法[21]。基于确定性
规则的控制器在实际操作前已经定义了一套规则，状态机被作为一种可行的方法提出来实现它。这
种控制方法已经成功应用于丰田普锐斯和本田 Insight[21]。基于规则的控制由有限状态机实现，它
有八个状态，根据事件触发的规则在可能的驾驶情况中切换，这些规则取决于刹车和加速踏板的角
度、电池的充电状态（SOC）和扭矩的要求，这种控制方法已经在 FT-SIM 的模拟中得到验证，但
难以评估潜在的改进[22]。参考文献中提出了一种新型的基于规则的 PHEVs 控制策略，其重点是所
有电动范围和充电耗尽范围的操作。[23]，并通过模拟乘用车在 FTP75 驾驶周期中的行驶情况进行
了验证。文献[24]中提出了一种基于发动机开关规则的控制策略，考虑了加速踏板的位置。但作者
仍然没有讨论节油的努力和潜力。ADVIOSOR 软件改进了一个启发式解决方案，该启发式控制的
结果与普锐斯控制策略进行了比较，比较结果表明，PHEV 的汽油里程比普锐斯控制策略增加了
16%[25]。Jalil 等人提出了一种基于规则的策略，以确定串联式混合动力电动汽车的电池和发动机
之间的功率分配，这种 "恒温器 "策略使燃油经济性在城市循环中提高了 11%，在高速循环中提高
了 6%[26]。然而，所有这些传统的基于确定性规则的控制器很难实现优化操作。在基于模糊逻辑
规则的控制器中，需要根据动力系统的一些 "专家 "知识来建立模糊规则，这需要很长的开发周期
[27]。一个自适应的模糊逻辑控制器选择对燃油经济性影响最小的操作点，关键参数根据驾驶周期
的变化而演变，正如文献所实现的那样。然而，当动力系统有两个或更多的控制变量时，开发适当
的自适应模糊规则是非常困难的[28], [29]。一般来说，PHEV 在基于规则的控制策略下有三种工作
模式，即电动车（EV）模式、充电耗尽（CD）模式和充电维持（CS）模式[20]。在基于规则的控
制中，具有适当控制参数的 EV + CD + CS 控制模式产生的油耗最低。[20]这已被证明不能保证
PHEV 能量消耗的最佳性[30]。因此，基于优化的 EMS 在 PHEV 的应用中更为常见。
1.3.3 基于优化的能量管理策略
基于优化的 EMS 包含两个子类型：局部优化 EMS 和全局优化 EMS。前者侧重于在实时环境中
寻找局部最优解。它包括等效消耗最小化策略（ECMS）[13]、模型预测控制（MPC）策略[14]和神
经网络（NN）策略[15]。相反，后者在整个行程中全局优化动力传动系统操作，这通常需要事先了
解行程[16]。它包括动态规划（DP）策略[17]、遗传算法（GA）策略[18]和博弈论（GT）策略
[19]。然而，前者牺牲了实时性的最优性，后者牺牲了实时性的最优性。这两种算法都不能单独实
现全局实时优化。从计算机的层次结构出发，一个新兴的研究趋势是将不同的 EMS 结合起来形成
一个多层（通常是两层）结构，其顶层侧重于全局优化。同时底层在顶层的引导下，优化了实时控
制。这种分层 EMS 的研究趋势可以分为两个分支。一个分支将顶层设置为脱机工作，这样可以避
免实时性问题。例如，[20]使用离线 DP 训练基于 EMS 的自适应神经模糊推理系统（ANFIS）。在
[21]中，部署了离线 DP 和 Pontryagin 最小原则（PMP）来训练基于神经网络的 EMS。在文献[22]中，
离线构造神经网络来预测模糊 PMP 协同 EMS 的未来条件。在文献[23]中，贝叶斯优化（BO）用于
离线调整基于广义最小残差（GMRES）的 EMS 的参数。分层 EMS 的另一个分支在线执行所有层。
例如，在[24]中，顶层强化学习（RL）搜索全局优化，而底层树搜索算法在短期窗口内优化动力系
统。在[25]中，管理层的马尔可夫转移概率表（TPM）在决策层预测模型预测控制（MPC）-DP 协
同 EMS 的车速。在[26]中，顶层的 PMP 计划底层 DP 的最佳电池荷电状态（SOC），以找到最佳功
率分配比。在[27]中，经济层中的二次规划为控制层中的 MPC 控制器获得参考 SOC，以优化燃油
经济性。在[28]中，移动边缘计算单元（MECU）中的 DP 为车载控制单元中的 MPC 算法提供参考
控制策略和 SOC 轨迹。在[29]中，云级别的 DP 支持车辆级别的 MPC（参考电流和 SOC），同时
MPC 将实时功率需求反馈给 DP。在[30]中，云层中的 DP 每六十秒执行一次，以向车辆中基于规则
的控制器提供参考功率曲线。在应用中，分层 EMS 通常与云计算（包括[28]、[29]、[30]）协同工
作，因此云服务器的计算能力可以缓解全局最优性与实时性之间的冲突。然而，它并不能保证分层
EMS 的实时性。总之，对优化性能的要求促使新兴的 EMS 变得越来越复杂，这与控制车辆动力传
动系统的实时性要求相冲突。据笔者所知，在理论上还没有对 EMS 的计算复杂性进行分析，更不
用说在道路驾驶测试中了。本研究提出一种两层网际网路分散式电能管理系统（ID-EMS），用以
实时地整体优化电源的能源消耗和使用寿命。分析了算法的计算复杂度，评估了最坏情况下的计算
时间，从理论上验证了算法的实时性。因此，部署了一个互联网分布式车辆在环（ ID-VIL）仿真系
统[31]，以通过道路驾驶测试验证所提出的 ID-EMS 的实时能力。在 ID-VIL 系统中，多个地理上分
离的硬件在环（HIL）子系统通过网络连接起来，以模拟 PHEV 的动态特性并记录控制回路中的时
延。
(资料来源：译文)
1.3.4 基于机器学习的能量管理策略
机器学习是人工智能的一个子领域，它研究的是能够从数据中学习并随着时间的推移提高其性
能的算法的发展和实施。在大数据、人工智能和计算机技术的背景下，机器学习（ML）已被广泛
应用于能源管理问题，为克服传统方法的局限性提供了新的研究方向。与基于规则和基于优化的能
源管理策略相比，基于学习的能源管理策略（LB-EMS）不依赖于设计者的 "专家知识 "来制定控
制规则，也不依赖于被控对象的数字模型来计算最佳控制行动。相反，它依靠先进的数据挖掘方法
和大量的历史/实时经验数据来获得预测结果或控制策略。机器学习算法可分为三种主要类型：监
督学习、无监督学习和强化学习。
（1）监督学习
监督学习将预先定义的特征数据和目标数据作为数据集来训练一个最优控制模型，目的是赋予
模型一定预测和分类识别能力。因此，监督式学习可以进一步分为回归监督式学习和分类监督式学
习。回归监督学习通常被纳入基于 MPC 的控制框架中，以实现对车辆速度、发动机扭矩和动力电
池功率等信息的预测。SUN 等人[57]评估了基于广义指数变化、马尔科夫链和神经网络的预测器。
结果表明，神经网络预测器在一系列验证和实际驾驶周期中提供了最佳的整体性能。其中，径向基
函数神经网络的性能优于递归神经网络和反向传播神经网络，后者对时间序列问题很有效。分类监
督学习通常被用于驾驶模式、车辆运行模式和驾驶条件类型的分类和识别，目的是协助实现自适应
能源管理控制。例如，Wu 等人[58]提出了一种基于驾驶条件识别的模糊控制策略。驾驶工况识别
模型根据车辆行驶参数识别出当前的驾驶周期，并将识别结果传递给模糊扭矩分布模型。同时基于
PSO 方法对不同驾驶周期下的模糊控制器的成员函数和模糊规则进行了优化，以提高燃油经济性。
（2）无监督学习
与监督学习相比，无监督学习的主要功能是在探索性数据分析阶段发现隐藏的模式或对数据进
行分组。在车辆能源管理领域，无监督学习主要用于驾驶循环或数据降维的分类，以协助开发高效
的控制策略。例如，GRELLE 等[59]使用了 c-均值聚类方法，将包含标准驾驶循环中最佳混合度以
及车辆状态向量（如车速、电池 SOC、催化剂温度和 ICE 温度）的数据库中的元素进行分组。
MONTAZERI 等[60]基于聚类算法进行了实际交通条件下的驾驶循环数据采集，实现了驾驶特征识
别和驾驶循环分类，以提高能源管理策略的效率。FINESO 等[61]基于聚类算法开发了一种无监督
机器学习技术，用于识别基于规则的最优策略。VENDITTI 等[62]使用了类似的方法，提取了并联
HEV 的控制策略。
（3）强化学习
强化学习是机器学习中的一个领域，强调如何基于环境而行动，以取得最大化的预期利益 ¹。
强化学习的主要特点是学习者可以通过与环境的交互，不断地试错和反馈，来更新自己的知识和策
略。强化学习的核心概念包括：状态、动作、奖励、策略、值函数、贝尔曼方程等。与其他方法最
大的差异在于，强化学习可以实现无模型的策略寻优.因此，这类方法不会像优化型算法那样高度
依赖数字化模型的建模精度.此外，收敛后的强化学习模型可以直接根据状态到动作的最优映射关
系完成能量管理，避免了基于数字化模型的在线计算，因此具有巨大的在线应用潜力[63].由于上述
原因，强化学习成为了近些年能量管理领域的研究热点
在论文[31]中，该论文提出了一种混合学习方法，HyLEAR，它结合了深度强化学习和规划，
用于部分可观察环境中的自动驾驶汽车。HyLEAR 由两个模块组成：一个深度神经网络，从原始传
感器数据中学习价值函数和策略；一个蒙特卡洛树形搜索算法，使用所学的价值函数和策略来规划
最佳行动。HyLEAR 可以处理具有动态障碍物和不确定性的复杂场景，并以高效率和稳健性实现无
碰撞导航。论文[32]比较了四种用于混合动力电动汽车（HEVs）能量管理的深度强化学习（DRL）
算法，即 DQN、DDQN、DDPG 和 TD3。本文评估了这些算法在不同驾驶周期和不同车辆模型上
的性能，并分析了它们的可转移性和稳健性。该论文认为，TD3 在油耗和电池充电状态方面优于其
他算法，而且基于 DRL 的策略比基于规则的策略能取得更好的效果。在基于 DRL 的方法中，EMS
问题被建模为一个马尔可夫决策过程。目前的研究主要集中在基于深度强化学习（DRL）的 EMS
上，因为它们具有很强的学习能力。[33]使用 deep-Q-learning network（DQN）算法进行能源管理，
解决了维数灾难问题。在此基础上，[34]比较了 double-deep-Q-learning 与 DQN 在插电式混合动力
汽车能量管理方面的作用，证明了前者在收敛性和燃油经济性方面的优势。[35]表明，基于深度确
定性政策梯度（DDPG）算法的能源管理政策具有很强的深度神经网络的表征能力，可以显著提高
燃油经济性。此外，[36]表明，同步优势行为者批评（A3C）和分布式最优策略优化（DPPO）提高
了 EMS 的学习效率。
1.4 研究内容与方向
2.PHEV 的 ID-VIL 配置（待补充，参考论文）
2.1ID-VIL 概述
如图 5，ID-VIL 模拟可以看作是一个分布式服务器-客户机系统，其中云服务器连接不同的
子系统（包括 VIL、FIL 和 BIL）。它们耦合在一起以模拟 PHEV 的行驶。因此，云服务器负责
仿真对象实车在环仿真
燃料电池在环电池在环（BIL）
（FIL）云服务器
电池 EMS 燃料电池电子负荷

电子负荷互联网分布通信时序
式电池管理控制
功率转换
其他HEV子系
器
统软件仿真
电池包
燃料电池
驱动电机
电车控制驾驶员输
电机
器入信号
车轮
实车在环（VIL-EV)
运行 EMS（仅针对建议的 ID-EMS 的全局优化部分）、通信控制以及其他子系统（包括逆变器
和驱动电机）的软仿真。其余子系统（X-in-The-loop）接收来自云的命令（例如，电源需求），
并在硬件在环系统上执行。之后，将实际响应（例如，可用功率）发送回云。
图 5 ID-VIL 仿真示意图
2.2 ID-VIL 的网络配置
图 6 ID-VIL 仿真拓扑图
驾驶员车联网逆变器燃料电池
互联网
ECU、电机电池
云服务器
如图 6 所示，云是中心节点。由于道路驾驶测试的要求，VIL 子系统通过无线 IOV 连接（4G
LTE 网络）连接到云。同时，由于传输延迟和可靠性的问题，有线互联网链接了其余的子系统。更
多关于 ID-VIL 安排的细节在补充材料中介绍，其中讨论了减轻传输延迟影响的方法。
图 7 ID-VIL 仿真的地位位置分布
图 7 说明了整个分布式系统的地理分布。具体来说，（1）VIL 位于重庆理工大学华西校区周边
的红光路，用于道路驾驶测试。(2) 云是由中国电信租用的，位于他们的 IDC 机房。 (3) FIL 是由重
庆长安新能源汽车技术公司提供的，位于他们的技术研发中心。(4) BIL 位于重庆理工大学华西校
区的电力电子实验室内。每个子系统的配置概要见表 1。
表 1 在 ID-VIL 中配置子系统
子系统详细配置主要参数
测试车辆实车在环仿真车辆质量：1.5t
（VIL）
EMS 软仿真互联网分布式 EMS
（云端）
逆变器和软仿真异步电动机
驱动电机（云端）额定功率：20kW
燃料电池燃料电池在 PEM，额定功率：30kW
环仿真（FIL）额定电压：168 V
电池电池在环额定电压：3.2V×56，
仿真额定容量：50Ah
2.3 实车在环子系统
CAN-USB
转换器 4G LTE USB无
线调制解调器
车载数据
采集装置
电动汽车
（力帆 620EV）
图 8 实车在环配置
如图 8 所示，VIL 基于纯电动汽车（力帆 620EV），其配置如表 2 所示.驾驶员的输入（θacc 和
θbrk）在以下公式中转换为所需的驱动功率：
Pev =ωmot × min(T mot_MAX ， P mot_MAX / ω mot )× θacc

req
其中 Tmot_MAX（200 Nm）和 Pmot_MAX 是在 Cloud 上模拟的驱动电机的参数，而不是物理安装在
VIL 上的驱动电机。这种安排的原因在补充条款的 S2 节
2.4 云服务器
云服务器是从当地中国电信租用的（CPU：Xeon，四核；2.13 GHz；内存：8 GB RAM；带宽：
5 Mb）。它的主要功能包括：（1）能源管理策略，（2）通信控制，以及（3）子系统软件模拟
（在本研究中，它是驱动电机）。第一个功能（能源管理策略）将在第 3 节描述。[31]中的研究讨
论了第二个功能（通信控制）。电动汽车（力帆 620EV）车载数据采集单元 4G LTE USB 无线调制
解调器 CAN to USB 连接器 6 最后一个功能（子系统软件模拟）将在补充材料的第 S2 节中说明。
2.5 动力源的 SOH 估算
这辆 PHEV 有两个动力源：一个燃料电池组和一个电池组，它们的退化率可能会受到 EMS 行
动的影响。因此，在拟议的 ID-EMS 中，它们的 SOH 被视为优化对象之一。在补充材料中，可以
找到评估动力源 SOH 的方法。
2.5.1 PEM 燃料电池的 SOH (FIL)
图 9 用于 FIL 的 30KW PEM 燃料电池测试台
30kw PEM
燃料电池
控制台
在图 9 中，一个 30 千瓦的 PEM（质子交换膜）燃料电池测试台被配置为 FIL 子系统。FIL 从云
端接收功率需求（Pfc_req），并将可用功率（Pfc_avl）、瞬时燃料消耗（Fuel）和堆栈的
SOH（SOHfc）发送回来。Pfc_avl 和 Fuel 由物理量传感器测量，但 SOHfc 的变化太小，无法在实
时应用中检测到，因此需要一个预定义的模型来计算 ΔSOHfc，这将在补充材料的第 S3 部分讨论。
表 2 PEM 燃料电池堆参数
名称参数
燃料电池数量 240
参考电流 107A
参考电压（BOL） 168V
开路电压 295.2V
空闲电流 10.2A
该燃料电池堆的参数列于表 2。该电池堆由 240 个信号燃料电池组成。每个电池的开路电压为
1.23V。根据国家标准 GB/T 38914-2020[33]，参考电流（Iref）被定义为当信号燃料电池的终端电压
为 0.70V（电池堆：0.7×240=168V），在电池堆第一次被激活后的恒定负荷下的电流。换句话说，
电池堆处于生命之初（BOL）。以同样的方式，空闲电流对应于 0.65V。
图 10 燃料电池的燃料消耗量
在环境温度为 20℃的恒定功率条件下，评估了电池堆的燃料消耗率，如图 6 所示。当燃料电
池老化时，其参考电压（Vref），即 Iref 恒定电流工作条件下的堆栈终端电压，将线性下降[34]。
此外，在 GB/T 38914-2020[33]中，燃料电池堆的寿命被定义为当 Vref 从其 BOL 水平下降 20%时，
堆达到其寿命终点（EOL）。因此，燃料电池的 SOH（SOHfc）定义如下：
其中 VBOL 是燃料电池处于 BOL 时的参考电压，Vref 是燃料电池目前的参考电压。

图 11 不同工况下的∆ SO H fc
其中 VBOL 为燃料电池处于 BOL 时的参考电压，Vref 为燃料电池目前的参考电压。GB/T
38914-2020[33]也提供了定量评价燃料电池退化过程的实验方法。首先，应考虑启动-停止工作条件
对 SOHfc[35]的影响。其次，可以通过从整体结果中扣除启动-停止的影响来测量某些恒定功率条件
下的降解率。最后，在图 7 中得到了不同输出功率下的燃料电池降解率 ΔSOHfc 的曲线图。ΔSOHfc
的重复实验的细节在补充材料的 S3 节中介绍。基于 ΔSOHfc 的地图，燃料电池堆的降解可以被视
为以下能源管理的最佳对象之一。
2.5.2 LiFePO4 电池的 SOH (BIL)
电池
电池测试仪
温度控制箱
电子负载
图 12 BIL 电池测试台
当设置 BIL 时，假设电池组中的电池单元在 SOC 和 SOH 方面都是相等的。表 1 中的电池组包
含 56 个电池单元，而图 12 中的 BIL 只有一个电池单元。因此，假设功率在电池之间均匀分布，
BIL 的输出功率被设定为整个电池组输出功率的五十六分之一。电池单元的配置可以在表 3 中找到。
此外，如图 8 所示，电池单元位于一个可控的温度箱中（25℃），以减少温度对电池 SOC 和 SOH

的影响。一般来说，BIL 从云端接收电力需求（Pbat_req），并将可用电力（Pbat_avl）、电池
SOC（SOCbat）和 SOH（SOHbat）发送回来。图 8 中的电子负载测量 Pbat_avl。SOCbat 是根据安
培小时法估计的。在短时间的实验中，测量 SOHbat 的微小变化是不可行的。因此，与燃料电池类
似，建立一个预定义的 SOHbat 模型来解决这个问题。
表 3 电池参数
名称参数
类型 LiFePO4
额定电压 3.2V
额定容量 50Ah
欧姆电阻 1.21mΩ
电池的容量衰减过程与欧姆电阻的增量呈线性关系[36]。此外，当电池达到寿命终点（EOL）
时，电池容量下降到寿命起点（BOL）水平的 80%，并且欧姆电阻增加一倍。所有这些导致了
SOHbat 的定义如下：
REOL −Rohm
SO H bat = ×100 %
RBOL
具备以下电池的 EOL 标准：
{ R EOL=2 × R BOL
C EOL=0.8 ×C BOL
以下是电池的 EOL 标准：其中 Rohm 是电池目前的欧姆电阻，RBOL/REOL 是寿命开始/结束
时的欧姆电阻（1.21 mΩ/2.42 mΩ），CBOL/CEOL 是寿命开始/结束时的容量（50 Ah/40 Ah）。如
果电池在充电/放电活动后静止一段时间（≥10 分钟），其极化电阻将下降到接近 0，这意味着欧姆
电阻（Rohm）等同于内阻（Rin）[37]。因为图 8 中的电池测试仪可以直接测量 Rin，所以也可以得
到公式（3）中的 SOHbat。由于能源管理的要求，将构建一个电池 SOH 模型。与图 7 中的燃料电
池 SOH 不同，ΔSOHfc 只与其输出功率（Pfc）有关，而电池的输出功率（Pbat）和 SOCbat 都会影
响其 ΔSOHbat [37]。因此，电池 SOH 的模型是一个二维轮廓图，Pbat 在 y 轴上，SOCbat 在 x 轴上。
此外，ΔSOHbat 实验的基本思路与 ΔSOHfc 的实验相似。也就是说，在一个给定的条件（Pbat 和
SOCbat）下工作引起的内阻变化（ΔRin）被用来计算相应的 ΔSOHbat，公式（3）。ΔSOHbat 的重
复降解实验的细节在补充材料的 S4 部分介绍。
图 13 不同工况 Δ SO H bat
通过在不同的工作条件（Pbat 和 SOCbat）下反复进行降解实验，在图 13 中建立了 ΔSOHbat 的
二维轮廓图。它是提议的 EMS 的最佳对象之一。因为当电池老化时，退化率可能会发生变化[38]，
在实际应用中，需要在不同的 SOHbat 状态下校准一系列 ΔSOHbat 的等高线图（图 9 是其中之一），
从 100%到 0%。然而，考虑到 SOHbat 的缓慢变化率，我们假设在本文的实验中，SOHbat 不会从图
13 标定的状态中下降很远。
3.全局最优 EMS 算法
3.1 简介
典型的全局优化算法，如随机动态规划（SDP），不能满足汽车动力传动系统控制的实时
性要求。因此，本文提出了一种分层结构，底层 EMS 上的模糊控制器在基于 SDP 的顶层 EMS
的指导下负责实时控制。然而，顶层 EMS 的实时性依然无法得到保证。SDP 算法需要在松散
但仍然存在的时间限制内执行，因此需要分析其计算复杂度来评估计算时间。
3.2 ID-EMS 的双层结构
行车数据记
云端EMS 行车预测
录仪
与其他系统
全局优化
的交互 IOV
实时优化
车载EMS
图 14 ID-EMS 两层结构
图 14 中 ID-EMS 的两层结构受到了计算机分层结构的启发。一方面，云上的顶层 EMS 专注于
全局优化和相关任务（例如，预测未来的驾驶条件）。另一方面，底层的车载 EMS 收集实时的车
辆状态（电池 SOC 和最近的平均车辆能耗）并实时找到本地优化的能源管理。

实车道路测试
前导车实时行驶
工况数据
离线部分在线部分
SDP算法
顶层使用聚类数据
得到6种典型行训练完成的神经预测未来行驶工（针对能耗与电
历史行驶数据使用EM算法分类训练神经网络
（云端）驶工况网络况池衰减的全局能
（NN）
量管理）
指导SOC
电池SOC ID-VIL中的PHEV
底层底层模糊控制器需求充电功率动力总成
汽车最近的平均（测试车辆）
（车载端）能耗
图 15 ID-EMS 流程图
如图所示：本文 ID-EMS 流程为：
1. EM 算法将历史驾驶数据分为 6 组典型条件。
2.使用聚类数据训练 RBF 神经网络（NN）。
3.经过训练的神经网络使用来自领先车辆的实时驾驶数据来预测测试车辆的未来驾驶条件。
4.基于预测信息，采用 SDP 算法获得针对能耗和电池衰减的全局优化能量管理。
5.分析了 SDP 算法的计算复杂度，以估计其计算时间。
6.使用来自云服务器的全局解决方案（参考 SOC）作为参考，车载模糊控制器尝试实时局部优
化充电活动。另外，（1）和（2）是在云上离线计算的。（3）和（4）在云上以在线模式（实
时）执行。车载嵌入式处理器仅执行（6）。
3.3 历史行驶数据处理（离线）。
3.3.1 历史行驶数据（云端）
图 16 道路测试的形式路线
在这项研究中，假设车辆在预定的路线上运行。现实生活中的类似场景包括通勤交通和公共交
通。图 12 中的预定义路线是围绕重庆理工大学花溪校区的。这条路线由四条道路组成，其中只有
一条（内环高速）是高速公路状况，其他都是城市状况。此外，图 12 中的路线根据地理特征（如
红绿灯和交叉路口）被分为 15 段（称为微行程片段[39]），这可以方便下面的数据处理。蓝点是预
定义的点，用于触发 3.3.2 节中顶层 EMS 的计算。

速度（km/h)
时间（s)
速度（km/h)
距离（km)
图 17 采集的历史行驶数据
驾驶数据是在 17:00 至 19:00（典型的高峰期）采集的，届时将进行公路驾驶测试。此外，在记
录驾驶数据时，除非出现危险情况，驾驶员应尽可能地跟随交通流，这样可以大大消除司机的驾驶
习惯对实验数据的影响。图 13 显示了一个记录的历史驾驶数据的样本（接近 14 公里长，持续半小
时）。在空间域中呈现的驾驶数据比在时间域中显示出更多的可重复性[40]。因此，在 EM 聚类分
析的预处理中，驾驶数据在空间域中被处理为 15 段。
3.3.2EM 聚类分析（云端）
表 3 用于行驶数据聚类的特征参数
# 特征参数单位
1 平均速度 (km/h）
2 平均加速度 (m/s2)
3 平均减速度 (m/s2)
4 怠速停车比例 (%)
5 0-20km/h 速度比例 (%)
6 20-40km/h 速度比例 (%)
7 40-60km/h 速度比例 (%)
8 >60km/h 速度比例 (%)
9 平均油门踏板位置 (%)
10 平均能耗 (%)
(kJ/km)
在[41]中，有一些特征参数和驾驶周期行为有较强的关联性。因此，在数据预处理过程中，表
3 中的这些特征都是从微行程片段数据中提取的。平均能耗（#10）是基于公式（1）中的车辆驾驶
功率 Pev，它是指推动车辆前进的机械功率。因此，它自然独立于 EMS 的控制，只受驾驶员的输入
（θacc）的影响。因此，如果司机被指示尽可能地跟随交通流，这个平均能量消耗可以被视为主要
受交通流状况影响的变量
表 4 子工况描述
类型典型特征
1 交通顺畅，中速
2 高速公路，高速
3 进入高速公路中速以上，加速
4 高速公路外，中速以上，减速
5 轻微交通堵塞，中速行驶
6 交通堵塞，低速
然后，一个 EM 算法将微行程片段数据聚类为表 4 所列的 6 种驾驶条件。这种 EM 算法[42]是
一种迭代方法，用于最大化包含潜在变量的统计模型中的参数的后验估计。也就是说，EM 迭代在
计算两个步骤之间交替进行。期望步骤（E-step）使用当前统计参数的估计值来评估潜变量的对数
可能性的期望值。最大化步骤（M-step）通过最大化 E-step 中的对数似然的期望值来寻找统计参数

的新估计值。然后，在 M 步骤中估计的参数被用来确定下一个 E 步骤中潜变量的分布。在使用 EM
算法之前，应该建立一个高斯混合模型（GMM）[43]来表达样本数据（微旅行数据）。首先，
x=（x1，x2，...，xn）是 n 维样本空间 χ 中的一个随机向量。在现实中，它代表了表 5 中样本数据
的特征参数。如果 x 服从高斯分布，其 PDF 应该是
−1
1 2
¿¿
p( x )= n n
e
(2 π ) ∨Σ ¿ 2
2
其中 Σ 是 n×n 协方差矩阵，μ 是 n 维平均向量。其次，如果将样本数据聚为 k 组
（C={C1，C2，...，Ck}），代表表 6 中的驱动子条件，高斯混合分布可以定义如下：
k
p M (x)=∑ α i ⋅ p (x ∣ μ i , Σ i)
i =1
其中，αi（αi>0）是混合系数，代表一个样本属于 Ci 的先验概率，Σ𝑖=1𝑘 αi=1。此外，混合分
布 pM(x)包含 k 个混合成分，每个成分都服从 Gauss 分布的 Ci。
最后，让样本集 D={x1, x2,..., xm}代表图 13 中驾驶历史的样本数据，zj（j= 1, 2, ..., k）代表高斯混
合模型的每个成分。因此，xj 属于 Ci 的后验概率定义为属于集群 Ci 的后验概率定义为
现在，EM 算法可以描述如下：
α i ⋅ p(x j ∣ μi , Σ i )
γ ji = p M (z j =i∣ x j )= k
∑ α l ⋅ p( x j ∣ μ l , Σl )
l=1
(1）初始化：设置混合高斯分布的初始化参数{（αi, μi, Σi）|1 ≤ i ≤ k}；
迭代(2)和(3)，直到满足停止标准{
(2) E-步骤：计算每个混合物成分的后验概率 γji = pM(zj = i | xj) (1 ≤ i ≤ k)。
使用方程（7）；
(4) M-步骤：基于最大似然估计，计算下一个 Estep 的新参数，具体如下：
∑ γ ji
α = j =1
'
i
m
¿
m
∑ γ ji x j
' j=1
μ= i m
∑ γ ji
j=1
∑ γ ji ( x j−μ 'i)( x j −μ'i)T

Σ 'i= j=1 m
∑ γ ji
j=1
(4) 输出：迭代之后，每个样本 xj 都被聚类到获得最高后验概率的 Cλj 组中。
概率，即
λ j=arg max γ ji
i ∈{1,2 ,… ,k }
其中 λj 是样本 xj 的聚类标签。
然后，图 13 中的驾驶数据被聚类为 6 组典型的驾驶条件，如表 6 中所列。聚类后的数据将在
下一节用于训练 RBF 神经网络。此外，图 14 和图 15 显示了聚类数据的两组特征参数，即平均速度
和平均能量消耗。这两个参数将被用于全局优化过程中。
图 18 子工况平均速度概率分布图
图 19 子工况平均能耗概率分布图
3.3.3 训练用于预测的神经网络(NN)
本节使用聚类的驾驶数据来训练一个 RBF 人工神经网络[44]。这个网络可以对领先车辆的在线
驾驶状况。分类后的结果将被用作测试车辆的未来驾驶状况。将被用作测试车辆的未来驾驶条件，
这将在下一节中讨论。
N 输入 H神经元
K输出
图 20 具有 N 个输入元素、H 个隐藏神经元和 K 个输出元素的 RBF 神经网络
图 16 中的 RBF 神经网络是一个由三层组成的局部近似网络。首先，输入层中的神经元作为分
布点，由表 5 中的微行程片段数据的特征参数表示。其次，隐藏层使用类似高斯的径向基函数
（Rj（x））作为激活函数：
2
−∥ x−C j ∥
R j (x)=exp ⁡( 2
)( j=1,2 ,… , H )
2σ j
其中，x=（x1，x2，...，xN）是输入层的输入向量，代表表 5 中的特征参数，Cj 是隐藏层中第

j 个 RBF 神经单元的中心向量，σj 是该单元的半径。第三，输出层使用隐藏层结果的加权和作为子
条件 i 的输出信号。
H
y i=∑ ωij R j ( x)+ω i (i=1,2 , … , K )
j=1
其中，ωij 是隐藏层中第 j 个单元与输出层中第 i 个输出之间的链接权重，ωi 是第 i 个输出的位
移。最后，输入数据 x 被划分到子条件 ε 中，获得最高的输出 yi，如下所示：
其中 ε 是最高输出的集群标签。
ε =arg max yi
i ∈ {1,2, … ,K }
在对 RBF 神经网络进行离线训练后，它可以利用领先车辆的信息对测试车辆的未来驾驶状况进行
在线预测。在对 RBF 神经网络进行离线训练后，它可以利用领先车辆的信息对测试车辆的未来驾
驶状况进行在线预测，这也是下一节的内容。
3.4 双层能量管理（在线）
3.4.1 基础理论与算法介绍
（1）随机动态规划（SPD）算法
动态规划是执行一系列相关决策时的一项有用的数学技术，它提供系统化的方法来寻求全局最
优解。对于具有确定性的过程的规划而言，每做完一次决策后进入的下一状态也是确定的。而对于
随机动态规划算法而言，在随机变量因素的影响下当前状态做完决策后进入的下一状态是无法完全
确定的，因此新的状态也会因此而具有随机的性质。所以在随机动态规划算法当中应该利用分阶段
思想来处理随机变量的问题。
随机动态规划主要利用现实世界中存在现实情况来转化成数学中的抽象向量，从而建立数学模
型来解决问题。系统优化时，常用模型组成部分如下:
1. 阶段：指解决问题时对其的自然划分。阶段与阶段之间是互相联系的，且具有顺序性，对
所有阶段的求解过程就是对系统问题的求解。阶段可以是连续的，也可以是离散的，一般
用 k 表示阶段。
2. 状态变量：指一个阶段开始时的自然状态。在当前阶段所获得的收益，将只取决于当前状
态，与过去的决策和状态无关。用表示 k 阶段下的某一状态。
3. 决策变量：当一个阶段状态确定后，决策变量的作用是将当前的状态转化为下一阶段的某
个状态用 uk( )表示在状态下的决策变量。
4. 策略：由决策所组成的序列称之为策略，从第 k 阶段到第 j 阶段的策略记作为：
pkj ( xk )={uk ( x k ), ⋯ ,u j (x j )}
5. 状态转移：状态转移描述了从一个状态执行了一定决策后到达另一个状态。假设第 k 阶段
的状态变量为，那么 k+1 阶段的状态变量即可根据所作的决策来确定。表示为
λ k+1=T k (λ k , x k ( λ k )) ,
6. 指标函数：用于衡量所实现过程优劣的一种数量指标，它是定义在全过程和所有后部子过
程上的数量函数，用V k , n (x k , uk , x k+1 , ⋯ , xn +1)表示，k =1,2 , ⋯ , n。指标函数应具有可分离
性，即V k , n可表示为 x k ， uk ，V k+1的函数，记为

V k , n (x k , uk , x k+1 , ⋯ , xn +1)=φk ( x k , uk ,V k+1 ,n ( x k +1 , uk +1 , ⋯ , x n+1 )) （1）
而且函数φ k 对于变量V k +1 ,n是严格单调的。过程在第 j 阶段的阶段指标取决于状态 x j 和决
策u j，用 v j ( x j , u j )表示。指标函数由 v j ( j=1,2 ,⋯ , n) 组成。
7. 递推方程：依据随机动态规划组成成分和随机变量的特点，系统的描述建立递推方程：
J k (λ k )= opt f { gk ( λ k , μk , ω k )+ J k +1 (T ( λk , ωk , uk ))} (2)

ωk
uk ∈U k ( xk )
其中k =1,2 , ⋯ , N −1表示所处的阶段， gk ( λk , μ k , ω k ) 表示 k 阶段的指标函数，
λ k+1=T (λ k ,ω k ,u k )表示状态转移矩阵： λ k , ω k ,u k分布表示状态变量、随机变量与决策变量。

opt 最大值或最小值。 f 函数表示递推方程的函数对应关系，可使用期望等表示。
动态规划问题同时还具备着以下特征
1. 最优子结构：在一个全局最优策略当中，对于其中的任意一个阶段，无论之前的策略以及
状态是怎么样的，对目前阶段的状态都不会产生影响，而且该阶段之前所确定的最优策略，
在该阶段之后所形成的决策序列也是最优策略，即全局最优策略中的子策略也是最优的。
2. 无后效性：在决策的过程当中，对于给定的某个状态，它未来的决策不受它之前状态的影
响，只会受当前或最近一次状态的影响。
3. 子问题重叠性：动态规划的根本目的是为了解决问题的冗杂性，因为在决策过程当中，每
个子问题都会有相同的子问题，而动态规划会将这些子问题的状态记录到表里，以此方便
后续查询。因此动态规划是一种以空间复杂度简化时间复杂度的算法。
综上，求解动态规划问题一般包含以下几步：
1. 明确解决问题对象
2. 将问题划分成多个阶段，确定状态变量空间，按照时间或者空间进行划分
3. 确定控制动作空间，根据被控对象状态进行合理划分
4. 确定状态转移函数，根据被控对象进行建模
5. 根据控制目的设计指标函数
6. 求解最优值函数，生成最优控制策略
（2）算法的时间复杂度（待补充算法导论里的渐进符号方面的知识）
在算法设计和分析中，时间复杂度是衡量算法执行时间的一个重要概念。当算法输人规模
足够大，使得只有运行时间的增长量级有关时，我们要研究算法的渐近效率。也就是说，我们
关心当输人规模无限增加时，在极限中，身法的运行时间如何随着输入规模的变大而增加。通
常，渐近地更有效的某个算法对除很小的输人外的所有情况将是最好的选择。
通常用 T(n)表示。其中，n 表示问题的规模，T(n)表示算法执行所需要的时间。在算法分
析中，我们通常将 T(n)的增长率作为算法执行时间的度量标准。时间复杂度的计算方法，一般
采用大 O 记号（O(n)）表示。大 O 记号是指在算法的渐进分析中，用来表示算法的最坏情况下
的时间复杂度。例如，O(n)表示算法的时间复杂度不超过 n 的某个函数 f(n)。具体来说，如果
一个算法的时间复杂度为 O(f(n))，则存在一个正常数 k 和一个整数 N，使得当 n>N 时，算法执
行的时间不超过 k*f(n)。
常见时间复杂度的分类和说明
时间复杂度常见的分类有常数阶、对数阶、线性阶、线性对数阶、平方阶、立方阶和指数阶。
下面对这些常见时间复杂度进行分类和说明：
常数阶
常数阶时间复杂度，即 O(1)，表示算法执行时间不随问题规模 n 的增加而增加。例如，一个算

法执行时间为 c 的常数，则该算法的时间复杂度为 O(1)。常数阶时间复杂度的算法执行时间独
立于问题规模，是最优秀的时间复杂度。
对数阶
对数阶时间复杂度，即 O(log n)，表示算法执行时间随问题规模 n 的增加而呈对数增长。例如，
二分查找算法的时间复杂度为 O(log n)。对数阶时间复杂度的算法执行时间随问题规模增加而
增长得比较慢，是较优秀的时间复杂度。
线性阶
线性阶时间复杂度，即 O(n)，表示算法执行时间随问题规模 n 的增加而呈线性增长。例如，遍
历一个数组的时间复杂度为 O(n)。线性阶时间复杂度的算法执行时间与问题规模 n 成正比，是
常见的时间复杂度之一。
线性对数阶
线性对数阶时间复杂度，即 O(nlog n)，表示算法执行时间随问题规模 n 的增加而呈线性对数增
长。例如，归并排序算法的时间复杂度为 O(nlog n)。线性对数阶时间复杂度的算法执行时间与
问题规模 n 成非线性对数关系，是较优秀的时间复杂度。
平方阶
平方阶时间复杂度，即 O(n^2)，表示算法执行时间随问题规模 n 的增加而呈平方增长。例如，
冒泡排序算法的时间复杂度为 O(n^2)。平方阶时间复杂度的算法执行时间与问题规模 n 成平方
关系，是较差的时间复杂度。
立方阶
立方阶时间复杂度，即 O(n^3)，表示算法执行时间随问题规模 n 的增加而呈立方增长。例如，
矩阵乘法算法的时间复杂度为 O(n^3)。立方阶时间复杂度的算法执行时间与问题规模 n 成立方
关系，是较差的时间复杂度。
指数阶
指数阶时间复杂度，即 O(2^n)，表示算法执行时间随问题规模 n 的增加而呈指数增长。例如，
求解旅行商问题的暴力穷举算法的时间复杂度为 O(2^n)。指数阶时间复杂度的算法执行时间与
问题规模 n 成指数关系，是最差的时间复杂度。
不同时间复杂度对算法执行时间的影响
不同时间复杂度对算法执行时间的影响是显而易见的。当问题规模 n 很小时，各种时间复杂度
的算法的执行时间差异不大。但是，当问题规模 n 很大时，不同时间复杂度的算法的执行时间
差异会变得非常大。因此，在实际应用中，我们需要选择时间复杂度比较优秀的算法来解决问
题。
3.4.2 基于先导车的实时神经网络（NN）预测
表 5 先导车参数
子系统参数
车型长安 eado EV460
迎风面积 2m2
汽车质量 1450kg
荷重 100kg
驱动电机永磁同步电机
额定功率 40kW
峰值功率 120kW
电机齿轮比
车轮直径固定 9.1
0.595m
如前所述，ID-EMS 使用先导车辆驾驶状况来预测测试车辆的未来驾驶状况。预测的准确性是
基于这样的假设：先导车辆的驾驶状况与测试车辆的驾驶状况相似。为确保这一假设，我们采用了
几种方法。首先，与第 3.2.1 节中收集历史驾驶数据时类似，驾驶员被要求跟随交通流，这样驾驶
员的习惯就不会影响预测结果。第二，很明显，如果有更多的领先车辆，预测将更加准确。因此，
在本研究中部署了三辆领先车辆。他们的出发时间表应该被精心设计，这将在第 4.1 节中讨论。第
三，主导车辆的参数应该与测试车辆（力帆 620EV）相似。同一型号的车辆将是最好的选择。然而，
没有足够的力帆 620EV，所以选择了另一个车型（长安逸动 EV460）作为主导车辆。对比表 X 和表
5 中的参数，除了驱动电机外，测试车辆和先导车辆是相似的。这不会是一个问题，因为本研究选
择了车辆的驱动力（PEV）进行计算。PEV 可以看作是推动车辆的机械功率，与驱动电机的型号无
关（见第 2.3 节），在补充材料的 S5 节中有一个实验来比较测试和领先车辆的 PEV。

GPS模块
数据采集处理端
OBD接口
4G LTE USB上网卡
USB转CAN-BUS接口卡
图 21 先导车配置
此外，图 21 中领先车辆的配置与图 X 中的测试车辆相似，除了一个部分。测试车需要监测车
辆的状况并控制驾驶动力（见图 2 和 3）。相比之下，主导车辆只监测车辆的状况。简而言之，前
者是可读可写的，而后者是只读的。
F
F F F
(a) 先导车
F
子工况类型
速度（km/h)
高速F
公路
(b) 测试车
F
子工况类型
速度（km/h)
距离（km)
图 21 基于先导车的 NN 预测示例
图 21 说明是只有一辆先导车辆的预测情况。具体来说，先导车辆比测试车辆提前 10 分钟出发。
基于图 12 中相同的地理特征，先导车辆的实时驾驶数据在空间域中被分为 15 段。然后，应用训练
好的 NN 将每段划分为表 6 中的一种典型子条件，这些子条件将被作为第 3.3.2 节中 SDP 优化过程
中预测的测试车辆的未来驾驶状况。在本研究中，为了提供更准确的未来驾驶状况，实验中部署了
三辆领先车辆。相关的出发时间表和预测结果将在第 4.1 节讨论。

3.4.3 基于随机动态规划算法的能量管理策略
由于未来的驾驶状况是根据先导车辆的状况来预测的，所以在之前的研究中，预测问题曾经通
过动态编程算法来解决[29]。然而，在这种情况下，当前阶段的系统状态（电池 SOC）和策略决定
（充电功率和持续时间）不能明确地决定下一阶段的状态。预测的下一个状态有一个概率分布，因
为在表 6 的特定驾驶条件下，行驶时间（平均速度）和能量消耗分别服从图 18 和图 19 所示的概率
分布。因此，EMS 的全局优化是由 SDP 算法处理的[45]。
图 22 随机动态规划（SDP）算法结构
SDP 的结构如图 19 所示，其变量的物理含义解释如下。 n 是阶段索引，代表图 18 中一个微旅
行段的索引，因为阶段是在空间域中定义的。sn 是系统状态，包括电池 SOC。xn 是策略决策，表
示燃料电池组的充电功率和持续时间。给定状态 sn 和阶段 n 的决策 xn，pi 是系统进入状态 i 的概率。
在应用中，pi 表示图 15 中特定驾驶条件下平均能耗的概率。如公式（15）所示，Ci 包括三个来源：
基于图 6 的燃料消耗成本，基于图 7 的燃料电池 SOH 成本，和基于图 9 的电池 SOH 成本。
其中 Prfuel、Prfc 和 Prbat 分别是氢气燃料、燃料电池组和动力电池组的货币价格。此外，由于
初始 SOC（SOCinit）和结束 SOC（SOCend）是在旅行前预定的，所以省略了插入式充电的成本，
这意味着如果 EMS 按照设计工作，插入式充电所需的总电池能量应该是一个常数（SOCinit -
SOCend）。由于 Ci 被定义为从阶段 n 的状态 sn 到阶段 n+1 的状态 i 的决策成本，fn(sn, xn)，表示
C i=fuel ⁡( P fc )× P r ful + Δ SO H fc ( Pfc )× P r fc

+ Δ SO H bat (Pbat , SO C bat )× P r bat
从阶段 n 开始到结束的最小预期总和，如下所示：
S
f n (s n , x n )=∑ pi (C i +f n +1 (i))
¿
i=1
其中 S 是阶段 n+1 的可能状态数，由图 15 中指定驾驶条件下的平均能耗的概率区间量决定。

¿
然后， f n+1 (i)表示从阶段 n+1 开始到结束的状态 i 的最佳（最小）解决方案，定义如下：
其中，这个优化（最小化）的可行区域涵盖了 xn+1 的所有可行值，代表了燃料电池组的可用
充电功率范围。此外，在图 19 中，在第 n+1 阶段从状态 S 到状态 1 的电池 SOC 值从高到低分布
（最高的是 SOCub，如果在第 n 阶段只有一个状态 sn，最低的是 SOClb）。这是因为相应的 pi 的
平均能耗是由低到高排列的。因此，在相同的决策 xn（充电功率和持续时间）下，最低的能量消
耗（或车辆驱动功率）会导致下一阶段的最高状态（电池 SOC），反之亦然。
f ¿n+1 (i)=min f n+1 (i , x n+1 )

x n+ 1
参考SOC
距离（km)
图 23 参考 SOC 的数值示例
最后，方程（16）和（17）中的 SDP 问题被逆向求解。其结果被存储在一个以电池
SOC（SOCub 和 SOClb）为边界的决策树中，并将从云端传输到测试车辆的车载处理器。由于数据
量大，发送与当前车辆状态有关的部分结果，而不是整个树状结构的结果，是比较实际的。因此，
只有当测试车辆到达一个新的微旅行时，才会触发数据传输。它只传输与当前状态 sn 有关的
SOCub 和 SOClb 的数据，因为当前电池 SOC 决定了 sn。图 20 展示了一个 SOCub 和 SOClb 的数字
例子，在下一节中传输给底层 EMS，并被视为参考 SOC。

3.4.4 随机动态规划算法的时间复杂度分析
时间复杂度分析是开发实时系统的基础。首先，SDP 算法的伪代码（也见于图 19）如下，其
核心过程是一个四重循环。从外到内，有阶段循环、状态循环、决策循环和概率循环。概率循环的
形式是第 4 行的 S 步叠加。
图 24 SDP 算法伪代码
伪代码中的变量定义与第 3.3.2 节中相同。即，n 是阶段索引，sn 是系统状态，xn 是策略决策，
pi 是概率，Ci 是成本，fn 是阶段 n 到终点的最小预期和。如第 1 行所示，阶段是向后枚举的（从最
后一个到第一个）。第 2 行中的状态 sn 的计算被简化，不包含确定状态边界的过程[Statelb,
Stateub]。第 5、6、7 行的 if 端体代表方程（17），其中选择了最优（最小）解。此外，[Statelb,
Stateub]与图 24 中的[SOCub, SOClb]不同。前者是指 SDP 计算过程中的状态可行域，而后者表示
SDP 算法的优化结果。
状态上限
状态下限
实际运行时间
计算时间(秒)
SDP状态(SOC)
理论运行时间
SDP阶段规模(n)
图 25 SDP 算法计算时间
其次，SDP 的计算复杂度可按以下方式评估。(1) 预先定义了政策决定 xn 的大小，它等于可行
的充电选项（充电功率和持续时间）的数量。2）概率 pi 的大小也是预定的，它是图 15 和 19 中指
定驾驶条件下不同平均能耗的数量。因此，决策和概率循环（从第 3 行到第 8 行）的复杂性可以被
看作是一个常数。通过在云服务器上重复运行决策和概率循环（其配置见第 2.4 节），其平均计算
时间为 0.00384 秒，这是每个状态 sn 的计算时间，被定义为 O（1）的计算时间。(3) 鉴于第 n 阶段
的状态大小为 m，第 n 阶段的理论计算时间为 0.00384×m 秒。那么，SDP 的计算时间是由每个阶段
的状态总数决定的，所以 n 个阶段的 SDP 的复杂度可以表述为 O(n-m)。(4) 图 21 说明了阶段的大小
n 和状态的大小 m 之间的关系。因为状态的物理含义是电池 SOC，其最大可行区域被限制在[0.1,
0.9]，状态大小 m 不能随着阶段大小 n 的增加而扩大。如图 21 所示，状态的下边界 Statelb 在 n=5
时达到限制，而上边界 Stateub 在 n=53 时达到。因此，通过将图 21 中的状态分为三个部分，SDP
的复杂性呈现如下。
4. 实车在环实验
4.1 实验安排
表 xx 试验布置实验
参数数值
出发时间 17:30
行驶距离(km) 14.5
预定义 SOCinit 0.3
预定义 SOCend 0.2
先导车数量 3
燃料(H2)价格(元/kg) 40
燃料电池组价格(元/kW) 2000
电池价格(元/kWh) 1000
基于图 1 中的 ID-VIL 平台，建立了一个道路驾驶实验来评估所提出的 ID-EMS 的性能。试车
路线为重庆交通大学华西校区周边，如图 12 所示。实验安排的参数见表 8。需要对一些参数进行具
体解释。首先，SOCinit（0.3）设置得相对低于日常使用，因为 24 模拟 PHEV 中电池组的容量
（9kWh）远大于 14.5 公里驾驶测试所需的容量。如果 SOCinit 较高，EMS 将倾向于仅在 EV 模式下
工作。其次，由于顶层 EMS 中的最优目标是以货币成本进行评估的，因此其单价也在表 8 中提供。
最后，在实验中部署了三辆领先的车辆（图 17 中的长安逸动 EV640），其驾驶条件被用作测
试车辆的预测驾驶条件。理想情况下，他们每个人负责覆盖整个行程的三分之一，如图 26 所示。
为了优化覆盖率，引导车辆和测试车辆的发车时间表定义如下：
（1）领先车辆#1−#3：在前一辆车 9 分钟后离开；（2）测试车辆：当领先车辆#1 返回起点
时，且在领先车辆#3 九分钟后离开。
测试车辆等待领先车辆#1 返回的原因是，在此之前，预测的驾驶条件可以覆盖整个行程。
此外，云上还保存了每个行程段的预测驾驶条件表。每辆领先车辆在推出一个路段后，都会上
传一次其驾驶状况。同时，云确保新上传的分段驾驶条件将覆盖旧的驾驶条件。因此，通过按时间
序列呈现预测信息，可以获得领先车辆的预测信息表，这将在第 4.2.1 节中进行讨论。

4.2 ID-EMS 的道路试验
4.2.1 三辆领先车辆的预测驾驶条件
测试车辆和引导车辆的记录驾驶条件如图 27 所示。测试车辆的出发时间定义为时间零点。因
此，时间零点之前的时间被设置为负值。在图 27 中，领先车辆之间的发车间隔严格为 9 分钟，而
测试车辆由于等待领先车辆#1 而等待了 9 分钟以上。此外，领先车辆#3 的驾驶条件比其他领先车
辆更类似于测试车辆，因为它们在出发时间表中彼此更接近。
(a)测试车#1
速度（km/h) 速度（km/h) 速度（km/h) 速度（km/h)
子工况类型子工况类型子工况类型子工况类型

(b)先导车#3
(c)先导车#2
(d)先导车#1
时间(s)
图 xx 测试车与先导车的行驶工况
行程片段(空间域)
起点
中间点1
时间域
中间点2
(绿色：先导车#1，黄色：先导车#2，红色：先导车#3，白色：测试车
图 xx 云端上预测的行驶工况
先导车在完成一个行程段时将其驾驶状况上传到云端。特定行程段的新数据将覆盖云端上相应的旧数据。通过
在云上列出存储的驾驶条件，预测的驾驶条件表如图 28 所示。它的横轴是空间域中的行程段索引，如图 12 中带圆
形边界的数字所示。12。其垂直轴由测试车辆在时域中驶出每个片段的时刻定义，如图 26 中带正方形边界的数字
所示。例如，测试车辆的出发时间为时间零点。推出第一段的时间是时间一，等等。表中的数字指的是图 14 和图
15 中的一类子条件。它的颜色指的是它所属的车辆类型。例如，当时间为零时，测试车辆从起点出发，并且每个领
先车辆（#1、#2 和#3）覆盖行程的一部分（红色、黄色和绿色）。在第四时刻，测试车辆驶出第四段，到达中间点
一。此时，先导车#1 已经退出了实验。剩下的行程由先导车#2 和先导车#3 完成。随着实验的推进，预测片段的长
度也会缩小，这形成了一个阶梯状的信息表。云上 ID-EMS 的顶层（SDP）将其作为预测驾驶条件，对整个行程进
行全局优化。
4.2.2 试验结果
(km/h)
(W)
速度
Pveh
高速路段
燃料
(g)
(W)
Pfc
SOCfc
SOHbat
(W)
Pbat
延迟#4
SOCbat
延迟#12
延迟#0
时间(s)
ID-EMS 试验结果(运行 SDP 算法三次)
表 xx 顶层 EMS 延迟（运行 3 次 SDP 算法）

时间段理论时间(s) 实际时间(s)
#0 13.63200 18.206
#4 8.74752 12.150
#12 1.24032 2.796
ID-EMS 的驱动实验结果如图 29 所示。顶层 EMS 计划在测试车辆处于三个点时执行。即，起点、中点 1 和中
点 2。顶层 EMS 不是在每个跳闸段执行的（图 29 中的点线），因此可以节省计算时间。此外，由于领先车辆的数
量限制了预测驾驶条件的更新率，顶层 EMS 的额外执行不会导致更好的最佳性能。第 4.2.3 节中的比较实验将证明
这一点。此外，在驾驶过程中，顶层 EMS 是在线执行的。相应延迟的影响如图 29 所示。也就是说，在起始点，底
层使用当前的 SOCbat 和 SOClb 作为 SOCub 和 SOClb 来运行测试车辆，直到 18.2 秒后基准 SOC 可用，这导致延迟#0 内
的基准 SOC 的矩形尖。在中点 1 和 2，底层使用旧的参考 SOC，直到新的参考 SOC 在延迟#4 和#12 内到达。如表 9
所示，随着时间的推移，延迟更短，因为用于休息驾驶行程的 SDP 计算阶段的大小也缩小了。由于两个原因，理论
延迟比实际延迟更短。一个是理论计算时间不包括所有操作，这已在第 3.3.3 节中进行了讨论。另一个是理论上的
没有考虑网络延迟，而实际的考虑了。关于 ID-VIL 系统的网络延迟的实验和讨论可以在[31]中找到。底层 EMS 仅
控制充电时间，并使用预定义的最佳充电功率作为默认充电条件。因此，在图 29 中，燃料电池组的充电功率保持
在 20.25kW。充电频率是有限的，因为燃料电池组的每次启动都会损坏其 SOHfc，这可以通过每次充电操作开始时
SOHfc 的急剧下降来观察到。此外，大多数充电操作都位于高速公路条件下，因为高速公路条件下的平均能耗高于
其他驾驶条件下的能耗。此时，Pfc 的一部分可以直接驱动车辆，避免了电池内阻的损失，同时节省了 SOHbat 的成本。
最后，实时 SOCbat（红色粗线）通常遵循参考 SOC[SOClb，SOCub]（黄色带）。它表示底层 EMS 使用来自顶层 EMS

的全局优化结果作为参考来指导其实时控制。
4.2.3 试验实时性分析
(W) (km/h)
Pveh
(W)
SOCfc Pfc 速度
高速路段
燃料
(g)
SOHbat
(W)
Pbat
SOCbat
时间(s)
图 xx ID-EMS 试验结果(一直运行 SPD 算法)
表 xx 顶层 EMS 延迟（运行 3 次 SDP 算法）
时间段理论时间(s) 实际时间(s)

#0 13.63200 18.430
#1 12.37632 15.460
#2 11.16672 14.688
#3 9.94560 13.464
#4 8.74752 11.990
#5 7.59552 10.526
#6 6.47424 9.478
#7 5.46432 8.031
#8 4.48512 6.860
#9 3.60192 5.479
#10 2.76096 4.243
#11 1.96224 3.415
#12 1.24032 2.727
#13 0.68352 2.003
#14 0.27264 0.957
为了验证 ID-EMS 的实时性，在极端条件下进行了两次实验。由于驱动条件会影响 EMS 的性能，因此记录了
图 27 中的驱动条件并将其应用于实验。除此之外，对比实验中的其他布置也与表 8 中相同。其目的是测试重计算负
载的影响，以便上层 EMS 设置为在每个跳闸段执行（图 30 中的所有点线和起点）。表 10 中给出了每个段的上层
EMS 的执行延迟。根据结果，所提出的 ID-EMS 可以在这些延迟的情况下正常工作。换句话说，ID-EMS 可以处理
繁重的计算负载情况。
(W) (km/h)
Pveh 燃料
(W) (g)
Pbat SOCfc Pfc 速度
高速路段
SOHbat
(W)
SOCbat
时间(s)
图 xx ID-EMS 试验结果(不运行 SPD 算法)
另一种是模拟测试车辆无法连接到云的情况。因此，底层 EMS 必须在没有来自顶层 EMS 的参考 SOC 的情况
下操作。因此，当前电池 SOC 水平和最低阈值（0.2）被设置为 SOCub 和 SOClb。在这种情况下，测试车辆在电荷
消耗模式下工作，这会产生阶梯形的参考 SOC。当当前电池 SOC 降至预定阈值（0.21）以下时，SOCub 被设置为恒
定值（0.21。此外，假设测试车辆可以通过 IOV 连接到领先车辆，因此图 23 中的预测能耗 Eveh_pre 仍然可用。因
此，底层 EMS 中的模糊控制器可以向电池充电适量的能量，以便图 31 中的 SOCbat 在每个跳闸段结束时保持在
[SOClb，SOCub]的边界内。它可以优化整体性能，这将在下一节中通过与基于规则的 EMS 进行比较来证明。总之，
即使云断开连接，ID-EMS 也可以正常工作。
表 xx 道路试验统计结果
ID-EMS ID-EMS ID-EMS RB-EMS DP-EMS
(运行 3 次) (一直运行) (不运行)

实际 SOCinit 0.3 0.3 0.3 0.3 0.3
实际 SOCend 0.2002 0.2012 0.2068 0.2029 0.2010
H2 燃料消耗(g) 76.2 76.5 80.2 78.1 75.3
H2 燃料成本(RMB) 3.05 3.06 3.21 3.13 3.01
∆ SOHfc 5.045e-5 5.058e-5 7.972e-5 1.621e-4 3.603e-5
∆ SOHfc_start 2.079e-5 2.079e-5 4.851e-5 1.317e-4 6.930e-6
∆ SOHfc 成本(RMB) 1.51 1.52 2.39 4.86 1.08
∆ SOHbat 3.005e-4 2.976e-4 3.091e-4 3.134e-4 3.009e-4
∆ SOHbat 成本(RMB) 2.69 2.66 2.77 2.81 2.70
总成本(RMB) 7.25 7.24 8.37 10.80 6.79
表 11 显示了道路试验的统计结果。由于道路实验导致的燃料电池堆的 ΔVref 和电池的 ΔRin 太小，无法通过物
理检测方法测量，因此表 11 中的 ΔSOHfc 和 ΔSOHbat 分别基于图 7 和图 9 中的模型进行了模拟。同时，表 11 中的
其余数据由相应的环内子系统收集。比较表 11 的第一列和第二列证明，更频繁地执行顶层 EMS 并不能带来更好的

性能。如前所述，这是由于领先车辆的数量有限。因此，ID EMS 的执行时间的安排适合于当前实验。此外，顶层
EMS 的指导是必要的。否则，如果底层 EMS 单独工作，则将采用 CD-CS 策略。
4.3 RB-EMS 和 ID-EMS 的对比实验
引入了基于规则的 EMS（RB-EMS）和基于 DP 的 EMS（DP-EMS），将它们的性能与所提出
的 ID-EMS 进行了比较。他们的实验也基于图 27 中记录的驾驶数据和表 8 中的排列。此外，RB-
EMS 基于简单的 CD-CS 策略[47]，该策略不使用任何未来的驾驶信息。因此，RB-EMS 以最佳性能
为代价，具有最低的计算复杂度。相比之下，DP-EMS 需要对未来驾驶信息有充分的了解。此外，
整个行程在时域中被分割成一系列 5 秒的片段，然后 DP-EMS 可以搜索理想的全局优化。

(km/h)
Pveh
速度
(W)
高速路段
燃料
(W)
Pfc
(g)
SOCfc
SOHbat
(W)
Pbat
SOCbat
时间(s)
图 xx RB-EMS 试验结果
(km/h)
Pveh
(W)
速度
高速路段
燃料
(W)
Pfc
(g)
SOCfc
SOHbat
(W)
Pbat
SOCbat
时间(s)
图 xx ID-EMS 试验结果
图 32 和 33 分别是 RB-EMS 和 DP-EMS 的实验结果。首先，由于与 ID-EMS 相同的原因，在高速公路条件下执
行 DP-EMS 的充电操作。然而，RB-EMS 的原因并不相同。RB-EMS 在高速公路条件下充电，仅仅是因为其 SOC 此
时低于充电阈值（0.2）。其次，ID-EMS 和 DP-EMS 限制了它们的充电频率，因为考虑了启动对 SOHfc 退化的影响。
相比之下，RB-EMS 的频繁充电操作将显著损坏其 SOHfc。第三，如前所述，RB-EMS 和 ID-EMS 的底层（模糊控
制器）都使用最佳充电功率来简化控制，使它们在图 29 和图 32 中的 Pfc 在 20.25kW 下工作。表 11 中还列出了 RB-
EMS 与 DP-EMS 的统计结果。根据表 11，可能得出的结论如下。首先，DP-EMS 获得了最佳的油耗性能，但 ID-
EMS 和 DP-EMS 之间的差异相对较小。这可能是因为在 ID-EMS 中应用了最佳充电功率。其次，DP-EMS 实现了最
低的燃料电池退化成本，这应归因于其最低的充电频率。第三，如图 32 所示，采用 CD-CS 策略的 RB-EMS 在道路
实验中适应了频繁的充电操作。因此，它承受着最高的燃料电池退化成本，这提高了它的总体成本。第四，当云不
可用时，模糊控制器（底层 EMS）的性能仍然优于 RB EMS，因为测试车辆可以连接到领先的车辆来预测未来的能
源消耗。因此，底层 EMS 可以为电池正确充电，避免燃料电池频繁的启停操作，而燃料电池是 RB-EMS 总成本的
主要来源。
4.4 FIL/BIL 重复试验
如上所述，燃料电池和电池在 30 分钟的驾驶实验内的降解过程太慢且太小，无法通过物理测
量检测到。因此，为了验证表 11 中模拟的 SOHfc 和 SOHbat 的准确性，分别在 FIL 和 BIL 上进行了
一些基于图 29、32 和 33 中记录的 Pfc 和 Pbat 的重复实验。每个实验组重复 80 次，然后分别在 FIL
和 BIL 上对表 12 中的 ΔVref 和 ΔRin 进行物理测量。根据[34]和[36]，如果燃料电池或电池的 SOH
没有从初始水平下降很远，那么燃料电池和电池的退化过程可以被视为线性的。因此，表 12 中每
个循环的 ΔSOHfc 和 ΔSOHbat 定义为总变化的 1/80。通过将表 12 中的每个循环的降解率与表 11 中
的模拟降解率进行比较，燃料电池的差异比电池的差异更显著，这可能是因为 Vref 的采样精度比
Rin 的采样精度差。
正如预期的那样，RB-EMS 由于其频繁的充电操作而在 SOHfc 中表现最差。
表 xx 重复试验统计结果
ID-EMS RB-EMS DP-EMS
(运行 3 次)
∆ V ref(V) 0.155 0.514 0.110
∆ SOHfc 0.004613 0.015298 0.003274
∆ SOHfc/圈数 5.766e-5 1.912e-4 4.093e-5
仿真误差 +14.3% +17.9% +13.6%
∆ Rin(mΩ ) 0.031 0.033 0.030
∆ SOHbat 0.025616 0.027269 0.024790
∆ SOHbat/圈数 3.202e-4 3.372e-4 3.099e-4
仿真误差 +6.6% +7.6% +3.0%
5. 总结
本文提出的 ID-EMS 采用了 PHEV 的分层全局优化。分析了它的计算复杂度，以估计最坏情况
下的理论计算时间。基于 ID-VIL 仿真平台的道路驾驶测试验证了理论结果。它还证明了即使在极
端条件下，如网络故障，ID-EMS 也可以坚持全局最优。因此，介绍了 PHEV 实时 EMS 的开发全过
程，可以为该领域的研究人员提供一些指导。ID-EMS 的缺点是，预测未来的驾驶条件取决于领先
的车辆，而这会受到许多因素的影响。此外，缺乏联网车辆（可能的信息来源）也限制了 ID-EMS
的商业应用。考虑到联网车辆的占用率仍在发展，其他信息来源，如在线数字地图，可能是更好的
选择或对当前设置的补充。如百度地图的流量 API 服务。

论文3

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

论文3

Uploaded by

Copyright:

Available Formats

基于分层式全局优化的插电式燃料电池混合动力汽车实时

2.表的 cycle 是什么

EMS），以此实时减少和优化全球能源消耗和电池损耗问题。 ID-EMS 利用云计算构建分层结构

在新能源汽车车型里，PHEV 兼备纯电动汽车（ElectricVehicles，EV）和传统 HEV 的优势。相

需求；与 HEV 相比，其电池容量更大，并且可以通过廉价电网对电池进行电量补充，最大限度的

应同等重视。因此，PHEV 的 EMS 应具有强大的功能以满足各种目标，并且能灵活调整以适应变

化的行驶条件。换言之，应该利用 EMS 结合不同的控制算法来优化多目标（如节能、减排和电池

1.2 PHEV 研究现状

1.2.1 PHEV 发展历史及现状

德国等国家对于 PHEV 的研究较早，技术也较为成熟。1900 年，费迪南德-保时捷设计了 Lohner-

Porsche Mixte【10】，该车使用电动机为车轮提供动力，并使用内燃机进行发电。20 世纪 70 年代，

美国能源部开始资助 PHEVs 的研究，作为其减少对外国石油依赖的努力的一部分。2007 年正式展

出插电式混合动力汽车的雪佛兰 Volt，于 2010 年起开始在市场推广，其零百加速约 9.2 s，油耗约

为４ L/100 km 【4】。之后福特 C-emergi，凯迪拉克 CT6 等 PHEV 车型相继研发成功，开始逐步占

领全球市场。同期丰田旗下最典型的一款 PHEV 车型普锐斯（Prius）也正式上市。【5】PHEV 汽

设施的不断完善。三菱欧蓝德 PHEV 是另一款流行的 PHEV。这款 SUV 拥有一个 13.8 千瓦时的锂

里程内燃机接管。该车的系统总输出功率为 221 马力，从 0 到 60 英里/小时只需 7.6 秒。【11】供应

PHEV 产品的中国自主品牌供应商主要有比亚迪、吉利、长城、长安、奇瑞、广汽 Aion、传祺等，

价格多集中在 15-20 万元，主打高性价比，节能高效是主要卖点。供应插电混动车型产品的中国合

中短期核心路线。目前，PHEV 仍在加速发展，关于 PHEV 的研究和开发主要集中在改进电池技术

1.2.2 PHEV 结构分类及特点

根据混合度（驱动电机功率占整车功率比例）可以将 PHEV 分为混合度小于等于 5%的微混、

混合度 20%左右的轻混、混合度 30%-40%的中混以及混合度大于 40%的重混【6】。混合度越大电

串联式 PHEV 的结构如图 1 所示[7]。串联式 PHEV 具有如下特点[8]：1）汽车由动力电池提供

了废气排放。增程式电动汽车（EREV）的工作原理与串联式 PHEV 非常类似，但两者是有本质区

别的。串联式 PHEV 是由普通油电混合动力汽车派生出来的，具有普通油电混合动力汽车的大部分

发电机 逆变器 蓄电池

并联式 PHEV 的结构如图 2 所示。其特点类似于并联式普通油电混合动力汽车。发动机和电动

发动机 耦合器 电动机

发电机 逆变器 蓄电池

发动机 行星齿轮 电动机

1.3 EMS 研究现状

是完全独立。【13】PHEV 的 EMS 可分为两大类：基于规则的 EMS 和基于优化的 EMS。

度、电池的充电状态（SOC）和扭矩的要求，这种控制方法已经在 FT-SIM 的模拟中得到验证，但

难以评估潜在的改进[22]。参考文献中提出了一种新型的基于规则的 PHEVs 控制策略，其重点是所

有电动范围和充电耗尽范围的操作。[23]，并通过模拟乘用车在 FTP75 驾驶周期中的行驶情况进行

之间的功率分配，这种 "恒温器 "策略使燃油经济性在城市循环中提高了 11%，在高速循环中提高

规则的控制器中，需要根据动力系统的一些 "专家 "知识来建立模糊规则，这需要很长的开发周期

的自适应模糊规则是非常困难的[28], [29]。一般来说，PHEV 在基于规则的控制策略下有三种工作

PHEV 能量消耗的最佳性[30]。因此，基于优化的 EMS 在 PHEV 的应用中更为常见。

基于优化的 EMS 包含两个子类型：局部优化 EMS 和全局优化 EMS。前者侧重于在实时环境中

现全局实时优化。从计算机的层次结构出发，一个新兴的研究趋势是将不同的 EMS 结合起来形成

制。这种分层 EMS 的研究趋势可以分为两个分支。一个分支将顶层设置为脱机工作，这样可以避

免实时性问题。例如，[20]使用离线 DP 训练基于 EMS 的自适应神经模糊推理系统（ANFIS）。在

[21]中，部署了离线 DP 和 Pontryagin 最小原则（PMP）来训练基于神经网络的 EMS。在文献[22]中，

离线构造神经网络来预测模糊 PMP 协同 EMS 的未来条件。在文献[23]中，贝叶斯优化（BO）用于

离线调整基于广义最小残差（GMRES）的 EMS 的参数。分层 EMS 的另一个分支在线执行所有层。

同 EMS 的车速。在[26]中，顶层的 PMP 计划底层 DP 的最佳电池荷电状态（SOC），以找到最佳功

率分配比。在[27]中，经济层中的二次规划为控制层中的 MPC 控制器获得参考 SOC，以优化燃油

经济性。在[28]中，移动边缘计算单元（MECU）中的 DP 为车载控制单元中的 MPC 算法提供参考

控制策略和 SOC 轨迹。在[29]中，云级别的 DP 支持车辆级别的 MPC（参考电流和 SOC），同时

MPC 将实时功率需求反馈给 DP。在[30]中，云层中的 DP 每六十秒执行一次，以向车辆中基于规则

的控制器提供参考功率曲线。在应用中，分层 EMS 通常与云计算（包括[28]、[29]、[30]）协同工

EMS 的实时性。总之，对优化性能的要求促使新兴的 EMS 变得越来越复杂，这与控制车辆动力传

动系统的实时性要求相冲突。据笔者所知，在理论上还没有对 EMS 的计算复杂性进行分析，更不

统[31]，以通过道路驾驶测试验证所提出的 ID-EMS 的实时能力。在 ID-VIL 系统中，多个地理上分

离的硬件在环（HIL）子系统通过网络连接起来，以模拟 PHEV 的动态特性并记录控制回路中的时

源管理策略相比，基于学习的能源管理策略（LB-EMS）不依赖于设计者的 "专家知识 "来制定控

习。回归监督学习通常被纳入基于 MPC 的控制框架中，以实现对车辆速度、发动机扭矩和动力电

的控制策略。例如，GRELLE 等[59]使用了 c-均值聚类方法，将包含标准驾驶循环中最佳混合度以

及车辆状态向量（如车速、电池 SOC、催化剂温度和 ICE 温度）的数据库中的元素进行分组。

算法，即 DQN、DDQN、DDPG 和 TD3。本文评估了这些算法在不同驾驶周期和不同车辆模型上

他算法，而且基于 DRL 的策略比基于规则的策略能取得更好的效果。在基于 DRL 的方法中，EMS

上，因为它们具有很强的学习能力。[33]使用 deep-Q-learning network（DQN）算法进行能源管理，

发电机逆变器蓄电池

发动机耦合器电动机

发电机逆变器蓄电池

发动机行星齿轮电动机

电池 EMS 燃料电池电子负荷

驾驶员车联网逆变器燃料电池

时的欧姆电阻（1.21 mΩ/2.42 mΩ），CBOL/CEOL 是寿命开始/结束时的容量（50 Ah/40 Ah）。如