Professional Documents
Culture Documents
论文3
论文3
互联网分布式能源管理策略
待解决:1.百度地图 api 是否能替代实车测试中的先导车
摘 要(待补充)
随着全球环境污染和能源短缺问题的不断升温,新能源汽车
提出了一种用于插电式燃料电池混合电动汽车(PHEV)的互联网分布式能源管理策略(ID-
EMS,其顶层结构在云服务器上搜索全局优化的电池充电状态(SOC),以指导底层的机载模糊控
制器。从理论上分析顶层随机动态规划(SDP)算法的计算复杂性,给出了实时算法的发展过程。
此外,还介绍了一个互联网分布式车辆在环(ID-VIL)的仿真平台,通过道路驾驶试验来评估所提
出的 ID-EMS 的实时性能。还测试了一些极端条件,如重计算负载和网络故障。实验结果表明
ID-EMS 可以处理极端条件并实时逼近全局优化解。
关键词:插电式燃料电池混合动力汽车、互联网分布式能源管理策略、云计算、实时性能分析 、
车在环仿真
1. 绪论
1.1 研究背景
当下,环境污染和能源短缺是全世界所面临的最迫切的问题之一,化石能源供应量(含煤电和
气电等二次化石能源)“意外”大幅下降给经济运行、企业生产和民众生活带来的严重“震荡”,
以及化石能源价格暴涨导致一些企业成本高企而陷入困境甚至破产的局面。而全球汽车保有量正持
续上涨,因此导致能源消耗和原油供给之间的矛盾日益突出。2022 年起,世界油气市场处于供需紧
平衡状态,能源价格延续着此前的上涨趋势。不断升温的俄乌冲突局势导致原本就处在供需紧平衡
中的能源市场供给再度趋紧[1]。根据国际相关统计数据得知,目前全球交通用油比例高达百分之六
十二以上,将会导致在不久后出现石油严重短缺问题[2]。因此,为减少并解决环境污染和能源紧缺
问题,新能源汽车应运而生。在面对能源危机的压力下,各国接踵实施相关政策鼓励发展新能源汽
车,我国也陆续出台了多项战略方针,把新能源汽车列为现阶段重点发展产业之一。
对纯电动汽车,其具有传统燃油和动力电池叠加的续航能力,能够更好的满足用户较远距离的驾驶
降低燃油消耗,因此得到了企业、汽车科研机构以及政府的大力支持[3]。
插电式混合动力汽车(PHEV)具有外部充电插头和比传统混合动力汽车(HEV)更大的电气
部件(即动力电池),因此应该使用更多的电力而不是进行燃油消耗。为此,应在汽车总行程结束
时将电池耗尽至最低允许水平,这对能量管理策略(EMS)提出了更高的要求。此外,PHEV 电源
的维护和更换成本较高,已经阻碍了其应用。这意味着能源经济性和电池健康状态(SOH)的平衡
寿命保护)的动力传动系统操作。
混动汽车兴起于美国第二次石油危机,丰田是较早踏足混动汽车领域的企业之一,美国、日本、
车产品的不断发展迭代的背后是电池、电机、发动机等一些相关核心部件的技术进步以及配套充电
资品牌供应商主要有上汽大众、上汽通用、广汽本田等,除了一汽奥迪等高端车型以外,多集中在
15-25 万元区间。外资品牌在混动技术路线上存在一定的分歧,部分车企选择纯电路线为核心路线,
加快对旗下燃油和混动车型的替换,其余车型则是兼顾纯电和混动路线,部分日系车企将混动视为
增加续航里程和降低成本几个方面上。
机功率越大,电池电能也越大,但是耗油量越少。PHEV 系统架构由电机、电控、逆变器、直流斩
波器、电池、油箱、充电器等部分构成,按照发动机的耦合方式和驱动系统的结构不同可以分为串
联式、并联式和混联式三种形式。
(1) 串联式插电混合动力构型
驱动力,当动力电池的能量不足时,发动机带动发电机发电,发电机将电能输送给电动机,电动机
直接驱动汽车。2)类似于普通串联式油电混合动力汽车,发电与车轮之间没有机械连接,发动机
可一直工作在最佳工况点附近,避免了发动机的怠速和低速运转工况,提高了发动机的效率,减少
特点,只是将功率型电池更换为比容量更大的能量型电池,使动力电池有足够的能量,保证汽车在
纯电动模式下的行驶里程更长。增程式电动汽车是由纯电动汽车派生出来的,由于汽车增加了增程
器,所以称为增程式电动汽车。所谓的增程器,就是一台小型发动机,用于发电,以提高纯电动汽
车的续驶里程,避免频繁地停车充电。当动力电池的能量充足时,汽车进入纯电动模式,由电动机
驱动汽车行驶;当动力电池所储存电量无法满足纯电动工况时,增程器(发动机)起动,通过发电
机对动力电池充电,在汽车依然由电动机驱动的前提下增加续驶里程[9]。
发动机
电动机
减速器 机械连接
电连接
功率输出
车轮
图 1 串联式 PHEV 结构
(2) 并联式插电混合动力构型
机相互独立,既可以采用电动机单独驱动汽车,实现纯电动行驶,又可以采用发动机单独驱动汽车
行驶,在功率需求较大时可以由发动机和电动机联合驱动汽车行驶。发动机和变速器通过耦合器进
行机械连接,发动机所提供的动力和由动力电池-电动机所提供的动力在原驱动系统的某一处会合
[4]。
逆变器 蓄电池
机械连接
减速器
电连接
功率输出
车轮
图 2 并联式 PHEV 结构
(3) 混联式插电混合动力构型
如图 3 所示混联式插电混合动力构型主要由发动机、动力耦合装置、驱动电机、逆变器、动力
电池、发电机等部分组成。混联式混合动力汽车综合了串联式与并联式两种驱动形式的优点,其三
个动力源之间具有更多的动力匹配方式,车辆具有多种工作模式,从而保证了混合动力系统在复杂
工况下仍能实现最佳动力匹配,进而达到最大限度节能减排的目的。是当前研究的热点构型。混合
机械连接
电连接
电动机 功率输出
减速器
车轮
结构是发动机与电机可以在串联和并联两种模式之间去转换,在速度低的时候主要是电机工作,在
加速时转换为串联模式,与发动机共同工作,动力的性能比较好,但是架构较为复杂,并且成本比
串联和并联昂贵。
图 3 混联式 PHEV 结构
1.3.1 能量管理概述与分类
混合动力汽车的能量管理策略是一种确定如何在发动机和电动机之间最佳地分配功率需求以及
如何控制电池的充放电的方法,以便在保持车辆性能的同时最大限度地减少燃料消耗和排放[12]。
在过去十年左右的时间里,人们发表了大量以能量管理技术为主题的研究.如图 4 所示,文中将这些
方法分为三种类型:基于规则、基于优化、以及基于学习的方法.需要强调的是,由于各类方法存
在各自的优缺点,可以通过不同方法之间的协同工作实现更好的控制效果,因此各类方法之间并不
图 4 能量管理技术分类
1.3.2 基于规则的能量管理策略
基于规则的能源管理策略使用预定义的规则或逻辑,根据某些输入或条件确定系统的最佳运行
模式或功率分配。【14】通常用于混合动力汽车传动系统,其中的规则可以基于电池的充电状态、
基于规基于参 恒温器、功率跟随、
数标定的策略 有限状态机
基于规则 确定性策略
基于频率解耦 低通滤波器、小波变
的策略 换
确定性动态规划
DP (DDP)、随机动态
规划(SDP)
离线优化
PMP PMP
基于优化
遗传算法(GA)、粒子
启发式搜索 群优化(PSO)、模
拟退火(SA)
博弈论(GT)、二次
其他
规划(QP)
能量管理策略
传统EMS、自适应
ECMS
EMS、预测EMS
在线优化
确定性MPS、自适应
MPC
MPC、随机MPC
鲁棒控制、时域拟谱
其他 法(PSTD)、滑模控
制
分类监督学习
基于学习 监督学习
回归监督学习
非监督学习 聚类
Q-learning、Dyna、
经典强化学习
Sarsa
强化学习
深度强化学习 DQL、DDPG、TD3
车速、道路坡度等因素。基于规则的能源管理策略具有简单、易于实施和快速计算的优点[19]。
基于规则的控制策略包括基于确定性规则的方法和基于模糊逻辑规则的方法[21]。基于确定性
规则的控制器在实际操作前已经定义了一套规则,状态机被作为一种可行的方法提出来实现它。这
种控制方法已经成功应用于丰田普锐斯和本田 Insight[21]。基于规则的控制由有限状态机实现,它
有八个状态,根据事件触发的规则在可能的驾驶情况中切换,这些规则取决于刹车和加速踏板的角
了验证。文献[24]中提出了一种基于发动机开关规则的控制策略,考虑了加速踏板的位置。但作者
仍然没有讨论节油的努力和潜力。ADVIOSOR 软件改进了一个启发式解决方案,该启发式控制的
结果与普锐斯控制策略进行了比较,比较结果表明,PHEV 的汽油里程比普锐斯控制策略增加了
16%[25]。Jalil 等人提出了一种基于规则的策略,以确定串联式混合动力电动汽车的电池和发动机
了 6%[26]。然而,所有这些传统的基于确定性规则的控制器很难实现优化操作。在基于模糊逻辑
[27]。一个自适应的模糊逻辑控制器选择对燃油经济性影响最小的操作点,关键参数根据驾驶周期
的变化而演变,正如文献所实现的那样。然而,当动力系统有两个或更多的控制变量时,开发适当
模式,即电动车(EV)模式、充电耗尽(CD)模式和充电维持(CS)模式[20]。在基于规则的控
制中,具有适当控制参数的 EV + CD + CS 控制模式产生的油耗最低。[20]这已被证明不能保证
1.3.3 基于优化的能量管理策略
寻找局部最优解。它包括等效消耗最小化策略(ECMS)[13]、模型预测控制(MPC)策略[14]和神
经网络(NN)策略[15]。相反,后者在整个行程中全局优化动力传动系统操作,这通常需要事先了
解行程[16]。它包括动态规划(DP)策略[17]、遗传算法(GA)策略[18]和博弈论(GT)策略
[19]。然而,前者牺牲了实时性的最优性,后者牺牲了实时性的最优性。这两种算法都不能单独实
一个多层(通常是两层)结构,其顶层侧重于全局优化。同时底层在顶层的引导下,优化了实时控
例如,在[24]中,顶层强化学习(RL)搜索全局优化,而底层树搜索算法在短期窗口内优化动力系
统。在[25]中,管理层的马尔可夫转移概率表(TPM)在决策层预测模型预测控制(MPC)-DP 协
作,因此云服务器的计算能力可以缓解全局最优性与实时性之间的冲突。然而,它并不能保证分层
用说在道路驾驶测试中了。本研究提出一种两层网际网路分散式电能管理系统(ID-EMS),用以
实时地整体优化电源的能源消耗和使用寿命。分析了算法的计算复杂度,评估了最坏情况下的计算
时间,从理论上验证了算法的实时性。因此,部署了一个互联网分布式车辆在环( ID-VIL)仿真系
延。
(资料来源:译文)
1.3.4 基于机器学习的能量管理策略
机器学习是人工智能的一个子领域,它研究的是能够从数据中学习并随着时间的推移提高其性
能的算法的发展和实施。在大数据、人工智能和计算机技术的背景下,机器学习(ML)已被广泛
应用于能源管理问题,为克服传统方法的局限性提供了新的研究方向。与基于规则和基于优化的能
制规则,也不依赖于被控对象的数字模型来计算最佳控制行动。相反,它依靠先进的数据挖掘方法
和大量的历史/实时经验数据来获得预测结果或控制策略。机器学习算法可分为三种主要类型:监
督学习、无监督学习和强化学习。
(1)监督学习
监督学习将预先定义的特征数据和目标数据作为数据集来训练一个最优控制模型,目的是赋予
模型一定预测和分类识别能力。因此,监督式学习可以进一步分为回归监督式学习和分类监督式学
池功率等信息的预测。SUN 等人[57]评估了基于广义指数变化、马尔科夫链和神经网络的预测器。
结果表明,神经网络预测器在一系列验证和实际驾驶周期中提供了最佳的整体性能。其中,径向基
函数神经网络的性能优于递归神经网络和反向传播神经网络,后者对时间序列问题很有效。分类监
督学习通常被用于驾驶模式、车辆运行模式和驾驶条件类型的分类和识别,目的是协助实现自适应
能源管理控制。例如,Wu 等人[58]提出了一种基于驾驶条件识别的模糊控制策略。驾驶工况识别
模型根据车辆行驶参数识别出当前的驾驶周期,并将识别结果传递给模糊扭矩分布模型。同时基于
PSO 方法对不同驾驶周期下的模糊控制器的成员函数和模糊规则进行了优化,以提高燃油经济性。
(2)无监督学习
与监督学习相比,无监督学习的主要功能是在探索性数据分析阶段发现隐藏的模式或对数据进
行分组。在车辆能源管理领域,无监督学习主要用于驾驶循环或数据降维的分类,以协助开发高效
MONTAZERI 等[60]基于聚类算法进行了实际交通条件下的驾驶循环数据采集,实现了驾驶特征识
别和驾驶循环分类,以提高能源管理策略的效率。FINESO 等[61]基于聚类算法开发了一种无监督
机器学习技术,用于识别基于规则的最优策略。VENDITTI 等[62]使用了类似的方法,提取了并联
HEV 的控制策略。
(3)强化学习
强化学习是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益 ¹。
强化学习的主要特点是学习者可以通过与环境的交互,不断地试错和反馈,来更新自己的知识和策
略。强化学习的核心概念包括:状态、动作、奖励、策略、值函数、贝尔曼方程等。与其他方法最
大的差异在于,强化学习可以实现无模型的策略寻优.因此,这类方法不会像优化型算法那样高度
依赖数字化模型的建模精度.此外,收敛后的强化学习模型可以直接根据状态到动作的最优映射关
系完成能量管理,避免了基于数字化模型的在线计算,因此具有巨大的在线应用潜力[63].由于上述
原因,强化学习成为了近些年能量管理领域的研究热点
在论文[31]中,该论文提出了一种混合学习方法,HyLEAR,它结合了深度强化学习和规划,
用于部分可观察环境中的自动驾驶汽车。HyLEAR 由两个模块组成:一个深度神经网络,从原始传
感器数据中学习价值函数和策略;一个蒙特卡洛树形搜索算法,使用所学的价值函数和策略来规划
最佳行动。HyLEAR 可以处理具有动态障碍物和不确定性的复杂场景,并以高效率和稳健性实现无
碰撞导航。论文[32]比较了四种用于混合动力电动汽车(HEVs)能量管理的深度强化学习(DRL)
的性能,并分析了它们的可转移性和稳健性。该论文认为,TD3 在油耗和电池充电状态方面优于其
问题被建模为一个马尔可夫决策过程。目前的研究主要集中在基于深度强化学习(DRL)的 EMS
汽车能量管理方面的作用,证明了前者在收敛性和燃油经济性方面的优势。[35]表明,基于深度确
定性政策梯度(DDPG)算法的能源管理政策具有很强的深度神经网络的表征能力,可以显著提高
燃油经济性。此外,[36]表明,同步优势行为者批评(A3C)和分布式最优策略优化(DPPO)提高
了 EMS 的学习效率。
1.4 研究内容与方向
2.1ID-VIL 概述
如图 5,ID-VIL 模拟可以看作是一个分布式服务器-客户机系统,其中云服务器连接不同的
仿真对象 实车在环仿真
燃料电池在环 电池在环(BIL)
(FIL) 云服务器
和驱动电机)的软仿真。其余子系统(X-in-The-loop)接收来自云的命令(例如,电源需求),
并在硬件在环系统上执行。之后,将实际响应(例如,可用功率)发送回云。
图 5 ID-VIL 仿真示意图
2.2 ID-VIL 的网络配置
图 6 ID-VIL 仿真拓扑图
互联网
ECU、电机 电池
云服务器
LTE 网络)连接到云。同时,由于传输延迟和可靠性的问题,有线互联网链接了其余的子系统。更
图 7 ID-VIL 仿真的地位位置分布
图 7 说明了整个分布式系统的地理分布。具体来说,(1)VIL 位于重庆理工大学华西校区周边
区的电力电子实验室内。每个子系统的配置概要见表 1。
表 1 在 ID-VIL 中配置子系统
子系统 详细配置 主要参数
测试车辆 实车在环仿真 车辆质量:1.5t
(VIL)
EMS 软仿真 互联网分布式 EMS
(云端)
逆变器和 软仿真 异步电动机
驱动电机 (云端) 额定功率:20kW
燃料电池 燃料电池在 PEM,额定功率:30kW
环仿真(FIL) 额定电压:168 V
电池 电池在环 额定电压:3.2V×56,
仿真 额定容量:50Ah
2.3 实车在环子系统
CAN-USB
转换器 4G LTE USB无
线调制解调器
车载数据
采集装置
电动汽车
(力帆 620EV)
图 8 实车在环配置
θbrk)在以下公式中转换为所需的驱动功率:
VIL 上的驱动电机。这种安排的原因在补充条款的 S2 节
2.4 云服务器
5 Mb)。它的主要功能包括:(1)能源管理策略,(2)通信控制,以及(3)子系统软件模拟
(在本研究中,它是驱动电机)。第一个功能(能源管理策略)将在第 3 节描述。[31]中的研究讨
论了第二个功能(通信控制)。电动汽车(力帆 620EV)车载数据采集单元 4G LTE USB 无线调制
30kw PEM
燃料电池
控制台
端接收功率需求(Pfc_req),并将可用功率(Pfc_avl)、瞬时燃料消耗(Fuel)和堆栈的
表 2 PEM 燃料电池堆参数
名称 参数
燃料电池数量 240
参考电流 107A
参考电压(BOL) 168V
开路电压 295.2V
空闲电流 10.2A
为 0.70V(电池堆:0.7×240=168V),在电池堆第一次被激活后的恒定负荷下的电流。换句话说,
电池堆处于生命之初(BOL)。以同样的方式,空闲电流对应于 0.65V。
图 10 燃料电池的燃料消耗量
堆达到其寿命终点(EOL)。因此,燃料电池的 SOH(SOHfc)定义如下:
38914-2020[33]也提供了定量评价燃料电池退化过程的实验方法。首先,应考虑启动-停止工作条件
对 SOHfc[35]的影响。其次,可以通过从整体结果中扣除启动-停止的影响来测量某些恒定功率条件
为以下能源管理的最佳对象之一。
电池
电池测试仪
温度控制箱
电子负载
图 12 BIL 电池测试台
表 3 电池参数
名称 参数
类型 LiFePO4
额定电压 3.2V
额定容量 50Ah
欧姆电阻 1.21mΩ
电池的容量衰减过程与欧姆电阻的增量呈线性关系[36]。此外,当电池达到寿命终点(EOL)
时,电池容量下降到寿命起点(BOL)水平的 80%,并且欧姆电阻增加一倍。所有这些导致了
SOHbat 的定义如下:
REOL −Rohm
SO H bat = ×100 %
RBOL
{ R EOL=2 × R BOL
C EOL=0.8 ×C BOL
SOCbat)下工作引起的内阻变化(ΔRin)被用来计算相应的 ΔSOHbat,公式(3)。ΔSOHbat 的重
复降解实验的细节在补充材料的 S4 部分介绍。
图 13 不同工况 Δ SO H bat
13 标定的状态中下降很远。
3.全局最优 EMS 算法
3.1 简介
典型的全局优化算法,如随机动态规划(SDP),不能满足汽车动力传动系统控制的实时
但仍然存在的时间限制内执行,因此需要分析其计算复杂度来评估计算时间。
3.2 ID-EMS 的双层结构
行车数据记
云端EMS 行车预测
录仪
与其他系统
全局优化
的交互 IOV
实时优化
车载EMS
图 14 ID-EMS 两层结构
指导SOC
电池SOC ID-VIL中的PHEV
底层 底层模糊控制器 需求充电功率 动力总成
汽车最近的平均 (测试车辆)
(车载端) 能耗
图 15 ID-EMS 流程图
1. EM 算法将历史驾驶数据分为 6 组典型条件。
3.经过训练的神经网络使用来自领先车辆的实时驾驶数据来预测测试车辆的未来驾驶条件。
6.使用来自云服务器的全局解决方案(参考 SOC)作为参考,车载模糊控制器尝试实时局部优
化充电活动。另外,(1)和(2)是在云上离线计算的。(3) 和(4)在云上以在线模式(实
时)执行。车载嵌入式处理器仅执行(6)。
3.3 历史行驶数据处理(离线)。
3.3.1 历史行驶数据(云端)
图 16 道路测试的形式路线
在这项研究中,假设车辆在预定的路线上运行。现实生活中的类似场景包括通勤交通和公共交
通。图 12 中的预定义路线是围绕重庆理工大学花溪校区的。这条路线由四条道路组成,其中只有
一条(内环高速)是高速公路状况,其他都是城市状况。此外,图 12 中的路线根据地理特征(如
红绿灯和交叉路口)被分为 15 段(称为微行程片段[39]),这可以方便下面的数据处理。蓝点是预
时间(s)
速度(km/h)
距离(km)
图 17 采集的历史行驶数据
驾驶数据是在 17:00 至 19:00(典型的高峰期)采集的,届时将进行公路驾驶测试。此外,在记
录驾驶数据时,除非出现危险情况,驾驶员应尽可能地跟随交通流,这样可以大大消除司机的驾驶
时)。在空间域中呈现的驾驶数据比在时间域中显示出更多的可重复性[40]。因此,在 EM 聚类分
析的预处理中,驾驶数据在空间域中被处理为 15 段。
3.3.2EM 聚类分析(云端)
表 3 用于行驶数据聚类的特征参数
# 特征参数 单位
1 平均速度 (km/h)
2 平均加速度 (m/s2)
3 平均减速度 (m/s2)
4 怠速停车比例 (%)
5 0-20km/h 速度比例 (%)
6 20-40km/h 速度比例 (%)
7 40-60km/h 速度比例 (%)
8 >60km/h 速度比例 (%)
9 平均油门踏板位置 (%)
10 平均能耗 (%)
(kJ/km)
在[41]中,有一些特征参数和驾驶周期行为有较强的关联性。因此,在数据预处理过程中,表
3 中的这些特征都是从微行程片段数据中提取的。平均能耗(#10)是基于公式(1)中的车辆驾驶
(θacc)的影响。因此,如果司机被指示尽可能地跟随交通流,这个平均能量消耗可以被视为主要
受交通流状况影响的变量
表 4 子工况描述
类型 典型特征
1 交通顺畅,中速
2 高速公路,高速
3 进入高速公路中速以上,加速
4 高速公路外,中速以上,减速
5 轻微交通堵塞,中速行驶
6 交通堵塞,低速
一种迭代方法,用于最大化包含潜在变量的统计模型中的参数的后验估计。也就是说,EM 迭代在
计算两个步骤之间交替进行。期望步骤(E-step)使用当前统计参数的估计值来评估潜变量的对数
算法之前,应该建立一个高斯混合模型(GMM)[43]来表达样本数据(微旅行数据)。首先,
−1
1 2
¿¿
p( x )= n n
e
(2 π ) ∨Σ ¿ 2
2
(C={C1,C2,...,Ck}),代表表 6 中的驱动子条件,高斯混合分布可以定义如下:
k
p M (x)=∑ α i ⋅ p (x ∣ μ i , Σ i)
i =1
现在,EM 算法可以描述如下:
α i ⋅ p(x j ∣ μi , Σ i )
γ ji = p M (z j =i∣ x j )= k
∑ α l ⋅ p( x j ∣ μ l , Σl )
l=1
迭代(2)和(3),直到满足停止标准{
使用方程(7);
∑ γ ji
α = j =1
'
i
m
¿
m
∑ γ ji x j
' j=1
μ= i m
∑ γ ji
j=1
∑ γ ji
j=1
概率,即
λ j=arg max γ ji
i ∈{1,2 ,… ,k }
其中 λj 是样本 xj 的聚类标签。
和平均能量消耗。这两个参数将被用于全局优化过程中。
图 18 子工况平均速度概率分布图
图 19 子工况平均能耗概率分布图
3.3.3 训练用于预测的神经网络(NN)
驾驶状况。分类后的结果将被用作测试车辆的未来驾驶状况。将被用作测试车辆的未来驾驶条件,
这将在下一节中讨论。
N 输入 H神经元
K输出
图 16 中的 RBF 神经网络是一个由三层组成的局部近似网络。首先,输入层中的神经元作为分
布点,由表 5 中的微行程片段数据的特征参数表示。其次,隐藏层使用类似高斯的径向基函数
(Rj(x))作为激活函数:
2
−∥ x−C j ∥
R j (x)=exp ( 2
)( j=1,2 ,… , H )
2σ j
条件 i 的输出信号。
H
y i=∑ ωij R j ( x)+ω i (i=1,2 , … , K )
j=1
其中 ε 是最高输出的集群标签。
ε =arg max yi
i ∈ {1,2, … ,K }
在对 RBF 神经网络进行离线训练后,它可以利用领先车辆的信息对测试车辆的未来驾驶状况进行
驶状况进行在线预测,这也是下一节的内容。
3.4 双层能量管理(在线)
3.4.1 基础理论与算法介绍
(1) 随机动态规划(SPD)算法
动态规划是执行一系列相关决策时的一项有用的数学技术,它提供系统化的方法来寻求全局最
优解。对于具有确定性的过程的规划而言,每做完一次决策后进入的下一状态也是确定的。而对于
随机动态规划算法而言,在随机变量因素的影响下当前状态做完决策后进入的下一状态是无法完全
确定的,因此新的状态也会因此而具有随机的性质。所以在随机动态规划算法当中应该利用分阶段
思想来处理随机变量的问题。
随机动态规划主要利用现实世界中存在现实情况来转化成数学中的抽象向量,从而建立数学模
型来解决问题。系统优化时,常用模型组成部分如下:
1. 阶段:指解决问题时对其的自然划分。阶段与阶段之间是互相联系的,且具有顺序性,对
所有阶段的求解过程就是对系统问题的求解。阶段可以是连续的,也可以是离散的,一般
用 k 表示阶段。
2. 状态变量:指一个阶段开始时的自然状态。在当前阶段所获得的收益,将只取决于当前状
态,与过去的决策和状态无关。用 表示 k 阶段下的某一状态。
3. 决策变量:当一个阶段状态确定后,决策变量的作用是将当前的状态转化为下一阶段的某
4. 策 略 : 由 决 策 所 组 成 的 序 列 称 之 为 策 略 , 从 第 k 阶 段 到 第 j 阶 段 的 策 略 记 作 为 :
pkj ( xk )={uk ( x k ), ⋯ ,u j (x j )}
5. 状态转移:状态转移描述了从一个状态执行了一定决策后到达另一个状态。假设第 k 阶段
λ k+1=T k (λ k , x k ( λ k )) ,
6. 指标函数:用于衡量所实现过程优劣的一种数量指标,它是定义在全过程和所有后部子过
7. 递推方程:依据随机动态规划组成成分和随机变量的特点,系统的描述建立递推方程:
动态规划问题同时还具备着以下特征
1. 最优子结构:在一个全局最优策略当中,对于其中的任意一个阶段,无论之前的策略以及
状态是怎么样的,对目前阶段的状态都不会产生影响,而且该阶段之前所确定的最优策略 ,
在该阶段之后所形成的决策序列也是最优策略,即全局最优策略中的子策略也是最优的。
2. 无后效性:在决策的过程当中,对于给定的某个状态,它未来的决策不受它之前状态的影
响,只会受当前或最近一次状态的影响。
3. 子问题重叠性:动态规划的根本目的是为了解决问题的冗杂性,因为在决策过程当中,每
个子问题都会有相同的子问题,而动态规划会将这些子问题的状态记录到表里,以此方便
后续查询。因此动态规划是一种以空间复杂度简化时间复杂度的算法。
综上,求解动态规划问题一般包含以下几步:
1. 明确解决问题对象
2. 将问题划分成多个阶段,确定状态变量空间,按照时间或者空间进行划分
3. 确定控制动作空间,根据被控对象状态进行合理划分
4. 确定状态转移函数,根据被控对象进行建模
5. 根据控制目的设计指标函数
6. 求解最优值函数,生成最优控制策略
(2)算法的时间复杂度(待补充算法导论里的渐进符号方面的知识)
在算法设计和分析中,时间复杂度是衡量算法执行时间的一个重要概念。当算法输人规模
足够大,使得只有运行时间的增长量级有关时,我们要研究算法的渐近效率。也就是说,我们
关心当输人规模无限增加时,在极限中,身法的运行时间如何随着输入规模的变大而增加。通
常,渐近地更有效的某个算法对除很小的输人外的所有情况将是最好的选择。
析中,我们通常将 T(n)的增长率作为算法执行时间的度量标准。时间复杂度的计算方法,一般
行的时间不超过 k*f(n)。
常见时间复杂度的分类和说明
时间复杂度常见的分类有常数阶、对数阶、线性阶、线性对数阶、平方阶、立方阶和指数阶。
下面对这些常见时间复杂度进行分类和说明:
常数阶
立于问题规模,是最优秀的时间复杂度。
对数阶
增长得比较慢,是较优秀的时间复杂度。
线性阶
常见的时间复杂度之一。
线性对数阶
问题规模 n 成非线性对数关系,是较优秀的时间复杂度。
平方阶
关系,是较差的时间复杂度。
立方阶
关系,是较差的时间复杂度。
指数阶
求解旅行商问题的暴力穷举算法的时间复杂度为 O(2^n)。指数阶时间复杂度的算法执行时间与
问题规模 n 成指数关系,是最差的时间复杂度。
不同时间复杂度对算法执行时间的影响
不同时间复杂度对算法执行时间的影响是显而易见的。当问题规模 n 很小时,各种时间复杂度
的算法的执行时间差异不大。但是,当问题规模 n 很大时,不同时间复杂度的算法的执行时间
差异会变得非常大。因此,在实际应用中,我们需要选择时间复杂度比较优秀的算法来解决问
题。
3.4.2 基于先导车的实时神经网络(NN)预测
表 5 先导车参数
子系统 参数
车型 长安 eado EV460
迎风面积 2m2
汽车质量 1450kg
荷重 100kg
驱动电机 永磁同步电机
额定功率 40kW
峰值功率 120kW
电机齿轮比
车轮直径 固定 9.1
0.595m
如前所述,ID-EMS 使用先导车辆驾驶状况来预测测试车辆的未来驾驶状况。预测的准确性是
基于这样的假设:先导车辆的驾驶状况与测试车辆的驾驶状况相似。为确保这一假设,我们采用了
员的习惯就不会影响预测结果。第二,很明显,如果有更多的领先车辆,预测将更加准确。因此,
三,主导车辆的参数应该与测试车辆(力帆 620EV)相似。同一型号的车辆将是最好的选择。然而,
5 中的参数,除了驱动电机外,测试车辆和先导车辆是相似的。这不会是一个问题,因为本研究选
择了车辆的驱动力(PEV)进行计算。PEV 可以看作是推动车辆的机械功率,与驱动电机的型号无
数据采集处理端
OBD接口
4G LTE USB上网卡
USB转CAN-BUS接口卡
图 21 先导车配置
辆的状况并控制驾驶动力(见图 2 和 3)。相比之下,主导车辆只监测车辆的状况。简而言之,前
者是可读可写的,而后者是只读的。
F
F F F
(a) 先导车
F
子工况类型
速度(km/h)
高速F
公路
(b) 测试车
F
子工况类型
速度(km/h)
距离(km)
图 21 基于先导车的 NN 预测示例
图 21 说明是只有一辆先导车辆的预测情况。具体来说,先导车辆比测试车辆提前 10 分钟出发。
中预测的测试车辆的未来驾驶状况。在本研究中,为了提供更准确的未来驾驶状况,实验中部署了
由于未来的驾驶状况是根据先导车辆的状况来预测的,所以在之前的研究中,预测问题曾经通
过动态编程算法来解决[29]。然而,在这种情况下,当前阶段的系统状态(电池 SOC)和策略决定
(充电功率和持续时间)不能明确地决定下一阶段的状态。预测的下一个状态有一个概率分布,因
图 22 随机动态规划(SDP)算法结构
初始 SOC(SOCinit)和结束 SOC(SOCend)是在旅行前预定的,所以省略了插入式充电的成本,
i=1
平均能耗是由低到高排列的。因此,在相同的决策 xn(充电功率和持续时间)下,最低的能量消
耗(或车辆驱动功率)会导致下一阶段的最高状态(电池 SOC),反之亦然。
距离(km)
图 23 参考 SOC 的数值示例
SOC(SOCub 和 SOClb)为边界的决策树中,并将从云端传输到测试车辆的车载处理器。由于数据
量大,发送与当前车辆状态有关的部分结果,而不是整个树状结构的结果,是比较实际的。因此,
只有当测试车辆到达一个新的微旅行时,才会触发数据传输。它只传输与当前状态 sn 有关的
SOCub 和 SOClb 的数据,因为当前电池 SOC 决定了 sn。图 20 展示了一个 SOCub 和 SOClb 的数字
核心过程是一个四重循环。从外到内,有阶段循环、状态循环、决策循环和概率循环。概率循环的
形式是第 4 行的 S 步叠加。
图 24 SDP 算法伪代码
SDP 算法的优化结果。
状态上限
状态下限
实际运行时间
计算时间(秒)
SDP状态(SOC)
理论运行时间
SDP阶段规模(n)
图 25 SDP 算法计算时间
的充电选项(充电功率和持续时间)的数量。2)概率 pi 的大小也是预定的,它是图 15 和 19 中指
的复杂性呈现如下。
4. 实车在环实验
4.1 实验安排
表 xx 试验布置实验
参数 数值
出发时间 17:30
行驶距离(km) 14.5
预定义 SOCinit 0.3
预定义 SOCend 0.2
先导车数量 3
燃料(H2)价格(元/kg) 40
燃料电池组价格(元/kW) 2000
电池价格(元/kWh) 1000
基于图 1 中的 ID-VIL 平台,建立了一个道路驾驶实验来评估所提出的 ID-EMS 的性能。试车
试车辆的预测驾驶条件。理想情况下,他们每个人负责覆盖整个行程的三分之一,如图 26 所示。
为了优化覆盖率,引导车辆和测试车辆的发车时间表定义如下:
时,且在领先车辆#3 九分钟后离开。
测试车辆等待领先车辆#1 返回的原因是,在此之前,预测的驾驶条件可以覆盖整个行程。
此外,云上还保存了每个行程段的预测驾驶条件表。每辆领先车辆在推出一个路段后,都会上
传一次其驾驶状况。同时,云确保新上传的分段驾驶条件将覆盖旧的驾驶条件。因此,通过按时间
4.2.1 三辆领先车辆的预测驾驶条件
测试车辆和引导车辆的记录驾驶条件如图 27 所示。测试车辆的出发时间定义为时间零点。因
辆更类似于测试车辆,因为它们在出发时间表中彼此更接近。
(a)测试车#1
速度(km/h) 速度(km/h) 速度(km/h) 速度(km/h)
(c)先导车#2
(d)先导车#1
时间(s)
图 xx 测试车与先导车的行驶工况
行程片段(空间域)
起点
中间点1
时间域
中间点2
(绿色:先导车#1,黄色:先导车#2,红色:先导车#3,白色:测试车
图 xx 云端上预测的行驶工况
先导车在完成一个行程段时将其驾驶状况上传到云端。特定行程段的新数据将覆盖云端上相应的旧数据。通过
形边界的数字所示。12。其垂直轴由测试车辆在时域中驶出每个片段的时刻定义,如图 26 中带正方形边界的数字
所示。例如,测试车辆的出发时间为时间零点。推出第一段的时间是时间一,等等。表中的数字指的是图 14 和图
15 中的一类子条件。它的颜色指的是它所属的车辆类型。例如,当时间为零时,测试车辆从起点出发,并且每个领
先车辆(#1、#2 和#3)覆盖行程的一部分(红色、黄色和绿色)。在第四时刻,测试车辆驶出第四段,到达中间点
行全局优化。
4.2.2 试验结果
(km/h)
(W)
速度
Pveh
高速路段
燃料
(g)
(W)
Pfc
SOCfc
SOHbat
(W)
Pbat
延迟#4
SOCbat
延迟#12
延迟#0
时间(s)
层使用当前的 SOCbat 和 SOClb 作为 SOCub 和 SOClb 来运行测试车辆,直到 18.2 秒后基准 SOC 可用,这导致延迟#0 内
控制充电时间,并使用预定义的最佳充电功率作为默认充电条件。因此,在图 29 中,燃料电池组的充电功率保持
在 20.25kW。充电频率是有限的,因为燃料电池组的每次启动都会损坏其 SOHfc,这可以通过每次充电操作开始时
SOHfc 的急剧下降来观察到。此外,大多数充电操作都位于高速公路条件下,因为高速公路条件下的平均能耗高于
4.2.3 试验实时性分析
(W) (km/h)
Pveh
(W)
SOCfc Pfc 速度
高速路段
燃料
(g)
SOHbat
(W)
Pbat
SOCbat
时间(s)
图 27 中的驱动条件并将其应用于实验。除此之外,对比实验中的其他布置也与表 8 中相同。其目的是测试重计算负
繁重的计算负载情况。
(W) (km/h)
Pveh 燃料
(W) (g)
Pbat SOCfc Pfc 速度
高速路段
SOHbat
(W)
SOCbat
时间(s)
即使云断开连接,ID-EMS 也可以正常工作。
表 xx 道路试验统计结果
为代价,具有最低的计算复杂度。相比之下,DP-EMS 需要对未来驾驶信息有充分的了解。此外,
Pveh
速度
(W)
高速路段
燃料
(W)
Pfc
(g)
SOCfc
SOHbat
(W)
Pbat
SOCbat
时间(s)
图 xx RB-EMS 试验结果
(km/h)
Pveh
(W)
速度
高速路段
燃料
(W)
Pfc
(g)
SOCfc
SOHbat
(W)
Pbat
SOCbat
时间(s)
图 xx ID-EMS 试验结果
图 32 和 33 分别是 RB-EMS 和 DP-EMS 的实验结果。首先,由于与 ID-EMS 相同的原因,在高速公路条件下执
实验中适应了频繁的充电操作。因此,它承受着最高的燃料电池退化成本,这提高了它的总体成本。第四,当云不
主要来源。
如上所述,燃料电池和电池在 30 分钟的驾驶实验内的降解过程太慢且太小,无法通过物理测
没有从初始水平下降很远,那么燃料电池和电池的退化过程可以被视为线性的。因此,表 12 中每
Rin 的采样精度差。
表 xx 重复试验统计结果
ID-EMS RB-EMS DP-EMS
(运行 3 次)
∆ V ref(V) 0.155 0.514 0.110
∆ SOHfc 0.004613 0.015298 0.003274
∆ SOHfc/圈数 5.766e-5 1.912e-4 4.093e-5
仿真误差 +14.3% +17.9% +13.6%
∆ Rin(mΩ ) 0.031 0.033 0.030
∆ SOHbat 0.025616 0.027269 0.024790
∆ SOHbat/圈数 3.202e-4 3.372e-4 3.099e-4
仿真误差 +6.6% +7.6% +3.0%
5. 总结
程,可以为该领域的研究人员提供一些指导。ID-EMS 的缺点是,预测未来的驾驶条件取决于领先
的车辆,而这会受到许多因素的影响。此外,缺乏联网车辆(可能的信息来源)也限制了 ID-EMS
的商业应用。考虑到联网车辆的占用率仍在发展,其他信息来源,如在线数字地图,可能是更好的