You are on page 1of 5

实时混合试验控制方法研究

一、研究介绍
实时混合试验(Real-Time Hybrid Simulation, RTHS)是混合仿真技术的发展,有益于
实时研究包括速率相关效应在内的结构动态响应,可用于大型全尺度试验子结构的试验,
并与数值子结构的模拟相结合,获取整个结构系统在地震激励下的动态响应,成本低、效
率高。在 RTHS 中,要求伺服液压作动器实时跟踪试验子结构上规定的位移,而不确定性
和非线性会极大地影响控制性能,且由数值积分方法、作动器动力学等因素产生的时滞也
是相关的热点研究问题。
Silva 等(2020)基于地震激励建筑物实时混合模拟提出了该研究领域的基准控制问
题,以一个三层钢框架模型作为参考结构,开发和提供了真实的数值模型来评估各种控制
方法的 RTHS 性能 [1]。本文基于该基准控制问题,针对现有研究中存在的作动器动力学、
时滞补偿、建模不确定性等科学问题,拟提出一种新型控制方法提高 RTHS 位移跟踪效果
和鲁棒性。主要工作包括:
(1)基于深度强化学习算法设计自适应 PID 控制器;
(2)探究实时混合试验动态补偿的鲁棒模型预测控制方法;
(3)探究基于离散自适应回归模型的优化补偿设计方法。

二、研究内容
2.1 RTHS 基准控制问题
基准模型考虑一个三层钢框架,如图 1 所示。选取钢框架首层作为试验子结构,其余
楼层为数值子结构。通过考虑各层楼板的模态阻尼和质量的变化,定义了四种不同的分区
情况。采用 9 个时域指标 J1—J9 来评价拟议控制器在标称模型和参数变化情况下摄动模型
的跟踪性能和鲁棒性。图 2 为 RTHS 基准控制问题 Simulink 模型,需将拟提出的控制器置
换图中的控制器模块分析。

图 1 参考结构物理划分 图 2 RTHS 基准控制问题 Simulink 模型


2.2 基于强化学习的自适应 PID 控制方法
线性化 MTS244.41s 液压伺服作动器 Simulink 模型,利用 MATLAB 设计控制性能与
鲁棒性平衡的 PID 参数;基于 DDPG 算法,强化学习智能体采用 Actor-Critic 结构,Actor
和 Critic 神经网络都设计为具有输入层、隐藏层和输出层的 3 层拓扑结构,采用阶跃信号
学习该智能体形成自适应 PID 控制器,并相应地设计针对该系统合理的奖励函数。控制器
学习完成后,对比了在不同输入位移指令下和传统定值 PID 控制器的控制性能。图 3 为基
于强化学习的自适应 PID 控制器的 Simulink 图。
(a) MTS244.41s 液压伺服作动器 (b) Actor 和 Critic 神经网络

(c) 基于强化学习作动器控制框图

(d) 基于强化学习的自适应 PID 控制器 Simulink 图


图 3 基于强化学习的自适应 PID 控制方法
为验证所提控制方法的有效性,将幅值为 0.5mm,频率为 1Hz 的正弦波作为命令位移信
号,仿真时间为 30s,系统的测量位移和跟踪误差如图 4; 将 Kobe 波作为命令信号,仿真
时间为 30s,系统的测量位移和跟踪误差如图 5。结果表明:基于强化学习的自适应 PID
控制方法能有效地进行时滞补偿,因其具备在不同激励下对 PID 参数自整定的特点,与传
统定值 PID 控制相比,跟踪能力和鲁棒性更好。
图 4 幅值 0.5mm,1Hz 正弦波激励下的系统的测量位移和跟踪误差

图 5 Kobe 波激励下系统的测量位移和跟踪误差
2.3 RTHS 动态补偿的鲁棒模型预测控制方法
Tsokanas 等(2020)[2]提出的模型预测控制方法由鲁棒模型预测控制器、多项式外推算
法和卡尔曼滤波器组成,如图 6 所示。MPC 能够在线适应控制律,对一组特定的仿真时间
步长进行专门时滞补偿和不确定性补偿; MPC 可以进行在线优化,同时处理系统的约束条
件。MPC 的工作流程为读取当前状态 x [k];计算最优控制序列;实施序列的第一个元素,
如图 7 所示。结合基准控制问题中的被控对象模型,利用 MATLAB2020a 中的模型预测控
制工具箱,通过正弦输入信号简单验证了 MPC 方法在基准控制问题的有效性,如图 8 所
示。

图 6 RTHS 模型预测控制器结构
图 7 MPC 方法论

图 8 模型预测控制工具箱的应用
2.4 基于离散自适应回归模型的优化补偿设计方法
Carrion 和 Spencer(2007)[3]在连续时域开发了一种基于模型的前馈补偿器;Phillips 和
Spencer(2011)[4]使用了伺服液压执行器的三阶或四阶传递函数来设计基于模型的补偿器。
Fermandois 将连续时间域内基于模型的前馈反馈控制方法应用到基准控制问题,本文对此
进行了复现。图 9 为被控对象模型,图 10 为前馈控制系统 Bode 图。
由于数字计算的发展,离散控制器可以减少数模转换过程产生的时滞。本文将自适应
滤波技术和基于模型的控制方法结合提出基于离散自适应回归模型的优化补偿设计方法。
被控对象模型采用自回归各态历经模型(ARX 模型),如下:
y ( t ) + a1 y ( t−1 )+ …+a na y ( t −na )=b1 u ( t−d ) +…+ bnb u (t−d−nb+1 )
其中:na 为系统极点数目,nb 为系统零点数+1
Z 变换有,可以得到有限脉冲模型(FIR 模型):
由于为非最小相位系统,被控对象的逆用脉冲传递函数表示为:

由于非因果部分导致的系统不稳定,通过引入纯时滞 z−∆ 使得系统稳定。其中 n1 和∆需


要优化确定,通过采用不同的优化算法调节前馈逆控制器的参数。时域内自适应律通过最
小二乘法确定参数,使得误差信号均方根最小。而传统时域评价指标由于依赖响应过程,
通过快速傅里叶变换引入频域评价指标 FEI 来计算输入输出信号之间的幅值和时滞的误差,
并利用窗口移动技术克服数据长度有限情况下时滞补偿的实时优化问题。

图 9 被控对象模型 图 10 前馈控制系统 Bode 图

参考文献
[1] Christian E. Silva, Daniel Gomez, et al. Benchmark control problem for real-time hybrid simulation [J].
Mechanical Systems and Signal Processing, 2020,135.
[2] Tsokanas, N., Wagg, D., & Stojadinović, B. (2020). Robust Model Predictive Control for Dynamics
Compensation in Real-Time Hybrid Simulation. Frontiers in Built Environment,
6.doi:10.3389/fbuil.2020.00127
[3] Carrion, J. E., and Spencer, B. F., Jr (2007). "Model-based Strategies for Real-time Hybrid
Testing." University of Illinois at Urbana-Champaign, Champaign-Urbana, IL, USA, 211.
[4] Phillips, B. M., and Spencer, B. F., Jr (2011). "Model-Based Feedforward-Feedback Tracking
Control for Real-Time Hybrid Simulation." University of Illinois at Urbana-Champaign,
Champaign-Urbana, IL, USA, 42.
[5] Fermandois, G. A. (2019). Application of model-based compensation methods to real-time hybrid
simulation benchmark. Mechanical Systems and Signal Processing, 131, 394-416.
doi:10.1016/j.ymssp.2019.05.041

You might also like