You are on page 1of 154

TP242.6 单位代码: 10335

分类号:

密级: 公开 学 号: £型塑!多

洳专:j、法
博士专业学位论文


中文论文题目: 多旋翼飞行器

遨应堂重塾塑型
Motion Planning—
英文论文题目:一Kinodynamic
for Multirotor Aerial Vehicles

申请人姓名: 叶鸿凯

指导教师: 高飞 特聘副研燧
合作导师: 许超 教授

学科(专业): 电子信息

研究方向: 自主导航与运动规划

所在学院: 控制科学与工程学堕

论文递交日期二零二二年四月

万方数据
多旋翼飞行器

动力学运动规划


论文作者签名:

指导教师签名:

论文评阅人l: 隐名评阅

评阅人2: 隐名评阅

评阅人3: 隐名评阅

评阅人4: 隐名评阅

评阅人5: 隐名评阅

答辩委员会主席: 吴 俊 教 授 浙江大学

委员1:

委员2:

委员3:

委员4:

委员5:

答辩日期 2022年05月30日

万方数据
for Muitirotor Aerial Vehicles

Author’S signature:

Supervisor’S signature: 红恳臣护


External reviewers: 垒垦Q望Y塑Q坚

△旦Q望Y坐Q堕

垒旦Q望Y坐Q坠璺

垒旦Q望Y塑Q坚

垒旦Q旦Y坐Q坠曼

Examining Committee Chairperson:

Prof.Jun Wu ZJU

Examining Committee Members:

垒墅Q鱼i堂皇旦!Q£兰垒璺必i星墨旦里旦 旦鉴堕兰!
Associate Prof.Yi Zhou HNU

垒墅Q旦i堂皇旦!Q£..№曼坠垒望g 圣!旦

Date of oral defence: 丛型三Q坐1 2Q呈呈

万方数据
浙江大学研究生学位论文独创性声明

本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成

果。除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的

研究成果,也不包含为获得浙江大学或其他教育机构的学位或证书而使用过的材料。

与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢

意。

学位论文作者签名
1裼岫 签字日期:沙Vy年6月‘日

学位论文版权使用授权书

本学位论文作者完全了解浙江大学有权保留并向国家有关部门或机构送交本论

文的复印件和磁盘,允许论文被查阅和借阅。本人授权浙江大学可以将学位论文的全

部或部分内容编入有关数据库进行检索和传播,可以采用影印、缩印或扫描等复制手段

保存、汇编学位论文。

(保密的学位论文在解密后适用本授权书)

学位论文作者签名:

签字日期:沪11年
1裼粕
占月 6日
导师签名

签字日期:
稚高仉
年 月 曰

万方数据
致谢

自13年本科入学,我已然在求是园度过近九年时光,而今将要离开,许多往事依

旧历历在目,我想诚挚地感谢在这一段旅程中与我相识相知相助的人们。

我发自内心地感谢我的导师许超教授和高飞老师,你们的辛劳成就了现在的所有,

创建且维系着有爱的实验室大家庭。自大三的一个科研训练项目开始,许超老师便指导

我的科研。许老师勤勉尽责,对事物总是保持着极高的热忱。我们时常感叹于其知识渊

博且思维活跃。高飞老师则更加亦师亦友,从本科时的学长变为我硕博连读时期的导

师。我永远会记得的是高老师教会我要对问题本质进行不断思考,永远不要停止思考。

两位老师有着宽广又超前的视野,果敢而准确的决断,是我终身学习的榜样。能受两位

老师多年的言传身教,我实属幸运。

由衷感谢实验室的兄弟姐妹,从ZMART,到FASTLAB,从老和山脚,经甬江之

滨,到西塞山下,一起经历的跌宕愈之加深了我们感情。实验室于我一直是一个家,我

也将永远视这里为家。感谢朱疆成、邱炜、崔粲、王宏达几位师兄在我刚进入实验室时

对我的一切关照,你们带领我快速成长,完成从懵懂的本科生到研究生的转变,我会记

得那些饱含笑与泪的成都和北京之旅。感谢蔡声泽、叶长春、叶波、茹祥宇、翁一桢、

黄永斌、郭磊、朱均、万旭东、王瀚林几位师兄对我在科研和生活上的关照,我依旧回

味那些封存在已经消失的301、302,以及健身房和球场上的欢乐。令我感动和开心的是

毕业后大家也都还保持着联系,互相交流帮助。感谢汪哲培、张煜恰、熊坤、梁家铭几

位同期伙伴一路上的扶持,Paper、比赛、项目,不论高峰还是低谷,大家一起经历了最

长的风风雨雨,你们会是一辈子最诚挚的朋友,我永远珍视,祝你们今后一切顺利。感

谢丁梓明、王立子、全伦、王钱浩、纪佳林、周鑫、杨天凯几位师弟,你们每个人都有着

非常鲜明的优点,而靠谱是共同点。和你们从304到宁波再到湖州,一起经历了FAST

LAB初期的建设,你们在我心里不仅是在科研领域能够独当一面的师弟。更是能够知

心交谈的朋友,和你们在一起的时光我非常快乐。感谢仲星光、殷隆基、贾振、侯嘉良、

温向勇、吴雨薇以及其他所有在FASTLAB相遇的朋友,有些情谊无法用相识的时间长
短衡量,一经熟识便知道会是永远的朋友。感谢所有师弟师妹,你们的天赋和成就比之

我绝对是有过之而无不及,与你们一起学习合作是我的荣幸。限于篇幅,对所有未具名

万方数据
朋友的感谢暂且留于心中。

感谢我的朋友朱麒霈、叶林、孙健、孙聪,生活五味杂陈,深深感谢你们的支撑。

感谢我的家人。

如果这是Harry Potter的魔法世界,那我希望习得提取记忆的咒语,有些能将之消

除,而有些能够永远存放。

生活塑之我独立而理性,而我固爱此间遇见的每一个人。

叶鸿凯

2022年6月17日凌晨于浙大湖州研究院

万方数据
摘要

近年来,小型多旋吴飞行器在航拍摄影、巡检监控、农业喷洒、物流配送等领域渐

渐崭露头角,随着其在各行业中的应用越来越广泛,对其自动化、自主化、智能化作业

的需求愈发强烈,开发飞行器自主导航系统成为研究热点。稳定的感知以及控制能够保

证自主导航系统的下限,而鲁棒且高效的运动规划则决定飞行作业任务完成情况的上

限。随着飞行作业的场景愈发偏向近地面的低空复杂环境,导航时对避障的要求越来越

高,考虑避障约束、飞行器的物理限制、以及作业任务需求的运动规划在整体自主导航

系统中扮演的角色越来越关键。

归纳飞行器自主导航中常见的三大类情形:一、全局规划。已知较大范围精确的静

态全局地图,在此情况下进行全局最优轨迹规划,导航执行此轨迹的过程中无需动态感

知与重规划;二、局部规划。无先验地图信患,只能实时动态感知自身周围的小范围环

境,此时导航过程中需要根据最新的精确地图信息不断进行重规划,每次重规划称作局

部轨迹规划;三、跟踪规划。已知粗略的大范围全局地图,可据此规划出全局轨迹,但

是由于全局地图不精确,甚至是过时的,此全局轨迹可能与实际的障碍物发生碰撞,因

而在导航跟踪全局参考轨迹的过程中仍然需要动态感知,获得精确的小范围地图,并且

进行实时重规划以避开实际的障碍物。本文分析多旋翼飞行器在上述情形下自主导航中

的运动规划侧重点并展开研究,主要内容如下:

1.对于全局规划情形,规划算法重点需要考虑是否具有全局最优性以及能否快速收

敛。本文使用在采样类动力学规划方法中深度结合局部优化的求解方法,提出时空形变

树算法,在探索解空间的过程中生长一棵在时间和空间层面同时发生形交的轨迹树,随

着树的生长自然地选择拓扑路径更好的轨迹,直至逼近全局最优解。树中一段轨迹边的

生长建模为求解末状态部分受约束的两点边值问题,使用约束松弛策略加速求解。本文

提出形变单元的概念,其仅包含树中的一个状态节点以及连接在其上的所有轨迹边,只

占整体轨迹树的一小部分。我们针对性地设计用形交单元表示的轨迹树整体质量性能指

标,在时间和空间层面优化不同形变单元的组合,花费尽量小的代价高效提升整体轨迹

树的质量,提升算法的收敛性。

2.对于局部规划情形,规划算法重点需要考虑飞行器的运动初始状态和求解的实时

In

万方数据
性以应对实时变化的环境。本文使用采样类前端规划衔接高效后端提优的层级式规划框

架,每次重规划求解一条满足实时性且足够好的局部最优轨迹。本文根据环境快速构建

近似拓扑图,用其引导在状态空间的采样,极大提升了采样类动力学运动规划算法的求

解效率。针对轨迹提优,本文提出基于双层优化求解的轻量级后端算法,内层求解具备

闭式解形式,有效利用前端轨迹,花费极少计算代价提升了前端结果轨迹的光滑性和连

续性。之后将所提出的规划框架与算法应用于一架全自主四旋翼飞行器上进行未知环境

下的导航飞行测试,在未知的室外稠密树林、遮挡严重的室内房间等环境验证了算法的

有效性。

3.在上述层级规划的基础上,针对采样类规划在窄缝类空间中求解低效的问题,本

文提出在采样规划中结合双向搜索与快速求解的局部优化。快速局部优化专注于探索有

限范围内的解空间,其构建为一系列的无约束二次凸优化问题,每轮迭代具有闭式解。

针对前端初值信息没有被充分利用的问题,本文在后端提优时进一步将障碍物信患构建

进性能指标中,同时保有二次规划问题的结构,使得保证求解效率的同时成功率更高。

由此增强了采样类前端以及后端提优的效率与性能,更快地求解得到一个初始可行解,

并且提优的成功率更高,从而更好满足实时重规划的需求。之后本文进行了大量数值对

比测试,并在实物四旋翼飞行器上进行导航测试,在稠密障碍物、类迷宫等环境中验证

了所提出规划方法的有效性。

4.对于跟踪规划情形,除了考虑运动初始状态和求解实时性之外,规划算法还需要

考虑与参考轨迹的时空贴合以及连续重规划之间一致性。针对避障时规划结果不连贯,

导致飞行器运动路线随重规划频繁切换,产生类似于“摇摆犹豫”的现象,增加了碰撞

风险的问题,本文定义了轨迹问的7..拓扑连贯关系,并提出考虑拓扑连贯性的采样类动

力学规划算法,增加了连续重规划之问的路径拓扑一致性,使得整体导航过程中避障时

轨迹更加顺滑,更加安全。考虑到时空上贴合参考轨迹与避开障碍物等具有冲突性质的

约束,本文提出自适应末端状态的重规划轨迹跟踪方法,使用轨迹类、罚函数等方法消

除约束,使用梯度下降法求解。线搜索时根据丁.拓扑连贯关系计算最大步长,保持优化

的结果轨迹与初值轨迹处于同一拓扑路径。与传统固定末状态的方法相比,所提出方法

在满足避障约束的同时大大缩小了实时位置跟踪误差。此外,本文在接近真实的仿真系

统中验证了所提出的轨迹跟踪算法的切实可靠性。

关键词:多旋翼飞行器;自主导航;运动规划;最优控制

IV

万方数据
Abstract

In recent years,small-sized Multkotor Aerial Vehicles(MAVs)have been used in aerial

photography,inspection and monitoring,agricultural spraying,logistics and delivery,and many

other fields.As their applications in various fields become broader,the demands for their all-

tomation,autonomy,and intelligent operation are geeing stronger'and developing autonomous

navigation systems for MAVs has become a research hotspot.Ⅵmile stable perception and con-

trol can ensure a lower performance bound of the autonomous navigation systems,robust and

efficient motion planning determines how well the missions call be accomplished.As the op-

eration scenarios incline to the low-altitude near-ground complex environment,the demands

for obstacle avoidance during navigation become higher,and the role of motion planning con-

sidering obstacle avoidance,physical vehicle limitations,and task requirements becomes more

critical in the overall autonomous navigation system.


Three main common situations in MAV autonomous navigation are summarized:1.Global

planning.In this case,a large-scale and accurate static global map can be acquked.The global

optimal trajectory planning is performed,and the navigation execution of this trajectory is per-

formed without online sensing and replanning;2.Local planning.There is no a priori map

information,and only a small area around the MAV itself can be sensed dynamically in real-

time,such that the navigation process requires replanning continuously according to the latest

accurate map information.Each rcplanning is called local trajectory planning;3.Tracking

planning.A rough large-scale global map is known,and a global trajectory call be planned

accordinglg However,the global map is inaccurate or outdated,and the global trajectory may
collide with actual obstacles.Therefore,in tracking the global reference trajectory,there is still

a need for dynamic perception to build accurate arounding maps,as well ItS real-time replanning

to avoid actual obstacles.This paper studies motion planning ofMAY autonomous navigation

in the above situations,which mainly includes:

1.For the global planning situation,the planning algorithm should focus on achieving

global optimality and quick convergence.Our solution deeply combines local optimization with

万方数据
sampling-based methods.We propose an algorithm called spatio-temporal deformable tree that

grows a trajectory tree to explore the solution space and meanwhile deforms simultaneously
in the time and space dimensions.It naturally selects a trajectory with better path topology

(homotopy class)as the tree grows until approaching the near global optimal.The growth of a

tree edge is modeled as solving a two—point boundary value problem with a partially constrained

end state,and a constraint relaxation strategy is used to accelerate the solving process.We

define the concept of a deformation unit,which only contains one state node in the tree and all

the trajectory edges connected to it,accounting for only a small part of the overall trajectory

tree.We design objectives expressing the overall tree quality by means of deformation units,

and optimize in both time and space dimensions with different combinations ofthe units.In this

way,the overall tree quality is improved effectively at a minimum cost,and thus the convergence

is improved.

2.For the local planning situation,the planning algorithm should consider the vehicle mo—

tion.which is not stationary,and consider whether it can be solved in real—time to cope谢m the

instantly changing environment.Our solution adopts a hierarchical planning framework.It con-

rains a
sampling-based kinodynamie front-end module and a following post-process back-end

module,which looks for a locally optimal trajectory in each replanning cycle.In the front-end,

all approximate topological graph is quickly constructed according to the environment and is

used to guide the sampling in the state space,which significantly improves the efficiency of

the sampling-based kinodynamic planning.In the back-end,exploiting the front-end legacy,

we propose a
lightweight post-processing algorithm using bi—level optimization,and the inner

layer ofwhich has closed-form solutions,improving the smoothness and continuity with mini-

mal computation resources.The proposed planning framework and algorithm ale then applied

to a real quadrotor for autonomous navigation tests,verifying the algofithra’S effectiveness in

obscure environments such as dense outdoor forests and heavily occluded indoor rooms.

3.Based on the above—mentioned hierarchical planning,we propose integrating fast re—

gional optimization and bi—directional search in the global sampling process for narrow space

planning.The regional optimization prioritizes exploring limited regional spaces and is solved

by a sequence ofunconstrained quadratic programming with closed-form solutions for each it-

万方数据
eration.To beHer exploit the front-end legacy,we further incorporate the obstacle information

into the objective design ofthe back-end optimization while still retaining a quadratic program-

ming structure such that efficiency is guaranteed.As a result,the overall performance of the

sampling-based font-end and the back-end optimization is enhanced in that an initial feasible

solution can be obtained faster,and the snccess rate of optimization is higher,thus better meet-

ing the demands ofreal-time replarming.Extensive numerical comparison tests and navigation

tests on a real quadrotor are then conducted to verify the effectiveness of the proposed method

in dense obstacle and mazedike environments.

4.In the case of tracking planning,apart from considering the vehicle motion and the

real-time capability,the planning algorithm further needs to respect the space-time fitness with

the reference trajectory and the consistency between successive replan cycles.To address the

problem of incoherent planning results during successive replan cycles when avoiding obsta-

cles,which leads to frequent path switchings,making the vehicle’'hesitate'’to dodge and swing,

and increase the risk of collision,this paper defines the,--topology-coherence relationship be—

tween U'ajectories and proposes sampling-based kinodynamic planning algorithms that improve

replan coherence,producing smoother and safer trajectories during the overall navigation pro—

CesS.Considering the conflicting constraints of fitting in the reference trajectory and avoiding

obstacles,this paper proposes a trajectory optimization method for tracking replanning that con-

strains the end-state in the reference trajectory and optimizes it adaptively.We nse trajectory

classes,penalty funcfions,and other methods to eliminate constraints and use gradient descent to

solve the problem.The maximum step size is calculated according to the 1_-topology-coherence
relationship during the line search,keeping the resultant optimized trajectory in the same path

topology as the initial trajectory.Compared with the traditional fLxed end-state method,the pro-

posed method greatly reduces the real-time position tracking error while satisfying the obstacle

avoidance constraint.The performance ofthe proposed trajectory tracking algorithm is vedfied

in a realistic simulated MAV navigation system.

Keywords:Multirotors;Autonomous Navigation;Motion Planning;Optimal Control

VⅡ

万方数据
ⅥⅡ

万方数据
目录
致谢………………………………………………………………………………………………… I

摘要…………………………………………………………………………………………………III

Abstract..........................................................................................................1Ii‘

目录…………………………………………………………………………………………………Ⅸ
图目录………………………………………………………………………………………………XIII

表目录………………………………………………………………………………………………XV

1绪论……………………………………………………………………………………………. 1

1.1研究背景及意义………………………………………………………………………. 1

1.2多旋翼飞行器动力学运动规划研究现状………………………………………….. 3

1.2.1基于状态空间采样的方法…………………………………………………… 4

1.2.2基于图搜索的方法……………………………………………………………. 7

1.2.3基于优化的方法………………………………………………………………. 8

1.2.4混合式方法…………………………………………………………………….. 9

1.3本文主要研究内容及组织结构………………………………………………………10

2多旋翼飞行器动力学运动规划问题基本构建…………………………………………..13

2.1引言………………………………………………………………………………………13

2.2机体动力学模型约束………………………………………………………………….14

2.2.1非线性模型……………………………………………………………………一15

2.2.2微分平坦及平坦后的线性模型………………………………………………16

2.3过程约束………………………………………………………………………………..19

2.3.1系统状态/控制输入区间约束………………………………………………..19

2.3.2躲避障碍物约束……………………………………………………………….20

2.4边值约束………………………………………………………………………………..22

2.4.1初始时刻约束…………………………………………………………………..22

2.4.2终止时刻约束…………………………………………………………………一23

2.5性能指标………………………………………………………………………………..24

2.6本章小结………………………………………………………………………………..24

IX

万方数据
3结合采样与优化方法的全局最优动力学运动规划……………………………………..27

3.1引言………………………………………………………………………………………27

3.2问题描述………………………………………………………………………………..29

3-3轨迹树的生长…………………………………………………………………………..30

3.3.1时空形变树算法……………………………………………………………….30

3.3.2最优轨迹边求解……………………………………………………………….35

3.3.3多项式轨迹边的两种表示……………………………………………………38

3.4轨迹树的时空形变…………………………………………………………………….40

3.4.1形变单元构造…………………………………………………………………..40

3.4.2优化性能指标设计…………………………………………………………….41

3.4.3罚函数法构建形变单元的无约束优化…………………………………….42

3.4.4梯度下降求解形变单元的优化………………………………………………43

3.4.5形变模式………………………………………………………………………..45

3.5全局规划数值实验…………………………………………………………………….46

3.5.1实验设置………………………………………………………………………..46

3.5.2形变模式比较…………………………………………………………………..46

3.5.3时空优化比较…………………………………………………………………..48

3.5.4与层级式规划方法比较………………………………………………………49

3.6本章小结………………………………………………………………………………..52

4层次化实时局部动力学运动规划………………………………………………………….53

4.1引言………………………………………………………………………………………53

4.2基于引导采样的前端动力学运动规划……………………………………………..54

4.2.1问题描述………………………………………………………………………..54

4.2.2基于引导采样的轨迹树生成算法…………………………………………..55

4.2.3基于近似拓扑引导的状态空间采样………………………………………..57

4.3轻量级高效后端轨迹提优…………………………………………………………..59
4.3.1问题描述………………………………………………………………………..59

4.3.2二次型优化目标构建………………………………………………………….61

4.3.3内层优化的闭式最优解构造…………………………………………………63

万方数据
4.3.4双层优化求解流程…………………………………………………………….64

4.4与相关算法的数值对比测试………………………………………………………..66

4.4.1采样策略对比测试…………………………………………………………….66

4.4.2轨迹规划系统对比测试………………………………………………………67

4.4.3后端提优算法对比测试………………………………………………………68

4.4.4前后端集成对比测试………………………………………………………….69

4.5真机未知环境自主导航试验…………………………………………………………70

4.5.1实验设定………………………………………………………………………..70

4.5.2路径点间导航…………………………………………………………………..71

4.5.3快速重规划测试……………………………………………………………72
4.6本章小结……………………………………………………………………………….73

5 结合快速局部优化和双向搜索的实时规划………………………………………………75

5.1引言………………………………………………………………………………………75

5.2结合快速局部优化和双向搜索的采样规划前端………………………………….76

5.2.1双向轨迹树生长………………………………………………………………76

5.2.2求解轨迹边的两点边值问题…………………………………………………79

5.3快速局部优化…………………………………………………………………………..80

5.3.1考虑障碍物的二次型性能指标构建………………………………………..80

5.3.2问题构建及迭代求解过程……………………………………………………81

5.3.3吸引点选取……………………………………………………………………..83

5.4后端轨迹提优…………………………………………………………………………..83

5.5数值与实物实验……………………………………………………………………84
5.5.1实验设置………………………………………………………………………..84

5.5.2前端对比测试结果及分析……………………………………………………85

5.5.3后端对比测试结果及分析……………………………………………………86

5.5.4实物四旋翼飞行器飞行测试………………………………………………..88

5.6本章小结……………………………………………………………………………….89

6 自适应跟踪参考轨迹实时重规划…………………………………………………………93

6.1引言………………………………………………………………………………………93

万方数据
6.2基于采样的拓扑连贯性运动规划…………………………………………………..95

6.2.1 7_一拓扑连贯关系………………………………………………………………..96

6.2.2 7.一拓扑连贯前端规划算法…………………………………………………….97

6.3自适应跟踪参考轨迹的轨迹优化…………………………………………………..103

6.3.1问题描述………………………………………………………………………..103

6.3.2使用轨迹类处理等式约束……………………………………………………104

6.3.3使用罚函数处理不等式约束…………………………………………………105

6.3.4无约束优化问题及梯度推导…………………………………………………107

613.5求解过程………………………………………………………………………..109

6.4仿真导航测试及结果分析……………………………………………………………112

6.5本章小结………………………………………………………………………………..118

7总结与展望……………………………………………………………………………………119

7.1全文工作总结…………………………………………………………………………..119

7.2将来工作展望…………………………………………………………………………..120

参考文献…………………………………………………………………………………………..121

l咐勇t………….….……………………………………………………………….…………...…...129

A固定步长采样泛函积分的连续不可微性…………………………………………..129

作者简历…………………………………………………………………………………………..131

攻读学位期间科研成果………………………………………………………………………….131

XU

万方数据
图目录
图1.1 多旋翼飞行器各类应用场景……………………………………………………. 1

图1.2 自主导航系统模块框架示意图…………………………………………………. 2

图2.1 参考坐标系…………………………………………………………………………15

图2.2不同分辨率下的占据栅格地图(图源自Homtmg等人【84I工作)……….21

图2.3 欧氏距离场地图(图源自Hart等人【85】工作)………………………………21

图2.4安全通道地图………………………………………………………………………21

图3.1添加相同数量的状态节点后轨迹树的拓扑结构以及当前最优轨迹………29

图3.2形变单元示意图…………………………………………………………………..40

图3.3形变模式意图………………………………………………………………………45

图3.4测试环境以及某次结果轨迹…………………………………………………….46

图3.5 不同形变模式的轨迹代价收敛性比较示意图………………………………..47

图3.6 不同优化方法的轨迹代价收敛性比较示意图………………………………..50

图3.7与层级式规划方法进行比较的测试环境以及递增时间预算时所得到

的结果轨迹…………………………………………………………………………5l

图3.8基于不同时间预算的平均求解时间与轨迹质量对比……………………….52

图4.1 近似拓扑骨架构建的2维示意图………………………………………………58

图4.2 近似拓扑骨架构建与状态采样的3维示意图………………………………..59

图4.3 2阶模型前端轨迹加速度不连续示意图………………………………………60

图4.4路径拓扑惩罚项示意图………………………………………………………….6l

图4.5近似拓扑引导采样策略与均匀随机采样策略效率对比示意图……………66

图4.6 不同采样策略下轨迹树生长对比示意图………………………………………67

图4.7测试环境以及不同后端优化方法产生的轨迹………………………………..68

图4.8不同起终点距离及不同障碍物密度下的集成测试对比结果………………70

图4.9实物飞行所用四旋翼飞行器及机载设备………………………………………7l

图4.10室外测试场景以及实际飞行轨迹………………………………………………72

图4.11室外测试整体飞行速度曲线…………………………………………………….72

图4.12室内测试场景以及实际飞行轨迹………………………………………………73

xIII

万方数据
图4.13室内测试整体飞行速度曲线…………………………………………………….73

图4.14追踪移动目标飞行测试………………………………………………………….74

图4.15重规划避障序列图………………………………………………………………..74

图5.1 选择吸引点示意图………………………………………………………………..83

图5.2 后端循环求解过程轨迹示意图………………………………………………….84

图5.3 森林类型类2.5维测环境以及某次规划轨迹对比…………………………..86

图5.4洞穴类型3维测环境以及某次规划轨迹对比………………………………..86

图5.5 窄缝类型3维测试环境以及某次规划轨迹对比……………………………..86

图5.6不同方法在不同环境下求解出第一条轨迹的平均用时(ms)……………87

图5.7迷宫类型飞行测试环境………………………………………………………….90

图5.8 实时重规划测试环境……………………………………………………………..9l

图6.1 局部规划目标状态以及时域长度示意图………………………………………94

图6.2连续重规划间的不连贯性示意图………………………………………………95

图 .3 7-.拓扑连贯轨迹示意图…………………………………………………………..96

图 .4 7-.拓扑连贯生长树示意图………………………………………………………..97

图 .5丁.拓扑连贯连接图示意图………………………………………………………..102

图 .6计算最大线搜索步长示意图…………………………………………………….112

图6.7是否考虑跟踪自适应性的测试环境与最终执行路线……………………….115

图6.8参考轨迹跟踪位置误差对比曲线………………………………………………115

图6.9重规划结果轨迹…………………………………………………………………..117

图6.10倾角、推力、角速率、速率曲线………………………………………………117

图6.11连续重规划是否考虑拓扑连贯性对比测试环境……………………………..118

图A.1固定步长采样泛函积分示意图………………………………………………….129

万方数据
表目录
表3.1 不同形变方法得到的平均轨迹时长和平均轨迹代价对比………………….49

表4.1 前端动力学运动规划比较结果(平均值)…………………………………..67

表4.2后端数值对比结果………………………………………………………………..69

表5.1 前端规划方法标记……………………………………………………………….85

表5.2 前端规划1000次平均结果比较………………………………………………..85

表5.3 后端优化对比结果第一部分…………………………………………………….88

表5.4后端优化对比结果第二部分…………………………………………………….89

表6.1 轨迹优化参数符号数值表……………………………………………………….114

表6.2 重规划求解时间表………………………………………………………………..116

万方数据
万方数据
浙江大学博士专业学位论文 1绪论

1绪论

1.1研究背景及意义

小型多旋翼飞行器(MultirotorAerialVehicles,MAVs)是指以使用电机驱动的螺旋

桨作为飞行动力的非载人飞行器系统,相比其他固定翼或扑翼形式的无人飞行器,MAVs

有着更出色的机动灵活性、更简单的机械结构,以及更为低廉的成本,进而在物流配送、

精准农业、巡检监控、航拍摄影等领域有着广泛应用。

(a)农业喷洒 (b)航拍摄影 (c)物流配送

(d)竞速飞行 (e)高空喊话 (f)巡检监控

图1.1多旋翼飞行器各类应用场景

随着应用领域不断丰富,飞行器的工作场景也逐渐从高空转向近地面的复杂环境,

因而对躲避障碍物的需求逐渐增强。面对障碍物环境复杂、先验地图缺失的场景,当前

飞行作业仍高度依赖熟练的人工操控和外部导航,使得任务的效率低下,以及受人为主

观影响较大。无人自主导航系统则能够利用愈发成熟的传感器,使用环境感知、状态估

计、运动规划、决策控制等相关领域的前沿算法来弥补这一缺陷,飞行器在复杂环境下

的自主无人导航在各项应用中显得愈发重要。

在多旋翼飞行器自主导航系统中,如图1.2所示,运动规划模块是承上启下的核心

之一。此模块求解飞行器在将来一段时间所期望处于的状态,也即轨迹,若为连续形式

万方数据
浙江大学博士专业学位论文 l 绪论

则是得到一个状态关于时间的连续函数,若是离散形式则是一段状态序列。此结果轨迹

输出给到所承接的控制模块,作为期望状态和当前状态一起计算出执行器接受的控制输

入以使得飞行器在将来一段时间跟随此期望的状态序列。运动规划模块的输入一般是由

状态估计模块输出的当前飞行器的状态,由地图构建模块所输出的当前所观测到的环境

信息,以及任务规划模块给出的目标状态。

对于已知且非动态的环境,运动规划只需进行一次,找到全局最优的轨迹,而对于

在未知环境下的导航,则需要在飞行器行进中实时感知当前环境,并且实时重规划,整

个流程一般以滚动优化(Receding Horizon)的框架进行,以一定频率触发规划或者按

需触发规划。稳定的感知以及控制能够保证自主导航系统的下限,而鲁棒且高效的运动

规划则决定飞行作业任务完成情况的上限,对于飞行作业的低空环境,障碍物高度非结

构化且难以预测,考虑避障约束、飞行器的物理限制、以及任务需求的运动规划在整体

自主导航系统中扮演的角色越来越关键。与动力学模型、物理限制等约束相比,躲避障

碍物的约束对轨迹求解的最优性有着更强的制约和影响。给定运动规划的起终点,复杂

的障碍物将可行空间分割成不同的路径拓扑类型(PathTopologyClass),或称同伦类型

(Homotopy Class),也将整体解空间划分成互相之间间隔较远的不同子区域。相同路径

拓扑类型下的轨迹很大程度上对应着解空间中同一子区域内的解,动力学模型、物理限

制等约束再决定各自子区域解空间下的最优解。

考虑到求解实时性的需求,许多运动规划方法U-5】使用层级式规划(Hierarchical

Planning)的框架,先基于最短路径规划在构型空间(Configuration Space)得到一条几

何路径,再对此几何路径进行时间参数化(Time Parameterization),或在此几何路径的

万方数据
浙江大学博士专业学位论文 l绪论

基础上进行轨迹规划,最终得到时间参数化的轨迹。几何路径规划解决寻找最终轨迹所

在的环境拓扑位置的问题,后续的时间参数化或轨迹规划再考虑系统的动力学等约束。

层级式规划的思路值得借鉴,但此类路径规划衔接上轨迹规划的做法存在几点问题:1.

不同层级规划的目标不一致,例如路径规划时追求最短路径,轨迹规划时考虑最短时

间、最小能量消耗等特定任务需求;2.在几何路径规划时未考虑任何飞行器的运动学和

动力学模型约束;3.在路径规划时未考虑飞行器的初始状态,例如在重规划时飞行器一

般具有初速度。上述问题造成的结果是。路径规划得到的路径没有反映出真正想要的轨

迹所应该在的环境拓扑位置,甚至在此结果路径的基础上进行轨迹规划可能无法得到满

足飞行器运动学和动力学约束的轨迹,或是规划出不期望的转弯或是掉头轨迹。

针对上述问题,动力学运动规划[61(Kinodynamic Planning)方法在状态空间(State

Space)(或称相空间Phase Space)进行一体式规划,整体考虑一个目标,求解时直接面

对所有约束且考虑系统的初始及末端状态,直接在全局解空间中求解最优的轨迹,得到

最终轨迹的位置处于合理的路径拓扑下且满足飞行器的运动学和动力学约束。此类方法

的研究或基于图搜索、或基于采样,或基于最优控制,各自有其优缺点,难以兼顾求解

实时性与最优性,尤其是对于空中作业的小型飞行器,其尺寸较小,载荷有限,受到传

感器精度和计算功率的约束。规划求解效率的问题更为突出,而实时性在动态环境中小

范围局部重规划时却是必要的,最优性则是对于较大范围的全局规划所需具备的。

本文综合考虑采样类与最优控制类动力学运动规划方法的优缺点,结合层级规划的

思想,针对复杂环境中多旋翼飞行器在不同任务情形下的大范围全局规划与小范围局部

规划问题,设计高效高质量的求解方法。本文的研究能够为飞行器自主导航规划的实时

求解与最优性求解提供设计思路,具有较大应用前景。

1.2多旋翼飞行器动力学运动规划研究现状

从解的最优性角度,动力学运动规划可分为最优动力学运动规划和可行动力学运动

规划。最优规划指在整体解空间中找到全局最优解或接近全局最优解,其主要方法的总

体思路与基于图搜索的和基于采样的最优路径规划方法相同,往往暗含贝尔曼最优性

原理川的思想,主要用于全局规划的离线求解。可行规划一般指在整体解空间中找到

高质量的可行解,或在解空间的某一子区域内找到最优解,即整体解空间的一个局部最

万方数据
浙江大学博士专业学位论文 1绪论

优解,主要用于局部规划的实时求解。其主要方法同样包括图搜索类和采样类的可行路

径规划方法,另外还有基于优化的方法,以及混合方法,有时还衔接一个轨迹提优的步

骤。需要注意的是,各类方法并非绝对孤立,许多方法的思想有着内在联系,例如从求

解最优控制问题的角度,动态规划方法中的分治思想与采样类方法中拆分成子问题求解

的思想类似。本文将各种动力学运动规划方法在整体上分为三大类型:状态空间采样类

方法,图搜索类方法,以及混合式方法,以下对各类文献进行梳理与分析,主要针对飞

行器系统但不限于此。

1.2.1基于状态空问采样的方法

采样类方法的一大优点是其不显式构建可行状态空间的精确边界,而是通过在连

续的状态空间采样,得到离散的状态点,通过图型结构或树型结构(树型结构也可视作

特殊的图型结构)将其连接起来,以求高效地探索可行空间的连通性,因而主要用于

解决由障碍物约束带来的问题复杂度。此类方法一般具备概率完备性【8,91(Probabilistie

Completeness),即若一个问题存在解,则随着采样不断进行,找到一个可行解的概率趋

于1。许多针对构型空间的路径规划方法天然适应于扩展到状态空间的动力学运动规划,

不同之处在于采样的空间以及连接采样点的方式。连接两个状态点构成一段轨迹,此

过程也称作Steer,而这往往需要求解最优控制中的两点边值问题(TwoPointBoundary
Value Problem,TPBVP),即对特定动力学系统求解给定初始条件与终止条件的运动方

程。当存在复杂约束、系统微分模型的非线性较强或目标函数不可徼时,求解TPBVP变

得非常困难,而通过连接离散的状态来探索解空间的连通性需要大量求解TPBVP,这

往往成为此类方法的效率瓶颈。

探索与开发(Exploration and Exploitation)是采样类方法的两大核心。探索指连接

轨迹图使其遍布完整的解空间(针对多查询类(Multi Query)问题),或生长轨迹树使

其生长至解空间中所有需要探索的部分(针对单查询类(Single Query)问题),开发指
如何利用采样出的解空间信息修正维护轨迹图和轨迹树的结构以更好地表征解空间。因

此,设计高效的非均匀采样方式来得到落在最优解的周围的状态样本,以及设计连通图

和轨迹树的构建方法成为两个主要研究方向。另外,对于动力学运动规划问题,由于两

个状态点之间的是一段轨迹,如何高效求解任意两个状态之间的连接轨迹也是一大方

向。

万方数据
浙江大学博士专业学位论文 1 绪论

关于图或树连接结构的构建方式,状态空间轨迹规划与构型空间路径规划都是根据

各自定义的距离代价度量(Metric)进行构建,不同之处在于对距离的度量方式的定义。

Kawaki等人[10】提出的PRM算法和LaValle等人【11】提出的RRT算法将采样出的节点和

图或树中与之最近的节点相连,此类方式能够快速探索整个空间,但没有利用图或树中

已有的结构信息。Karaman等人[121证明了PRM与RRT算法最终收敛到一个非最优解,

并在工作中提出了具有渐进最优性(Asymptotic Optimality)的PRM*、RRG以及RRT+

算法,这些算法利用图或树的局部结构信息,连接节点的同时通过重连接操作修正图与

树的结构而达到局部最优状态,随着采样点的数量趋于无穷,得到最优解的概率趋近于

1。Arslan等人【13】进一步提出RRT#算法,对无希望的(Nonpromising)节点不进行重连

接,以及使用循环重连接将由采样带来的信息传播到树的其他部分,从而解决了RRT*

算法中的过开发(OverExploitation)与欠开发(UnderExploitation)问题,提高了算法

收敛到最优解的效率。上述方法都是增量式采样,Janson等人【l 41提出FMT*算法,使用

批采样的方式得到一批次状态节点,根据直接动态规划[15】方法连接批采样出的各节点,

可类比于图搜索中的Dijkstra算法【161。Gammell等人【”,18]之后提出BIT*算法,使用多

次分批次采样出逐渐稠密的采样点,采取图搜索中增量式搜索的方法如LPA*算法【19】

进行增量搜索,得到渐进最优的解。除了构建单棵树之外,同时构建双向的搜索树[20-冽

也有助于快速探索以及解决目标点被障碍物围困住的情形。

关于采样分布问题的研究大致可分为两种,重要性采样与自适应采样【231。重要性

采样基于的是,对于某一特定任务,状态空间中各部分的重要性程度是不同的。例如在

可行解或是最优解的周围采样有助于提高算法的收敛性,然而这些解本身就是要求解

的量,是事先未知的。不过依据经验,我们可以估计最优解在解空间中的位置从而设

计采样状态的分布。一些工作[24-27】针对特定问题和场景设计特定的采样分布,对于路

径规划,Oleynikova等人【26】和Bloehliger等人【24】在进行实时定位与建图(Simultaneous

LocalizationandMapping,SLAM)的同时对可行空间的中轴路径骨架进行近似提取,类

似于Voronoi图的形式,之后在中轴骨架的附近采样位置点。对于动力学运动规划问题,

Ye等人[271根据速度方向一般会沿着中轴骨架路径的方向的特征进行采样。相较均匀采

样,这些方法找到第一个解所用的时间、质量和算法收敛率都有大幅提升。另一些工

作[28-33]利用机器学习能有效提取高维特征的特性,尝试开发通用的方法来获得采样的

概率分布而非只针对特定的场景和问题。这要求将地图抽象成用特定参数表征的形式,

万方数据
浙江大学博士专业学位论文 1绪论

然而许多实际情况我们只能去检测一个采样的状态是否碰撞而无法知道地图的形式,如

何高效地表征抽象地图仍然是一个待解决的问题。且使用机器学习难以获得强的泛化

能力,较为繁重的网络推理也使其难以在自主导航中在线使用。需要指出的是,在规划

过程中状态空间中各部分的重要性程度并不是一成不变的,因此自适应采样相比重要

性采样更能够应对此类情况。Gammell等人【蚓提出Informed-RRT*,证明了当有一个初

始解之后,能够提升解质量的采样被约束在一个高维椭球内,因此能够进行直接采样

(Direct Sampling),其与均匀采样后拒绝采样(Sample Rejection)相比大大提升了采样


效率,尤其是在高维空间,其之后与Sturb等人一起提出的BIT,tIT]、AIT*[351、EIT*[361

等算法也同样利用此特性进行自适应采样。然而这里得到的理论分布仅存在于最短路径

问题(L2-norm),若是处理最短时间或者最小能量等其他优化目标的问题,仍然无法直

接获得有效的状态空问采样分布,且其无法缩短找到第一个解的时问。关于状态空间的

自适应采样仍旧是一个研究难点。

关于Steer过程中TPBVP求解问题的研究,可分为替代求解或是近似快速求解。

Boeuf等人【37,381、Beul等人【39,40]以及Rauscher等人141】利用最优控制中最短时间转移问

题Bang—Bang控制的结论,设计特定的控制输入模式来决定两个状态间转移的最短时间

轨迹,避免了求解TPBVP,但此轨迹库引入了次优性且仅适用于时间最优的目标函数

和链式线性动力学模型。另外一些避免求解TPBVP的方法在控制输入层面采样,根据

微分模型通过前向积分得到新状态点,例如Li等人【42】提出的SST*算法。此类方法类

似于运动基元(Motion Primitive)类方法,但基元通过在线构建且由随机性采样生成。

针对近似快速求解,Webb等人【43】利用极小值原理,对线性幂零系统能够快速求得无约

束’rPBVP的闭式解(Closed-form Solution),之后再检查状态和控制输入的约束,整体

求解效率高于设计特定控制模式的方法,但是要求采样的状态较为合理。Zheng等人【.町

在其基础上提出末状态部分受约束的TPBVP闭式解求法,降低了采样所需的状态维度。

对于非线性系统,Perez等人【45】提出LQR-RRT*,在工作点将动力学模型线性化,使用

LQR(Linear Quadratic Regulator)近似求得解析解。

采样类方法因其对解空间的高效探索与开发而适合于状态空间维度较高的全局最

优规划。另外,针对具备渐进最优性的采样类算法,可以使其具备即时性质(Anytime

Property),意思是其能够快速得到一个初始可行轨迹,之后在执行此轨迹的过程中。在

运算时间允许的情况下,继续提升后续未执行的部分的轨迹质量湖。或是得到一个初始

万方数据
浙江大学博士专业学位论文 l绪论

可行轨迹后使用高效后处理的方法对其提优,因而此类方法也适合有实时重规划需求的

自主导航情形。

1.2.2基于图搜索的方法

与基于采样方法将状态空间离散化不同,基于图搜索的动力学运动规划算法将控制

输入与状态转移的时间离散化,从某一初始状态出发,对系统施加某一常量控制输入。

维持一段时间,根据系统的微分模型前向积分,得到新的状态点,再对新的状态点进行

同样操作,由此生成层级式的符合模型约束的有向搜索图,各个离散的状态点构成图中

节点,连接节点的边即是一段常量控制的轨迹。对一个状态点应用不同控制输入得到的

轨迹边也称作运动基元(Motion Primitive)。在此图上根据A幸【47】之类搜索策略得到分

段常量控制的最终轨迹。

Likhachev等人【删和Zhang等人t49,503提前离线构造一个由层级式运动基元组成的

搜索空间,当机器人运动的时候,选取与当前运动状态最为接近的一个子搜索空间,在

线搜索出满足动力学约束的轨迹,并使用查表式启发函数加速搜索过程。Zhang等人的

后续工作[51,52]结合局部观测和先验地图,选择到达目标状态的概率最大的运动基元,避

免了繁重的在线图搜索。然而构造状态概率需要事先已知的地图,当环境完全未知且较

为稠密时无法在线实时规划。

此类方法是分辨率完备(Resolution Complete)的,即在离散的分辨率足够精细的

情况下,一定能找到可行解。然而这种控制输入与采样时间的离散化需要对求解质量和

求解时间进行权衡,当离散程度较底时,能够较快得到一个可行解。但是质量不高,且

可能在此分辨率下无解,反之则有较高的求解成功率且得到的解质量较高,但求解时间

更长。另外更为致命的是,此类方法为指数计算复杂度,即平均求解时间按离散程度呈

指数增长,尤其是状态模型的维数较高时,求解时间难以估量,导致维数灾难(Curse of

Dimcnsionality),从而难以用于有实时性求解需求的自主导航系统,或是只能用于短距

离局部规划。一些实际加速求解的做法包括在线构建搜索图、剪枝删去一些在解空间中

相邻的节点、设计合适的启发式函数(Heuristics)来更好地估计状态转移代价等等。

混合A・【53l(HybridA幸)算法在线构建一棵搜索树,在拓展某一个节点时才对其构

建运动基元,并且将状态空间栅格化,以每个栅格只保留一个图节点的形式对树节点进

行剪枝,提升了求解速度但牺牲了解的最优性。针对多旋翼飞行器系统,Liu等人[54,551

万方数据
浙江大学博士专业学位论文 1 绪论

根据飞行器模型的微分平坦特性【561,使用以加加速度为输入的三阶积分器来表示动力

学模型,从而得到有闭式解形式的启发式函数,但仍然没有维数灾难问题,无法实时使

用。Zhou等人[571进一步牺牲了动力学模型精度,使用以加速度为输入的二阶积分模型

来降低状态的维度,缩短了求解时间能够满足实时局部重规划的需求,但是得到的轨迹

质量过低,需要繁重的后处理提优来提升轨迹质量。

大多数搜索类方法在特定离散的分辨率下保证了最优性。但得到这个最优解所需要

的时间是无法估计的,因此不适用于实时规划,剪枝删去相近节点的策略和ARA*[58]之

类增加启发式函数的权重,先贪心找到一个次优解的方法都引入了较大的次优性,降低

了解的质量。

1.2.3基于优化的方法

不同于基于搜索和基于采样的方法增量式地探索整个解空间,基于优化的方法利用

数值优化技巧对动力学运动规划问题进行直接求解。虽然求解为线性复杂度,但是一方

面由于各类问题的约束常常造成解空间的结构强非凸,另一方面因为安全避障的约束难

以构建,使得优化过程的计算缓慢,且常常陷入局部最优解,难以得到全局的最优轨迹

或近似最优轨迹。对于求解局部最优解,基于梯度的优化则能够较好处理由系统模型约

束、任务约束等引入的问题复杂度,因此适合用于在有了轨迹初值后的后处理提优。

安全通道走廊(Safe Corridor)是一种表示可行工作空间的方式,对于飞行器来说,

安全飞行走廊由复杂三维空间中找到的一系列连通的可通行区域组成,通过将待优化轨

迹完全限制在安全走廊内来保证安全性。安全走廊通常为一系列具有凸性的单元,这些

凸单元提供了方便构建的碰撞约束以及相应的梯度,提升了轨迹优化的求解效率。由此

带来的一个问题是其限制了最终轨迹的环境拓扑位置,难以保证在全局解空间下的最

优性,可能需要构建许多条不同拓扑下的飞行通道来进行多次轨迹优化。另外,相比于

碰撞检测类方法,基于凸单元的安全走廊难以充分表征所有可行空间,可能导致解空间

过小的问题。Mellinger等人[59】最早系统地指出,使用走廊约束来使飞行器轨迹被限定

在空间的一个区间内,但并未给出构造飞行走廊的方法。Deits等人【雏蚓使用一系列连

通凸多面体来表示可行空间,将限制多项式轨迹在多面体中的线性不等式约束描述为

一组多项式平方和(SumofSquares)条件,并采用混合整数二阶锥规划(MixedInteger

Second-Order Conic Programming)来求解轨迹各段在不同多面体中的分配问题。该方法

万方数据
浙江大学博士专业学位论文 l 绪论

可以得到固定段数分辨率下的最优解,然而仅适用于离线计算。Gao等人【63】同样采用凸

多面体描述可行区域。其使用B6zier曲线表征轨迹,将曲线的控制点限制在多面体内以

保证安全,利用时间最优路径重参数化【删(Time.Optimal Path Parameterization)来完成

轨迹的时间分配,在轨迹的空间域和时域进行交替优化。除了飞行走廊之外,一些工作

使用欧氏符号距离场(Euclidean Signed Distance Field,ESDF)描述安全避障的约束,在

ESDF上进行线性插值以提供避障的梯度信患,优点是计算方便,但引入了非光滑函数。

Oleynikova等人【65】对分段多项式轨迹在ESDF上做离散的路径积分,构建出与障碍物

发生碰撞的惩罚代价,Usenko等人【删和Zhou等人【5刀采用类似的约束描述但采用B样

条表征轨迹,将约束施加在样条曲线的离散控制点上。还有一些方法与基于采样类的方

法一样不显示构建可行工作空间的描述,仅使用碰撞检测,例如Richter等人【l】使用二

次规划(QuadraticProgramming,QP)来优化分段多项式轨迹段间节点的高阶导数,将

中间路径点约束在以RRT*算法求得的节点上,推到得到闭式解形式的能量最优轨迹。

然而由于此类方案在优化求解时在性能指标以及约束的构建上均未考虑局部障碍物信

息,每次检查轨迹的碰撞后需要中途添加新的路径点,重新构建优化问题才能最终得到

可行解,其运算速率并不适合在线实时使用。

1.2.4混合式方法

一方面基于搜索和基于采样的方法重在高效地探索整个解空间,能够在全局强非凸

的解空间中搜索到最优或近似最优的轨迹,但是其探索解空间的效率经常因为狭窄通道

的存在而大大受限。另一方面基于优化的方法难以完全考虑整个解空间的约束而难以找

到全局的最优解,但是却能优先利用解空间中的局部信患因此能够较好地处理狭窄通道

等问题。所以,一个自然的发展趋势是结合各类方法的优势,取长补短。混合使用。

Choudhury等人【671提出RABIT*算法,使用BIT*B'q作为其全局规划器,在全局探

索的过程中结合CHOMP[r键]进行局部优化,将一些本来与障碍物发生碰撞的路径边优

化至可行区域,从而加速全局探索的过程。然而其收敛效率高度依赖BIT*算法中根据

L2-Norm距离对采样区域进行的更新收缩,且CHOMP需要事先构建障碍物距离场来提

供梯度使得轨迹收敛,繁重的局部优化可能反而使全局搜索的效率降低。Kiln等人[69,701

使用了同样的局部优化器,开发了稀疏的连通图来探索不同的轨迹拓扑空间,其障碍物

梯度由在探索的过程中执行的碰撞检测构建得到,虽然不需要提前或在线计算障碍物距

万方数据
浙江大学博士专业学位论文 l 绪论

离场,但这种方式得到的梯度可能非常不准确,有损于基于梯度优化的收敛效率。Hauer

等人【71】在采样类方法中结合优化,在生长树的过程中重新部署某些节点的位置来提升

整体树的质量,其不事先构建环境的碰撞梯度信患,而是使用线搜索将节点在其他代

价梯度的方向上推离直到与障碍物发生碰撞。Shirai等人【72】将局部优化集成到基于搜

索的LWA*方法【力】的规划框架中,提出一种满足动力学运动规划的通用框架,并使用

延迟优化(Lazy Optimization)来减少优化的负担,但是其使用的混合整数规划(Mixed

IntegerProgramming)依旧需要较长的计算时间。针对飞行器系统,Natarajan等人[74】使

用加权A木算法【75,761(Weighted A宰)结合局部优化,在飞行器线性模型的低维空间进

行全局搜索,在非线性模型的高维空间进行局部优化,实现较为高效的全局姿态规划

(SE(3)Planning)。

经验上来看,这种混合式做法的整体效率受集成局部优化的方式和局部优化的求解

效率影响较大。本文所提出的各类方法也采取混合式方法的思路,在整体上结合采样类

方法与局部优化求解各情形问题,深度探究结合方式与轻量级的局部优化算法设计。

1.3本文主要研究内容及组织结构

总体上,本文针对多旋翼飞行器的动力学运动规划算法及其在自主导航中的应用开

展研究。一般来说,不同的自主导航情形对动力学运动规划算法的要求及侧重点是不同

的,从感知信息的层面出发,根据己知地图的规模以及精确程度,本文归纳出以下三类

具有递进关系的多旋翼飞行器自主导航情形:

.情形一.全局规划:已知较大范围精确的静态全局地图,在此情况下进行全局最优

轨迹规划(通常轨迹为几十米至上百米),导航执行此轨迹的过程中无需动态感知

与重规划;

一情形二.局部规划:无先验地图信息,只能实时动态感知自身周围的小范围环境,

此时导航过程中需要根据最新的精确地图信患不断进行重规划,每次重规划称作

局部轨迹规划(通常轨迹为几米至十几米);

一情形三.跟踪规划:已知粗略的大范围全局地图,可据此规划出全局轨迹,但是由
于全局地图不精确,甚至是过时的,此全局轨迹可能与实际的障碍物发生碰撞,因

万方数据
浙江大学博士专业学位论文 1 绪论

而在导航跟踪全局参考轨迹的过程中仍然需要动态感知,获得精确的小范围地图,

并且进行实时重规划以避开实际的障碍物。

多旋翼飞行器在上述情形中进行运动规划的共同要求是都需考虑其动力学及运动

学模型的约束,根据情形特点不同又需各自考虑不同的侧重点,本文考虑如下:

针对全局规划情形,已知大规模精确的静态全局地图,期望在完整解空间中找到最

优轨迹,则规划算法重点需要考虑是否具有全局最优性以及能否快速收敛,以期尽快找

到近似全局最优轨迹。此方面研究成果由本文的第3章介绍。

针对局部规划情形,无先验地图信息,精确的地图范围小且变化频率高,要求飞行

器在运动行进中快速进行重规划,则规划算法重点需要考虑飞行器的运动初始状态和求

解的实时性以应对实时变化的环境,以期高效地生成高质量的避障轨迹。此方面研究成

果由本文的第4章以及第5章介绍。

针对跟踪规划情形,大规模的地图较为粗略甚至过时,依此地图规划出的参考轨迹

可能与实际地图中的障碍物发生碰撞,同样要求飞行器在行进中进行重规划以避障。除

了考虑运动初始状态和求解实时性之外,规划算法还需要考虑与参考轨迹的时空贴合以

及连续重规划之间一致性,而同时避障的要求为此带来了挑战。此方面研究成果在本文

的第6章介绍。

全文总共包含7章节,具体内容安排如下:

第1章为绪论,介绍了本文课题所研究的背景及内容,详细梳理了不同类别的多旋

翼飞行器动力学运动规划方法并分析其特点,之后进一步讲述了本文所探究的不同情形

下的自主导航规划问题,指出其重点研究方向。

第2章从最优控制的角度描述多旋翼飞行器动力学运动规划问题的基本形式,从性

能指标构建、动力学模型精简、过程约束构建、边值约束构建几个方面对问题建模,此

章将作为建立不同情形不同任务下运动规划问题数学模型的基础。

第3章针对已知精确环境下的飞行器全局最优动力学运动规划问题,提出时空形变

轨迹树算法,使用在采样类动力学规划方法中深度结合局部优化的方法来求解。将树生

长时轨迹边的构建建模为末状态部分受约束的TPBVP问题,使用约束松弛策略加速求

解。设计以最小优化单元表示的轨迹树整体质量性能指标,在时间和空间层面优化不同

单元的组合,花费尽量小的代价高效提升整体轨迹树的质量。

第4章针对未知环境导航中的局部实时重规划问题,提出使用采样类前端动力学运

万方数据
浙江大学博士专业学位论文 1绪论

动规划衔接高效后端提优的层级式规划框架求解。构建近似拓扑图引导在状态空间的采

样来提升采样类动力学运动规划算法的求解效率。使用内层求解具备闭式解形式的双层

优化后端提优算法高效提升前端结果轨迹的光滑性和连续性。之后使用全自主四旋翼飞

行器在室内外复杂环境进行实时重规划的高速导航飞行测试。

第5章在上一章的基础上,面对障碍物窄缝等环境,增强了采样类前端以及后端提

优的效率与性能,更好地满足实时重规划的需求。提出在采样规划中结合双向搜索与快

速求解的局部优化,快速局部优化构建为一系列的无约束二次凸优化问题,每轮迭代具

有闭式解。在后端提优时将障碍物信息构建进性能指标中,同时保有二次规划问题的结

构,使得保证求解效率的同时成功率更高。之后在实物四旋翼飞行器上进行导航测试,

在稠密障碍物、类迷宫等环境中验证了所提出规划方法的有效性。

第6章探究未知环境下对全局参考轨迹的时空跟踪问题,定义了轨迹间的1-.拓扑连

贯关系,提出考虑拓扑连贯性的采样类动力学规划算法,增加连续重规划之间的路径拓

扑一致性,使得整体导航过程中避障时轨迹更加顺滑,更加安全。针对时空上贴合参考

轨迹与避开障碍物等具有冲突性质的约束提出自适应末端状态的重规划轨迹优化方法。

使用轨迹类、罚函数等方法消除约束,使用梯度下降法求解,并在线搜索时根据7I.拓扑

连贯关系计算最大步长,保持优化的结果轨迹与初值轨迹处于同一拓扑路径。之后在接

近真实的仿真导航系统中验证了所提出的轨迹跟踪算法。

第7章对全文工作进行总结,并提出对未来工作的展望。

万方数据
浙江大学博士专业学位论文 2多旋翼飞行器动力学运动规划问题基本构建

2 多旋翼飞行器动力学运动规划问题基本构建

2.1引言

多旋翼飞行器的动力学运动规划问题是指在其初始时刻状态与终止时刻状态之间

找到一条满足各项约束的轨迹。之所以称作动力学运动规划,是因为在规划时要考虑其

运动学与动力学模型,与常见构型空间的路径规划不同的是,各项约束大多涉及到时间

维度,因此最终结果是一条以时间参数化的状态轨迹,而轨迹中的构型状态可作为路

径。

此处以最优控制的形式对所考虑的规划问题进行整体统一的描述,针对不同情形具

体问题的数学模型则分别在各章中再详细介绍。基本数学模型描述如下:

min歹:圣(£,,x@,))+厂。co,x@),u(£))dt
.,£0
(2-1a)

s.t.f(t,x(t),u(t))一文(t)=0, (2一lb)

c(to,t,,x(zo),x(t,)'u(to),u(£川=0, (2-le)

9(t,x(t),u(t))≤0,Vt∈[to,tA, (2一ld)

其中x(t)和u(t)分别表示飞行器的状态向量和控制输入向量,()=d()/dt表示对时间

t求导,to和t,分别表示规划的初始时刻与终止时刻。

上式表示了我们期望求解在容许范围内的控制输入u(t1,使得由终端代价圣和过

程代价c组成的泛函性能指标歹沿着对应的状态轨线x(t)取得最小值。控制输入u(t)
和状态向量x(t)需满足式(2.1b),式(2一le)-与式(2—1d)所描述的约束。

式(2.1b)为模型约束,表示x(t)随时间的变化需满足系统的动力学模型,其通常以
连续形式的非线性或线性微分方程形式给出。

式(2.1c)为边值约束,表示初始状态和终止状态需满足某些条件,其中初始状态一

般完全确定,终止状态则可能只有部分确定,而终止时刻t,一般也不定,为待优化变

量。

式(2.1d)为过程约束,其为泛函,表示x(t)和u(t)的变化需在某些容许范围内,作
用于整个连续的时间域t∈【to,tj】上。

万方数据
浙江大学博士专业学位论文 2多旋翼飞行器动力学运动规划问题基本构建

相比于的一般运动规划问题,本文所研究的多旋翼飞行器平台及其在复杂环境下的

运动有以下特点:

1.载荷有限且能量效率不高,导致飞行时间短,因此希望规划出的轨迹节省能量。

2.飞行速度快且计算资源有限,在感知范围有限时要求实时求解,因此希望规划问

题的构造便于求解。

3.复杂环境为三维空间,障碍物密集且不规则,希望对环境的表征尽量简单又能够

尽量保留可行空间。

结合第1章所描述的不同情形,上述特点对于飞行器规划的性能指标了选取以及对

各项约束的构建与处理将产生影响。本章将对多旋翼飞行器规划的一般问题进行建模,

分析其受到的各项约束,其中第2.2节介绍本文构建的飞行器动力学模型约束,第2.3节

介绍本文考虑的过程约束,第2.4节介绍常见的边值约束如何构建,第2.5节介绍本文所

选取的性能指标,第2.6节总结本章内容。

2.2机体动力学模型约束

常见的多旋翼飞行器如双旋翼、四旋翼等一般为欠驱动系统,其构型空问的自由变

量属于sE(31,有六个自由度,而独立控制变量的个数一般小于此。其较为完备的动力
学模型159】以电机转速作为控制输入。以三维空间的平移、旋转及其导数作为状态交量,

涉及到电机与螺旋桨的建模。该类型精确的非线性建模有助于设计飞行器姿态以及位置

控制的算法,然而从运动规划角度,遵循此非线性模型直接为状态变量或控制输入的每

一个维度规划轨迹则过于复杂。现今旋翼飞行器的导航框架一般将控制器与规划器解

耦,且利用其微分平坦【56l的性质在平坦空问进行轨迹规划,跟踪轨迹时再由平坦输出

恢复原本状态进行飞行器控制,本文所进行的规划与导航同样遵循此框架,即规划时的

模型约束使用平坦空间的动力学模型。

下面首先介绍一种满足实际应用需求的非线性模型,再介绍微分平坦以及如何使用

选定的平坦输出恢复该非线性模型的状态变量以及控制输入。

万方数据
浙江大学博士专业学位论文 2多旋翼飞行器动力学运动规划问题基本构建

2.2.1非线性模型

此模型建立的思路是考虑实际中便于测量的状态量,例如位置与速度,以及考虑具

体应用应当约束的量,例如平稳飞行时姿态倾角不应过大,以及考虑便于设置允许取值

范围的一些物理限制,例如推力和机体角速度,而不考虑更复杂的电机模型与空气动力

学等特性,因其包含许多难以精确测量的参数。

我们首先引入如图2.1所示的参考坐标系(均为右手系)并作如下假设:

1.多旋翼为刚体,其机体坐标系原点与质心重合。

2.多旋翼运动过程中质量不变。

3.多旋翼只受重力与螺旋桨产生的拉力,其中重力沿世界坐标系磊。轴负方向,螺

旋桨拉力沿机体坐标系锄轴正方向。

.,.,1一’矿j

X"

考虑飞行器状态X=_[”p,”D,R),其中”P=(p。,P。,仇)T∈R3为其质心相对于

世界坐标系O。z。‰‰的平移矢量,”由=(Vx,Vy,%)T∈R3为质心相于0。X。‰‰的

速度矢量,R∈so(3)为以旋转矩阵表示的机体坐标系06‰YbZb相对于世界坐标系的旋

转,由欧拉角经z—x—y的转序得到。控制输入为11={,,6u].,其中f∈R>o为所
有电机连带螺旋桨产生的合推力,6u=(Ldx,%,心)T∈R3为机体角速度,则以牛顿一欧
拉方程描述的多旋翼飞行器动力学模型建立如下:

万方数据
浙江大学博士专业学位论文 2多旋翼飞行器动力学运动规划问题基本构建

m”苗=mg+Real (2—2a)

A=R【6u】。, (2-2b)

其中m为飞行器质量,g=(0,0,一9)T为重力加速度向量, e3=(0,0,1)T为常数向量,

【6u】×为6∽的反对称矩阵形式:

№:f三--。Wz兰 (2-3)

一岣蛾0

从运动规划实际应用的角度,此非线性模型相对精简,同时又较为精确地考虑了旋

翼飞行器的动力学特性。之后利用多旋翼非线性系统的微分平坦性质【56】来进一步简化

模型约束。

2.2.2微分平坦及平坦后的线性模型

已有许多工作[59・77-791证明多旋翼系统具有微分平坦【561性质并在此基础上进行轨迹

规划与控制。具体来说,一个非线性系统具备微分平坦特性是指存在着平坦输出口,该

系统原本以非线性微分方程所描述的系统状态变量和控制输入能够由所选定的平坦输

出及其有限高阶导数{盯,方,子,…}直接解析计算得到,而无需对原本的非线性模型进
行积分。

在此我们选取多旋翼飞行器系统的平坦输出为仃=‰,珊,乳,例T,其中前三项为

飞行器质心在世界坐标系下扛,Y,z)三轴的平移,妒为欧拉角中的偏航角。我们用,.M
表示变量r从0到8阶关于时间导数的堆叠(r,矿,...,r(s)),则微分平坦变换表示为从平

坦输出及其有限高阶导数到系统状态和控制输入的映射,记作

(X,u)=皿(盯H). (2.4)

下面将给出式(2-2)下多旋翼飞行器动力学模型微分平坦变换皿的代数推导,即推

导如何由仃嘲解析地计算上小节所述非线性模型的状态向量x={”p,”空,R)和控制
输入u=(,,6u)。

16

万方数据
塑堑登博士专业譬垡论文 2多旋翼飞行器动力学运动规划问题基本构建

”P与”西即分别为向量仃与寺中的前三项。

由定义可知旋转矩阵中三列的数值分别为机体坐标系的三轴单位向量在世界坐标

系下的表示,即R=(Xb,Yb,铂),而直=(瓯,Ob,磊),其中各列向量计算如下。
根据式(2-2a),锄与合推力向量同向,因此

Zb=加ri5一g),
(2-5)
毛=伽(”§一g)”F,
其中”酋与”夺分别为向量子与孑中的前三项,加:R3卜÷R3为将非零向量转化为同方
向单位向量的函数,先w:R3卜÷缺3×3为其一阶导数,分别定义如下:

加(z)=z/II=ll。,
Q呦
帅)=(一=T扒=//II圳:,
如图2.1所示,局部坐标系Obx。ycZe为一中间转换坐标系,其与机体坐标系原点相同,而

与世界坐标系在旋转上只有偏航角不同,则给定偏航角妒,可计算局部坐标系的X轴单

位向量及其对时间导数为

zc=(cos妒,sin妒,o)T,
(2-7)
圣。=(一sin!b,cos妒,0)。妒,

其中妒与西分别为向量盯与方中的第四项。而由欧拉角z—x—Y的旋转顺序可知,
机体坐标系的Y轴与Obx。孙平面垂直,由此可以确定机体坐标系的3,轴单位向量及其
对时间导数为

3,6=’7■(锄×∞。),
(2-8)
Ob=,i'Ⅳ(铂×z。)(磊×z。+Zb×圣。).

而机体坐标系的z轴可由已求得的舶与Zb叉乘得到,计算如下

茁b=舶×铂,
(2-9)
氟=雪6×孙+铂×磊.

由此方法计算恢复飞行器姿态需满足两个条件:1YT)一g不为零向量,即合推力不

为零;2.Zb×z。不为零向量,即不允许姿态倾转90。(相对于水平悬停时)。为了避开

第二类奇异点,我们采用Watterson等人【蛐l基于Hopf纤维化(HopfFibration)的方法,

17

万方数据
浙江大学博士专业学位论文 2 多旋翼飞行器动力学运动规划问题基本构建

将飞行器姿态分解为偏航角引起的水平旋转,以及相对于水平面的倾斜角两部分,并且

使用四元数表示,分别称为偏航四元数和倾斜四元数。

给定偏航角砂,对应的偏航四元数为

蛳=(cos(妒/2),0,0,sin(砂/2))。, (2-10)

机体坐标系z轴Zb如式(2—5),将机体z轴从世界坐标系z。旋转到锄的倾斜四元数为

栌而杀蓊(1+Zb(3))《“2)'锄(1L 0)T (2-11)

可验证吼中不包含任何沿机体Z轴自身的旋转分量,即偏航四元数和倾斜四元数互相

解耦,则飞行器整体的姿态四元数g为

1 +


2吼圆郇2万丽 1 C(

0《

删蜩悱删 胁托‰陋一一一一
l S(一_嘞㈤吖锄
”徊|;㈦ /)S几 砂.口叫现
㈨舭胆动

f靠+q;一馥一谚 2(qlq2一qoq3) 2(qlqa+qoq2)\


R=冗忡t(g)=l 2(qlq2+qoqa) 醯一q}+谚一酲 I,
2(q2qa—9091) (2一13)

\2(qlq3一qoq2) 2(q2qa+qoql) 爵一q}一程+酲/

f磊(1)sin(妒)一26(2)cos(妒)一磊(3)(z6(1)sin(妒)一zd2)c08(妒))/(1+锄(3))\

I zb(1)cos(妒)+zb(2)sin(妒)一之b(3)(石6(1)cos(妒)+zb(2)sin(妒))/(1+2r6(3))l
\ (Zb(2)2b(1)一铂(1)庇(2))/(1+铂(3))+妒, /

万方数据
浙江大学博士专业学位论文 2多旋翼飞行器动力学运动规划问题基本构建

至此,通过式(2—5)至式(2一15),我们能够由平坦输出及其至三阶的高阶导数{盯,方,子,孑)
解析地计算恢复状态向量x={”p,”由,R>和控制输入U={,,‰}。
通过微分平坦,我们能够将模型约束简化为链式积分的线性系统

虫(£)=Ax(t)+Bu(t), (2-16)

根据不同应用考虑不同阶次,例如若为三阶线性系统,则以加加速度作为控制输入。使

用线性模型却依然能够考虑非线性项的约束,这为后续的优化计算带来极大便利。

2.3过程约束

过程约束是指在时间区间【to,o,】上对飞行器行为的限制,表示其无法到达状态空
间的某些区域,分为系统状态/控制输入区间约束,以及躲避障碍物的约束。

2.3.1系统状态,控制输入区间约束

考虑到实际物理系统的能力,例如速度、加速度无法到达无穷大,无法产生反方向

的推力等,系统状态及控制输入是有界的,其存在容许作用区间。考虑上小节所描述的

非线性以及线性的动力学模型,整体上飞行器在运动时会受到下列代数不等式约束:

II郇(t)l L2=lIfD(t)112≤V。。, (2一17a)

fla(t)ll。=忡(圳:≤am。, (2—17b)

lIJ(t)112=0a(t)I|:≤J‘max, (2-17e)

116u(t)II。≤Q。ax, (2-17d)

II&rccos(e3ra(t)ez)lI。钆。, (2—170

,m{。≤f(t)≤^。,t∈[to,ts], (2-170

其中v。。,am。,J。。,Q。ax,Om。和{,m洒‰。)分别为速度、加速地、加加速度、机体
角速率、姿态角和螺旋桨推力的区间幅值参数。一些参数的取值为飞行器的设计极限,

例如螺旋桨推力{厶…‰,),而另一些参数则是根据具体任务情景确定的期望限制或
安全上下限,例如最大飞行速度v。ax和最大倾角0。。。式中的机体角速率6u、旋转矩

阵R和螺旋桨推力值,由上一小节的微分平坦输出恢复得到。

万方数据
浙江大学博士专业学位论文 2多旋翼飞行器动力学运动规划问题基本构建

注意到上述约束存在耦合关系,例如加速度与姿态角/推力之间存在关系,加加速

度与机体角速率之间存在联系,因此在规划时无需同时考虑。在不同的情形下,由于目

的不同,我们考虑使用不同的约束组合。例如在第4章探究实时局部规划时,考虑到有

限的感知距离,我们允许以较大姿态避开障碍物,且希望快速实时求解,因此我们使用

二阶线性模型,仅考虑速度与加速度的约束。在第3、5章我们使用三阶线性模型,则加

加速度约束需要被考虑。而在第6章探究跟随全局轨迹且希望飞行器保持姿态平稳,我

们使用确切的机体角速率约束、姿态角约束和推力约束来替代加速度和加加速度约束。

23.2躲避障碍物约束

在所有任务情形中,飞行器在全时刻都需要避开障碍物。轨迹规划的避障依靠与地

图进行交互实现,在图1.2所示的模块化导航框架下,地图模块作为真实环境的抽象表

征,提供碰撞检测的接口,轨迹规划中对不同的地图类型有不同的处理方式。本文所探

究的任务情形多样,包含快速实时局部规划与全局最优规划,且复杂环境障碍物密集、

不规则,这对环境的表征提出两大要求:

1.能够以尽量小的计算花销快速查询某一构型是否与障碍物发生碰撞,这有利于快

速实时局部规划。

2.尽量接近真实环境,即地图的可行区域尽量不遗漏真实环境的可行空间,这对于

探究全局最优解至关重要。

根据上述要求,本文使用占据栅格地郾蜘(OccupancyGridMap,OGM)和欧式符
号距离场I翱(EuclideanSignedDistanceField,ESDF)两种地图对环境进行表征。图2.2展

示了三维环境中不同分辨率下的占据栅格地图,图2.3展示了三维环境下的欧式符号距

离场地图。

两种地图都将环境以一定分辨率离散成空间栅格,每个栅格包含状态属性表示此栅

格是否与障碍物发生碰撞,碰撞检测时只需查询轨迹所经过或者覆盖的栅格是否碰撞。

在分辨率合适且感知准确的前提下,理论上真实环境的工作空间中无障碍物区域的任何

地方都为规划求解的可行空间。以安全通道为表征的地图形式为了计算效率一般表示成

连续相交的凸多面体或者球的组合,而真实环境中工作空间几乎都为非凸,尤其是复杂

的不规则环境,以凸组合形式的安全通道势必将一大部分真实可行区域排除在外,限制

万方数据
浙江大学博士专业学位论文 2多旋翼飞行器动力学运动规划问题基本构建

图2.2不同分辨率下的占据栅格地图(图源自Hornung等人l“I工作)

图2.3欧氏距离场地图(图源自Han等人185I工作)

了全局最优解轨迹潜在的可行解空间,如图2.4所示。另外,占据栅格地图和欧氏距离场

地图的共同特点是查询效率高,查询复杂度为0(1)。

图2.4安全通道地图

碰撞检测的方式还与所研究对象构型空间状态的选取相关,本文所研究的多旋翼飞

行器体型相对较小,与地图的分辨率大小接近,因此将飞行器视作球体,则其构型状态

简化为三维空间中的位置

P=(Px,Pu,Pz)T∈酞3. (2—18)

万方数据
浙江大学博士专业学位论文 2 多旋翼飞行器动力学运动规划问题基本构建

如此一来,对空间障碍物按球体半径进行膨胀后即可构建出构型空间,碰撞检测只

需对构型空间中的点做检查。本文在进行实物测试时会将膨胀半径设置为稍大于机体半

径以考虑后续轨迹跟踪时的控制误差,保证安全性。

第4章和第5章使用占据栅格地图,构造完成后地图中每个栅格为三种状态:占用

(Occupied),安全(Free),或者未知(Unknown),分别表示此栅格位置上有障碍物,没

有障碍物,或者还未观测到。避障需满足轨迹位置经过的栅格不为占用状态,轨迹避障

的约束描述为

p(t)隹OGM。,t∈[to,t1], (2-19)

其中OGM赢表示被占据栅格所在位置的集合。

第3章和第6章使用欧氏距离场地图,其在占据栅格地图基础上构建,每个栅格额外

存储了一个数值,表示该栅格离与其最近的被占用栅格之间的距离。避障需满足轨迹位

置经过的栅格所示的距离大于一定阈值,轨迹避障的约束描述为

施丁(p(t))之rtDl,£∈[to,o,】 (2—20)

其中k,zs7-:R3卜÷R表示计算一个三维位置点到其最近障碍物的距离的函数,n川表示

安全距离阈值。

本文所使用的占据栅格地图构建算法为Elfes等人【821提出的基于贝叶斯估计的概

率更新方法。欧氏距离场地图构建算法为Felzenszwalb等人【86】提出的基于最小函数卷

积的方法。对于连续时间的避障约束,我们以一定时间分辨率对轨迹进行采样转化为离

散点的位置约束。

2.4边值约束

边值约束指飞行器运动起始时刻的状态x(to)和终止时刻的状态x(ts)受特定条件
所限制,根据不同任务的不同情形所受约束不同,需结合实际情况具体确定。

2.4.1初始时刻约束

£=to为规划的起始时刻,对于已知环境下的全局规划,例如第3章所探究的问题,

飞行器在起始时刻一般为静止状态,只需根据任务情形选定起始位置点即可。

万方数据
浙江大学博士专业学位论文 2多旋翼飞行器动力学运动规划问题基本构建

对于未知环境下快速导航,例如第三、四、六章所探究的问题,需在行进中不停地

进行实时局部重规划,为了保证飞行器运动的连贯性,每次重规划起始状态的选择分为

以下两种情况:

1.当轨迹跟踪误差小于容许范围限度时,规划起始状态选取为当前所跟踪轨迹上某

个超前时刻的状态。令真实世界中当前时刻为t。,则

x(to)=xt,。。k(to+zxt), (2-21)

其中x讹吐(t)为当前所跟踪轨迹。此初始时刻约束假设了未来△£时间内轨迹跟踪

较好,经过At时间,飞行器的状态到了Xtrack(to+At)附近。

2.当轨迹跟踪误差超过容许的误差限度时,说明飞行器已经偏离了当前所跟踪的轨

迹,那么规划起始状态选取为以状态估计所得到的当前状态为初始值,再根据动

力学模型前向积分At时间所得到的状态。即

x(to)=血”。(x。m At), (2—22)

其中X。“为状态估计所得到的飞行器当前状态,.也。为动力学方程。

上述约束要求每次轨迹重规划在△£时间内结束,△t的选取一般为数毫秒到数十毫

秒,根据具体规划任务和硬件计算性能条件确定。

2.4.2终止时刻约束

t=t,为规划的起始时刻,对于全局规划,同起始时刻一样,飞行器在终止时刻一

般也为静止状态,只需根据任务情形选定终止位置点即可。此种起止均为静止状态的规

划被称作Rest.to—Rest规划。

对于行进中不停进行着的实时局部重规划,每次重规划终止状态的选取根据任夯不

同有很大区别。此处列举一些例子,后续章节再结合具体情形具体分析。例如第4章的

实物试验中,终止状态由所跟随的移动目标确定,或是在交互中由用户给定,为状态空

间中一个确定的点:

x(ts)=xgoal. (2-23)

万方数据
浙江大学博士专业学位论文 2多旋翼飞行器动力学运动规划问题基本构建

再例如第6章所探究的跟踪参考轨迹的情形,要求重规划终止状态约束在参考轨迹上,

此时终止状态约束为状态空间中的一条曲线:

x(t1)∈x9捌, (2-24)

其中X州为满足约束的目标状态点的集合。

2.5性能指标

对于飞行器规划,常见的性能指标有最短时间【8"11,最小能量【59,92]等等。式(2.1a)所

表示的综合性能指标了由积分指标J:£(t,x(t),u(t))出和终端指标圣(£,,x(t,))两部
分构成。其中,积分指标用于描述任务对某些指标在时域过程中的积累优化需求,例如

若希望运动过程尽快完成,则可将积分指标设置为£=1,若希望飞行器在运动过程中

的机动尽量平缓,则可将积分指标设置为使累积控制输入最小C=u(t)Tu(t)。终端指

标用于描述任务对终止时刻状态的优化需求,对于飞行器的运动规划此指标较少出现,

对于终止时刻状态的限制一般在约束中构建而非在优化目标上构建。

本文所探究的飞行器复杂环境下自主导航,结合第2.1节中所描述的平台及其运动

特点,规划中的共同性能目标为期望以尽量平滑(节省能量)的轨迹尽快地完成任务。

因此,本文所探究的大多数情形下将以最小能量和最短时间的加权和为性能指标:

了=石飞+-u1州)Tu t))出柏咱)+石飞u∽Tu@)出, (2-25)

其中p为时间项的权重。

2.6本章小结

本章针对飞行器运动规划的一般问题从最优控制的角度给出了数学模型的基本构

建。本章的主要贡献体现在三个方面:首先,构建了一个精简且实用的非线性动力学模

型,并依据微分平坦性质将此非线性的模型约束用链式线性的模型约束替代,而在过程

约束中需考虑的状态同样可由平坦输出及其高阶导数解析地计算恢复得到;其次,分析

了所探究问题的碰撞检测需求,选定了适合的地图表征形式,并给出了两种地图下避障

约束的描述;最后,阐述了在不同情形的飞行器导航问题中,尤其是未知环境下边值约

万方数据
浙江大学博士专业学位论文 2多旋翼飞行器动力学运动规划问题基本构建

束该如何构建。本章所建立的问题基本模块将用于建立飞行器在不同情形不同任务下的

运动规划模型,具体将在后续章节介绍。

万方数据
浙江大学博士专业学位论文 2多旋翼飞行器动力学运动规划问题基本构建

万方数据
浙江大学博士专业学位论文 3结合采样与优化方法的全局最优动力学运动规划

3结合采样与优化方法的全局最优动力学运动规划

3.1引言

第2章从最优控制的角度构建了多旋翼飞行器运动规划的基本问题,本章主要探究

情形一.全局规划,也即飞行器在已知精确复杂环境下的全局最优运动规划问题。

式(2一1)所表示的最优控制问题的求解方法可分为直接法(Direct Method)、间接

法(IndirectMethod)和动态规划法(Dynamic Programming,DP)三类【93】。直接法将控

制输入和状态变量在时间上离散化,将问题转化为离散的非线性规划问题(Nonlinear

Programming,NLP),再求解原问题离散形式的数值最优解。直接法形式较为统一,能

处理较为复杂的非线性约束,对不同问题的适用范围广,因而被广泛使用,但也存在两

个缺点[94】:一、难以保证转化后的NLP问题为原最优控制问题的最优解;二、初值的

选取对求解效率影响很大,初值选取不好容易导致陷入局部最优解。障碍物作为一类特

殊的强非线性约束,对初值选取有着很大影响。一些工作【z,63,95彻首先求解最短路径规
划问题(以路径长度作为性能指标)得到一条无碰撞的几何路径,接着以此为初值在附

近的安全空间求解满足动力学约束的轨迹(性能指标发生变化)。由于障碍物约束的存

在,优化求解得到的轨迹一般很难跳出由该几何路径确定的特定路径拓扑类(Homotopy

Class)。因此,以此种层级式的规划方式,我tf]能够得到在特定路径拓扑类下的局部最

优解。然而,全局最优轨迹却可能不落在此特定路径拓扑类下,因为路径的长度和轨迹

的代价没有必然联系。若期望求取全局最优解,则需找到属于不同路径拓扑的路径分别

作为初值进行求解后再互相比较。层级式的规划方式由于前后性能指标的不一致从而不

适用于求取全局最优轨迹。

相比于直接法的离散化形式求解,间接法则通常利用取得极值的必要条件,并结

合充分性条件或问题的实际物理意义来得到解析形式的最优解【98】。间接法包括变分法

(Calculus ofVariation)和庞特里亚金极大值原理(Maximum Principle)1991。古典变分法

要求控制变量不受限制,是一个开集,且哈密顿函数对控制变量的导数存在,而实际中

控制输入一般为有界闭集。极大值原理为对交分法的改进,其允许控制变量受约束,并

且不要求哈密顿函数对控制变量连续可微。间接法通常涉及到啥密顿函数两点边值问题

万方数据
浙江大学博士专业学位论文 3结合采样与优化方法的全局最优动力学运动规划

(TwoPointBoundaryValueProblem,TPBVP)的求解,当存在复杂的非线性约束例如障

碍物约束时求解是很困难的。

动态规划法将原最优控制问题拆分为若干个阶段,根据贝尔曼最优性准则求取到每

个阶段的累积最优控制序列,直至求解完整的原最优控制问题。其中心思想是将原规模

较大的问题转换为多个规模较小、更易求解的子问题,分而治之∞】。在机器人的运动

规划领域,一些最优性采样类运动规划方法(Optimal Sampling-based Motion Planning,

OSBMP)便是应用了动态规划法中分治的思想和贝尔曼最优性准则。在本质上,此类

方法通过增量式【121或者批次式【14】采出的状态样本将连续的状态空间离散化,再以树结

构【ll】或者图结构【lol的形式依据最优性准则连接这些状态样本来探索解空间的连通性,

连接任意两个状态之间的运动轨迹求解即为求解一个TPBVP。通过在采样时引入随机

性,其能够高效地探索完整的解空间从而得到接近全局最优的解。

结合本章探究的问题,我们提出一种结合采样和优化的方法来求解全局最优轨迹。

不同于层级式的方法,本章方法将原较大规模的问题通过采样分解为求解一系列子问

题,每个子问题具有和原问题相同的性能指标和约束,但规模更小,更容易求解。通过

不断求解分布于完整解空问中的子问题,我们在状态空间生长一棵轨迹树来不断探索具

有不同局部极小解的子空间,在算法的运行过程中自然地跳出局部最优解,确定更好的

路径拓扑,而无需提前确定路径初值。另外,由于OSBMP需要大量求解TPBVP,而近

邻状态间的轨迹更容易满足约束,尤其是避障约束,因此我们使用约束松弛,即在求解

TPBVP时暂时性地忽略过程约束,仅考虑模型约束和边值约束,使用极小值原理求取

子问题的解析解,直到必要时再检查求解结果是否违反约束,以此增加求解效率。

虽然SBMP适用于求解全局最优问题,但是单纯基于采样的方法【43,100,10l】收敛缓

慢,因其难以采到最优解周围的状态样本。充分采样有助于轨迹树的良好生长然而需花

费许多计算时间。为了提升收敛性,我们期望轨迹树中每一条边的生长都以尽量小的代

价为探索解空间做出最大贡献,每一个被添加的节点都在状态空间中合适的位置。另

外,对涉及到系统动力学模型的轨迹规划来说,时间这一维度至关重要。因此,我们提

出在添加一个状态节点到轨迹树中之后在空间和时间两个层面对轨迹树进行形变优化,

即,进行时空优化来保持轨迹树良好生长,如图3.1所示。优化轨迹树的难点在于保持优

化效率的同时设计实际的优化目标。对轨迹树中每一个状态节点和每一条轨迹边都进行

形变优化过于低效,我们引入形变单元的概念,其包含一个状态节点以及所有连接此节

万方数据
浙江大学博士专业学位论文 3结合采样与优化方法的全局最优动力学运动规划

(a)结合时空形变优化 (b)不结合形变优化

图3.1添加相同数量的状态节点后轨迹树的拓扑结构以及当前最优轨迹

点的轨迹边。一个形变单元只占完整轨迹树的-4,部分,然而对其进行形变优化能够提

升以该单元所包含节点为根节点的子树的质量。以此方式,我们以较低的代价高效利用

了每个状态样本带来的解空间中新的信崽,从而加速了求解全局轨迹算法的收敛性。

在本章后续部分,第3.2节建立了具体问题的数学模型,提出使用结合采样与优化

的方式求解;第3.3节描述了轨迹树在状态空间的生长过程,将轨迹边的求解描述为终

端时刻自由、终端状态受约束的最优控制问题并松弛约束求解;第3.4节提出了以形变

单元的形式对轨迹树进行形变提优,该约束优化问题以罚函数法求解。第3.5节进行了

比较数值实验,验证了本章所提出方法的高效性;第3.6节进行总结。

3.2问题描述

本章我们选取3阶线性积分模型,以加加速度作为控制输入,偏航角另外考虑,则

多旋翼飞行器的线性模型为

文(t)=nx(t)+Bu(t),
l 》

),uct,=Fc幻,pct,=
f P

…瓢沙
I × 3

x(t)=l由 B = ,

I 眺I 3
/,f-I 、\

fF .1
)0 _

其中I。为礼维单位方阵,Oi。J为t行J列的零矩阵。

万方数据
浙江大学博士专业学位论文 3结合采样与优化方法的全局最优动力学运动规划

选取权衡时间一能量最优的性能指标,全局规划的具体数学模型为线性二次最短时

间(Linear Quadratic Minimum Time,LQMT)问题【1021:

。。曷}岛,了=/o巧(p+三u(t)Tu(t))出 陋乏a

s.t.文(t)=Ax(t)+Bu(t), ∞
捌 b

x(o)=Xi。砒x(Tj)=X9。£, 吣乞C

lIv(t)ll。=lIf,(t)112≤V。。, 叫
也 d

lla(t)[I:=IIiB(t)ll。≤a。。, 陋乏e

IIj(t)tl。=IIri(t)ll。≤J。。, ㈣
他 蟹

f倪m-(p(t))≥7"t。f,Vt∈【0,Ts】 陇之.g

表示求取最优控制u+(z)和最优到达时间乃,使得飞行器从初始时刻状态K础到达目

标状态Xgoal,期间使得运动尽量平缓且耗时尽量短,满足速度、加速度,以及加加速度
在某些幅值内,同时避开所有障碍物。

我们采取采样与优化相结合的方法来求解上述全局规划问题,具体方法分为轨迹树

的生长和轨迹树的形变两个部分。

3.3轨迹树的生长

3.3.1时空形变树算法

轨迹树生长过程算法的主体框架与RRT#算法类似,包括采样、找父节点、重连接

等操作,输入规划起始状态K。it,规划目标状态南。一,障碍物环境E,以及形变模式£’

最终求解得到近似全局最优轨迹矿。

我们首先定义所需的数据结构。给定现有的轨迹树结构,记为丁,树上每一个状态

节点竹∈丁包含以下信息:

・‰:节点礼对应的状态;

・陬:树丁中节点礼的父节点;

・e。:从节点‰到住的轨迹边,也表示为(砩。,‰);

10

万方数据
浙江大学博士专业学位论文 3结合采样与优化方法的全局最优动力学运动规划

・已:轨迹边e。的时长;

・G:树丁中节点n的直接子节点;

・夕。:从树7_的根节点至节点n所经过的轨迹边所构成的轨迹的累积代价值(cost-

to-come value,g-value),代价计算如式(3-2a)。

轨迹树生长的具体步骤如算法1所示,在不混淆的情况下,我们以节点n对应的状

态‰代表该节点。

算法1:时空形变树算法
Input:障碍物环境E,起始状态x/础,目标状态b。2,形变模式C

Output:轨迹矿

I树中状态点V÷-(x砒),树中轨迹边£÷-0,轨迹树丁卜(V,£),
2 while终止条件未达到do

3 X。。+--Sampling(E);

4 疋。。。+--NearNeighborSearch(7-,x。e1|J,r);

if砩+_ChooseParen∥‰。‰e”蟛then
6 V÷-+.【x。。。),£+-+(xp,Xnew),丁÷-(V,£);
7 if TryConnectingGoal(xne¨x9。∥then
8 l找到一个可行解;
l—

9 if已经找到一个可行解then

m RewirelnCascade(,k。,xne。);
n l甜+--SelectDeformationUnits(xp,£);
:j DeformlnOrder(L0;

13矿+-RetrieveTrajectory(T,x9砌);

以下详细介绍算法1中所涉及各函数的具体内容。

1.初始化(第1行):将初始状态Knl。添加到轨迹树7-中作为树的根节点,此时树

中只有一个节点,没有边。

2.采样(第3行):在三维工作空间均匀随机采样9维状态空间的前三维,即采样位

万方数据
浙江大学博士专业学位论文 3结合采样与优化方法的全局最优动力学运动规划

置状态,得到新状态点x。。。速度状态和加速度状态在采样时设为不定,将在后续求解

TPBVP时自动计算,之后在第3.3.2节详述。

3.近邻搜索(第4行):我们以固定的欧氏距离半径r在轨迹树的状态节点中搜索出

距离x。。小于r的节点,该过程可描述为

NearNeighborSearch(T,x,r):={u∈y|lI口一xIl2≤r). (3-3)

在Webb等人【43】的工作中,在给定一固定代价值了和一状态节点x时,其计算出了能

够以小于代价歹到达此节点的后向可达集,以及从此节点出发,能够以小于代价歹到

达的前向可达集,将状态范围在这两种可达集内的状态节点作为近邻节点,分别进行后

续的选择父节点和重连接操作。然而此计算开销大,我们使用欧氏距离代替真正的代价

距离来简化计算。Li等人{m031和Zheng等人[4q的工作在近邻搜索时同样使用欧氏距离,

其指出了前(后)向可达集实际为以X为中心的次黎曼球(e-radiussub-Riemannianball),

而在一些条件下该次黎曼球内部总是存在一个特定大小的欧式空间高维球(Euclidean

hyp即-ball),因此在近邻搜索时可以使用欧氏距离近似替代真正的代价距离,在后续的

找父节点和重连接时再使用代价距离。使用大于一定值的固定的距离半径进行紧邻搜索

依然能保证渐进最优性【121。

4.选择父节点(第5、6行):从近邻节点的集合‰。中,选择一个“有潜力的
(promising)”节点作为)【tl。的父节点,使得轨迹边(昂,翰。)满足约束,并且经由xp
到达)【’1。的累计代价值最小,该过程为动态规划最优性准则的体现,可描述为

c幻。sePnre佗‘(z,x,E):5 gxv+歹(】cp,x)
x,raEinz

s.t.CheckFeasible(xp,x,E)==True,(3-4)

夕x,+J(砩,x)+H(x,舄。1)<盛,,删

其中CheckFeasible函数检查轨迹边是否满足约束,歹函数表示计算轨迹边的代价,H

函数表示计算可接受的(admissible)启发式函数对轨迹边的代价进行估计,此估计作为

真实代价的下界,虼rrent为当前已获得的最优解的代价,若当前无可行解,则虻。硎=
+oo。若找到满足条件的父节点,则将节点)c,|。和轨迹边(xp,x)添加到轨迹树丁中。“有

潜力的(promising)”节点意思为可能存在经由该节点到目标状态的轨迹,其代价小于

当前已有解代价。若此节点为non-promising,则无需将其添加至树中而耗费计算资源。

万方数据
浙江大学博士专业学位论文 3结合采样与优化方法的全局最优动力学运动规划

算法2:选择父节点
Input:障碍物环境E,潜在父节点集合疋,待连接节点)c,l。。

Output:父节点~

Xp+-null,Q÷-0;

/・对“有潜力的”父节点进行排序 ●f


l豇t,【。。。÷-9x。+了(K,x。。);

if孔渤。。+日(x。。,誓争埘)<唬,—t then


L Q÷-+@,氨‰A

7 x嘲。÷-Q.t叩();

。。9
L x№p≯+--小
关于了函数和日函数的计算将在第3.3.2节和第3.3.3节详述。实际实现如算法2所示,我

们先对荪。口r中的节点毪进行排序,不考虑障碍物,计算其中每个节点状态转移到)c,l。。

的代价,再加上)c‘的累计代价值甄,得到从轨迹树根节点经由x/到x一的轨迹累积代
价的一个估计蟊;,。。。,若)c‘“有潜力”,则将元组(】c‘,豇,‰。)存进优先队列Q中,按
氟,x~以升序排列。在之后的循环中每次取出Q中轧渤。。最小的节点(算法2第7行),
此时再考虑障碍物,对轨迹边(】ct,x。。)进行碰撞检测,若无碰撞,即找到符合要求的
父节点,退出循环。先对潜在的父节点进行排序相当于延迟了碰撞检测,不需要对所有

潜在的父节点轨迹边做碰撞检测。由于碰撞检测操作往往比估计代价要花费更多计算资

源,此种做法往往效率更高。

5.尝试连接目标点(第7行):由于目标状态为状态空问中的一个点,当向树中添加

一个新节点后,若此新节点距离目标点小于一定距离,则我们尝试以此节点状态和目标

点状态作为边值条件求解TPBVP,若求解结果满足约束,则找到了一条满足约束的轨

迹,即式(3.2)的一个可行解。

万方数据
浙江大学博士专业学位论文 3结合采样与优化方法的全局最优动力学运动规划

算法3:序列重连接
Input:障碍物环境E,轨迹树丁,新添加的节点h。。
1 Q 4-+xne";

2 while Q非空do

xi+.Q.z印();

疋。。4-NearNeighborSearch(T,x,r);
for Xc∈,%。,do

^x涔。÷-5bc;+了(xi,X。);

if^x淳。<gx。八^x泓。+H(x。,Xgoal)<夕乞rr。。t then
if CheckFeasible(xi,xc,到then

I改x。的父节点为强;

L L睁+xc;

6.序列重连接(第10行):新添加的状态节点x。。和轨迹边带来了新的信息,则可

利用这些信息重新构建轨迹树的拓扑结构。即,若经由轧。到达其近邻节点集合以。。,
中的某些节点x而使得这些节点的累积代价值减小,且新构建的轨迹边(h。。,X)满足
约束,则将这些节点的父节点改变为h。。。如算法3所示,我们采取RRT#[13】算法中的

重连接策略,不止对新添加状态节点)【r|。的近邻节点进行重连接,若某个节点x被重

连接了,则对x近邻节点也尝试重连接,即,将新信息充分传播到树中的其他区域。同

样,我们只对“有潜力的(promising)”节点进行重连接操作。实际操作时,我们将重连

接后的节点放入优先队列Q,按节点的累计代价值g—value以升序排列,之后每次从

优先队列中取出g—value最小的节点,对其近邻节点尝试重连接,若某节点被重连接

了,则将其放入队列,如此迭代进行,直至队列为空,即树的结构不再需要发生改变。

7.时空形变优化(第11、12行):在添加一个新的节点后,我们对轨迹树进行形变优

化以充分利用局部解空间信息。我们首先在树中选取形变单元(在第3.4.1节介绍),再

按顺序对这些形变单元进行优化,时空形变优化的过程将在第3.4节详述。

8.获取当前最优轨迹(第13行):在算法运行的过程中,所有“有潜力的(promising)”

节点保存其当前最优的父节点,若找到解,则可从终止节点根据父结点指针不断回溯至

万方数据
浙江大学博士专业学位论文 3结合采样与优化方法的全局最优动力学运动规划

根节点,途中经过的轨迹边即构成当前最优轨迹。

9.终止条件(第2行):终止条件可设为算法运行时间超出预设求解时间,或是轨迹

树中节点的个数超出预设个数等等,可根据不同需求不同设置。

3.3.2最优轨迹边术解

在算法1每一轮迭代的ChooseParent函数、TryConnectingGoal函数和RewireInCas-

cade函数中,我们都需要求解两个邻近状态点之间的一条最优轨迹边,此过程作为整个

全局轨迹求解的一个基础部分会被大量调用,因而需要尽可能快的求解。在求解某一条

轨迹边的时候,作为从原问题分解出的小规模同类问题。性能指标与全局优化问题相同,

对于各类约束,我们则将过程约束暂时忽略,只考虑边值约束和模型约束,根据极大值

原理推导得到解析形式的解。即给定始末状态,我们便能够解析地得到连接此始末状态

以多项式形式表示的一段轨迹,其最优系数和最优时长的计算过程只涉及多项式求根和

约束检验等代数计算,而不涉及优化迭代。对于边值约束,对于ChooseParent函数,起始

时刻状态x(0)为近邻搜索出节点的状态,完全给定;终止时刻状态x(T)为新采样出的
节点状态,只有三维的位置P给定,其余自由,即部分受约束。对于TryConnectingGoal

函数和RewkeInCascade函数,起始时刻状态和终止时刻状态均为树中已有节点的状态

或目标状态x。砌,采样状态中自由的部分已在ChooseParent函数中计算得到,因此完全

给定。据此,求解轨迹边的问题描述为终端时刻自由,终端状态受约束的最优控制问题:

州Ii氓linT,球(0)'x(剐=f(p+烈1矿u@)出(3-5a)
s+t. 文(£)=Ax(t)+Bu(t), (3-5b)

x(O)=Xo, (3-5c)

G【x(T),卅:{《T)一x1
2 0’ 话终止状态完全给定’
(3.5d)

x(T)出。1,2,3一P=0,if终止状态部分给定,

其中状态变量、控制输入等与式(3.2)相同。diral,2,3表示某一向量的第1,2,3维,Xo统一

表示起始时刻状态,x。统一表示终止时刻状态,P表示采样出的三维位置状态。

依据极大值原理的具体求解过程如下:

35

万方数据
浙江大学博士专业学位论文 3结合采样与优化方法的全局最优动力学运动规划

引入协态向量函数x(t1∈R9,并作哈密顿函数如下:

日(£,x(t),u(t),入(£))=p+互1 u(t)Tu(t)+入(t)T(Ax(£)+Bu(t)),(3-6)

则协态方程为:

却)-_器一A'rx(班 (3-7)

由A矩阵的结构可知协态向量函数x(t)满足其前三维为常数,中间三维为关于时间t

的一次多项式,后三维为关于时问t的二次多项武。

因在最优轨线x’(t)和最优控制输入u‘(≠)上哈密顿函数取极小值,而此时暂时假

设u(t)约束不受限制,是开集,则做控制方程如下:

型塑磐掣“(t)+矿洲:0,(3-8)
一r川…r7’
a旷ft)

由B矩阵的结构可发现最优控制u’(t)各维度上的解分别为最优协态向量函数”(t)后
三维对应维度上的相反数:

u’(t)=一入象。7.8’9(t), (3-9)

即为关于时间t的二次多项式。

再由3阶线性模型式(3—5b)可知最优轨线xl(£)的位置维度每一轴各自为关于时间t
的五次多项式,以z轴为例,表示如下:

x+(t)出。1’4'7=

㈢=(萤{i)
其中cx=(a。,bz,cx,如,e。,厶)T为未知的z轴多项式系数向量,卢(t)=(1,t,t2,t3,t4,t5)T
(3-10)

为时间基底向量。则茁轴的最优控制为:

矿(£)d‘m。=露(t)=%T声(t), (3-n)

对Y轴和z轴同理。

则最优协态向量函数可写作

”(£)=一p‘5’(t)T Cz Cy c:】, 卢㈣(£)T b勺c。], 卢(3’(t)T Cx Cy


Cz】)T∈R9,(3-12)
36

万方数据
浙江大学博士专业学位论文 3结合采样与优化方法的全局最优动力学运动规划

其中p(。’(z)表示p(z)对t的s阶导数,例如p(3’(t)=声(t)。
式(3-5a)的性能指标可写作

7(x(。),x(T))=了(c*,T)=/T(p十五1u(t)Tu(z))出
=pT+互1。。丢:,cj ZT声@)声(t)Tdz ct,‘3—13’

其中Ck为南轴的多项式系数向量。

下面将分别讨论末端状态完全给定与部分给定的情形:

情形1.末蜡状态完全给定

对于终止状态完全给定的情况,由边界条件x(o)=)【0∈R9和x(T)=X1∈R9可
确定18维齐次线性方程组

㈤x(O)//=㈤Xl f3—14)

当T>0时线性无关,可将所有多项式系数Ck用T表示,再带入式(3—13)将其转换为关

于T的标量函数歹(c%(T),T)=了口),求取最优到达时间T转换为标量函数求极值问
题:

T+=argrainJ(T、
(3- 15)

s.t.T+>71m…歹(r)>0

其中露;。为可行到达时间下界的一个估计,可根据位移距离、速度、加速度约束幅值

等计算。实际求解上式时,我们计算方程警=0的根,此例中为求解一元六次方程,
从所有根与露伽之中选取使代价J(T)最小的满足条件的作为最优到达时间T+。求得
P之后,即可恢复得到最优多项式系数。

情形2.束靖状态部分给定
对于终止状态只有位置给定的情况,除了已知的边界条件外,还需联立横截条件。

根据式(3.5d)的终止状态约束,可写横截条件为

入(T)=—OG[盯x(T),T]T_U=(v1,vz,va,0,0,0,0,0,0)T∈R9,(3一16)
其中u=(u。,忱,u3)T∈酞3为终端等式约束相关的拉格朗日乘子向量。最优协态方程

式(3—12)满足”(T)=A(T),联合已知的边界条件x(O)=Xo∈R9和Xdi。1.2,3(T)=P∈

37

万方数据
浙江大学博士专业学位论文 3结合采样与优化方法的全局最优动力学运动规划

(x。篓;T,)=(i,], c3-,7,

3.3.3多项式轨迹遗的两种表示

当系统为s阶线性积分模型时,最优轨迹表不为2s一1次多呗式。对{z,Y,z,中仕

意一维,省略维度下角标,我们记多项式边界条件d=IxT(t)I仁0,xT(t)It:T]T∈R28,多

项式系数向量c∈R加,则给定时长T,一段多项式可由多项式系数向量和时长{c,T】-,

与多项式边界条件向量和时长{d,T)两种形式表示。
由c至d的转换可由边界条件的定义得到,如下:

d=Az(T)c,堋=∞G扮 p㈣

其中的各个块矩阵E,F,G为R“5维的方阵,其第i行J列的元素构建如下:

E巧2{:一。!:ff;i≠=Jj,, 。。∞

F巧cT,。{:『一1”/。一。卜p一‘:ffii><Jj,, c3-2。,

G文T)=譬黜・T一卅.(3-21)

万方数据
浙江大学博士专业学位论文 3结合采样与优化方法的全局最优动力学运动规划

由d至c的转换可通过对矩阵A,(T)进行整体求逆[1】或者更高效的分块求逆[104,105】

得到,然而矩阵求逆的计算复杂度高,后续第3.4.4节的约束优化求解需要大量使用此两

种表示形式的转换,我们希望尽快求解。

通过观察矩阵Af(T),发现其为Confluent Vandermonde Matrix形式,由Wang等

人【106】的工作指出,{c,T】.与{d,T)之间是双射关系(Bijection),即存在解析形式的转
换,如下:

c=Ab(T)d,钆㈤2㈦品)’ p22,

其中的各个块矩阵U,V,W同样为Rs。8维的方阵,根据SchappeUe等人【107】的工
作,其第i行J列的元素构建如下:

吣P叫!i州l (3—23)

ii(T)=竺诗高等掣,
l=Jj,,

V)1‘k-j¨-知(0i(‘)1一(力‘州=;E (3-24)

w羽)-笥与杀祷斜・
w…∑:=州旬力(8吉1)(28—等‘1) (3-25)

因此一条轨迹边可由c,T)或{d,T)两种形式表示。此两种可互相解析转换的多
项式轨迹边表示形式为后续的轨迹树约束形交优化提供了极大便利。

当轨迹时长给定时,例如以第3.3.2节所述方式求得,一条轨迹边的代价可经由{c,T)
计算为

fl(c,T)=PT+foT三cT卢㈤∽p㈤(£)Tc dt=∥+互1cTQ(丁)c, (3-26)

或经由{d,T)计算为

ff(d,T)=了(x@)lt=0,X(帖T,T)=pT+z1-dTM(T)d,
。-27’
d:Jlx(t)lt:TI
x@)It-。I,M(丁):Aj(T)Q(T)A。(T).
此代价可作为在完整约束解空间中的两个状态点之间最优转移代价的一个估计,

第3.3.1节中的启发式函数日由此计算。

万方数据
浙江大学博士专业学位论文 3结合采样与优化方法的全局最优动力学运动规划

3.4轨迹树的时空形变

在轨迹树不断生长以探索解空间信息的过程中,当一个新的状态节点和新的轨迹边

被添加到轨迹树上时,此轨迹树随即采集了解空间的一些新信息。然而,由于采样的不

充分,一些状态节点的累积代价值(cost-to—come value)也许并不能很好地估计解空间

中该处代价的实际值,表现为树没有很好的生长,尤其在时间这一维度。而对轨迹树中

的某些轨迹边进行形变能够提升轨迹树的质量。

3.4.1形交单元构造

我们首先定义形变单元的概念,并将其作为轨迹树形变的最小单位。

如果我们在状态空间“重新放置”树上其中一个节点,即改变其状态,并保持其他

所有节点的状态不变,同时保持节点间的连接结构不变,那么只有与该被“重新放置”

的节点相连接的轨迹边会受到影响。因此,我们定义一个形变单元为某个集合,该集的

元素包含一个状态节点、该节点与其父节点之间的边、和该节点与其直接子节点之间的

边。在一个形变单元内,时空形变通过优化该节点状态和这些相关轨迹边的时长进行,

与此同时轨迹树上其他所有节点的状态和其他所有轨迹边的时长保持不变。我们记一个

形变单元中的元素集合如下:

{K,T。)={x。,兀,正,ll∈厶), (3-28)

万方数据
浙江大学博士专业学位论文 3结合采样与优化方法的全局最优动力学运动规划

其中礼为被“重新放置”的节点,厶表示节点札所有直接子节点的集合,T。={死,Z,Ii E

厶}包含与之相连接的所有轨迹边的时长。值得注意点是,我们设置节点的状态为优化

变量而非轨迹边的多项式参数,由此带来两大优势:

1.隐式地消除了节点上的连续性约束。

2.优化变量的个数大大减少。

一个形交单元的例子如图3.2所示,该例中的形变单元含有三条轨迹边。

3.4.2优化性能指标设计

优化形变单元时我们需要设计一个合理的性能指标,其需遵循一些准则:在形变过

后,轨迹树的整体质量应当有所提升,从而根据此树将有着更高的可能性找到更好的甚

至是最优的全局轨迹。另外,该指标的计算应当尽量简单。根据Hauer等人【7l】所揭示

的,通过在状态空间生长轨迹树对解空间进行一定程度离散的覆盖,则轨迹树中所有节

点的代价值(cost—to—comevalue,g-value)之和能够在某种程度上作为对此解空间的最

优值函数的一个估计。同样考虑到优化一个形变单元会且仅会改变该单元所包含节点以

及该节点所有后继节点的代价值,即影响以该节点为根的子树,而整个树中的其他轨迹

分支却不受影响。我们因此设计优化性能指标如下:

肌+∑仇,(3-29)
i∈D“

其中口。表示节点n所有后继节点的集合。另外可选择性地,我们可以给上式中每一个

节点赋上权重W∈【0,1】,以表示其构成最终的最优轨迹的可能性,彰显其重要程度。我

们能够设计某些启发式函数(heuristics),例如第3.3.3节所描述的来估计节点到规划终

点的代价值(cost-to—govalue),并以此估计值作为权重。如此设计性能指标表示我们期

望优化以该形变单元所包含的节点为根的子轨迹树。

根据树结构的性质,我们有

鼽=c(砩。,)【7I)+绑。, (3-30)

其中c(麓,xJ)表示连接节点i与J的边的代价,可由式(3-27)解析地得到,其作为考虑所

有约束时两个节点之间状态转移所耗费真正代价值的一个估计。通过式(3.30),性能指

万方数据
浙江大学博士专业学位论文 3结合采样与优化方法的全局最优动力学运动规划

标的计算通过计算轨迹树中每一条边的代价值c(xi,玛)的加权和来完成。每条边(Xi,xj)
的权重计算如下:以整体树的起始节点为起点,以优化单元所代表子树的每一个节点为

终点,每一个起终点组合都有一条轨迹,对每一条轨迹,计数某轨迹边被经过的次数,

即为该边的权重。注意,本段落中边的权重非上一段落所描述的节点的权重。边的权重

由优化开始时当前树的结构确定,对于某树形结构,各边的权重是确定的。而节点的权

重则通过启发式函数估计,是可选项,也可不估计而都设为1。

因此,性能指标转化为:

如+∑gi=∑∑嘞c(毪,巧)
{∈Dn ‘∈7;J∈Q

=厶c(‰,x。)+∑哦c(x。,墨)+c (3.31)
l∈矗

=∑喀c(酝,毪)+C,
ZJ ’’…’7
{∈{n)U c,l

其中兀表示以节点n为根节点的子树,厶等于1+nb des(n),nb_des(n)为节点n所

有后继节点的个数,C为一个常量,表示形变单元中所包含的边以外的、树中的其他边

的代价和。

至此,所设计的性能指标仅与某一选定的形交单元相关,却能够在某种程度上呈现

某一子轨迹树的质量,进而作为一部分解空间的最优值函数的估计。

3.4.3罚函数法杓建形交单元的无约束优化

在第3.3节轨迹树的生长过程中,我们求解轨迹边时对待障碍物和运动学等约束以

先暂时忽略后检查的方式实现了对完整解空间的快速探索。而在本节形变优化的过程

中,我们更专注于形变单元附近的局部解空间,利用已在树中收集的解空间信息来提升

轨迹树的质量。此时,障碍物和运动学等约束应当直接处理而非用后检查的方式。

记9(pM(t))∈时+1 1 0为式(3-2d)至式(3.29)等泛函形式的不等式约束,我们构

建罚函数以软约束的形式将其转移至性能指标中从而构建成无约束优化问题。由于泛

函形式的不等式约束实际包含无穷多个不等式约束而难以直接处理,我们采取Teo等

人BoB,109]的方法,对构建出的罚函数在固定个数的离散的时刻点进行采样,对违背约束

的部分进行积分,以有限维度的约束积分逼近,则由罚函数转化成的性能代价指标杓建

为其采样点的加权和。另外,注意到这些泛函约束的计算在每一条轨迹边之问相互独

万方数据
浙江大学博士专业学位论文 3结合采样与优化方法的全局最优动力学运动规划

立,即,9@H(t)),£∈【0,正l仅涉及到ct以及正。
因此。对于某一多项式系数以及时长为{ct,正)的轨迹边,其罚函数转化成的性能

(3・32)
乃(ct忍,乜)2卺∑jffio畸zTm凹眵(ct,正,£),oJ,
其中ki是采样点的个数,爿∈R茹1为权重向量,表示泛函约束向量9中每一维的惩罚
因子,(wo,W1,…,呲;一-,Wk,)=(1/2,1,…,1,l/2)为梯形求积法则中的系数,max[-,・】
为对向量每一维度分别取较大值的操作,t=歹/‰.互为采样时间间隔。

对式(3-31)中的每一条边构建如式(3-32)所示的罚函数,则针对某一形变单元<x。,T。)

t瓠∈{磊“以(讯聃讹忍觑)),
。‘33’

铲{黑鲫鼍
其中d|l等于1+nb_des(几),n6_des∞)为节点礼所有后继节点的个数。

3.4.4梯度下降求解形交单元的优化

对形变单元中的一条轨迹边<q,正】.,i∈{n>U厶,我们根据链式法则推导式(3.33)中

解耦的性能指标相对于优化变量{h,T。)的梯度,如下;

筹=鼍象=Qc耻t,甏=筹关象, c3圳,

甏=p+尹1配k,甏=髻+警豢毛,(3-35)

等=鼍姜啪m吡b卜吲,0], (3-36)

堕:』[Aol(硝A{l(硝.T,删=n (3-37)
‰I陋(正)T A№)T]。,班∈厶,

万方数据
浙江大学博士专业学位论文 3结合采样与优化方法的全局最优动力学运动规划

bOGh_2/3(h。),(t酱)pCh)(t),v草OG_h =啊2B矿(h+鬻1)(t)Tcip(h∽挑{1)2渤’叫。,
鼍一眦)酱,警一科ct鬻,
pⅢ’

万方数据
NO—DE
浙江大学博士专业学位论文 3结合采样与优化方法的全局最优动力学运动规划

訾.

图3.3形变模式意图

3.4.5形变模式

对一个形变单元进行优化能够更充分地探索其附近的局部解空间而保持轨迹树的

其他部分不变。对多个形变单元进行优化有助于提升树的整体质量但会带来更多的计算

开销,权衡计算负担和期望的优化程度,我们提出4种不同的形变模式,各种模式以不

同形变单元组合的形式对轨迹树的不同部分进行形变优化。如图3.3所示,在一个新的

状态节点礼e叫被加入到轨迹树中之后,我们记其父节点为n,树的形变优化按以下4种

模式中的一种进行:

节点模式(PatternNODE):仅优化一个形变单元,该单元包含节点几和与之相连
接的边,如图3.3左上角蓝色的树边所示。

树干模式(Pattern TRUNK):优化多个形变单元。从节点n根据父节点指针不断

往前回溯至起始节点的一个直接子节点,按顺序记录下所经过的每个节点,再以相反顺

序优化这些节点所在的形变单元,即从该直接子节点优化到节点n,如图3.3右上角橙色

的树边所示。

树枝模式(Pattern BRANCH):优化多个形变单元。从节点礼开始,对其后继节

点进行广度优先搜索,按顺序记录下所经过的每个节点,再以此顺序优化这些节点所在

的形变单元,即优化以节点n为根节点的子树中所包含的所有形变单元,如图3.3左下

角红色的树边所示。

万方数据
浙江大学博士专业学位论文 3结合采样与优化方法的全局最优动力学运动规划

全树模式(Pattern TREE):优化多个

形变单元。从整树的根节点start开始,对

其后继节点进行广度优先搜索,按顺序记

录下所经过的每个节点,再以此顺序优化

这些节点所在的形变单元,即优化完整树

中所包含的所有形变单元,如图3.3右下角

绿色的树边所示。

按不同模式进行形变优化的能效将在

下一节进行讨论。

3.5全局规划数值实验

3.5.1实验设置

在以下的数值试验中,我们设置s=

3,即使用加加速度作为输入的三阶积分

模型来表示我们的多旋翼飞行器动力学模

型。式(3.5a)性能指标中时间项的权重设置

为P=100。速度、加速度、加加速度的

幅值限制分别设置为5m/s,7m/s2,以及

15m/s3。地图事先已知并且为静态,对于碰
撞检测,我们使用0.1m分辨率的占据栅格

地图,将障碍物膨胀0.2m后以相同分辨率

构建欧氏距离场地图以提供距离梯度信息。

3.5.2形交模式比较
图3.4测试环境以及某次结果轨迹
本实验使用一台含英特尔i7.6700处理

器,主频为3.4 GHz的计算机进行。

本实验对比测试了按不同形变模式进

行规划,以及不使用时空形交而仅仅使用

万方数据
浙江大学博士专业学位论文 3结合采样与优化方法的全局最优动力学运动规划

单纯采样方法进行运动规划(记作w/o)的效果。除此之外,我们还与一种基于搜索的

全局动力学运动规划求解方法进行比较。对于搜索类的方法,我们使用了动力学A星

算法[551(kinodynamicA木)的启发项增强版本(weightedA木【761)来加速搜索过程,并比

较了3种不同增强启发项的权重,分别为1.7、2-3、2.8。由于所提出的算法具有渐进收

敛性,我们给每种算法设置3秒钟的运行时长,每种算法运行100次。

测试环境以及某次运行的结果轨迹如图3.4a所示。其中,淡蓝色轨迹指示以节点模

式(PaRemNODE)进行形变的结果,橙色轨迹指示以树干模式(PaRemTRL脚()进行
形变的结果,红色轨迹指示以树枝模式(PatternBI乙心CH)进行形变的结果,绿色轨迹
指示以全树模式(PatternⅡ也E)进行形变的结果,紫色轨迹指示不进行时空形变的结

果,深蓝色轨迹指示动力学A星算法的结果。可以发现相比于不进行形变(紫色)和搜

索类方法(深蓝色),本章所提出的时空形变树方法产生更顺滑的轨迹,尤其是以树枝

模式(PaRem BRANCH)进行形变(红色)。

惯oU

co;n|o们铝∞

11me firis)

图3.5不同形变模式的轨迹代价收敛性豳磬呖寻意图

最优轨迹的代价随时间变化的收敛过程如图3.5所示,其中短划线表示100次实验

的标准差,不加启发项增强的搜索方法花费数十秒求解因而没有在图中显示。所提出基

于采样的时空形变全局规划方法能够快速找到第一个解,并且在之后轨迹代价快速收

敛。相比于不进行形交(w/o,紫色菱形标记),按任意一种模式进行形变的收敛效率均

47

万方数据
浙江大学博士专业学位论文 3结合采样与优化方法的全局最优动力学运动规划

极大提高。在4中模式中,树枝模式(PatternBRANCH,红色粗十字标记)稍稍胜过全

树模式(Pattern TREE,绿色粗叉形标记)而完全优于节点模式(Pattem NODE,淡蓝色

圆点标记)和树干模式(PatternTRUNK,橙色倒三角标记)。这是因为树中新加入的状

态节点所带来的新信息而产生的潜在提升主要作用于以其父节点为根的子树,而树的其

他部分因此新节点而受影响的可能性较小。因此,以树枝模式(PatternBRANCH)进行

形变优化不失为对计算代价和提升树质量之间的一个较好的权衡。对于不同启发权重的

搜索类的方法(深蓝色细叉形标记),权重越大则越快找到解,然而其轨迹的代价也越

高,质量越低,且所耗时均大于所提出的方法而求得全局轨迹的质量又低于所提出的方

法。

3.5.3时空优化比较

本实验使用一台含英特尔i7—10750H处理器,主频为2.6 GHz的计算机。

第3.4节提出的时空形变优化能够方便地与快速探索随机树(RRT)一族的采样类运

动规划算法相结合,本实验将其融合至三种相似的RRT族动力学运动规划算法中,即

原始RRT、RRT*和RRT#,分别记作kRRT、kRRT*和kRRT#。对于三种算法,我们

将本章所提出的时空形变优化与仅空间形变优化和不形变优化进行比较,分别记作加后

缀.ST、一S和不加后缀。仅空间形变时我们不优化轨迹边的时长,仅优化树中节点的状

态。对于进行形变的方法,我们采取树枝模式(PattemBRANcH)。我们给每种算法设

置7秒钟的运行时长,每种算法运行100次。

测试环境以及某次运行的结果轨迹如图3.4b所示。其中,淡蓝色轨迹指示kRRT算

法不进行形变优化的规划结果,深蓝色轨迹指示kRRT算法进行时空形交的规划结果,

黄色轨迹指示kRRT*算法不进行形变优化的规划结果,绿色轨迹指示kRRT*算法进行

时空形交的规划结果,橙色轨迹指示kRRT#算法不进行形交优化的规划结果,红色轨

迹指示kRRT#算法进行时空形变的规划结果。分别将淡蓝色轨迹与深蓝色轨迹、黄色

轨迹与绿色轨迹、橙色轨迹与红色轨迹进行比较,可以发现经过相同的计算时间,进行

时空形变优化的方法能得到更加平滑的轨迹。

表3.1中记录了100次运行后不同形变方法经过相同计算时间后得到的轨迹时长和

轨迹代价的平均值和标准差。对比仅空间形变优化,可以发现本章所提出的时空形变不

仅最终得到的平均轨迹代价更小,平均轨迹时长也更短,说明了在时间维度进行形变的

万方数据
浙江大学博士专业学位论文 3结合采样与优化方法的全局最优动力学运动规划

表3.1不同形变方法得到的平均轨迹时长和平均轨迹代价对比

有效性。

最优轨迹的代价随时间变化的收敛过程如图3.6所示,对每一种RRT族动力学运动

规划算法,将同一种颜色和标记下的实线(时空形变)与点划线(仅空间形变)和点线

(不形变)进行比较,可以发现进行时空形变优化的收敛最快。结合形变后三种RRT族

方法的收敛趋势一致,这进一步说明了所提出的时空优化方法的泛用性。

3.5.4与层级式规划方法比较

本实验使用一台含英特尔i7.6700处理器,主频为3.4 GHz的计算机进行。

为了测试所提出的全局轨迹规划方法其搜寻更优路径拓扑的能力(以更小轨迹代

价表示),我们与两种层级式规划的轨迹规划方法进行比较:Bry等人【2】的方法和Wang

等人[97】的方法。本方法与被比较的方法都使用相同的时间.能量最优的性能指标,并且

求解轨迹都表示为分段多项式。被比较的两种方法的求解都需要提供一条先导的几何路

径。在Bry等人[23的方法中,该几何路径隐式地包含了附近无障碍区域的信息。通过将

待优化多项式轨迹的中间路径点的位置固定在几何路径的拐点上,该待优轨迹某种程度

上就被限制在了几何路径周围的安全区域,其余优化变量如轨迹中间路径点的高阶导数

和每段轨迹的时长则通过梯度下降优化得到。在Wang等人[971的方法中,该几何路径用

万方数据
浙江大学博士专业学位论文 3结合采样与优化方法的全局最优动力学运动规划

≮oU

co茹nlo∽苗∞

图3.6不同优化方法的轨迹代价收敛性比翱gi;意图

于引导生成一条安全飞行走廊(Safe Flight Corridor,SFC),接着将待优化的轨迹严格

约束在安全飞行走廊中从而保证安全。其方法的优化变量为多项式轨迹中间路径点以及

各段时长。就我们所知,Wang等人【97】的轨迹生成方法为基于飞行走廊类方法中效率最

高的。

我们使用RRT*算法生成所需的几何路径,使用Liu等人【96】的方法生成安全飞行走

廊。我们不断增加RRT*算法的时间预算,分别为2ms,5ms,lOms,30ms,50ms,和

100ms,对应生成6条总长度递减的几何路径,将其用作Bry等人[21方法和Wang等人【97】

方法的先导几何路径。基于此6条几何路径,两种方法分别对应生成6条轨迹。接着,

我们运行本章所提出的时空形变全局轨迹规划算法,在lOms,50ms,150ms,200ms,

250ms,和300ms 5个递增的时刻分别记录当前所得到的最优轨迹,同样得到5条轨迹。

三种算法分别运行100次,测试环境以及某次运行的结果轨迹如图3.7所示。红色

轨迹指示本章所提出算法的规划结果,绿色轨迹指示Bry等人[2】方法的规划结果,蓝色

轨迹指示Wang等人【97】方法的规划结果,淡黄色透明凸多面体指示安全飞行走廊。

图3.8展示了三种方法100次规划的平均求解结果,图中6组数据分别对应6种不

同时间预算下求解出的轨迹。图3.8a展示了层级式方法求得的轨迹平均代价(绿色和蓝

色折线)随着其先导几何路径长度(灰色矩形块)的变化趋势,我们发现其轨迹质量并

万方数据
浙江大学博士专业学位论文 3结合采样与优化方法的全局最优动力学运动规划

(a)2ms时间运行RRT*,10ms运行本章算法 (b)5ms时间运行RRT+,50ras运行本章算法

(c)lOres时间运行RRT*,150ms运行本章算法(d)30ms时间运行RRT*,200ms运行本章算法

(e)50ms时间运行RRT*,250ms运行本章算法(D lOOms时间运行RRT。,300ms运行本章算法

图3.7与层级式规划方法进行比较的测试环境以及递增时间预算时所得到的结果轨迹

不是随着先导轨迹质量提升而提升,有时基于长度较短的先导路径得到的轨迹反而代价

更高,这是因为其层级式的方案在不同层级的优化性能指标不一致,这不利于全局轨迹

规划。而本章所提出的方法在完整的基于采样的规划过程中有着一致的性能指标,且具

有渐进最优性,随着时间预算增加,轨迹代价不断下降(红色折线)。图3.8展示了三种

方法求解时每个模块的平均耗时。在每一组条形图中,左边条为Wang等人【97】方法的耗

时,其由RRT*几何路径规划(黄色块)、安全飞行走廊构建(蓝色块)和轨迹优化(灰

色条)三部分组成;中间条为Bry等人【2】方法的耗时。其由RRT*几何路径规划(黄色

块)和轨迹优化(灰色条)两部分组成;右边条为本章所提出方法的耗时,只需轨迹优

化(灰色条)一部分。可以发现本章所提出方法的总体耗时在各组中均最短。分别对比

图3.8b和图3.8aee对应的组别,可以发现本章所提出方法以最少的耗时得到代价最小的

轨迹。

万方数据
浙江大学博士专业学位论文 3结合采样与优化方法的全局最优动力学运动规划

I…“R…R译鳞蓟专复………………ii溺蔺喾石猫溺爱蕲簖
—.-8吖等入方法孰迹代价—●一本章所提方法孰迹代价

盎22

剧17

12
刀卫.『#器荫沭溉一rn一
7 ”拍弱M妁及扎
i| ||

(a)基于不同先导几何路径求得的平均轨迹代价

(b)总体以及各过程平均耗时

图3.8基于不同时间预算的平均求解时间与轨迹质量对比

3.6本章小结

本章针对已知精确环境下的飞行器全局最优动力学运动规划问题,整体上使用在采

样类动力学规划方法中深度结合局部优化的方法来求解。我们总结主要贡献如下:1.我

们提出时空形变树算法,在探索解空间的过程中生长一棵在时间和空间层面同时发生形

变的轨迹树,随着树的生长自然地选择拓扑路径更好的轨迹,直至逼近全局最优解。2.

树中一段轨迹边的生长建模为求解末状态部分受约束的TPBVP问题,使用约束松弛策

略加速求解。3.我们提出形变单元的概念,其仅包含树中的一个状态节点以及连接在其

上的所有轨迹边,只占整体轨迹树的一小部分,我们之后针对性的设计用形变单元表示

轨迹树整体质量的性能指标,在时间和空间层面优化不同形变单元的组合,如此便能够

花费尽量小的代价高效提升整体轨迹树的质量,提升算法的收敛性。

链接1中给出了本章内容动画形式的介绍。

https://www.jianguoyun.com/p/DTVaefoQIN6uChjTjbkEIAA

万方数据
浙江大学博士专业学位论文 4层次化实时局部动力学运动规划

4层次化实时局部动力学运动规划

4.1引言

在上一章中,我们探究了飞行器在已知复杂环境下的全局最优轨迹规划问题,期望

在复杂的障碍物环境中尽可能快地找到接近最优的轨迹,然而由于障碍物环境的拓扑复

杂性,即使对飞行器的非线性动力学模型做了简化,探究完整的解空间求解最优轨迹或

是接近最优轨迹也往往需要花费较高的计算代价,无法实时进行。

在本章中,我们探究情形二.局部规划,也即飞行器在未知环境下的导航,重点研

究局部实时运动规划问题。对于未知环境下的高速飞行,要求在行进中极短时间内完成

轨迹的重规划以应对实时改变的、不可预知的环境,避开障碍物。对于一段完整的导航

过程,随着飞行器在环境中的位置发生改变,其周围环境不断变化,重规划不断进行,

每次飞行器也只是执行重规划出轨迹的--d'部分,求解最优轨迹的必要性不如全局规划

时强烈。因此,在局部实时运动规划问题中,对最优解的需求转变为快速求解一个足够

好的可行解。另外,于较为廉价的飞行平台,例如一些常见的消费级旋翼飞行器来说,

其搭载的计算平台一般较低级,计算资源有限,如此则难以快速生成无碰撞的高质量轨

迹,生成轨迹的实时性与高质量难以同时保证。

对于上述难题,我们提出了一个系统性的轨迹规划方案来填补这一缺陷。我们的方

案采取了层次化的规划框架,分为两层,称之为前端和后端。

前端动力学运动规划基于简化的飞行器动力学模型,考虑飞行器的初末状态,得到

满足运动学约束的、无碰撞的轨迹。对于高维度状态空间下的动力学运动规划,基于采

样类的方法可以通过设计智能采样策略来提升整体规划效率而具备巨大潜力。可以设想

一下下述情景:飞行器沿着长走廊高速飞行,则速度方向朝向走廊墙面的状态样本大概

率没有价值,而那些速度方向沿着走廊的状态样本则有较大可能落在最优轨迹附近。另

外较为重要的是,基于采样类的算法天然具有即时性(Anytime Property),意味着我们

能够快速得到一个可行的轨迹,而在执行此轨迹的过程中再去寻找更优的轨迹[4叼。在未

知环境中快速飞行对规划的实时性要求高,即时性显得尤为重要。因此,我们的前端动

力学运动规划使用基于采样类方法并且根据环境的障碍物分布进行状态空间采样。在此

万方数据
浙江大学博士专业学位论文4层次化实时局部动力学运动规划

前端中,我们先快速构建一个拓扑连接图来近似表征可行工作空间的连接性,再依据此

拓扑连接图在高维状态空间采样以引导轨迹树的生长,最终高效得到较高质量的轨迹。

由于考虑了初始状态和动力学约束,相比于单纯的路径规划结果,此轨迹会位于一个相

对合理的路径拓扑中,且其在时间维度的规划结果会较为合理。

有了前端较为高质量的轨迹初值,后端则较为轻量,基于前端得到的轨迹,后端充

分地利用已有轨迹所探求到的解空间信患进行高效地提优。我们设计了一个轻量级的基

于优化的后端来进一步提升轨迹的一些关键性能指标,即平滑性和连续性,同时保证其

安全无碰撞以及运动学可行。为了保障后端求解的高效性,我们整合那些已在前端获得

的信息到优化目标当中,并且构建为一系列具有闭式解(Closed.formSolution)的二次

规划(Quadratic Programming,QP)问题。

每一次重规划可作为独立的问题求解,因此本章后续描述均针对某一次重规划。

本章节内容安排如下:在第4.2节中,我们描述了基于近似拓扑引导采样的前端动

力学运动规划算法,得到高质量的初值轨迹,给到第4.3节中描述的后端进行高效轨迹

提优。之后在第4.4节进行与相关算法的数值对比测试,在第4.5节使用真实四旋翼飞行

器在未知环境下进行自主导航试验。最后在第4.6节进行总结。

4.2基于引导采样的前靖动力学运动规划

4.2.1问题描述

前端规划主要考虑初始状态、动力学约束和避障,相较于上一章的全局规划,初始

状态一般非静止,考虑到实时求解需求,本章对飞行器的模型进一步简化,使用2阶

线性模型,以加速度作为控制输入。前端规划问题的数学建模如式(4.1)所示。整体与

第3.2节全局规划类似,但减去了加加速度的约束,为2阶线性模型,且碰撞检测使用占

据栅格图而非梯度距离场地图。规划初始时刻状态的选取如第2.4.1节所述,规划终止时

刻状态根据实际需求决定,在第4.5节描述。对于前端求轨迹初值,我们使用单一采样类

的方法进行求解,期间不进行形变优化等操作。

万方数据
浙江大学博士专业学位论文 4层次化实时局部动力学运动规划

。嚣Ⅳ=/o巧(p+扣Tu㈣)出 (4—1a)

s.t. 文(£)=Ax(t)+Bu(t), (4-lb)

x(o)=Xinlt,x(乃)=b。i, (4-it)

0口(£)112=lIb(t)112≤V。。, (4-Id)

IIo(t)112=Ilij(t)112≤am。, (4-]0

p(t)I≠OG‰,Vt∈【0,乃】, (4-If)

xcz,=(;::),u。,=酋@,,pc”=仨差;),A=(三:!; 黔B啦), (4-19)

4.2.2基于引导采样的轨迹树生成算法

算法流程如算法4所示,主体与算法l类似,遵循RRT*算法[121的框架。其中初始化

(第1行)、近邻搜索(第4行)、选择父节点(第5、6行)、尝试连接目标点(第7行)、重

连接(第10行)、获取当前最优轨迹(第ll行)、终止条件(第2行)等操作与算法l、算

法2、算法3相同或类似,以下主要描述不同之处,各记号沿用第3.3.1节的定义。

1.在采样状态节点(第3行)时,状态样本为6维,根据第4.2.3节所描述的使用近似

拓扑引导采样。对于状态样本的前三维位置,我们首先随机选择近似拓扑图的一条边,

再随机采样出该边上的一个位置点,之后以该位置点为中心,在垂直该边的平面上按二

维高斯分布采样,得到位置点。对于后三维速度,其方向以该边的方向为中心,按高斯

分布采出偏离此中心方向一定夹角的向量,其大小以最大允许速度幅值为界均匀随机采

样。

2.在选择父节点(第5、6行)、尝试连接目标点(第7行)、重连接(第10行)时,由

于速度状态也由采样确定而非未知,连接两个状态点的无约束轨迹即为求解终端时刻自

由、始末状态完全已知的两点边值问题(TPBVP)。

3.在重连接时(第lO行),权衡求解实时性和轨迹最优性,我们只对新添加状态节

万方数据
浙江大学博士专业学位论文 4层次化实时局部动力学运动规划

算法4:引导采样动力学RRT*算法
Input:障碍物环境E,起始状态x俐t,目标状态XgooJ

Output:轨迹丌.

-树中状态点V÷-{xm“】.,树中轨迹边£卜0,轨迹树7-+-Ⅳ,£),
2 while终止条件未达到do

3 x""+一TopoGuidedSampling(E);

4 荪。。+-NearNeighborSearch(T,)【tl。。,r);

if砩÷-ChooseParent(X.eⅢ,‰m助then

V÷-+{x。。),£÷-+(昂,x~),丁÷_(V,£);
7 if TryConnectingGoal(xm")啕∞£J then

L找到一个可行解;
, if已经找到一个可行解then


L Rewire(X,~,‰);
11矿÷-RetrieveTrajectory(T,‰1);

点的近邻节点进行重连接,而非如算法3的循环重连接。

对于上述TPBVP的求解,我们同样采样松弛约束的方法,先暂时忽略过程约束,按

极大值原理求解,获得轨迹后再检查约束。哈密顿函数,协态方程,以及控制方程的构

建分别与式(3-6),式(3-7),以及式(3.8)相同。此时协态向量函数为6维,x(t)∈Re,由

B矩阵的结构可发现最优控制u+(t)各维度上的解分别为最优协态向量函数”(z)后三
维对应维度上的相反数:

U‘O)=一入盏。4.5'6(t),(4-2)

即为关于时间£的一次多项式。以z轴为例,最优控制为:

u+(t)跏。1=n:(t)=%T声(t), (4-3)

其中c。=(%,k,白,也)T为未知的z轴多项武系数向量,卢(z)=(1,t,t2,t3)T为时间基

底向量。再由2阶线性模型式(4-1)可知最优轨线r(t)的位置维度每一轴各自为关于时

万方数据
浙江大学博士专业学位论文 4层次化实时局部动力学运动规划

间t的三次多项式,以z轴为例,表示如下:

x+ct,凼。,,t=@善;)=(耋;{:;) c4・4,

对剪轴和Z轴同理。式(4-1)的性能指标可写作

‰耻/oT(%1u∽Tu(z))出=矿+-1。;吕:,《伽咖舳%(4.5)
其中ck为七轴的多项式系数向量。

由于终止状态完全给定,由边界条件x(O)=Xo∈R6和x(T)=Xl∈Ⅱ妒可确定12
维齐次线性方程组

㈥=㈡Xl
当T>0时线性无关,可将所有多项式系数ck用T表示,再带入式(3.13)将其转换为关
㈨,

于T的标量函数了(c七(T),T)=歹(T),求取最优到达时间T+的方法与第3.3.2节的情形

1相同,不同点为此时计算方程笃笋=0的根时为求解一元二次方程。求得T・之后,
即可恢复得到最优多项式系数。

至此,给出完整边界条件,我们在考虑2阶模型约束和边值约束的情况下计算出以

多项式形式描述的最优轨迹边{《()co,x-),T‘(xo,x・))。之后再检查求解时被忽略的速
度、加速度、障碍物等过程约束是否满足。若满足,则得到一条轨迹边,若不满足,则

・重新采样计算。

4.2.3基于近似拓扑引导的状态空问采样

许多前人的工作展示了改变采样分布对算法收敛率的提升作用。在实际环境中,考

虑到最优轨迹的速度一般沿着可行路径生长的方向,Blochliger等人【241和Oleynikova等

人【矧在环境中提取可行路径的中轴骨架,再在骨架周围采样。但是精确的提取中轴骨

架是一个较为耗费计算资源的事情,尤其是当环境中障碍物拓扑变得复杂,规划空间变

大时,骨架路径无法实时提取。而按照概率进行采样其实不需要非常精确且无碰撞的可

行骨架路径,只需提取出简要的拓扑路径即可,因此我们采用近似拓扑图引导采样。

近似拓扑图的生成如图4.I所示。首先根据上一章的TPBVP解析求解一条连接规划

的起始和终止状态的轨迹,此时忽略各类约束,得到一条无约束轨迹(红色曲线)。之后

万方数据
浙江大学博士专业学位论文 4层次化实时局部动力学运动规划

图4.1近似拓扑骨架构建的2维示意图

沿着这条轨迹,检查其和环境障碍物的碰撞,所使用的环境表示为占据栅格图,因此可

以得到穿进和穿出障碍物的点,记为只。和‰。,连接每一组只。和‰。得到横穿线段
(蓝色虚线段)。接着从每一组横穿线段的中点出发,在垂直横穿线段方向和平行水平面

方向做直线追踪(桔黄色虚线段),直到找到没有被障碍物占据的点,作为图顶点,记

为M。规划起始位置点和规划终止位置点也是图的顶点,按顺序连接规划起始位置点、

K、和规划终止位置点即构成近似拓扑图的有向边(橘黄色实箭头线段)。不像其他一

些在无障碍无区域精确得到拓扑图的方法,本文的方法使用了极少的计算代价得到了部

分的拓扑信息,作为精确度的牺牲,近似拓扑图的边可能会穿过障碍物,然而我们按概

率在图的边的周围采样状态的位置(一个采样点的状态由三维的位置和速度),尽量避

免了这一部分的影响。至于采样状态的速度向量,其方向以一定的高斯分布偏离其最近

图边的方向(绿色扇形区域),其大小以最大允许速度幅值为界均匀随机采样。3维环境

中的近似拓扑图与引导采样如图4.2所示,绿点表示随机采样点的位置状态,红线段表

示速度状态,橙色线段为近似拓扑图的边,红色曲线为无约束轨迹,深蓝色曲线为前端

规划结果,浅蓝色曲线为后端规划结果。与R6smann等人【4】工作类似,此种近似拓扑图

的构建适用与非凸障碍物较少的环境,在实际自主导航时,由于感知距离一般有限,精

确地图范围较小,且我们把未知区域当做可行区域,因此按近似拓扑图引导采样可行且

高效,将在第4.4.1节进行实验验证。

万方数据
浙江大学博士专业学位论文 4层次化实时局部动力学运动规划

图4.2近似拓扑骨架构建与状态采样的3维示意图

4.3轻量级商效后端轨迹提优

如上节所述,前端规划得到的轨迹满足了初末状态约束、运动学及动力学模型约束

和避障约束,然而由于即时性,其采样可能不够充分,存在提优空间。在本节,我们展

示如何结合前端轨迹的路径拓扑信息来高效地提升轨迹的平滑性和连续性。

探究前端的轨迹,我们发现首先由于在规划时考虑了初末状态、动力学模型以及避

障的约束,其几何位置以及处于一个相对合理的几何路径拓扑中。如一些工作【53’96】所

已经展示的,从这条初始轨迹出发,在其邻近的解空间中能找到一个质量更优的解。其

次,此前端轨迹基于加速度作为输入的线性模型,由上节可知,在三维空间中的任一维

度,其由分段三次多项式表征,具有整体Co以及C1连续性但仅为每段之内G2连续,

即加速度在每相连的两段轨迹之间存在突变。此突变会造成飞行器期望姿态的突变和抖

动,有害于飞行器的控制。因此我们希望在后端优化中尽量减小这一突变,使得提优后

的轨迹更加平滑与连续。如图4.3所示,蓝色细线为前端轨迹的加速度示意,橙色细线为

经过后端优化后的加速度示意。

4.3.1问题描述

对每一维度,考虑共含m段,每段为礼次的多项式轨迹,第i段表示为pi(t)=

c丁t,t∈【0,列,其中q=[Co,c1,C2,…,%]T∈R叶1为其第i段的系数,t=【1,t,t2,...,卅T
为时间基底,正为该段时长。我们的目标为以前端轨迹得到的多项式系数作为初值,保

持每段时长不变,尽量高效的找到更优的多项式系数。

万方数据
浙江大学博士专业学位论文 4层次化实时局部动力学运动规划

基于前述观察分析,我们令后端优化的目标函数J由三部分组成,将后端优化问题

构建如下:

t。,是器k)J=九以+A^厶+Ac以
(4—7)
s~t x(£)∈疋,一,u(t)∈“,ree,

A。∈Ⅱ≈+,A^∈Ⅱ≈+,A。∈Ⅱ&+,A。+A^+A。=1,

其中eT=[cj,cj,…,c黝为m段多项式的系数向量,以为整体平滑性的代价,以为惩
罚与前端轨迹路径处于不同集合路径拓扑的代价,以为惩罚段间加速度不连续性的代

价,九>0,h>0,A。>0为各惩罚项的相应权重。优化变量为{c,九,h,A。)。
此构建中,Jh项非常关键,如图4.4a所示,相比于前人工作【2,55,57】对障碍物碰撞约

束的考量,我们通过在优化目标中加上此项,处理优化轨迹时就从将其推离障碍物转换

成了将其吸引至无碰撞的可行解,这避免了需要耗费巨大计算量的距离场(ESDF)计

算。另外,此项将潜在的解空间范围极大地缩小于初始可行解的周围,如图4.4b所示,

对于障碍物约束造成的强非凸优化,不同路径拓扑下的解可理解为分布于解空间中的不

同极小值周围,图4.4a中不同路径拓扑下的三种不同颜色的路径对应图4.4b解空间中三

个不同“坑”中的点。

对于式(4.7)所描述问题的求解,由于实时导航对求解效率的需求,我们不求获得最

优的.[c,九,A^,A。)以使得优化目标最小化,转而期望尽快求得一个尽量好可行解。我
们构建一个双层优化(Bi.1evel Optimizaion)求解方法,内层求解优化变量c,外层求解

{九,h,入。)。我们知道,一个无约束的二次优化问题存在闭式解(Closed-form Solution)。
那么对于式(4-7),当优化目标是二次形时,若给定各项系数{九,h,九)且暂时忽略不
等式约束,则多项式的系数向量c能够闭式求解。以下将叙述如何构建优化目标为二次

万方数据
浙江大学博士专业学位论文 4层次化实时局部动力学运动规划

型,如何推导双层优化内层对C的最优闭式解,以及如何使用双层优化来求解一个可行

且较优的{A。,Ah,A。)权重组合。

(a)障碍物考虑方法示意图 (b)解空间中不同路径拓扑的解示意图

图4.4路径拓扑惩罚项示意图

4.3.2二次型优化目标构建

1.平滑惩罚代价以构建为待优化轨迹中每段多项式高阶导数的积分和:

五=∑f彬(t)m
七∈{z,掣,=)。”

=∑∑f嘲(£)】2dt
k∈{o,Y,:)i=1。”

=∑∑CT啦/t。)(㈣T舭啦

(4.8)
ke{z,Y,z)i=1

=∑∑c纛Q。J Ci,t

=F CTQ^

其中T=丑+乃+…+%为轨迹总时长,互为各段时长,t(J)=dJ[1,t,t2,…,t“】T/d∥
为t=【1,t,t2,…,t叮7的J次导数向量。Q叫=后‘tu’(t(J’)Tdt为佗+1维的对称方阵,
以及Q。为(n+1)×m维的块对角矩阵。由于前端轨迹基于加速度输入模型,为分段三

次多项式,则此处选取礼=3,J=2。

万方数据
浙江大学博士专业学位论文 4层次化实时局部动力学运动规划

2.路径拓扑惩罚代价^构建为待优化轨迹与前端轨迹之间路径距离的积分和:

以=∑/眺(£)一菇(z)】2dt
” ,t‘

=∑∑厂慨,七(t)一m(t)】2出
J 0
奄∈{£,簟,z)t==1

=∑∑(c讪一c扩/’ttT班(c讪一c靠)(4-9)

=∑∑(c啦一《。)T吼,t(c讪一c瓢)
kE{¥,p,:)i=l

=∑(c—c4)TQ^(c—c‘),
屉∈{霉,鼽=)

其中矿(£)为前端轨迹的位置。c+为其m段系数。Q“=/o‘ttTdt为n+l维的对称方
阵,以及qh为何+1)X m维块对角矩阵。

此项将迫使待优化的轨迹在位置上靠近前端无碰撞的轨迹,因此更可能在同一个路

径拓扑下的无障碍物区域找到可行解。

3.连续性惩罚代价以使得待优化的轨迹整体趋近于俨连续,其构建如下:

=∑∑‰t(2)I目;一略坫t(2)It-o】2(4-10)
ke{x,y声}i=-1

=∑cTqcc,
k6{x,Ⅻ声)

其中热,k(h)为在k维第砂段末尾的加速度,藏+,,%(o)为第O+1)地段起始的加速度。
Qc为对称带状矩阵。

万方数据
浙江大学博士专业学位论文 4层次化实时局部动力学运动规划

将上述惩罚项整合在一起得到整体的二次型优化目标如下:

.rain.J=九五+h^+k五
{c,A,,Ah,k)

=∑【九cTQc+h(c—c+)TQ^c—c+)+A。cZQ。c】
七∈{z,掣,:)


∑[cT(A,Q+hQh+A。Q。)c一2AhcTQhc’+Ah(C’)TQhc’】(4-1 1)
k∈{£,掣,z)

s.t.Ac=d,x(t)∈疋,”8,u(t)∈“,”8,

A8∈R+,A^∈R+,Ac∈ⅡE+,As-I-Aa+Ac=1,

其中Ac=d为每段的边界约束,即始末状态约束以及段间高阶导数的连续性约束,此

处为位置和速度连续。具体构建可参考Bry等人[21文献。每一维的代价函数相互独立可

解耦分别求解。

4.3.3内层优化的闭式最优解构造

内层优化时只优化多项式系数c,将权重系数{九,h,k)当做常量。
如Bry等人在【2】中所述,分段多项式轨迹除了由每段的各项系数表征之外,还可由

每段的边界高阶导数表征,转换如下:

c:K H,K:A-1c,(4-12)
l山I
其中矩阵K将多项式系数向量c映设至边界导数向量[dJ《1T,d/为边界导数向量中
已知的部分,也为边界导数向量中未知的部分,即真正的参与求解的优化变量,・C矩阵

的构成可见Bry等人的工作【2】。

以dp为优化变量,式(4.11)中的等式约束可被消去,内层优化构建为无约束的二次

规划问题,描述如下:

Ⅱ嘻n
J=匠]TR巴]一2入h匕]。z+入^cc+,TQhc+,。4.。3,
R=KT(九Q+AhQ^+入。Q。)K, z=KTQ^C’.

略去t,中不影响求解最优性的常数项,t,对d口的雅各比矩阵计算如下:

甏=2%d,+2%dp一2A母 (4.14)

万方数据
浙江大学博士专业学位论文 4层次化实时局部动力学运动规划

其中毗。和Z。为R和Z中对应维数的块矩阵。令式(4.14)等于0,可解析求得优化变
量d。如下:

dp=啄(入hZp—Ikldl). (4-15)

得到d。之后,将其带入式(4—12)可求得c。

至此,若给定一组权重系数{九,h,A。】.,我们便能够解析地求得基于此权重比的待
优化轨迹的最优系数,此为一轮内层优化求解。

4.3.4双层优化求解流程

由于在求解过程中略去了不等式约束,即没有考虑轨迹是否与障碍物碰撞与高阶

导数是否超限,在求解之后我们需要检查这些约束,若约束满足,则得到了问题4.13的

最优解,也即问题4一II在基于特定权重数值{九,A^,入。】.组合下的一个可行解。通过调整
各项权重系数的比例,我们能够调整待优化轨迹的平滑性、连续性以及与障碍物的距离

等,调整各项权重比例的过程即为双层优化的外层优化过程。

调整各项权重的思路为:由于{九,A,I,k)之和约束为常量,我们九占比尽量大以
获得更加平滑的轨迹,同样希望A。占比尽量大以获得段间更加连续的轨迹,但此两项

增加造成的h占比减小会使得待优化轨迹越远离初始的安全轨迹,更有可能发生碰撞。

因此,我们首先确定A^的占比,在可行的范围内得到一个尽量小的值,从而留给其他

两项更大的调节裕度,接着,将其固定,我们再确定A。的占比,在可行的范围内得到

一个尽量大的值以使段间加速度尽可能连续,从而迫近整体C2连续。

双层优化流程如算法5所示,我们记n=h/(X。+h+九)表示路径拓扑惩罚项代

价占整体的比重,记rc=九/(九+A。)表示惩罚段间不连续项代价占其与平滑项代价
之和的比重。令%的初始值r。.伽n接近于1以期望待优化轨迹在位置上更加贴合初始

的安全轨迹,具有更大可能性保持安全。令rc的初始值rc加it接近于0。在第一个循环

中,每次迭代时r。保持不变而不断减小n,此过程中优化的轨迹会愈发偏离初始轨迹,

直到求得的轨迹发生障碍物,经过第一轮循环我们得到了尽可能小的路径拓惩罚扑项

占比,留下了尽量大的裕度来使轨迹更加平滑和段问连续。接着进行第二轮循环,保持

上一轮得到的%保持不变而不断增加rc,此过程中优化的轨迹的段间会愈发连续,直

到求得的轨迹不满足约束,经过第二轮循环我们即得到了更加平滑与连续的轨迹。在每

个循环内层的ClosedFormSolve0函数即为使用式(4-15)-与式(4-12)解析求得轨迹系数。

万方数据
浙江大学博士专业学位论文4层次化实时局部动力学运动规划

CheckFeasible0函数检查内层优化得到的临时轨迹是否发生碰撞或其他高阶导是否违

反约束。我们的动力学前端提供了较好的每段多项式的时间分配,因此即使优化中时间

分配不变,高阶导的约束仍然容易满足。

由此,经过双层优化求解,我们对前端轨迹进行了高效地提优,在其解空间周围找

到了更加平滑与连续的轨迹,同时满足安全性。

算法5:双层优化算法
Input:障碍物环境E,初始轨迹死。n

Output:优化轨迹7r


rh÷-rh.init,re÷-rc,init,7flea÷-7rinit

^第一轮外层循环,确定r^ ・/

2 while rh>0 do

3 几肌p+-CiosedFormSolve(rh,rc);
4 if CheckFeasible(丌temp,E)yaits then

L:。

肛第二轮外层循环,确定rc

9 while rs>0 do

m 丌tet印+-ClosedFormSolve(rh,rc);
n if CheckFeasible(丌te,,Ip,E)fails then

L:晶

万方数据
浙江大学博士专业学位论文 4层次化实时局部动力学运动规划

4.4与相关算法的数值对比测试

所有的数值仿真测试在一台搭载2.2GHz英特尔i7—4702HQ处理器、16G内存的计

算机中进行。

4.4.1采样策略对比测试

我们将所提出的近似拓扑引导采样策略与典型的均匀采样策略进行对比。所测试

的模拟环境如图4.6所示。采样规划时间限制为10秒,并且以所提出的采样方法所得

结果的轨迹代价作为基准,两种策略的最优轨迹代价比值随着求解时间的变化趋势如

图4.5所示。

观察图4.5中呈下降趋势的两条蓝色曲线,可以发现若使用所提出的近似拓扑引导

采样策略,几毫秒内便找到初始可行解,之后轨迹代价迅速下降。与之对比,若是在状

态空间均匀采样,则得到初始可行解需花费数百毫秒,且之后轨迹代价缓慢收敛。观察

呈上升趋势的黄色曲线,可以发现给定同样的时间,采取近似拓扑引导采样时由于更加

合理的状态分布,轨迹树中节点的数量更多。从图4.6中可以对比看到引导采样经过3ms

的时间预算所得的轨迹树(绿色曲线)生长地更顺滑,而均匀采样经过lOOms的时间所

生长的轨迹树依旧非常杂乱,引导采样所得轨迹(橙色)也相较均匀采样所得轨迹(蓝

色)更合理。

1.25
Fi一勿疏雨矿t酉莉画君碌薜了……j 3 5

}*轨迹代价(拓扑引导采样) 3 趁
1.2 }—e-树中节点数量(均匀随机采样) 丹
I蔓—趣睦蔓樾量』堑 2 5 碰


1.15
{¨二≥/ 300

200
2 潜

萎u 100


1 S ^

£ 1 宝

1.05
0 5

1啊 ———————-———_J 0

0.00 4.00 6.00 8.00 10。00

时间(S)

图4.5近似拓扑射导采样策略与均匀随机采样策略效率对比示意图

万方数据
浙江大学博士专业学位论文 4层次化实时局部动力学运动规划

(a)近似拓扑引导此采样 (b)均匀随机采样

图4.6不同采样策略下轨迹树生长对比示意图

4.4.2轨迹规划系统对比测试

对于轨迹规划系统的数值测试,我们从三个方面与其他当前最为先进的相关算法进

行对比:前端动力学运动规划、后端轨迹优化和前后端集成测试。速度与加速度约束分

别设置为5m/s和6m/s2。
1)前端动力学运动规划对比

对于前端,我们将所提出方法找到的第一个解与Zhou等人【57】基于图搜索的方法结

果进行比较。其将加速度控制输入和时间离散化,基于相同的二阶线性模型前向积分得

到图节点,以求解两点边值问题设计启发式函数进行图搜索。我们进行1000次规划,随

机选取间隔10—15m的起终点,求解的均值记录在表4.1中。从表中可以看到,花费近

似的计算时间,我们的方法得到的轨迹平均代价更小,长度更短,段数更少,并且成功

率更高。我们的方法使用了两点边值问题的求解结果,轨迹每段内的控制输入线性变化

而非像Zhou等人【57】方法中的为常量,因此整体更加平滑。我们的方法仅仅平均多花费

了3.93%的计算时间(仍控制在5ms以内,满足实时求解),极大提升了轨迹的质量,

为后端优化提供了更好的初始轨迹从而大大降低了后端所需要的求解时间。

表4.1前端动力学运动规划比较结果(平均值)

万方数据
浙江大学博士专业学位论文 4层次化实时局部动力学运动规划

4.4.3后靖提优算法对比测试

对于后端优化,我们将所提出方法与Zhou等人的方法[571、Richter等人的方法【2l、

Mellinger等人的方法【59】以及Tordesillas等人的方法【95】进行对比。其优化目标中都包含

使控制输入的积分极小化。Zhou等人【57】采用B样条来表征轨迹,优化样条上的控制点,

其额外使用梯度距离场(EsDF)来将控制点推离障碍物以保证安全,求解则使用开源

的非线性优化库NLopt[1141。Richter等人【21使用分段多项式表征轨迹,其同样通过无约

束二次规划(QP)来优化中间路径点的高阶导数,每段轨迹的时长则通过梯度下降进

行优化调整,求解使用NLopt。Mellinger等人[59】同样使用分段多项式表征轨迹,其构

建约束二次规划问题来优化多项式系数,保持轨迹总时长固定不变,使用梯度下降优化

每段的时间分配,求解使用NLopt。Tordesillas等人【95】使用贝塞尔曲线(B6zierCurve)

表征轨迹,额外构建无障碍物的安全走廊,使用混合整数规划(MIQP)将轨迹严格约

束在内以保证安全,求解则使用商用的Gurobi优化器[115】。

图4.7测试环境以及不同后靖优化方法产生的轨迹

为了公平对比,除了Tordesillas等人使用Informed-RRT*算法得到初值以获得安全

走廊以外,对其他所比较的方法,我们使用同一条前端轨迹作为初值,由所提出的前端

规划得到。对于Richter等人和Mellinger等人的基于优化分段多项式的方法,我们比较

了以梯形公式求初始时间分配和以前端轨迹给出的时间分配,分别加上后缀记作T和

K。当优化过程中某一段中出现碰撞时,我们从初始轨迹的相应段上取出中间时刻的路

径点,添加至待优化轨迹中,即增加多项式轨迹段数,重新进行一次优化。此过程不断

进行直到整条轨迹都无碰撞。每一轮优化求解的停止条件设置为5 ms求解时间。测试

环境和轨迹求解结果如图4.7所示。

万方数据
浙江大学博士专业学位论文4层次化实时局部动力学运动规划

数值对比结果如表4.2中所列,可以发现本章所提出方法花费更短的时间产生代价

更小更加平滑的轨迹,这是由于其他的方法均将问题构建为强约束的非凸规划,使用通

用的非线性优化求解器,利用梯度下降法迭代求解,收敛缓慢,计算量大。而本章提出

的后端优化则将问题构建为无约束的序列二次优化,使用双层优化求解,利用了凸性使

得内层求解都有闭式解而无需计算梯度信息进行数值迭代。Zhou等人的方法使用梯度

距离场检查轨迹是否碰撞,需要额外的计算时间,本例约为50 ffl,8。Tordesillas等人的方

法建立安全走廊,同样需要额外的计算时间,本例约为100fr?,8。Richter等人和Mellinger

等人的方法在优化中不考虑障碍物信息因此需要多次迭代来生成一条无碰撞的轨迹。我

们的方法则将高质量的前端轨迹整合进优化目标中,从而缓和了上述问题带来的影响。

另外,我们注意到本章提出的后端优化方法虽然没有优化轨迹时问,但求得的轨迹时长

依然小于使用梯形时f,1分配作为初值的Richter等人和Mellinger等人的方法,并且和与

使用前端轨迹时间作为初值的结果差距甚徽。Tordesillas等人方法的求解耗费数百毫秒,

完全无法满足高速飞行中实时求解的需求。

4.4.4前后靖集成对比测试

对于集成对比测试,我们与Zhou等人的方法【571进行比较。在40m×40m×3m

的环境中,我们在不同距离的起终点(10—15 m和20—25 m)和不同障碍物密度

(100,200,300个障碍物)的情况下分别对比,数值结果如图4.8所示。从图4.8b中可以着

69

万方数据
浙江大学博士专业学位论文 4层次化实时局部动力学运动规划

出,作为一个整体规划系统,我们的系统方案在每一个场景中均产生代价更小即更加平

滑的轨迹。从图4.8a中我们发现,在规划距离较近时(10—15 m),我们的方法具备优

势。对于现实世界的应用,一个轻量级飞行器的精确感知距离往往小于10 m,甚至小

于5 m,因此局部规划的范围往往较短,由下节实物飞行测试可以验证。

融 蛇

O D玷

n毗
—o厘茁琏锚
O D:宝

(a)求解时间及占比(ms)

40

、一一

¥ 30






4.5真机未知环境自主导航试验

我们在室内和室外的未知复杂环境下分别进行自主导航测试,相关实验视频可在链

接1中找到。

4.5.1实验设定

我们所使用的测试平台为一架自组装的四旋翼飞行器,如图4.9所示,其使用大疆

N3飞行控制器2,搭载一个前视的RealSense D435i双目深度相机3用于环境感知和自身

‘https://www.jianguoyun.com/p/Dc_wgfUQIN6uChi7j7kEIAA

2https://www.dji.com/cn/n3
3https://www.intelrealsensc.corn/depth-camera-d435i/

万方数据
浙江大学博士专业学位论文 4层次化实时局部动力学运动规划

状态估计,相机的视场角为60。。由于远处深度估计不准确,我们只取3m内的深度估

计值,即精确的感知范围只有3 m。碰撞检测则基于占据栅格图【¨郇,其通过融合自身位

姿所对应的深度图得到。未知区域被视作安全以实现快速飞行。每当观测到新的障碍物

或者设置新的目标点时进行触发式重规划。所有的计算在一台CPU版大疆妙算2机载

电脑4上在线进行。

Oil Manifold2一C
机载计算机

DIIN3飞行接制器

Intel Realsense D435i


双目深度相机

图4.9实物飞行所用四旋翼飞行器及机载设备

4.5.2路径点闻导航

室外和室内测试的终点分别设置在约50 m外和15 m外,令飞行器飞至终点再返

回起点,每当观测到新的障碍物时进行重规划。

室外测试的场景如图4.10a所示,为事先未知的密集树林,其中四旋翼飞行器由红框

标出。最终执行轨迹如图4.10b,整体飞行的速度曲线如图4.11,在实时感知下基本保持

了3m/s以上的飞行速度。
室内测试的场景如图4.12a所示,障碍物尺寸相比室外时的树木更加巨大,对观测造

成更多的遮挡,对规划的实时性造成更大挑战。整体飞行的速度曲线如图4.13,最终执

行轨迹如图4.12b,其中蓝色轨迹为回程轨迹,其相比去程的红色轨迹更加平滑,这是因

为回程时部分环境已在去程时观测过并记录下来,使得规划能够利用的环境信息更为丰

富。

4https://www.dji.com/crdmanifold-2

71

万方数据
浙江大学博士专业学位论文 4层次化实时局部动力学运动规划

(a)室外飞行测试场景

(b)室外测试实际飞行轨迹

图4.10室外测试场景以及实际飞行轨迹


i 3

越2


30 时间(S)

图4.11室外测试整体飞行速度曲线

4.5.3快速重规划测试

为了进一步测试所提出规划算法的快速重规划性能,我们在室外飞行中不断改变目

标点让飞行器去追踪,当目标点改变或者新观测到障碍物时都进行重规划。在第一个测

试中,我们让飞行器追踪一个不断移动的二维码目标,如图4.14所示,其中追逐目标由

淡蓝色框标出,四旋翼飞行器由红框标出。在第二个测试中,我们在飞行器飞行的过程

中任意随机地改变目标点。图4.15展示了飞行器在躲避障碍物时按时间顺序观测到的地

图以及第一人称视角和第三人称视角图,左列为占据栅格地图,中间为第三人称视角,

右列为第一人称视角,序列时间间隔为0.25 s。

万方数据
浙江大学博士专业学位论文 4层次化实时局部动力学运动规划

(a)飞行测试场景 (b)实际飞行轨迹

图4.12室内测试场景以及实际飞行轨迹

童3


型2

图4.13室内测试整体飞行速度曲线

4.6本章小结

本章主要探究未知环境导航中的局部实时重规划问题,使用采样类前端规划衔接高

效后端提优的层级式规划框架,每次重规划求解一条保证实时性且足够好的局部最优轨

迹。我们总结本章主要贡献如下:1.前端规划采用基于引导采样的动力学RRT*算法,

根据当前环境快速构建近似拓扑图,用其引导在状态空间的采样,极大提升了采样类动

力学运动规划算法的求解效率。并且由于考虑了飞行器的初始运动状态,我们得到一条

位于合理路径拓扑下且满足动力学、避障等约束的初值轨迹。2.提出基于双层优化求解

的轻量级后端提优算法,内层求解具备闭式解形式,有效利用前端轨迹,花费极少计算

代价提升了前端结果轨迹的光滑性和连续性。3.将所提出的规划框架与算法应用于一架

全自主四旋翼飞行器上进行导航飞行测试,在未知的室外稠密树林、遮挡严重的室内房

间等环境保持3m/s的高速飞行。

万方数据
浙江大学博士专业学位论文 4层次化实时局部动力学运动规划

图4.14追踪移动目标飞行测试

图4.15重规划避障序列图 .一㈣霹…一 蒸一 霪一爹


74

万方数据
浙江大学博士专业学位论文 5结合快速局部优化和双向搜索的实时规划

5结合快速局部优化和双向搜索的实时规划

5.1引言

在上一章中,我们探究了飞行器在未知环境下的导航问题,重点研究了局部实时运

动规划,我们使用层级式的前端一后端方案,其中前端使用单纯采样类动力学运动规划

方法,后端构建求解双层优化问题。

对于使用单纯采样类方法的前端,当环境中存在如窄缝等难以通过的空间时,因采

样空间的维度高、边界广,往往需要大量采样才能联通窄缝两端的空间,导致其需要花

费较长时间才能得到一条可行轨迹,从而有时无法满足行进中重规划的实时求解需求。

局部优化(RegionalOptimization,RO)则利用局部小范围空M的信患而专注于探索某

些限定范围的解空间,有助于探索难以靠单纯采样联通的区域。因此,在全局采样探索

的过程中结合局部优化己成为应对这类场景的主流方案[67,69,70,1171,-l 81。从以往经验上看,

此类方案的总体效率取决于局部优化部分的求解效率。对于此,大多数工作构建非线性

优化问题并使用梯度下降类方法求解,而精确的梯度信息往往不难么容易计算得到,尤

其对于复杂的障碍物环境。本章考虑将RO构建为一系列迭代求解的无约束二次优化问

题,每次迭代都有闭式解,从而避免了计算繁杂的梯度信息,并且保证RO部分的求解

效率。另外,单向生长的轨迹树只有恰好连接上目标点时才算得到一条可行轨迹,当目

标状态点被障碍物“困住”时难以被连接到从而降低了求解成功率。同时构建另一棵由

目标点反向生长的轨迹树,尝试连接两棵树中的多个状态节点能够增加找到可行解的概

率。

对于后端提优,上一章的双层优化方法构建闭式求解的内层,虽然求解效率较高,

但在构建问题的过程中没有考虑周围的障碍物信患,在有限的安全空间内难以保证得到

无碰撞的可行解。本章对于后端提优问题的构建在一定程度上考虑了初始轨迹周围的障

碍物信息,增加了求解轨迹的安全性,而获取这些信患仅涉及迭代过程中对临时轨迹进

行碰撞检测,是原本就需要执行的操作,没有增加额外计算。同时我们保留了具有闭式

解的优点,保证了求解效率。

本章在上一章内容之上进行更深一步的探究,所提方法更好地满足飞行器自主导航

万方数据
浙江大学博士专业学位论文 5结合快速局部优化和双向搜索的实时规划

实时求解的需求。提出的改进主要在两方面:1.针对窄缝等难以靠单纯采样方法求解的

环境,我们在采样类的前端规划中结合双向搜索和快速求解的局部优化,极大减小了找

到第一个可行解所需的时间且提高了成功率。2.针对前端初值轨迹没有被充分利用的问

题,汲取前端快速局部优化中的思想,在后端提优问题的构造中考虑初值轨迹周围的障

碍物信息,同时保留有闭式解的二次型建模,使提优问题的求解更为高效且更容易满足

无碰撞障碍物约束。

本章内容安排如下:第5.2节描述了结合快速局部优化和双向搜索的采样规划前端

算法的具体流程,包括如何生长连接两棵双向轨迹树,以及如何求解轨迹边,其中所用

到的快速局部优化问题的构建与求解过程在第5.3节叙述。第5.4节描述了后端提优算法,

重点讲述了与上一章相关方面的不同点。之后第5.5节在数值仿真上将本章方法与相关

方法进行对比,验证了高效性,并在实物四旋翼飞行器上进行导航测试。最后在第5.6节

进行总结。

5.2结合快速局部优化和双向搜索的采样规划前靖

对于旋翼飞行器类漂移系统【loo](Drift System),除了初始速度之外,初始加速度

对重规划初始状态的影响同样较大,因此我们此时考虑3阶线性模型,则与第3章一样,

以加加速度作为控制输入u,状态向量X为9维向量。前端规划的问题描述与式(3-2)相

同,此处不再赘述。

5.2.1双向轨迹树生长

结合快速局部优化和双向搜索的采样规划流程如算法6、算法7所示。我们同时构建

两棵向对方生长的轨迹树,以重规划问题的初始状态和目标状态作为根节点,分别称作

正向树和反向树,以下介绍其中所涉及各函数的具体内容。

1.拓扑引导采样(算法6第4行):按第4.2.3节所描述的使用近似拓扑引导采样。只

在3维的位置维度和3维的速度维度采样,加速度维度在采样时设为不定,将在后续连

接正向树求解TPBVP时自动计算,之后在第5.2.2节详述。

2.近邻搜索(算法6第5、ll行):同样,我们以固定的欧氏距离半径r在不同轨迹

树的状态节点中分别搜索出距离‰。小于r的节点。

76

万方数据
浙江大学博士专业学位论文 5结合快速局部优化和双向搜索的实时规划

算法6:结合局部优化的丞鱼堡室挝蔓鎏
Input:障碍物环境E,起始状态x愀,目标状态Xgo。d
Output:轨迹矿

1正向树中状态节点h÷-(x州),正向树中轨迹边白÷-0,正向轨迹树
乃+_(h,白),
2反向树中状态节点Vb÷-{xt砸。>,反向树中轨迹边矗÷-仍,反向轨迹树

兀÷-(Ⅵ,邑),
3 while终止条件未达到do

● x。。。+一TopoGuidedSampling(E);


if{砩,0)÷-ChooseParent(X.一,‰一then

I¨÷-+{)ctl。),白÷-+昂,乃十-(h,白);
8 l连接上正向树;

n ‰,÷-NearNeighborSearch(7;,x。。,r);
:: if{)cp,昂】.÷-ChooseParen吖%。。K—then
¨ IⅥ÷-+{h。。},磊+-+昂,兀÷-(Ⅵ,磊);
¨

:2

:宝

n if连接上正向树八连接上反向树then

L戛蔗咖嘶尻‰).
坞 I if xm".gvalue__]orward+xnett,.g_value_backward<7r*.COSt then


万方数据
浙江大学博士专业学位论文 5结合快速局部优化和双向搜索的实时规划

算法7:选择父节点
Input:障碍物环境E,潜在父节点集合疋,待连接节点x

Output:父节点)(p,连接到父节点的轨迹边昂
1砩÷-null,min—cost+I oo;

2 forxmin饥名do

3 if父节点在正向树中then


L£÷-(‰。,x);
5 if父节点在反向树中then


L£÷-x,xm‘n);
7 if collisionse-CheckFeasible(£,E)人x硝n.g_value+£.cost<min—cost then

b÷.x厕n,min—cost÷-xm讯.g_value+£.cost,昂÷-£;

¨ l£÷-RegionaiOptimize(oe,E);
n if局部优化成功八x。沁g_value+£.cost<rain—cost then


l L b+-x戚。,mt礼-印武+-)c,,咖."dzⅡe+£.cost,o+-£;

3.选择父节点(算法6第6、12行):此步骤如算法7所示,从潜在父节点的集合麓。,
中寻找最合适的父节点。当连接正向树时,树中节点作为求解TPBV'P的初始状态,采
样节点作为终止状态,采样节点中不定的加速度维度通过求解TPBVP确定。当连接反

向树时,采样节点作为初始状态,树中节点作为终止状态,若之前已连接上正向树,则

采样节点的加速度维度由之前的TPBV'P求得,否则此时令加速度状态置零。若求得的

轨迹满足约束且累积轨迹代价为所有潜在父节点中最小的,则选其为父节点。若此轨迹

与障碍物发生碰撞且碰撞范围小于一定闽值,我们不是如上章简单的丢弃此轨迹,而是

对其进行局部优化,具体在第5.3节介绍,若局部优化成功且累积轨迹代价最小,则选其

为父节点。

4.重连接(算法6第lO、16行):当新节点被添加到正向轨迹树或反向轨迹树中后,

我们对新添加状态节点的近邻节点进行重连接。对于正向树的重连接,新节点作为求解

TPBVP的初始状态,树中节点作为终止状态;对于反向树的重连接,树中节点作为初

万方数据
浙江大学博士专业学位论文 5结合快速局部优化和双向搜索的实时规划

始状态,新节点作为终止状态。

5+获得当前最优解(算法6第19行):若某一节点同时连接上正向轨迹树与反向轨迹

树,则说明找到一条连接重规划初始状态与目标状态的可行轨迹。若该节点在两棵树中

的累积代价之和小于当前已有最优轨迹的代价,则说明找到了一条更优的轨迹,此时按

该节点在两棵树中的父指针分别回溯至两棵树的根节点即得到该轨迹。

5.2.2求解轨迹边的两点边值问题

G【xcT,,卅=(二{:;:主t3二:)=。, c5--,

(5.2)
入(砷=—OGl[x聂(T万)丁,T一]vu=(口l,忱,地,U4,地,‰,。,。,。)T∈时,

斟㈢, 仔3,

万方数据
浙江大学博士专业学位论文 5结合快速局部优化和双向搜索的实时规划

5.3快速局部优化

局部优化在生长轨迹树的每一轮迭代中可能会被频繁调用,因此我们希望尽可能快

的求解。通过分析求解11PBVP得到的发生碰撞的轨迹边‰l池,其有着较为合理的轨
迹时长,且我们已对其进行碰撞检测,知晓何处与障碍物发生碰撞,希望以较小代价将

碰撞的部分形变至周围的安全空间。上一章后端优化部分的二次型构建因有闭式解而求

解效率较高,在局部优化时我们同样利用此种构建形式。遵循轨迹边的多项式参数化形

式,我们将如l洫接轨迹时长均匀分割成J段5次多项式(算法8第2行),给优化引入
更多的自由度。

5.3.1考虑障碍物的二次型性能指标构建

对于{z,Y,2】I任一维度,二次型性能指标由三项组成。
1.平滑惩罚代价以构建为待优化轨迹中每段多项式加加速度的积分和:

以=f帅)12出 ‘54’

:妻cj Z霸tcs,ctts,,Tdt c;:cTQ,c,

其中T=丑+乃+…+乃轨迹边的总时长,正为第{段的时长,cT=【c丁,霹,…,c习
为待优化的J段多项式的总系数向量。

2.蓐径拓扑惩罚代价^构建为待优化轨迹边与之前碰撞的轨迹边‰址上位置点
f(t)之间路径距离的积分和,与式(4.9)相同:

^=/由(t)一矿(t)】2dt
‘5_5’

:妾cc。一e,T/正ttTdz cc;一《,:cc—c・,TQ^cc—c・,.

其中c汀=【c’丁,矿j,…,c譬]为原轨迹边分割后的J段多项式的总系数向量。此项将待
优化轨迹边在位置上靠近原轨迹边,从而使得大部分不碰撞的部分保留在原安全区域附

近。

3.障碍物碰擅惩罚代价五的构建与上一项类似,将上式的f(t)换成常量位置点
‰(t),提供“拉力”对待优化轨迹进行形交(关于“拉力”的描述在第5.3.3介绍)。此项

80

万方数据
塑望盔兰坚主童些兰垡堡塞 !丝鱼堡垄星塑垡垡塑翌塑垫室塑塞堕壑型

较为关键,因其隐式地提供了障碍物信息并将待优化轨迹的碰撞部分吸引至安全区域,

构建如下:

以=∑/一囟(£)一p印(t)】2疵
apEAPs。b,4p

=∑∑/…眈(t)咱,印(t)】2dt
叩∈^P。i5L“咖9 . (5—6)

=∑∑(ci—c罗)T/(4‘“”ttTd£(c;一c,)
=>.二(c—c叩)TQ。,印(c—c印),
函ps
其中APs为吸引点(AttractingPoints,APs)的集合,p。p(t)为其中一个吸引点的位置,

为常量,(£。。印.t。,印)互[o,卅为该吸引点所影响的总体轨迹时间,L为该吸引点所影响

的轨迹段的集合,(t“仰一t。,印p)∈【o,列为对应受影响轨迹段i上受“拉力”影响的时
间段。

整体性能指标如。构建为上3项指标的加权和,如下:

如o=k以+h工十九以=cTQc+cTM+N, (5—7a)

Q=A。Q。+A.Q,+A。∑Q。,印, (5-7b)
apEAPs

M=一2(AhQ,c++A。∑Qc,apca/'), ’
(5—7c)
ap∈APs

N=Ah(c+)TQ,c‘+A。∑(c印)TQ。,印c印, (5—7d)
ap∈APs

其中九,h,A。为对应项的权重。我们发现,添加障碍物惩罚后,性能指标依旧为二次

型,且当轨迹时长非负、“拉力”影响时间段非负、以及权重项非负时,二次项的系数

矩阵Q始终为正定。

5.3.2 问题杓建及迭代求解过程

局部优化的迭代求解过程如算法8所示,我们将局部优化构建为一系列二次优化问

题,循环求解,每一轮循环问题建模为

rainJRo

(5・8)
s.t.Ac=d,Vt∈[o,卅,x(t)∈z,”。。,u(t)∈uf’88,

万方数据
浙江大学博士专业学位论文 5结合快速局部优化和双向搜索的实时规划

算法8:局部优化/轨迹提优
Input:障碍物环境E,初始轨迹7r洲t或轨迹边占

Output:优化轨迹7r,是否成功标志result
l if输入轨迹边then


L‰t t--SpHtEdge(£);
3 while iteration nlgm<max礼t‘m do

4 Ad|ustOb|ective0;


丌咖巾+-ClosedFormSoive0;
6 ff collisions+--CheckFeasibleOhe哪助then

L苫州朋训沣讹e;


L AdjustOb|ective(collisions);

¨result÷一false;

其中Ac=d为每段的边界约束,即始末状态约束以及段间高阶导数的连续性约束,此

处为位置,速度,加速度连续。

与上一章不同的是,我们不优化权重系数,只优化多项式系数,当每段轨迹时长

已知、所有吸引点都确定、权重给定时,可根据第4.3.3节所描述的方法以闭式解求出

式(5.8)问题的无约束最优轨迹(算法8第5行)。之后我们对求得的轨迹进行碰撞检测,

若无碰撞,则得到一条安全轨迹,循环结束(算法8第6、7、8行);若碰撞,则根据碰

撞信息搜索选取新的吸引点AP,在原有吸引点的基础上,增量式添加新的吸引点,重

新构建障碍物碰撞惩罚代价五,此时得到新的与式(5.8)结构相同的二次优化问题(算
法8第10行),继续闭式求解,如此循环直至求解出安全轨迹或循环次数至上限。关于速

度、加速度、加加速度的幅值约束,若求解得的轨迹违背了这些约束,我们则对应增加

违背约束对应轨迹段的时长,之后重新闭式求解。

万方数据
浙江大学博士专业学位论文 5结合快速局部优化和双向搜索的实时规划

5.3-3吸引点选取

吸引点很大程度上引导了待优化轨迹形变的方向,其选取较为重要,下面描述局部

优化中如何选取吸引点。如图5.1a所示,对于碰撞轨迹边乏0ff池(黄色曲线)中的碰撞

部分,我们记碰撞起始与碰撞结束的点分别为P1与P2,记碰撞中间点为只。接着我们

使用路径搜索的方法(例如A星算法)得到一条从P1到P2的安全路径(绿色折线),
...............J
记此路径的中间点为Pm。作向量只《并延长一定距离(红色箭头),此时便得到针对
该碰撞部分的吸引点R,该吸引点只影响轨迹边碰撞部分附近的轨迹(蓝色虚线所指

示范围)。由于我们只对相对较短的碰撞轨迹进行局部优化,找安全路径的搜索范围较

小,因此搜索过程能够在非常短的时间内完成。Zhou等人【119】的工作使用了类似的局部

搜索策略来构造与障碍物距离梯度信息,得到的梯度结果较为粗糙、不精确,可能损害

其梯度优化的收敛。本章对求解问题的二次型构造避免了计算精确的障碍物梯度,而是

把障碍物的信息融合进性能指标中,在每次循环的过程中改变优化指标。






\ L 嗣
吣~ 隧 豳
~ k穰

黼 __ 目_

1●

∞翻


蕊 潮 -簿 一


H嘲

豳 黼豳

、 ■’ 瀚豳巴 ≯
——

露 豳隧
黼 豳圈躐 隧 缀隧
飞 —一 隔『
豳 叫旷

曩 疆圈
翱豳 嬲
№一
E ●

t'-前端轨迹
,—、芋影响区域
,”。菜…・次迭代的中|11l】轨迹

(a)局部优化的情况 (b)后端提优的情况

图5.1选择吸引点示意图

5.4后端轨迹提优

在后端提优中,我们使用与局部优化相同的问题构造方式,性能指标构造与式(5.4)至

式(5.7)类似,求解过程与算法8类似,不再赘述,各记号沿用第3.3.1节的定义,下面主

要描述与局部优化求解时的不同之处:

万方数据
浙江大学博士专业学位论文 5结合快速局部优化和双向搜索的实时规划

1.不再需要算法8第2行所示的分割轨迹,因为此时待优化轨迹由前端规划得到,已

经是分段多项式,有较高的优化自由度。

2.选择吸引点时不再需要搜索安全路径,因为此时前端给出的初值轨迹已经是安全

无碰撞的了。如图5.1b所示,当某一次循环的结果轨迹(黄色虚曲线)与障碍物发生碰

撞时,我们记碰撞部分的中间点为Pc,之后在初值轨迹(橙色实曲线)上找到对应时刻

的位置点,记为只,作向量只耳并延长一定距离(红色箭头),此时便得到针对该碰撞

部分的吸引点尸口,该吸引点只影响待优化轨迹上点耳附近的轨迹(蓝色虚线所指示范

围)。

后端循环迭代过程求解轨迹的示意如图5.2所示,为了更好的观察,我们将障碍物

设为半透明,橙色轨迹表示前端轨迹初值,红点表示吸引点,在迭代的过程中不断增加,

对应的蓝色线段表示某一吸引点在优化轨迹上所作用的范围。随着迭代进行,优化轨迹

由浅绿色变为深绿色,最终的深绿色轨迹相较初值轨迹更为顺滑同时与障碍物保持了一

定距离。通过充分利用前端轨迹所提供的时间和空间的信息,且考虑轨迹周围障碍物的

信息,同时保留迭代闭式求解的结构,后端提优相较上一章更为高效且成功率更高。

5.5数值与实物实验

5.5.1实验设置

在仿真与实物飞行中,我们设置飞行器运动状态高阶导数的幅值上限为5m/s的

速度,7m/s2的加速度,以及15m/s3的加加速度。性能指标中时间项的权重设置为

万方数据
浙江大学博士专业学位论文 5结合快速局部优化和双向搜索的实时规划

P=100。所有的仿真数值比较经由一台含3.4GHzIntel i7-6700处理器的计算机完成,实

物飞行测试所使用的自组装四旋翼飞行器与上一章(第4.5节)相同,机载计算机的处理

器为1.8GHzInteli7—8550U。对于碰撞检测,我们事先使用0.1m分辨率的占据栅格地图

构建,障碍物所在栅格被膨胀0.2m。

5.5.2前蟠对比测试结果及分析

为了验证在采样前端中结合双向搜索(BS)和局部优化(Ro)的效果,我们对是

否结合BS、RO二者之一或者都结合进行控制变量的消融实验(Ablation Study),不同

方法的标记如表5.1所示。为了排减小样类方法偶然性的影响,每种方法在3种类型的

环境中各自运行1000次。3种环境分别为如图5.3所示的森林类型类2.5维环境(记作

E),图5.4所示的洞穴类3维环境(记作C.),以及图5.5所示的含有许多窄缝的2.5维环

境(记作WI)。森林、洞穴、窄缝三种环境分别给定0.15s,1.0s,2.5s的求解时间预算。

某一次规划的结果轨迹也展示在3个环境图中,其中橙色为结合BS与RO方法所求得

的第一条轨迹,红色为此方法用完时间预算后求得的最终轨迹,绿色为结合RO的最终

轨迹,黄色为结合BS的最终轨迹,蓝色为不结合BS或者RO的基准方法的最终轨迹。

表5.1前端规翊方法标记

Baseline 单纯采样规划,都不结合 BS.Ro 结合双向搜索以及局部优化

BS 仅结合双向搜索 RO 仅结合局部优化

表5.2前蛸规划1000次平均结果比较

图5.6展示了不同方法在3种环境下求解出第一条轨迹的平均用时,可以发现,相

较于基准方法,不论是结合双向搜索或是结合局部优化,求解得到第一个解的时间都大

万方数据
浙江大学博士专业学位论文 5结合快速局部优化和双向搜索的实时规划

大缩短,尤其是对于窄缝的环境。表5.2展示了每种方法的最终轨迹的平均代价以及求

解成功率,可以发现经过相同的求解时间,相较于基准方法,不论是结合BS或是RO,

在不同环境中求解得到的轨迹质量都有所提升,求解成功率也都大大增加。总体来说,

在较大尺度的复杂环境下,本章提出的前端规划方法能够在数十毫秒内快速得到一条可

行轨迹,并且在给定的时间预算内提升轨迹质量,因此适合有实时求解需求的应用。

图5.3森林类型类2.5维测环境以及某次规划轨迹对比

图5.4洞穴类型3维测环境以及某次规划轨迹对比

图5.5窄缝类型3维测试环境以及某次规划轨迹对比

5.5.3后端对比测试结果及分析

不同后端提优方法对前端结果的利用方式不同,利用程度不一,我们将本章的后端

提优方式与以下三种学界前沿方式进行比较。

万方数据
浙江大学博士专业学位论文 5结合快速局部优化和双向搜索的实时规划

8∞
819.3
7 ∞
6 ∞
5 ∞
4 ∞
235.5
3∞

2 ∞
-190.9
1∞


t陪
(a)森林环境 (b)洞穴环境 (c)窄缝环境

图5.6不同方法在不同环境下求解出第一条轨迹的平均用时(ms)

方法1:第4章所提出的后端提优方法,其构建路径拓扑惩罚代价(第4-3.2节)使待

优化的轨迹靠近前端轨迹周围的安全区域,使用双层优化求解多项式轨迹系数参数以及

各代价项的权重,但是在构建优化问题时没有考虑周围的障碍物信息。

方法2:Liu等人【55】的轨迹提优方法,其将分段多项式轨迹的中间路径点固定在前

端轨迹每一段的中间路径点上,优化路径点的其他自由状态,若发生碰撞则增加轨迹树

固定点的个数,在构建优化问题时同样没有考虑周围的障碍物信息。

方法3:Zhou等人[57】的方法,其在前端轨迹上采样出控制点,用B样条重新参数

化轨迹,使用距离场将轨迹推向无障碍物的区域。

从方法上看,方法1,方法2,以及本章的提优方法在每一轮迭代求解时均有闭式

解,而方法3构造软约束的非凸优化问题,使用通用优化求解器NLopt[1141求解。测试

环境与第5.5.2节相同,每种提优方法使用同样的前端初值运行300次,平均结果记录在

表5.3与表5.4中。

从表中可以发现,本章的后端提优方法在求解时间、轨迹长度、轨迹平滑程度(加

加速度积分)、以及求解成功率上都胜过其他方法,尤其是轨迹平滑程度有显著提升。

我们同样发现在窄缝环境中,本章方法相较方法2在求解成功率上有所下降,迭代次数

上也有所增加,这是因为在含有较多仅恰好允许飞行器通过的窄缝环境中,类似于方法

2在优化时将一些路径点固定在安全区域的做法能够提供更强的约束以使得待优化的轨

迹待在安全的区域,从而更容易求解成功,但从数据中可以发现相应的轨迹平滑程度就

下降了。此处的成功率仅针对后端优化,对于完整的前端.后端求解框架,若后端求解

万方数据
浙江大学博士专业学位论文 5结合快速局部优化和双向搜索的实时规划

表5.3后蝤优化对比结果第—部分

失败。则前端已满足约束的轨迹依旧可以被执行。

与其他方法相比,本章方法由于以下两点原因而在整体上有着较好的表现。

1.额外利用了前端轨迹附近的碰撞信息,将原前端轨迹中与障碍物相聚较近的部分

推离障碍物。在迭代过程中检测到的周围障碍物提供了更丰富的周围环境信患。将其构

造成碰撞惩罚代价整合至优化性能指标中而同时保有闭适求解结构,相比于方法1,保

证求解效率的同时增加了成功率。

2.无需固定中间路径点,保留了更多的优化自由度,因而相比于方法2能得到加加

速度积分更小更顺滑的轨迹。

方法3一定程度上代表了其他构造非凸优化利用梯度信患求解的方法,收相比于构

造为凸问题享有闭式解的方法,方法3的优化求解需要更多的时间收敛,且当障碍物梯

度信息不准确时(例如树丛等杂乱环境)容易求解失败。

总结来说,当已有一个较高质量的前端轨迹初值时,本章所提出的后端方法作为一

个有效的轨迹提优手段,能够仅花费极少计算代价使得前端轨迹更加顺滑更适合飞行器

执行。

5.5.4实物四旋翼飞行善飞行测试

我们在两个挑战性的环境中进行实物飞行测试,相关实验视频可在链接1中找到。

第一个测试环境如图5.7a所示,为类似迷宫类型的狭窄环境,规划的起点与终点都

被障碍物“困住”。给定相同的lOOms前端规划时间预算,规划得到的轨迹如图5.7b所

示,其中蓝色轨迹为本章前端方法得到的轨迹,红色轨迹为在前端轨迹的基础上使用本

万方数据
浙江大学博士专业学位论文 5结合快速局部优化和双向搜索的实时规划

表5.4后螭优化对比结果第二部分

章后端提优得到的轨迹,黑色轨迹为按第4章前端方法得到的轨迹经过第4章后端方法提

优后得到的轨迹。对比红色轨迹与黑色轨迹,可以发现本章方法进一步改进了上一章的

方法。得到更顺滑的轨迹。

在第二个测试中,我们进一步测试在复杂环境下的实时规划求解能力。测试环境如

图5.8a所示,复杂的障碍物将环境分出许多不同的路径拓扑,且中间只有两个圆形门洞

可供通行。在飞行器不问断飞行的过程中不断随机改交其目标点,带有初始速度与加速

度的情况下进行重规划。图5.8b中枚红色箭头示意了当次重规划的初始速度,对比红色

轨迹(本章方法)与黑色轨迹(上一章方法),可以发现本章的方法规划出的轨迹顺着

当前初速度行进,处于更合理的路径拓扑中,而对比的轨迹出现了不期望的调头。

5.6本章小结

本章主要探究实时重规划问题,同样使用前端.后端的层级式规划框架,在上一章

的基础上增强了采样类前端以及后端提优的效率与性能,更快地求解得到一个初始可行

解,并且提优的成功率更高,从而更好满足实时重规划的需求。我们总结主要贡献如下:

1.针对采样类动力学轨迹规划在窄缝类空问中求解效率低的问题,提出在采样规划中结

合快速求解的局部优化以及结合双向搜索的方法。双向搜索利于求解目标点“被困住”

的情形,快速局部优化专注于探索有限范围内的解空间,其构建为一系列的无约束二次

凸优化问题,每轮迭代具有闭式解。2.针对前端初值信患没有被充分利用的问题,我们

在后端提优时将障碍物信患构建进性能指标中,同时保有二次规划问题的结构,使得保

证求解效率的同时成功率更高。3.进行了大量数值对比测试,并在实物四旋翼飞行器上

进行导航测试,在稠密障碍物、类迷宫等环境中验证了所提出规划方法的有效性。

万方数据
浙江大学博士专业学位论文 5结合快速局部优化和双向搜索的实时规划

(a)四旋翼飞行轨迹组合图

(b)规划轨迹示意图

图5.7迷宫类型飞行测试环境

万方数据
浙江大学博士专业学位论文 5结合快速局部优化和双向搜索的实时规划

(a)四旋翼飞行轨迹组合图

(b)规划轨迹示意图

图5.8实时重规划测试环境

91

万方数据
浙江大学博士专业学位论文 5结合快速局部优化和双向搜索的实时规划

万方数据
浙江大学博士专业学位论文 6 自适应跟踪参考轨迹实时重规划

6 自适应跟踪参考轨迹实时重规划

6.1引言

上述章节分别探究了飞行器在大范围地图中的全局最优轨迹规划,以及相对小规模

的局部实时规划问题。本章主要探究情形三.跟踪规划,即已知大范围地图信息,但是
精度较为粗糙,甚至是过时的,由此地图规划出全局参考轨迹,在跟踪此参考轨迹的过

程中进行相对小规模的局部实时规划。

此情形下的导航在某种程度上可以认为是参考轨迹的跟踪问题,与一般意义下的全

状态轨迹跟踪不同的是,我们只希望在时间与空间上跟踪此轨迹的位置。当面对系统动

力学可行性约束、安全避障约束、以及一些特定任务要求等诸多约束时,其难点在于如

何以及在导航系统的哪个环节考虑约束,以及如何处理与参考轨迹之间出现较大偏差的

情况。

许多相关工作在控制器层面考虑跟踪参考轨迹:基于模型预测控制(Model Predic—

fiveControl,MPC)类的方法[120,1211构建非线性优化问题求解离散化的控制输入,其形式

较为通用,但对避障约束以及大跟踪误差的处理能力有限。Rodriguez—Seda等人【m,123】根

据跟踪轨迹以及飞行器互相避让的指标针对性地设计特定的专家控制律(Control Law),

虽然计算简便,且能够在基于某些假设的前提下理论上保证稳定性与收敛性,但是实际

情况往往容易违背这些假设,导致控制率无法应用。另一些基于强化学习的方法[124,125]

通过大量模拟训练得到输入输出模型,将当前的观测输入直接映射得到一定离散分辨率

下的最优的控制信号,然而现实系统与抽象模型之间有不可忽视的建模误差,得到的模

型往往无法满足实际物理系统的应用需求。

由于上述缺点,近年来考虑跟踪参考轨迹的工作[1掘128】趋向于在导航系统中增加局

部规划模块,在此局部规划中考虑避障等各类约束相比在控制器中考虑更加灵活,以滚

动时域(Receding Horizon)的方式不断进行局部重规划,控制器只考虑跟踪局部规划

得到的轨迹,而全局参考轨迹则提供局部目标等信息。针对面向跟踪参考轨迹的局部重

规划,我们分析出以下几点需求:1.最基本的,局部规划的轨迹需满足系统动力学模型、

状态/控制输入幅值约束和安全避障等所有约束;2.需要鲁棒且灵活地跟踪参考轨迹。在

万方数据
浙江大学博士专业学位论文 6 自适应跟踪参考轨迹实时重规划

无障碍物时在时空维度尽可能跟踪参考轨迹,即贴合参考轨迹上相应时刻的位置,而在

避障或受扰动时能够自适应地调整全局参考轨迹上的跟踪范围,且之后快速回到全局轨

迹上。

考虑上述需求,在求解时有以下两个问题需要解决:

1.如何确定局部规划的目标状态,以及如何确定的局部规划的时域长度,也即局部

轨迹的时长。若将目标状态设定为全局参考轨迹上的状态,由于希望跟上参考轨迹,则

目标状态与时域长度之间存在约束关系,规划的时域长度即确定了参考轨迹上的目标

状态。如图6.1所示,灰色曲线为全局参考轨迹,黄色点指代当前t=to时刻系统的状

态,黑色点为t=to时刻对应参考轨迹上的期望状态,若选取T,1时长之后参考轨迹上

的状态(红色箭头)作为目标状态,由于其具有非零速度,又与障碍物靠的太近,则满

足动力学等约束的轨迹势必与障碍物发生碰撞(红色曲线),而选取乃z时长之后的目

标状态(蓝色箭头)则存在可行解(蓝色曲线)。针对局部目标状态的选择,Oleyaikova

等人【651选取全局参考轨迹上距离当前位置一定范围之外的点,并且在局部规划时固定

此目标状态。Liu等人【1261根据当前跟踪误差基于一个模糊模型(FuzzyModel)确定出

规划的时域长度。Senba§lar等人[128】选取全局参考轨迹上距离当前时刻一定时长之后的

点,并且在局部规划时固定此目标状态。本章提出的方法将规划的时域长度设为优化变

量,目标状态则约束在全局参考轨迹上,时域长度决定了目标状态在全局参考轨迹上的

位置,在优化的过程中自适应地确定最优的目标状态与时域长度,与根据经验确定的方

法相比更加灵活,对参考轨迹的时空跟踪更加精确。

图6.1局部规划目标状态以及时域长度示意图

2.如何增加连续重规划之间的连贯性。如图6.2所示,黄色、绿色、蓝色、红色曲线

万方数据
浙江大学博士专业学位论文 6 自适应跟踪参考轨迹实时重规划

依次为连续重规划轨迹,任意前后两次重规划都分别选择了不同的方向来绕过障碍物,

造成实际执行的路线(黑色点)产生“摇摆”并且一直在“靠近”障碍物而没有尽早地

绕开,虽然前三次重规划的结果都避开了障碍物,但是第四次的重规划(红色虚线)却

没有足够的空间来规划出无碰撞轨迹。若在连续的重规划之间考虑连贯性,即尽可能选

择同一方向饶障,则可以尽早的远离障碍物,更加安全。针对重规划连贯性,Knepper

等人[129・tall在重规划时使用运动基元(MotionPrimitives),在选择执行的轨迹基元时考

虑不同基元之间的拓扑相似性,类似于反应式避障。Chen等””2】提出局部认知地图的
概念,使用特定的地图表征区分轨迹间的拓扑关系,但只能用于二维规划。本章中定义

与地图的表征形式无关的轨迹间丁.拓扑连贯关系,并且设计基于采样的轨迹规划方法,

针对性地规划出与之前重规划结果之间具备连贯关系的轨迹,使得在完整导航过程中所

执行路线的一致性更强,更加顺滑,更加安全。

本章后续内容安排为在第6.2节给出7-一拓扑连贯关系的定义,并且介绍考虑拓扑连

贯的、基于采样的动力学运动规划方法;在第6.3节提出自适应优化末端状态跟踪参考

轨迹的轨迹规划方法,介绍如何处理各项约束,以及如何在优化过程中保持拓扑连贯;

在第6.4节将所提方法应用于接近真实的四旋翼仿真导航系统,进行对比测试;在6.5节

进行小结。

6.2基于采样的拓扑连贯性运动规划

路径拓扑等效性(HomotopyEquivalence)的概念在许多工作中被提出过[133。371,这

些工作大多关于如何判断首尾相连的路径是否属于其定义下相同的路径拓扑,以及关于

万方数据
浙江大学博士专业学位论文 6 自适应跟踪参考轨迹实时重规划

如何找到属于不同路径拓扑的路径。对于本章所探究的重规划一致性问题,我们针对性

地提出关于时间参数化轨迹的7-一拓扑连贯的概念。我们首先给出轨迹拓扑连贯性的定

义,再介绍考虑拓扑连贯的、基于采样的动力学运动规划方法。

6.2.1丁.拓扑连贯关系

定义1.(7-一拓扑连贯关系)给定障碍物环境E,以及两条以时间参数化的轨迹7/"1(t),t∈

[o,丑】,Ir2(t),t∈【0,乃】,其中五,T2分别为其轨迹时长,若满足IIp。,(t)一p。:(t)112<£,
即两条轨迹起始时刻位置之间的距离在一定范围内,且对所有的t∈[0,min(T,正,疋)],

线段P。。(t)p。。(£)不与环境障碍物发生碰撞,则称轨迹71"1(t)与丌2(z)互为7-一拓扑连贯关

系,记作nc(7l-1(t),丌2(t),7.)。

对于检测某一时间段范围内不同轨迹上任意两点的连线段是否与环境障碍物发生

碰撞,我们采取类似Zhou等人【137,1381均匀可视性形变(Uniform Visibility Deformation)

的做法,在待检测的轨迹上根据时间递增采样位置点,检测相同时刻所对应轨迹位置点

的连线路径是否与环境障碍物发生碰撞。此种做法为Jaillet等人【134】所提出的可视性形

变(VisibilityDeformation)的简化,在只引入小范围误差的情况下极大减少了检测所需

的计算量。

吼(t) ‰(t)

Ⅻ渺
图6.3下.拓扑连贯轨迹示意图

与大多数路径拓扑等效性定义不同的是,上述拓扑连贯关系的定义不需要轨迹具

有相同的起始位置点与终止位置点,我们要求起始位置接近,对终止位置则没有要求。

图6-3的例子展示了三条轨迹的拓扑连贯关系,图中三条轨迹起始位置接近,终止位置相

距较大,可将黄色轨迹~(t)视为前一次重规划的结果,蓝色轨迹丌6(t)和绿色轨迹丌6(£)

万方数据
浙江大学博士专业学位论文 6 自适应跟踪参考轨迹实时重规划

为此次重规划可能的轨迹。我们对每条轨迹以0.1s的时间分辨率采样出位置点,以直线

连接对应时刻的位置,判断与障碍物的碰撞,得到71"?/(t)与丌口(£)互为0.3s一拓扑连贯关

系,71"y(t)与仉(t)互为0.9s.拓扑连贯关系。
根据7-一拓扑连贯的定义,则在重规划时考虑连贯性的做法即为使得本次规划轨迹

与前一次重规划的结果互为丁一拓扑连贯关系,可形象地表述为在t∈『0,7_1的时间内,本

次重规划轨迹与上一次规划结果具有相同的“前进方向”,从相同的方向绕过障碍物。r

为可调节的参数,当取7.=0时即表示重规划时不考虑连贯性,每次重规划相互独立,7I

越大则表示重规划时对连贯性的需求越强。

6.2.2 7..拓扑连贯前靖规划算法

我们给出两种考虑7I一拓扑连贯的轨迹规划算法:

1.给定一条轨迹7j-t(t)以及拓扑连贯参数7.,pm(o)与规划的起始位置接近,要求规
划出的轨迹与m(t)互为7-一拓扑连贯关系,称此算法为丁一拓扑连贯生长树。
2.没有给定前置轨迹,给定拓扑连贯参数7-,要求规划出尽量多条起终点相同的轨

迹,其互相不为7-一拓扑连贯关系,称此算法为丁.拓扑连贯连接图。

6.2.2.1 7-一拓扑连贯生长树

t)

算法主体流程与算法1类似,遵循RRT*算、法【12】的框架,不再赘述,以下描述不同

之处,各记号沿用第3.3.1节的定义。在采样时,除了均匀采样之外,还增加采样给定轨

迹上的状态点以及其附近状态点。在选择父节点时,如算法9所示,当检查连至某一潜

万方数据
浙江大学博士专业学位论文 6自适应跟踪参考轨迹实时重规划

算法9:选择父节点
Input:障碍物环境E,潜在父节点集合疋,待连接节点x。。。,轨迹丌l,拓扑连

贯参数7-

Output:父节点)(p

I砩÷-null,Q÷-D;

2 for Xi∈疋do


l^x硝…÷-9x,+7(Ⅺ,Xnew);
4 if豇尚。。+H(x。㈣Xgoal)<瓯,,。t then


l L Q÷-十(K氨‰A
6 while Q非空do

x。i。+-Q.top0;
if CheckFeasible(xmi.,x。。",E)then

‰Ⅲ卜RetrieveTrajectory(T,xmi。)+(X。㈨X。。);
/・判断是否与给定的轨迹"fit互为r一拓扑连贯 年{

if 7£C(7n,7rh。。,7I)then

昂÷-Xmin;

break;

在父节点x。缸的轨迹边(x。饥,x一)为无碰撞之后(第8行),从x。in根据父节点指针
回溯至根节点再加上轨迹边(x,n溉巍。。),得到轨迹7rn。(第9行),再判断丌竹。。是否与
给定的轨迹为7..拓扑连贯关系(第lO行),若是,才将xmi。认定为符合条件的父节点。

在重连接时,如算法10所示,当检查连至某一潜在子节点)【c的轨迹边(h。,)【c)为无碰

撞之后(第4行),从x。。。根据父节点指针回溯至根节点再加上轨迹边(h。。,Xc),得到
轨迹7r。。。(第5行),再判断7r。。。是否与给定的轨迹为下.拓扑连贯关系(第6行),若是,

才将x。的父节点改为x。。。。在尝试连接目标点时,同样需做上述判断。

图6.4展示了1--拓扑连贯生长树算法的一个例子。红色曲线为前置轨迹_rt(t),给定

下,轨迹树7.的生长如绿色曲线所示,在t=【0,7-]的时间内轨迹树与丌I(£)(黑点部分)
具有“相同方向”,而在t>丁之后,轨迹树的生长没有限制。蓝色虚线为不符合与7r,(t1

万方数据
浙江大学博士专业学位论文 6 自适应跟踪参考轨迹实时重规划

算法10:重连接
Input:障碍物环境E,轨迹树丁,潜在子节点集合疋,新添加的节点,x。。,

轨迹死,拓扑连贯参数丁

1 forxc∈疋do

^x。…。。÷_级…+歹(】(tl。。,)(c);

if盈…1xc<鲰。八参‰…&+H(x。,Xgoa!)<唬~。t then
if CheckFeasible(x。。,)cc,助then

“etEl÷-RetrieveTrajectory(T,%。。)+(xn㈨Xc);
/・判断是否与给定的轨遗丌l互为P拓扑连贯

if 7-tC(Trl,7r。。。,7-)then

L k:女Xc的父节点为)c,l。;

成7-.拓扑连贯关系的生长方向,因此不能加入轨迹树中。

6.2.2.2丁.拓扑连贯连接图

在我们考虑的动力学运动规划中,轨迹连接图为有向图,其构建过程主体框架如算

法11所示,输入规划起始状态X涮。,规划目标状态x。。z,障碍物环境E,以及拓扑连贯

参数丁,最终求解得到互相不为丁一拓扑连贯的轨迹集合Ⅱ。

我们首先定义所需的数据结构。轨迹连接图9由有向轨迹边的集合£以及顶点的

集合1,构成,记为9∽,y)。

图中每一段轨迹边e∈£包含以下信息:

・%。“:边的起始顶点;

・仇。舭边的末尾顶点;

・(Xh。ad,xtail):连接起始顶点状态与末尾顶点状态的单段多项式轨迹,其中Xh。。d为
起始顶点对应的状态,X缸订为末尾顶点对应的状态;

在不混淆的情况下,我们以(Xhe。d,x涮z)表示一段轨迹边。

轨迹7r由多段依次收尾相连的轨迹边构成,函数Cost(It)表示此轨迹的代价。

万方数据
浙江大学博士专业学位论文 6 自适应跟踪参考轨迹实时重规划

图中每一个顶点甜∈V包含以下信息:

・Xh。ad:顶点对应的状态向量;

・Ⅱ:连接起始状态对应顶点至u的轨迹的集合,其中轨迹互相不为丁.拓扑连贯;

在不混淆的情况下,我们以顶点对应的状态x代表该顶点。

下面描述拓扑连贯连接图生成算法,如算法1l所示,在每一轮迭代中,主要步骤如

下:

1.拓扑引导采样(第3行):与算法6中的相同,只在3维的位置维度和3维的速度

维度采样,加速度维度在采样时设为不定,将在后续生成可行轨迹边求解TPBVP时自

动计算,求解TPBVP的方法与第5.2.2节相同,记此采样点为x。。。

2.近邻搜索(第4行):同样,我们以固定的欧氏距离半径r在图顶点中搜索出距离

)【,l。小于r的顶点作为其近邻顶点。

3.生成可行轨迹边(第5、6、7、8、9行):对每一个近邻顶点x。和求解以其为初

始时刻状态,x。。为终止时刻状态的TPBVP,得到单段多项式轨迹,若此轨迹满足约

束,则将其构建轨迹边,添加到图轨迹边的集合中。

4.添加顶点:若近邻顶点中找到至少一段满足约束的轨迹边(第lO行),则将x。。

添加到顶点集合中(第1l行)。此时,顶点x。。中还未含有任何轨迹,稀。.Ⅱ为空集。

之后,对每一个新添加轨迹边(x州。,x。。。)的起始顶点)‰。(第12行),将其含有的所
有轨迹】c,,咖.11分别与边(‰。,)c,l。)连成新轨迹7rm机(第13、14行),对每一条新轨迹
而眈,使用算法12更新顶点‰。所含的轨迹集合x。。.II。

5.更新顶点所合轨迹(第15、19第行):如算法12所示,对某一顶点‰,给出一条

连接起始顶点与)cc的轨迹丌0,在顶点xc的轨迹集合xc.Ⅱ中寻找与之互为7-.拓扑连贯

的轨迹。若没有找到,则将丌。添加到K.Ⅱ中;若找到一条丁.拓扑连贯的轨迹丌c,且7r0

的轨迹代价低于丌c,则将X。.II中的丌c替换为砌。

6.尝试连接目标顶点(第16行):当向图中添加一个新顶点x。。后,若此新顶点距

离目标顶点小于一定距离,则我们尝试以此顶点状态和目标顶点状态作为边值条件求解

TPBVP,若求解结果满足约束,则按算法12更新目标顶点所含轨迹集合。

7.终止条件(第2行):终止条件可设为算法运行时间超出预设求解时间,轨迹图中

边的个数超出预设个数,或是轨迹图中节点的个数超出预设个数等等,可根据不同需求

l∞

万方数据
浙江大学博士专业学位论文 6自适应跟踪参考轨迹实时重规划

算法ll:拓扑连贯连接图算法
Input:障碍物环境E,起始状态x州£,目标状态x9Dnl,拓扑连贯参数7.

Output:轨迹集合Ⅱ

1图中状态点y+-{x{碱),图中轨迹边£÷-O,连接图9+-(1,,£),
2 while终止条件未达到do

I}

I ifLC=heckF发easible(x一:,‰柚)th钮

L=三盎兰∽;

:2

“ if TryConnectingGoal(xnet‘,,x口∞J then


I L:=裂㈡;
20
II÷-x9刊.Ⅱ;

万方数据
浙江大学博士专业学位论文 6 自适应跟踪参考轨迹实时重规划

算法12:更新顶点所含轨迹UpdateNodeTraj(x。,710,r)
Input:待更新顶点X。,待比较轨迹丌o,拓扑连贯参数7-
1 for 7rc in xc.11 do

悟手州hen
else

x。.Ⅱ÷-+丌。;

进行不同设置。

8.最后当终止条件满足后,算法停止迭代,目标顶点的轨迹集合X90a1.Ⅱ即为所求
的轨迹集合(第20行)。

图6.5展示了7-一拓扑连贯连接图算法的一个例子。实曲线为构建出的连接图,对于

其中一个顶点h,从初始顶点x溉:到)【tI的轨迹共有5条,非拓扑等效的轨迹有黄色与

蓝色3条,但是互相不为7.一拓扑连贯关系的轨迹只有蓝色所示的2条,因此x。.Ⅱ含有
2条轨迹。

t=

t=T

万方数据
浙江大学博士专业学位论文 6自适应跟踪参考轨迹实时重规划

6.3 自适应跟踪参考轨迹的轨迹优化

6.3.1问题描述

记所跟踪的参考轨迹为X,。,(t),在t=0时刻开始跟踪。对于跟踪参考轨迹时的每

一次重规划,我们记规划开始时刻为to,对应参考轨迹上的状态为x,。,(to)。在第2章规
划问题基本建模的基础上,轨迹跟踪重规划所对应优化问题的具体数学描述如下:

。。积与,了=Z巧(三u(t)Tu(t))at+p,(Ts一霉。,)2 (6—1a)

s.t.文(t)=Ax(t)+Bu(t), (6—1”

x(O)=x眺,x(乃)=x,。i(to+乃), (6-1c)

lIv(t)ll:=IIp(t)ll:≤V。。, (6—1d)

IIal'CCOS(ej冗。。缸(口0))e。)0。≤曰。。, (6-1e)

116u(t)Il。≤Q。ax, (6—10

厶i。≤f(t)5,k。, (6-lg)

fvzsT(P(t))≥rtDl,耽∈【o,乃】, (6-1h)

饨c(pi。n(t),p(£),7.). (6一li)

式(6一la)优化目标中除了最小控制量之外,还增加了一项惩罚轨迹时长 (乃)与期

望跟踪时长(耳。,)的差值,其中Pr为此项的权重。

式(6.1b)为飞行器动力学模型等式约束,采取三阶链式线性系统。

式(6.1c)为边值等式约束,其中重规划时规划起始时刻状态的确定如第2.4.1节所述,

规划终止时刻状态约束在全局参考轨迹上,由轨迹时长,也即规划时域长度确定,此项

末状态约束的构建确保了在单条局部轨迹执行完成后,飞行器恰好在对应时刻接入全局

参考轨迹,到达了该刻所全局参考轨迹所规划的期望状态。将轨迹时长作为优化变量,

自适应地确定了最优的目标状态与时域长度,即自适应地跟踪参考轨迹。

式(6.1d)至式(6.1h)为表示系统所受物理限制的过程不等式约束,除了速度幅值约束

(式(6.1d))之外,在许多情形下希望飞行器保持姿态平稳,加速度幅值约束和加加速度

幅值约束在一定程度上能表示飞行的平稳性,但是不够确切,在此我们精确地限制飞

行过程中的的姿态角幅值小于最大允许倾角‰。(式(6—1e))、机体角速率向量模的幅

万方数据
浙江大学博士专业学位论文 6 自适应跟踪参考轨迹实时重规划

值小于最大允许角速率Q。。。(式(6.10)、以及推力幅值在螺旋桨所能产生的最小推力

五。i。以及最大推力厶。。之间(式(6一lg))。轨迹姿态角、机体角速率、以及推力的计算
由第2.2.2节给出的微分平坦变化m得到。对于避障约束(式(6—1h)),我们使用梯度距离

场,希望优化轨迹在空间位置上与障碍物保持最小距离r。ol。

式(6.1i)为拓扑保持约束,其中p(t)为待优化轨迹的位置,P洲。(£)为给定的表示期
望路径拓扑的轨迹位置,我们希望优化出的轨迹与之互为7I.拓扑连贯关系。

对于上述问题的求解,我们使用轨迹类的优化变量形式消除各类等式约束,尤其是

末状态约束,使用罚函数法处理不等式约束,最终转换为非光滑的无约束优化问题,整

体上采取Lewis等人[139]提出的处理非光滑优化的拟牛顿法求解,在线搜索时额外考虑

拓扑连贯性约束。以下详细描述约束处理方法与求解过程。

6.3.2使用轨迹类处理等式约束

Wang A E97]提出MINCO(MINimumControl Optimization)轨迹类,其实际为分

段多项式,一条s阶的MINCO轨迹实际为一条2s一1阶的多项式样条轨迹,定义如下:

‰…2∽:[。,T】一叫c=M(q,T), ㈣
q∈R”(M.1),T∈R笺},
其中p(t)表示一条m维M段的多项式轨迹位置,c=(c丁….,c][f)T∈R2M“…为
其整体多项式系数向量,q=(q1,...,qm一1)为多项式段间路径点构成的矩阵,T=

(噩….,%)T为每段多项式时长构成的向量。
MINCO轨迹类的核心为线性复杂度的平滑映射

c=A4(q,T), (6-3)

其将段间路径点q,以及每段时长T的组合转化为多项式系数c。给定起始与终止约束,

其使用多项式作为基底,MINCO轨迹类解析地求解了如下最小控制量的优化问题:

ra础in,o'7幽.。:Jon《昝置(知Tu(t))出(6-4a)
础)z

L抄)‘u(。))出
s.z.u(£)=pO)(£),耽∈[0,乃】 (64b)

p卜1】(o)=-o,p卜11(巧)=p,,(6-4c)

p(正)=吼,I≤i<M, (6-4d)

万方数据
浙江大学博士专业学位论文 6自适应跟踪参考轨迹实时重规划

其中,-o为给定的由0至s一1阶的起始时刻位置导数,Fr为给定的由0至s—l阶的

终止时刻位置导数。

任一以C=M(q,T)为系数矩阵的多项式样条自身即是严格经过路径点q的唯一
最小控制量轨迹。另外,给定可微函数F(c,T)=F(M(q,T),T)=H(q,T),只需提供
OF/Oc以及OF/OT,MINCO轨迹类内部可实现以线性复杂度计算出其对{q,T)的导
数OH/Oq以及cgH/cTr。

据此,我们使用MINCO轨迹类的参数化系数{q,T)作为优化变量,自然地消去了
线性动力学模型、起始状态、末端状态的等式约束。

6.3.3使用罚函数处理不等武约束

6.3.3.1外点罚函数处理过程约束

对于式(6.1d)至式(6一lh)所示的5个泛函类型过程不等式约束,我们首先将其表示为

方便运算的形式,记作如下:

9(c,T,t)=9(x(z),u(t),t)

忪(圳;一vm。2

al'ccos(ej冗舭t(q(t))e3)一%。 (6-5)
116u(t)瞻一f2ln。2 5 0,Ⅵ∈【0,Tf】.

(,(t)一厶)2一露

rtd—fvzs-r(p(t)1

其中厶=(,竹。+,m讯)12,,r=(,m。一厶t。)/2由推力幅值计算。由平坦输出x(t)以
及u(t)计算倾角、机体角速率、推力等物理参数的方法由第2.2.2节的微分平坦变化霍
给出。之后,我们借鉴Teo等人【108,109]方法的思想,对约束函数式(6.5)在离散的时刻点

进行采样,对违背约束的部分进行积分,即使用采样点的加权和来构建罚函数。考虑到

优化过程中轨迹时长发生变化,为了保证罚函数采样转化的精度,我们对分段多项式中

的每一段分别采取固定时问间隔采样,则这些泛函约束的计算在每一段轨迹边之间相互

独立,即9(c‘,正,t),t∈【0,正1仅涉及到ci以及正。

对于某一多项式系数以及时长为{c‘,正】.的轨迹边,对式(6.5)中的其中一个维度0,

万方数据
浙江大学博士专业学位论文 6自适应跟踪参考轨迹实时重规划

我们记在t时刻对泛函采样得到的函数值为

亿(ci,正,t)=in82([go(Ci,正,£),0] (6-6)

令采样间隔为6,则对于第i∈{1….,M)段轨迹边,维度O所对应的约束转化成的罚
函数代价指标计算如下:

工(c。,互,6)=九0∑屿R(ct,互,J6)+
j20
(6-7)

;(r,-ha)[Po(cit删圳%啪)]),n=阱
其中k为泛函约束向量乡中第O维度的惩罚因子,6为采样时间间隔,礼=l正/副为采
样点个数,(W0,W1,…,哟一1,%)=(1/2,1,…,1,1/2)为梯形求积法则中的系数。虽然
整数礼随着正的变化而改变,但是此种固定时间间隔采样得到的代价指标函数关于变

量正是连续的,证明见附录A,满足非光滑优化的拟牛顿、法【1391求解的前提要求。

6.3.3.2内点罚函数考虑拓扑连贯性

对于式(6-1i)所示的拓扑连贯约束,由于待优化轨迹的位置关于优化变量是连续变

化的,若我们保证拟牛顿法中每一轮线搜索的结果轨迹都与上一轮迭代的结果互为7I.拓

扑连贯关系,则最终得到的轨迹与给定的初值轨迹保有7-.拓扑连贯关系。对此,我们分

别计算每一轮线搜索的最大步长(在第6.3.5.1节详述),使得在此最大步长内的变化都

满足下.拓扑连贯。

考虑到给定的初值轨迹为无碰撞轨迹,我们构建对数障碍函数(LogarithmicBarrier

Function),使用内点罚函数法将拓扑连贯约束转移到代价指标上。对于某一多项式系数

以及时长为{ci,正}的轨迹边,我们记在t时刻采样得到的对数障碍函数值为

№剐)=-崦(型岛笋型), 洚8,

其中,/孤sr()为计算某一位置点与地图中障碍物最近距离的函数,由梯度距离场地图

获得,dt。f为障碍函数开始作用的距离容许参数。

令6为采样间隔,下为拓扑连贯参数,我们首先找到t=丁时刻对应的轨迹段,记

为叫,则对于第t∈{l,…,伽)段轨迹边,拓扑连贯约束转化成的罚函数代价指标计算

万方数据
浙江大学博士专业学位论文 6自适应跟踪参考轨迹实时重规划

玩(ct,互,6)=A^(6∑岣魄(ct,互,J6)+三(T一礼J)[玩(ct,乃,礼6)+Bh(ct,正,可)])
1=0

n=I吾I,T--<卜墨‰鬻』’卅-l
(6-9)

其中,A^为此项的惩罚因子,礼为采样点个数。

此代价项的含义为,在优化轨迹的位置连续变化时,当其与障碍物的最近距离小于

也02时,此项代价就变得接近无穷大,保证了优化时不发生拓扑跳变,从而保证与初始

轨迹7-.拓扑连贯。

6.3.4无约束优化问题及梯度推导

至此,通过使用轨迹类表示优化变量消除等式约束,以及使用罚函数消除不等式约

束、式(6—1)的约束优化问题转化为了无约束优化问题,如下:

.min』、fo。T…M一(知Tu(z,)疵
M 5 M 、
(6-10a)

+肼(乃一霉。,)2+∑玩(ct,正,d)+∑∑玩(ct,正,6)}.
i=1 o=1 i=1 J
(6—10b)

我们接下来根据链式法则推导式(6-10)中各项对{c,T】-的导数,之后由MINCO轨
迹类求得其对优化变量{q,T)的导数。
1.对于式(6-lOa)的控制量代价项,

Q酬c砜
?甜M(知~,dr=》M 睁Ⅲ

警-Qc州(玑等=扣酬(啦
2.对于轨迹时长相关的代价项西=Pr(乃一乃。,)2,

警嘞(乃也,). (6-12)

3.对于拓扑连贯项巩,我们只需计算采样点处罚函数值大于0时的梯度,则其相

万方数据
浙江大学博士专业学位论文 6自适应跟踪参考轨迹实时重规划

鼍砘(6喜屿掣+互1 c~∞[掣+掣]),
对Ct的导数为

篓砘G1rLB螂∥M(啪,吵咖“…一1. (6-14)

篆一n(狮ct'咖叶Bh(ci’”啪吲1I.…¨小肛叫,w”’

鼍砘(6壹j=O岣掣+互1 c正删[掣+掣]),
甏咄(三瓯(啪删+纰忍正)】),
(6-15)

其中藏(ci,正,t)laci对于式(6-5)的各维度不同,下面分别推导各维度对{p,t,,g,u,n
的导数,而{p,t,,q,u,.厂】.=皿p【31),则{p,御,口,u,,)对平坦输出的导数可根据第2.2.2节
的微分平坦变化关系式皿经自动微分1求得。最终(30(ci,正,t)/Oci可由链式法则推得。

嬲:2毗t),(6-16)t
I)针对式(6-5)中第一维速度幅值约束,

一。”。’
粕(q,)

F丽丽-2
2)针对第二维倾角幅值约束,根据式(2-13)中冗哗t(q)的形式,可推导得

鬻2 忻钆…T,
l石而2了i:彳i写盂:夏i丽。铷’一吼'一啦’船’' c纠7)
‘6。17’

万方数据
浙江大学博士专业学位论文 6 自适应跟踪参考轨迹实时重规划

缫:2u(拱£),(6-18)I
3)针对弟二维机体角逮翠梗的幅僵约采,

~r川V’
舢(世,t)
4)针对第四维推力幅值约束,

紫筹=2(肼㈡一,m), (6-19)

5)针对第五维障碍物约束,

篙掣t一蒜t.
ap(c{,) 卸(q,)‘
睁2。,
…一’

至此,我们给出了式(6-lo)无约束优化问题的性能指标对优化变量{q,T)的梯度表
示形式.之后可用描席下降法求解。

6.3.5求解过程

对式(6.10)的问题我们采用Lewis等人11391提出的处理非光滑优化的拟牛顿法求解,

其本质为L-BFGS算法,此处给出其主要步骤的伪代码流程如算法13所示。关于L.BFGS

算法的详细信息可参见Noeedal的文章【140l,本文不再介绍,下面我们描述考虑拓扑连

贯性的线搜索最大步长计算方法,以及线搜索方法。

算法13:拟牛顿法流程
Input:轨迹初值墨。/t

Output:优化结果r

1 while停止条件未满足d0


l计算线搜索最大步长;

3 l线搜索;

4 l更新Hessian信息;

6.3.5.1考虑拓扑连贯性的最大线搜索步长计算

对于某一个线搜索子问题,我们记以下3个条件并给出1个命题。

条件1:步长对应的轨迹与线搜索初值轨迹‰。互为丁一拓扑连贯关系。

万方数据
浙江大学博士专业学位论文 6 自适应跟踪参考轨迹实时重规划

条件2:Armijo准则[1411。

条件3:Wolfe准则【1421。

命题1.根据式(6-10)中的性能指标,对于某一次线搜索,若线搜索的初值轨迹不为局部

极小,并且其与障碍物的最近距离大于障碍函数开始作用的距离容许参数dtol,则满足

条件J且不满足条件2的步长一定存在。

证明.初值轨迹x。娃与障碍物的最近距离大于障碍函数开始作用的距离容许参数也d,

对数障碍惩罚项为0,由于线搜索时随着步长连续变化轨迹连续形变,则在此拓扑内的

轨迹均与K喇。互为丁.拓扑连贯关系,当步长增长至某一定值,轨迹形变至与障碍物充

分接近时,对数障碍惩罚项接近无穷大,此时轨迹不满足Armijo准则,此步长满足条

件1且不满足条件2。 口

据此,考虑拓扑连贯性的步长计算即为寻找一个最大线搜索步长,使得此步长下的

轨迹满足与线搜索初值轨迹X州。互为丁一拓扑连贯关系,但不满足Armijo准则[1411。

算法流程如算法14所示。给定某一次线搜索的初始轨迹x。it'梯度反方向d,以及

拓扑连贯参数丁,将最大步长max 初始化为1,步长下界
p ets.,为化 始
lower 初
bound 0

上界upper bound初始化为无穷大(第l行)。在每一轮迭代中,我们计算当前步长下的

轨迹xt。。(第3行),若此轨迹不满足与初值轨迹X衲托互为7-一拓扑连贯关系(第4行),

则说明当前步长过大,将upper dnuob_贯连扑拓一-7足满若;)行第(长步前当为置设 5

关系,但不满足Armijo准则(第6行),则说明当前步长下的轨迹经初值轨迹连续形变

够充分接近障碍物但没有改变拓扑,此时找到了一个符合条件的最大步长,退出迭代

(第4行);若满足7-.拓扑连贯关系,且满足Armijo准则(第8行),则说明当前步长过小,

将lower bound设置为当前步长(第9行)。之后,若初始步长下的轨迹已不满足7-.拓扑

连贯关系(第10行),则更新当前步长为lower bound与upper bound的中值(第110),

否则更新为初始步长的2.1倍(第13行),继续下一次迭代,直到找到符合条件的步长

或达到迭代次数限制(第2行)。

由此,我们找到满足条件1且不满足条件2的最大步长,此最大步长将作为之后非

精确线搜索的步长上界。图6.6展示了计算最大线搜索步长的示意图。在此次线搜索中,

初始轨迹为7ri。n(t),颜色渐淡的轨迹表示在梯度反方向上随步长增加的轨迹连续形变

过程。经过步长step2得到轨迹几卸2(t),其与障碍物的最近距离小于障碍函数开始作

万方数据
浙江大学博士专业学位论文 6 自适应跟踪参考轨迹实时重规划

算法14:计算线搜索最大步长
Input:轨迹初值x捌。,梯度反方向d,拓扑连贯参数7-

Output:最大步长max_step

max—step÷_1,步长下界lower—bound+--O,步长上界upper_bound÷-+o。;
2 while不到最大迭代次数限制do


xt啪p÷一Xinn+d率max_step;
4 if TopoConsistency(xi嘶t,xte"tp,砂fails then


L啪er-6。und+-max_step;
6 else if
Armijo伍佣t,x£。一知i/s then

L break;

8 else


L f~r—bound‘-m。u姚
m if upper_bound<+oo then


L m。t耵ep+-(10we_。札礼d+卿er_bou几d)/2;
u else


L m吼就ep+-2“mnzj卸;

用的容许距离(红圈所示处),轨迹代价趋于无穷大,但仍与7ri砒(z)互为7_-拓扑连贯关

系,此步长符合条件。

6.3.5.2连续非光滑函数的非精确线搜索

在此线搜索中,我们以上节求得的最大步长为上界,寻找一个满足条件2且满足条

件3的步长。Lewis等人[139]的工作证明了当式(6.10)中的性能指标函数连续且有下确界

时,此步长一定存在。

算法流程如算法15所示,给定某一次线搜索的初始轨迹均。加梯度反方向d,以及

最大步长max step,将当前步长step_size初始化为1,步长下界101lJer—bound初始化

为O,上界upper dn初始化为
uob_当算计们我,中代max
迭轮一每在step
。)行1第(

前步长下的轨迹Xt。。(第3行),若此轨迹不满足Arroyo准则(第4行),则说明当前步

万方数据
浙江大学博士专业学位论文 6 自适应跟踪参考轨迹实时重规划

长过大,将uppeK bound设置为当前步长(第5行);若满足满足Armijo准则,但不满

足Wolfe准则(第7行),则说明当前步长下的轨迹代价下降不够充分,将lower bound

设置为当前步长(第8行);若满足Armijo准则,且满足Wolfe准则(第9行),则此时

找到了一个符合条件的最大步长,退出迭代(第4行)。之后,若初始步长下的轨迹已

不满足Armijo准则(第11行),则更新当前步长为lower bound与upper bound的中值

(第12行),否则更新为初始步长的2.1倍(第14行),继续下一次迭代,直到找到符合条

件的步长或达到迭代次数限制(第2行)。

6.4仿真导航测试及结果分析

我们将所提出的自适应跟踪参考轨迹规划算法应用于高度仿真的四旋翼飞行器,在

如图6.7所示的约100m×100m×4m规模的大型地下车库场景进行轨迹跟踪的模拟导

航飞行测试,相关仿真导航视频可在链接2中找到。飞行器上搭载32线模拟激光雷达,

垂直视场角为900,水平视场角为3600,角度分辨率0.350,我们融合当前的激光点云观

测信息与里程计信息实时更新局部占据栅格地图,局部建图的范围为32m x 32m×8m,

分辨率0.25m,以飞行器为中心。之后将此局部占据栅格地图的占据部分在水平方向膨

胀2个分辨率单位,再转换为梯度距离场地图,局部地图更新频率为10Hz。全局参考

轨迹最高速度为6m/s,如图6.7深蓝色曲线所示,可以看到参考轨迹在许多地方与障碍
物发生碰撞,我们进行实时建图与重规划,跟踪参考轨迹上对应时刻的位置,同时避开

障碍物,且满足飞行器的各个物理性能限制。实验的传感器模拟、建图、规划、控制等

2https://www.jianguoyun.com/p/DVaWrFYQIN6uChjHj7kEIAA

万方数据
浙江大学博士专业学位论文 6自适应跟踪参考轨迹实时重规划

算法15:连续非光滑函数的非精确线搜索
Input:轨迹初值X概t,梯度反方向d,最大步长max_step

Output:合适步长step_size
1 step_size+.1,步长下界lower—bound+_0,步长上界

upper_bound+_max_step,bracket+_False;

2 while不到最大迭代次数限制do

3 xte竹甲七一xinn+d木step_size;

僻uppe胁r_bo—und+=s-吣溉;


L l删er—bou孔d÷-毗”魄;
9 else


L break;

l if bracket==me then

L step.s协,-(10wer_6㈣d+唧er_bou礼d)/2;
3 else


L ste疋毗e÷I 2.1年step_毗e;

所有模块均在一台含英特尔i7.10750H处理器,主频为2.6 GHz的计算机上进行,规划

算法采用的各个参数数值见表6.1,另外拟牛顿法迭代的收敛判断条件设置为整体性能

代价的变化率小于le一4。

每次重规划初始时刻状态的选取如第2.4.1节所述。对于终止时刻状态,我们首先选

取全局参考轨迹上在当前时刻往后耳。,的状态点作为前端规划的终止时刻状态,若此

状态点的位置在障碍物内,则向后顺延直至找到不碰撞的状态点。若之前一次重规划的

结果轨迹与参考轨迹之间不为丁.拓扑连贯关系,则说明当前需要考虑避障,此时使用

7-.拓扑连贯生长树算法,得到一条与上一次重规划的结果轨迹互为7_.拓扑连贯的初值轨

迹,否则使用7-.拓扑连贯连接图算法,得到一条或多条初始轨迹,我们选取代价最小的

万方数据
浙江大学博士专业学位论文 6 自适应跟踪参考轨迹实时重规划

一条,初始轨迹求解的时间阈度设定为15ms。之后,将此初值轨迹给到自适应跟踪轨

迹优化算法,自适应地优化约束在参考轨迹上的终止时刻状态,得到满足所有约束的局

部重规划轨迹,给到控制器跟踪此局部轨迹。

我们首先验证所提出的自适应重规划算法在跟踪参考轨迹上的性能提升,如图6.7所

示,红色箭头组成的路线为使用所提出的自适应跟踪算法完整跟踪参考轨迹后飞行器所

实际经过的路线,灰色箭头组成的路线则由将每次重规划的末状态固定的方法得到,没

有考虑自适应性,深蓝色曲线为全局参考轨迹,从细节图中我们可以发现本章所提方法

在避开障碍物的前提下与参考轨迹贴合地更好。在细节图6.7a中,使用自适位跟踪在安

全避障的同时紧贴参考轨迹,而固定末状态的方法则选择了另一方向绕障。图6.8展示

了两种方法在相应时刻与参考轨迹的位置跟踪误差曲线,可以看出本章自适应调节跟踪

末状态点的方法有着明显更小的跟踪误差。表6.2中记录了重规划中轨迹优化的求解耗

时占比,自适应跟踪过程总共进行了797次重规划,固定末端点跟踪的方式总共进行了

849次重规划。与固定末端点的优化方式相比,自适应跟踪的确增加了少量求解耗时,

但也可以保有10Hz的重规划频率,且求解成功率更高。

图6.9展示了连续8个时刻的重规划结果轨迹,分别对应图6.7c中8个箭头所指位置,

此时飞行器从两根立柱中间穿过,接着避开参考轨迹上所经过的障碍物。红色曲线为重

规划结果轨迹,红色箭头为使用本章自适应跟踪方法的飞行器当前位置与速度指向,灰

万方数据
浙江大学博士专业学位论文 6 自适应跟踪参考轨迹实时重规划

(a)路线细节(a)处示意图 (b)路线细节(b)处示意图

(c)最终执行路线对比

图6.7是否考虑跟踪自适应性的测试环境与最终执行路线

图6.8参考轨迹跟踪位置误差对比曲线

万方数据
浙江大学博士专业学位论文 6 自适应跟踪参考轨迹实时重规划

表6.2重规翅l:求解时间表

色箭头为使用固定末状态跟踪方法的飞行器当前位置与速度指向,深蓝色轨迹为全局参

考轨迹,深蓝色箭头为当前时刻所对应的参考轨迹上的位置与速度指向,可以对比发现

本章自适应跟踪方法的实时跟踪误差小得多。

图6.10展示了完整的跟踪过程中飞行器的实时推力、机体角速率、与水平面倾角、

以及速率曲线,可以发现整个过程中各项物理指标均在所设置的幅值约束之内。

在与上述相同的规划参数设置下,在如图6.11所示的环境中,我们与不考虑连续重

规划连贯性进行参考轨迹跟踪进行对比。红色箭头组成的路线为使用所提出的拓扑连贯

自适应跟踪算法完整跟踪参考轨迹后飞行器所实际经过的路线,灰色箭头组成的路线则

不考虑拓扑连贯性,深蓝色曲线为全局参考轨迹。从细节图6.11a中,我们看到灰色路线

的方法一开始选择了左侧饶障,之后又交到右侧饶障,犹豫不定,导致最终执行的路线

十分扭曲且与障碍物距离过近,而考虑了连续重规划拓扑连续的红色路线则有着较好的

避障一致性,最终执行的路线十分顺滑。

万方数据
浙江大学博士专业学位论文 6 自适应跟踪参考轨迹实时重规划

(a)箭头1处重规划结果 (b)箭头2处重规划结果

(c)箭头3处重规划结果 (d)箭头4处重规划结果

(e)箭头5处重规划结果 (O箭头6处重规划结果

(g)箭头7处重规划结果 (h)箭头8处重规划结果

图6.9重规划结果轨迹




蓬磐掣攀掣磐碧磐妻塑些
瞧三三二二二I~二~ …。二立二曼一-二…曼~毫一曼曼二l…:曼兰二量二:三



回 20
30时间ls)40

图6.10倾角、推力、角速率、速率曲线

117

万方数据
浙江大学博士专业学位论文 6 自适应跟踪参考轨迹实时重规划

、。。、。鬻、罗冀同一嗣一 ,。 _瞄L
々。/‘7 I;
Y『一
一 一J●
羹囊羞,、j。;纛囊。7j 7雾毒一。 一冀曩,■
纂攀摹簿一i攀。强誓磐。一“麓。更j 一叠1。I 7’矽哆舅参1誊…
《 。
i、

(a)轨迹细节(a)示意图 (b)轨迹细节(b)示意图

(c)最终执行轨迹对比

图6.11连续重规划是否考虑拓扑连贯性对比测试环境

6.5本章小结

本章探究了未知环境下对全局参考轨迹的时空跟踪问题。我们总结主要贡献如下:

1.考虑到连续重规划间轨迹的路径拓扑不一致,避障时出现“摇摆犹豫”的现象,导致

飞行器与障碍物过分接近,增加了碰撞的风险,我们定义了轨迹间的7-.拓扑连贯关系,

并提出考虑拓扑连贯性的采样类动力学规划算法,增加了连续重规划之间的路径拓扑一

致性,使得整体导航过程中避障时轨迹更加顺滑,更加安全。2.考虑到时空上贴合参考

轨迹与避开障碍物等具有冲突性质的约束,我们提出自适应末端状态的重规划轨迹优

化方法,使用轨迹类、罚函数等方法消除约束,使用梯度下降法求解。在线搜索时根据

7-一拓扑连贯关系计算最大步长,保持优化的结果轨迹与初值轨迹处于同一拓扑路径。与

传统固定末状态的方法相比,所提出方法在满足避障约束的同时大大缩小了实时位置跟

踪误差。3.在接近真实的仿真系统中验证了所提出的轨迹跟踪算法。

万方数据
浙江大学博士专业学位论文 7总结与展望

7总结与展望

7.1全文工作总结

本文以多旋翼飞行器在复杂环境下的自主导航为背景,主要针对其在全局规划、局

部规划、跟踪规划三大类情形下的运动规划问题,详细分析了侧重点及难点,并提出相

应的解决方案,全文工作总结如下:

1.对于已知精确环境下导航的全局规划情形,我们重点考虑了算法的全局最优性和

快速收敛性。我们提出时空形变轨迹树算法,整体上使用在采样类动力学规划方法中深

度结合局部优化的方法来求解。我们将树生长时轨迹边的构建建模为末状态部分受约束

的两点边值问题,使用约束松弛策略加速求解,从而能够快速探索全局解空间。我们设

计以最小优化单元表示的轨迹树整体质量性能指标,在时间和空间层面优化不同单元的

组合,花费尽量小的代价高效提升整体轨迹树的质量,从而极大加速了算法的收敛性。

2.对于未知环境导航中的局部实时重规划情形,我们重点考虑了飞行器的运动初始

状态以及算法的实时求解性,使用采样类前端动力学运动规划衔接高效后端提优的层级

式规划框架求解。我们构建近似拓扑图引导在状态空闻的采样,提升了采样类动力学运

动规划算法的求解效率,之后提出内层求解具备闭式解形式的双层优化后端提优算法,

高效提升了前端结果轨迹的光滑性和连续性,最后使用全自主四旋翼飞行器在室内外复

杂环境进行了实时重规划的高速导航飞行测试。

3.在层级式规划的基础上,针对在障碍物窄缝等环境中求解低效的问题,我们首先

提出在采样规划中结合双向搜索与快速求解的局部优化的方法,将快速局部优化构建为

一系列的无约束二次凸优化问题,每轮迭代具有闭式解,接着我们在后端提优时将障碍

物信息构建进性能指标中,同时保有二次规划问题的结构,使得保证求解效率的同时成

功率更,由此增强了采样类前端以及后端提优的效率与性能,更好地满足实时重规划的

需求。最后在实物四旋翼飞行器上进行导航测试,在稠密障碍物、类迷宫等环境中验证

了所提出规划方法的有效性。

4.对于未知环境下对全局参考轨迹的时空跟踪规划情形,针对避障时规划结果不连

贯的问题,我们定义了轨迹间的丁.拓扑连贯关系,提出考虑拓扑连贯性的采样类动力学

119

万方数据
浙江大学博士专业学位论文 7总结与展望

规划算法,增加了连续重规划之间的路径拓扑一致性,使得整体导航过程中避障时轨迹

更加顺滑,更加安全。面对时空上贴合参考轨迹与避障等具有冲突性质的约束,我们提

出自适应末端状态的重规划轨迹优化方法,在安全避障的前提下减小了实时跟踪误差,

并在线搜索时根据丁一拓扑连贯关系计算最大步长,保持优化的结果轨迹与初值轨迹处

于同一拓扑路径。最后在接近真实的仿真导航系统中验证了所提出的轨迹跟踪算法。

7.2将来工作展望

对于多旋翼飞行器自主导航系统,针对运动规划层面,我们认为还可在多个方面展

开研究,包括但不限于以下几点:

1.从系统可靠性的角度,考虑到感知与控制均有误差,可以对考虑不确定性的运动

规划算法开展研究。本文所研究内容需要大致可靠的上游感知和较为稳定的底层控制支

持,然而真实工况中存在感知高度不准确以及部分控制失效的情况,开发考虑感知不确

定性以及运动不确定性的规划算法能够对极端情况下的飞行作业提供一些安全保证。

2.从学科发展趋势的角度,随着大数据时代的到来,各类数据的获取越来越便捷,
硬件计算能力不断提高,可以对数据驱动的运动规划算法开展研究。本文所研究的规划

算法基于控制理论、优化理论等思想,偏向传统学院派的方式,虽然可解释性较强,但

存在调参繁杂、难以考虑周全等缺点,而基于数据的开发能够利用算力提高开发效率,

发现一些单纯靠人工设计难以考虑到的情况,例如使用端到端强化学习的导航规划方法

在限定场景中能够取得好的效果,或是利用以往知识(即数据)对特定情形下的启发式

函数进行精确估计。

3.从应用发展趋势的角度,许多场景对人机协同作业,或是多机协同作业的需求越

来越大,可以对协同规划算法开展研究。本文所研究的算法针对单机规划,能使单智能

体具有高度自主及智能性,对于人在回路或是多智能体的规划研究,则需从人机交互、

行为预测、信患通信、博弈等角度进行思考。

万方数据
浙江大学博士专业学位论文 参考文献

参考 文献
【l】 Richter C,Bry A,Roy N.Polynomial Trajectory Planning for Aggressive Quadrotor Flight in Dense
Indoor Environments【C]llProc.ofthe Intl.Sym.ofRobot.Research.2013:649-666.

【2】 Bry A,Richter C,Bachrach A,et a1.Aggressive flight offixed-wing and quadrotor aircraR in dense
indoor environments[J].Intl.J.Robot.Research(IJRR),2015,34(7):969-1002.

【3】 Wang Z,Zhou X,Xu C,et a1.Alternating Minimization Based Trajectory Generation for Quadrotor
Aggressive Flight[J].IEEE Robotics and Automation Letters,2020,5(3):4836-4843.
【4】 Rtsmann C,Hoffinann F,Bertram T.Integrated online trajectory planning and optimization in dis-
tincfivetopologies[J].Robotics and Autonomous Systems,2017,88:142-153.DOI:https://doi.org
/10.1016/j.robot.2016.1 1.007.
【5】 Pham Q C.A General,Fast,and Robust Implementation ofthe Time-Optimal Path Parameterization

Algorithm[J].IEEE Transactions on Robotics,2014,30(6):1533-1540.DOI:10.1 109/TRO.2014.2


351113.

0毋 Donald B,Xavier P,Canny J,et a1.Kinodynamic motion planningp].Journal ofthe ACM(JACM),


1993,40(5):1048-1066.
0刀 Bellman R.On the Theory ofDynamic Programming[I].Proceedings ofthe National Academy of
Sciences ofthe United States ofAmerica,1952,38(8):716-719.

●观 SvestkaP.Onprobabflisticcompletenessandexpectedcomplexityforprobabilisticpathplanning叨.,
1996.
LavaUe S M.Planning algorithms[M].Cambridge tuff.press.2006.
●n 观∞ KavrakiL,Sves&aP,LatombeJC,etal.Probabilisticmadmapsforpathplanninginhigh-dimensional
configuration spaces[J].IEEETransactionsonRoboticsandAutomation,1996,12(4):566—580.DOI:
lO.1109/70.508439.
LaValle S.Rapidly-exploring random trees:A new tool for path
plannmg阴.,1 998.
口n U习 KaxamanS,FrazzoliE.Sampling-basedalgorithmsforoptimalmotionplanning[J].111eInternational
Joumal ofRobotics Research,201 l,30:846.894.
n∞ Arslan O,Tsiotras P.Use of relaxation methods in sampling-based flgofithn岱for optimal motion
planning[C]//2013 IEEE International Conference 011 Robotics and Automation.2013:2421-2428.
DOI:10.1】09/I(、RA.20l 3.6630906.

[14] Jan.son L,Schmcrling E,Clark A,et a1.Fast marching竹∞:A fast marching sampling-based method
for optimal motion planning in many dimensions[I].The Intornational JonmaI
ofRobotics Research.
2015,34(7):883-921.DOI:10.1177,0278364915577958.
[15] Sniedovich M.DijksU'a’S algorithm revisited:the dynamic programming connexion[J].Control and
Cybernetics。2006。35:599-620.
[161 Dijks廿a E W,ct a1.A note on two problems in connexion with graphs[J].Numcrische mathematik,
1959,l(1):269-271.
【171 Crammell J D,Srinivasa S S,Barfoot T D.Batch Informed Trees唧T+):Sampling-based
optimal
planning via the heuristically guided search of implicit random geometric graphs[C]//2015 IEEE
International Conference on Robotics and Automation(ICRA).2015:3067.3074.DOI:lO.1 109HC
RA.2015.7139620.

[1 8】G-ammell J D,Barfoot T D,Srinivasa S S.Batch Informed Trees∞IT+):Informed asymptotically


optimal anytime search[J].The International Journal of Robotics Research,2020,39(5):543・567.
DOI:10.1177/0278364919890396.
[19] Koenig S,Likhachev M,Furcy D.Li危Iong planning A+阴.Artificial Intelligence,2004,155(1-2):
93.146.

[20】 KuffnerJ,LaValleS.RRT-connect:Anefficientapproachtosingle-querypathplanning[C]//Proceedings
2000 ICRA.Millennium Conference.IEEE Intemational Conference on Robotics and Automation.

Symposia Proceedings化at.No.H37065):v01.2.2000:995-1 001 v01.2.DOI:10.1 109/ROBOT


.2000.844730.

121

万方数据
浙江大学博士专业学位论文 参考文献

f211 Cheng A,Saxena D M,Likhachev M.Bidirectional Heuristic Search for Motion Planning with all
Extend Operator[C]//2019 IEE朗tSJ
Intemational Conference on Intelligent Robots and Systems.
IROS 2019,Macau,SAR,China,November 3-8,2019.IEEE。2019:7425—7430.DOI:lO.1 109/IRo
s40897.2019.8967796.

[22】 日eml'n S,Oberl{inder J,Hcrmann A,et a1.mH口.Connect:Faster,asymptotically optimal motion


planning[C]//2015 IEEE Intemational Conference on Robotics and Biomimetics(ROBl01.2015:
1670—1677.DOI:10.1109/ROBIo.2015.7419012.

[23】 陈瑛.航天器交会与接近操作采样运动规划与控制[D].哈尔滨工业大学,2020.
[24】 Blochliger F,Fehr M,Dyraczyk M,ct a1.Topomap:Topologicai Mapping and Navigation Based on
VisualSLAMMaps[C]//2018IEEEInternationalConfefenceonRoboticsandAutomation(ICRA).
2018:3818-3825.DOl:10.1109/ICRA.2018.8460641.

[25】 Cover H,Choudhury S,Schcrcr S,et a1.Sparse Tangential Network(SPARTAN):Motion planning


for micro aerial vehieles[C]//Proc.of也e IEEE Intl.Con£on Robot.and Autom.2013:2820.2825.

【26】 OleTnikova H,Taylor Z,Siegwart R,et a1.Sparse 3D Topological Graphs for Micro-Aerial Vehicle
Planning[Cl//Proc.ofthe IE]卧SJ
Intl.Conf on Intell.Robots and Syst.2018:1.9.
f271 Ye H。Zhou X。W缸g Z,et a1.TGKIPlanner:An E伍cient Topology Guided Kinodynamic Planner
for Autonomous Quadrotors[/].IEEE Robotics and Automation Letters,2021,6(2):494-501.DOI:
lO.1109几RA.2020.3047798.
【28】 Zucker M,Kuffaler J,Bagnell J A.Adaptive workspace biasing for sampling-based planners[C]//
2008 IEEE International Conference on Robotics and Automation.2008:3757.3762.

『29] Arslan O。Tsiotras P.Machine learning guided exploration for sampling-based motion planning a1.

godthms[C]//2015皿醐tSJ International Conference on Intelligent Robots and Systems(mos).


201 5:2646.2652.

[30】 Zhang C,Huh J,Lee D D.Learning Implicit Sampling Distributions for Motion Planning[C]//2018

mEBIRSJ International Conference on Intelligent Robots and Systems(IRoS).2018:3654—3661.


DOI:10.1109/IROS.2018.8594028.
f3 11 Ichter B,Sehmerling E。Lee T W E,et a1.Learned Critical Probabilistic Roadmaps for Robotic Mo.
tion Planning[C]//2020 m髓International Conference on Robotics and Automation(ICRA).2020:
9535.9541.DOI:10.1109/ICRA40945.2020.9197106.
【32】 Cheng&Shankar】('Burdick J W.Learning an Optimal Sampling Distribution for E伍cient Morion
Planning[C]//2020ⅢE剐RsJ International Conference on Intelligent Robots and Systems(IROSl.
2020:’7485.7492.DOI:10.1109/IRO¥45743.2020.9341245.

【33】 Qureshi A H,Miao Y,Simeonov A,ct a1.Motion Planning Networks:Bridging the Gap Between
Learning.Based and Classical Morion Planners[/].IEEE Transactions 0n Robotics。202l,37n1:48.
66.DOI:lO.1109厂1R0.2020.3006716.

【34】 Gammell J D,Srinivasa S S,Barfoot T D.Informed IU盯+:Optimal sampling-based


path planning
focused via direct of an admissible ellipsoidal heuristic[C]//Proe.of the IEEE『RSJ Intl.
sampling
Cone on Intell.Robots and Syst.Chicago,IL,2014:2997.3004.
『351 Strub M,Gammell J.Adaptively Informed 1hes(AIT+):Fast Asymptotically Optimal Path Planning
through Adaptive HeuristicsrC]/I.2020:3191.3198.DOI:10.1 109/ICRA40945.2020.9197338.
【36】 StrubMP,GammellID.刖陌。锄dElT‘:Asymmetricbidirectionalsampling-basedpathplanning[/].
The International Journal ofRobotics Research(IJRR),2022.

[371 Boeuf A,Cortts J,Alami K ct a1.Planning agile motions for quadrotors in constrained environ=

ments[C]//2014ⅡmDRSJInternationalConfercnceonIntelligentRobotsandSystems.2014:218.
223.DOI:10.1109/IROS.2014.69425“.
『38] Boeuf A,Cortts J’Alami R,et a1.Enhancing sampling-based kinodynamic motion planning for
quadrotors[C]//2015IEEE/RSJInternationalConferenceonIntelligentRobotsandSystemstIROS).
2015:2447.2452.DOI:10.1 109,IROS.2015.7353709.

『39] Beul M,Behnke S.Fast伽l state trajectory generation for multirotors[C]//2017 International Con.
ference on Unmanned Aircraft Systems CICUAS).2017:408-416.DoI:10.1109/ICUAS.2017.7991
304.

122

万方数据
浙江大学博士专业学位论文 参考文献

『401 BeulM,BehnkeS.FastTime-optimalAvoidanceofMovingObstaclesforHigh-SpeedMAV Fli曲t[c]//


2019 IEEE瓜SJ International Conference on Intelligent Robo协and Systems(IROS).2019:7240-
7247.DoI:10.1109/IRO¥40897.2019.8968103.
f411 Ranscher F,Sawodny O.Efficient Online Trajectory Planning for Integrator Chain Dynamics using
Polynomial Elimination们.ArXiv preprint arXiv:2012.07029,2020.
f421 Li Y。Littlefield z’Bekris K E.Sparse methods for efficient asymptotically optimal bnodynamic

planning[GI//AIgofithmic foundations ofrobotics XI.Springer,2015:263-282.


『431 W曲b D J.van den Berg J.Kmodynamic RRTo:Asymptotically optimal motion planning for robots
with linear dynamics[C]//eroc.of the正EE Intl.Conf.on Robot.and Autom.2013:5054-5061.
DOI:lO.1 109,lCRA.2013.6631299.

|“】 Zheng D,Tsiotras P.Accelerating Kinodynamic砒盯o Through Dimensionality Reduction[C]//


202l IEEE,RSJ International Conference on Intelligent Robots and Systems(tooSl.2021:3674—
3680.DOI:10.1109,瓜O¥51 168.2021.9636754.
『451 Perez A,Platt R,Konidaris G,et a1.LQR-RRT*:Optimal sampling-based motion plarming wim
automatically derived extension heuristics[C]//2012耻E
International Conference on Robotics
and Automation.2012:2537-2542.DOI:10.1 109/ICRA.2012.6225177.
『46] Karaman S.Wmter M氏Perez A。et a1.Anytime motion planning using the m盯[C]//Proc.of the
ⅢEE Intl.Conf.on Robot.and Autom.201 l:1478-1483.
f471 Hart P E,Nilsson N J。RaphaeI B.A formal basis for the heuristic determination of minimmn cost

paths[J].IEEE transactions on Systems Science and Cybernetics,1968,4(2):lOo-107.


『481 Likhachev M。Ferguson D.Planning long dynamically feasible maneuv睨's for autonomous vehi-

cles[J].Thc International Journal ofRobotics Research,2009,28(8):933-945.


『491 Zhang J,Chadha R G。Velivela V,et a1.P-CAP:Pre-Computed Alternative Paths to Enable Aggres-
sive Aerial Maneuvers in Cluttered Environments[C]//2018 IEEE瓜SJ International Conference on
Inteiligent Robots and Systems OROS).2018:8456.8463.DOI:lO.1109假OS.2018.8593826.
【50] Zhang J,chadha K、,clivela v,et a1.PCAL:Pre-computed Alternative Lanes for Aggressive Aerial
Collision Avoidance[C]//.2019.

f51] Zhang J,Hu C,Chadha R G,et a1.Maximum Likelihood Path Planning for Fast Aerial Maneuvers
and Collision Avoidanca[C]//2019Ⅱ匹l汰SJ International Conference on Intelligent Robots and

Systems 0Ros).2019:2805-2812.DOI:10.1109/琢DS40897.2019.8967828.
『521 Zhang J。Hu C,Chadha&et a1.Falco:Fast likelihood-based collision avoidance with extension to
human.guided navigation[J].Journal ofField Robotics,2020.37.DOI:lO.1002/rob.21952.
『531 Dolgov D.Thnm S。Montemeflo M。et a1.Path planning for autonomous vehicles in unkIIown semi-
structuredenvironments[J].TheInternational JournalofRoboticsResearch,2010,29(5):485-501.
【54】Liu S,Mohta K,Atanasov N,et a1.Search-Based Motion Planning for Aggressive Flight in SE(3)【J】.
IEEE Robotics and Automation Letters,2018,3(31:2439-2446.D0l:10.1 109,I.RA.2018.2795654,

『551 Liu S.Atanasov N。Mohta K,et a1.Search-based Motion Planning for Quadrotors璐ing Linear

Quadratic Minimum Time Control[C]//Proc.ofthe 1日;E/RSJ Infl.Conf’on Intell.Robots and Syst.


2017:2872.2879.

【56]FU哐SS M,L色VDIE J,MAR:兀N P,et a1.Flatness and defect ofnon-linear systems:introductory


theory and examplesfJ].International Journal ofControl。1995。61(6):1327.1361.DOl:10.108刚∞
207179508921959.
『571 Zhou B,Gao F.Wang L,et a1.Robust and e施eient quadrotor trajectory generation for fast all-

tonomous flight[J】.皿E Robotics and Automation Letters,2019,4(4):3529-3536.

『581 Likhachev M。Gordon G J。Thrun S.ARA’:Anytime A’with provable bounds on sub-optimality[C]//


Advances in NeuraI Information Processing Systems.2∞4:767-774.
f591 Mellinger D,Kumar V.Minimum snap trajectory generation and conU'ol for quadrotors[C]//Proc.
oftheIEEEInti.Conf.onRobot.andAutom.Shanghai.China,20ll:2520.2525.
f601 Deits R,Tedrake R.Computing large convex regions of obstacle-free space through semidefinite

programming[G]//Algorithmic Foundations ofRobotics XI:v01.107.Springer,2015:109-124.

[611 Deits k Tedrake R.Efficient Mixed-Integer Planning for UAVs in Cluttered Environments[C]//
Proe.oftheⅡ呢E Intl.Conf.on Robot.and Autom.Seattle。Washington,USA,2015:4249.

123

万方数据
浙江大学博士专业学位论文 参考文献

[62】Landry B,l:)eits R,Florence P R,et a1.Aggressive quadrotor flight through cluttered environments
using mixed integer programming[C]//201 6 IEEE International Confefence on Robotics and Au-
tomation(ICRA).2016:1469.1475.DOI:10.1109/!CRA.2016.7487282.
[63】 GaG F,Wang L,Zhou B,et a1.Teach-Repeat-Replan:A Complete and Robust System for Aggressive
Hight in Complex Environments叨.IEEE Transactions on Robotics。2020,36(5):1526.1545.DOI:
lO.11供I门『l的.2020.2993215.
f641 Verscheure D,Demenlenaere B,Swevers J,et a1.Time-optimal path tracking for robots:A convex

optimization approach[J].IE髓Transactions on Automatic Contr01.2009.54(I∞:2318-2327.

『651 Oleynikova H,Burri M,Taylor Z,et a1.Continuous-time trajectory optimization for online UAv
lEE日RSJ Intl.Conf.on Intell.Robots and Syst.Daejeon.Korea,2016:
replanning[C]/IProc.ofthe
5332-5339.

【66】Usenko V,von Stumberg L,Pangercic A,et a1.Real-time trajectory replanning for MAVs using
uniform B-splines and a 3D cffcular buffer[C]//Proc.ofthe IEEE』RSJ Inti.Cone on Intell.Robots
and Syst.2017:215-222.
『671 Choudhury S。Gamrnell J D。Barfoot T D。et a1.Regionally accelerated batch informed trees(RA.
Bn’+、:A framework to integrate local information into optimal path planning[C]//2016髓E
In-
tematio岫l Conference on Robotics and Automation(ICRA).2016:4207—忆14.DOI:lO.1 109,ICR
A.2016.7487615.
『681 Zucker M,Ra廿ifrN,Dragan A D。et a1.Chomp:Covariant hamiltonian optimization for motion
plauning[j].TheInternational JournalofRoboticsResearch,2013,32(9.10):1164.1193.
【69]KimD,KwonY。YoonS.DancingPRM*:SimultaneousPlanningofSamplingandOptimizationwith
Configuration Free Space Appmximation[C]//201 8 IEEE Intemational Conference on Robotics and

Automation(ICRA).2018:7071-7078.DOI:10.1109/ICRA.2018.846318l,
『70] Kim D'Kang M,Yoon S.Volumetric Tree*:Adaptive Sparse Graph for Effective Exploration of

HomotopyClasses[C]//2019压E日RSJInternationalConferenceonIntelligentRobotsandSystems
gROS).2019:1496.1503.DOI:10.1109/IRoS40897.2019.8967728.
【71]Hauer F,Tsiotras P.Deformable Rapidly-Exploring Random Trees[C]//Proceedings of Robotics:
Science and Systems.Cambridge,Massachusetts,2017.DOI:10.15607瓜SS.2017.ⅫI.008.

172] Shirai Y,Lin X,Mehta A,et a1.LTo:Lazy Trajectory Optimization with Graph-Search Planning for

High DOF Robots in Cluttered Environments[C]//2021 I眦International


Conference on Robotics
and Automation gfRA).2021:7533-7539.DOI:10.1109忸CRA48506.2021.9561502.
【73]Cohen B,phillips M,Likhachev M.Planning Single-arm Manipulations with n-Ann Robots[C]//
Proceedings ofRobotics:Science and Systems(RSS’14).2014.

【74】Natarajan凡Choset H,Likhachev M.Interleaving graph search and trajectory op血nization for ag-
gre路ive quadrotor nightff].髓E Robotics and Automation Letters,2021,6(3):5357-5364.
『751 Pohl I.First results on the effect of el'rot in heuristic searchfJl.Machine Intelligence。1970。5:219-
236.

【761 Rfidiger E,RolfD.Weighted A+search—relying view and application[J].Artificial Intelligence,


2009.173(14):1310-1342.DOI:https://doi.org/10.1016/j.artinL2009.06.004.
『771 MueHer M w,Helm M,D’Andrea R.A computationally e伍cient motion primitive for quadrocopter
trajectory generation[J].m髓Transactions on Robotics,2015。3l(6):1294.1310.
『781 Fen'in J,Leishman&Beard氏et a1.Differential flatness based controI ofa rotorcrafl for aggressive

manenvers[C]//201l啦E/RsJ International Conference on Intelligent Robots and Systems.2011:


2688-2693.DOI:lO.1109/ⅡtOS.201 1.6095098.

『791 Faessler M。Franchi A。Scaramuzza D.Differential Flatness ofQuadrotor Dynamics Subject to Rotor

Drag for Accurate Tracking ofHigh-Speed Trajectories[J].IEEE Robotics and Automation Letters,
2018,3∞:62晰26.DOI:lO.1109/I凰A.2017.”76353.
【801 WattersonM,KumarV.Controlofquadrotorsusingthehopffibrationon so(3)【q//RoboticsRe-
search.Springer,2020:199-215.
[81】 Vince J.Quaternions for Computer Graphics[M].Springer,201 1.

IS2】 Elfes A.Using occupancy grids for mobile robot perception and navigation[J].Computer,1989,
22(6):4657.

124

万方数据
浙江大学博士专业学位论文 参考文献

[83] Oleynikova H。Millane A,Taylor Z。et a1.Signed Distance Fields:A Natural Representation for Both
Mapping and Plarming[C]//RSS Workshop:Geometry and Beyond・Representations,Physics,and

Scene Understanding for Robotics.20 l 6.

[84】 D.Berg M,Marc V K,Mark O,et a1.Computational geometry[M].Springer,2000.


[85】 Hall L,Gao F,Zhou B,et a1.FIESTA:Fast Incremental Euclidean Distance Fields for Online Motion

Planning ofAerial Robots[C]//2019 IEEE/RSJ IntemafionaI Conference on Intelligent Robots and


Systems(Ⅱl-oSl.2019:4423.4430.DOI:10.1109偶0¥40897.2019.8968199.
Felzenszwalb P F,Hutteniocher D P.Distance Transforms of Sampled Functions[J/oLl.Theory of

Computing,2012,8(19):415.428.hap://www.theoryofcomputing.org/articles/v008a019.DOI:
10.4086/toe.2012.v008a019.

【87] Boeuf A,Cortes J,Alami&et a1.Planning agile motions for quadrotors in constrained environ-

ments[C]//Proc.ofthe IEE]傩J Intl.Conf.on Intell.RoboB and Syst.Chicago.IL,2014:218-223.


[88] Beul M.Behnke S.Analytical time.optimal trajectory generation and control for multirotors[C]//
2016 International Conference on Unmanned Aircraft Systems(ICUASl.2016:87.96.DOI:10.1lO
9/ICUAS.2016.7502532.

[89] Beul M.Behnke S.Fast Time.optimaI Avoidance o胝ving Obstacles for High-Speed M怂,Flight[C]//
2019 IEEE,RSJ International Conferenee on Intelligent Robots and Systems(mos).2019:7240-
7247.DOI:10.1109/mO¥40897.2019.8968103.
【90] Berscheid L.Kr69et T.1erk-limited Real-time Trajectory Generation with Arbitrary Target States[J].
ArXiv.202l。abe2105.04830.
【91】 Haschke R,Weitnauer E,Ritter H.On-line planning ofrime—optimal,ierk-limimd trajectories[C]//
2008 IEEE瓜SJ International Conference on Intelligent Robots and Systems.2008:3248-3253.DOI:
10.1109/IROS.2008.4650924.

[92] W^NG Y S,SUN L,ZHOU L,et a1.Online Minimum.acceleration Trajectory Planning with the
Kinematic Constraints[J].Acta Automatica Sinica,2014.40(n:1328.1338.DOI:https://doi.org/10

.1016/S18件1029(14160014-8.
[93] Vinter R.Optimal con缸,01.Reprint ofthe 2000 ed[M1.2010.DOI:10.1007/978.0.8176.8086.2.
【94] 吴冰.自主泊车的最优轨迹规划与跟踪控制研究【D】.合肥工业大学,2021.
[95】 Tordesillas J.Lopez B T.How J P.FASTER:Fast and Safe Trajectory Planner for Flights in Unknown

Envkonmenm[C]//Proc.oftheⅡIE吣J Intl,Coaf,Oll Intell.Robots and Syst.2019.


[96】 Liu S,Watterson M.Mohta K,ct a1.Planning Dynamically Feasible Trajectories for Quadrotors using
Safe Flight Corridors in 3-D Complex Environments[J].IEEE Robotics and Automation Letters(RA-
L1.2017:1688-1695.
【97] W抽g Z,Zhou X,Xu C,et a1.Geometrically constrained trajectory optimization for multicopters[J].
ArXiv prcprmt arXiv:2103.00190。2021.

[98】 李柏.复杂约束下自动驾驶车辆运动规划的计算最优控制方法研究【D】.浙江大学,2018.
【99】 张洪钺,王青.最优控制理论与应用IM】.2006.
【100】 Schmerling E,Janson L.Pavone M.Optimal sampling-based motion plarming under differential con-

straints:Thedriftcasewithlinearaffmedynamics[C]//201554thIEEEConferenceonDecisionand
Control(CDCl.2015:2574.2581.DoI:10.1109/CDC.2015.7402604.
【101】 Ye H,Zhou X,Wang Z.et a1.TGK-Planner:An Emeieut Topology Guided Kinodynamic Planner
for Autonomous Quadrotors[J].IEEE Robotics and Automation Letters,202l,6(2):494—501.DOI:
10.1 109,I.R A.2020.3047798.

【102】 Verriest E.Lewis F.On the linear quadratic minimnm-time problem[J].IEEE Transactions on Auto-
marie Control,l 991,36(7):859-863.DOI:l O.1l 09/9.85066.

【103】 Li Y,Littlefield Z,Bdcris K E.Asymptotically optimal sampling-based kinodynamic plarming[J/OL]


The Intemational loumal ofRobotics Research,2016,35(5):528.564.https://doi.org/10.1 177/0278
364915614386.DOI:10.1177/0278364915614386.

[104] Burke D。Chapman A,Shames I.Generating Minimum.Snap Quadrotor Trajectories Really Fast[C]//
2020 IEEE/RSJ International Conferenee on Intelligent Robots and Systems 0ROSl.2020:1487.
1492.DOI:10.1 109/ⅡtO¥45743.2020.9341794.

125

万方数据
浙江大学博士专业学位论文 参考文献

[105】 Burri M。Oleynikova H,Achtelik M,et a1.Real—time visual-inertial mapping,re.10calization and


planning onboard M AVs ia unknown environments[C]//Proe.ofthe IEEE/RSJ Intl.Conf.on Inteil.
Robots and Syst.Hamburg,Germany。201 5.

【106】 Wang Z,Ye H,xu C,et a1.Generating Large・Scale Trajectories Efficiently using Double Deserip-
tiom ofPolynomials[C]//2021 IEEE International Conference on Robotics and Automation(ICRA).
2021:7436.7442.DOI:10.1109/ICRA48506.2021.9561585.

【107】 SchappelleR.TheinverseoftheconfluentVandermondematrix[J].IEEETransactionsonAutomatic
Control,1972,17(5):724.725.DOI:10.1109几~C.1972.1100129.
【108】 Teo K,Rehbock V。Jennings L.A new computational algorithm for funcfionaI inequality constrained

optimization problems[J].Automatica,1993,29(3):789-792.DOI:https://doi.org/10.1016/0005-10
98(93)90076-6,
【109】 Too K,Yang X,Jermings L.Computational Diseretization Algodthms for Functional Inequality Con—
strained Optimizafion[J】.Annals ofOperations Research,2000,98(1-4):215.234.

【110】 Oleynikova H,Taylor Z,Fehr M,et a1.Voxblox:Incremental 3D Euclidean Signed Distance Fields
for on-boardM戳plarming[C]//2017 IEEE/RSI Intemational Conference on IntelligentRobots and

Systems(tooSl.2017:1366.1373.DOI:10.110呱oS.2017.8202315.
Chapra S。Canale R.Numefical Methods for Engineers[M].McGraw Hill,2014.
FletcherR f.Practical methods ofoptimizafion[M].Wiley,1987.
ⅢⅢⅢ U刁习 Haarala N。Miettinen K Miilcel5 M.Globally convergent limited memory bundle method for large.
scale nonsmooth optimization[J].Mathematical Programming,2007,109:181-205.

Ⅲq Johnson S G.111e NLopt nonlinear-optimization package[C/OL]//.http://github.com/stevengi/nlo

pt.

Ⅲ习 Gurobi Optimization,LLC.Gurobi Optimizer Reference Manual[EB/OU.2022.https://www.guro


bi.tom.
Thnm S.Burgard W,Fox D.Probabilistic Robotics[M].2005.
ⅢⅢ q刀 Stoneman S.Lampariello R.Embedding nonlinear optimization in RRT’for optimal kinodynamic

plarming[C]//53rd疆EE Conference on Decision and Contr01.2014:3737-3744.D01:10.I 109/CD


C.2014.7039971.

[118】 C,Alterovi乜R.Interleaving Optimization with Sampling-Based Motion Planning


Kuntz A,Bowen
(IOSm删:Combining Local Optimizati伽、^rith Global Exploration[J/OL].,2016arXiv:1607.0637
4.http://arxiv.org/abs/1 607.06374.
[119】 Zhou X,Wang Z,Yj H,ct a1.EGO.Planner:An ESDF-Free Gradient-Based Local Planner for
Quadrotors[J].IEEE Robotics and Automation Letters,2021,6(2】:478-485.DOI:10.1109/LRA
.2020.3047728.

[1201 Batkovic L Ali M,Falcone P。et a1.Safe Trajectory Tracking in Uncertain Environments[EB/OL].
arXiv.2020.https://arxiv.org/abs/2001.11602.

[121】 Febbo H,Lin J,Jayakumar P,et a1.Moving obstacle avoidance for large,high—speed autonomous
ground vehicles[C]//2017 American Control Conference fAcc).2017:5568.5573.DOI:10.23919
/ACC.2017.7963821.

Rodriguez.Seda E J.Decentralized trajectory tracking with colliSion avoidance control for teams of
unmanned vehicles with constant speed[C]//2014 American Control Conference.2014:1216.1223.
DOI:10.1109/ACC.2014.6859184.

[123】 Rodriguez.Seda E J.Dawkins J J.Dccentralized Cooperative CoUision Avoidance Control for Un-
manned Rotorcraft with Bounded Acceleration[J].Journal of Guidance,Control,and Dynamics,
201 8,41(111:2445.2454.DOI:l O.25 14/1.G003430.

[124】 SterOid S,N敏eli T。Alonso-Mom J,et a1.Sample


E伍cient Learning ofPath Following and Obstacle
Avoidance Behavior for Quadrotors[J].IEEE Robotics and Automation Letters,201 8,3(4):3852・
3859.DOI:10.1 109/I,RA.2018.2856922.

[125】 Zhang T,Kahn G.Levine S。et a1.Learning deep control policies for autonomous aerial vehicles谢m
h口C-guided policy search[C]//2016观E International Conference on Robotics and Automation
(ICRA).2016:528.535.DOI:10.1109/ICRA.2016.7487175.

126

万方数据
浙江大学博士专业学位论文 参考文献

【126] Liu X,Zhang M,Rogers E.Trajectory Tracking Control for Autonomous Underwater V曲icles Based
on Fuzzy Rc-Planning ofa Local Desired TrajectoryrJl.1EEE Transactions on v曲icular Technology,

2019。68(12):11657-11667.DOI:10.1 109厂TVT.2019.2948153.
【127] Subosits J k Gerdes J C.From the Racetrack to the Road:Real-Time Traieetory Replanning for
Autonomous Driving[J].ⅢEE Transactions on IntelligentⅥ出icles,2019,4(2):309—320.DOI:10.1
109/TIV.2019.2904390,

[128] 争enba§lar B,H抽ig w,Ayanian N.RLss:Real-time Multi・Robot Trajectory Replanning using Lin・
earSpatialSeparations[J[.ArXive-prints,2021.arXiv:2103.07588:arXiv:2103.07588arXiv:2103.0
7588 Its.R0].

【129] Knepper R,Srinivasa S,Mason M.An Equivalence Relation for Local Path Sets[Cl//:v01.68.201 O:
19-35.DOI:10.1007/978—3-642—17452一O 2.

【130] Knepper R A,Mason M T.Improved hierarchical planner performance using local path equiva-
lence[C]//201 1 lEEE,RSJ Intemational Conference on Intelligent Robots and Systems.201 1:3856.
3861.DOI:10.1109/IROS.2011.6095126.

【1311 Knepper R A,Srinivasa S S,Mason M T.Toward a deeper understanding of motion alternatives


via all equivalence relation on Iocal paths[/].The International Joumal ofRobotics Research。2012.
3l(2):167-186.DOI:10.1177,0278364911430418.
【132] Chen Q,Lu Y,Wang Y,et a1.From topological map to local cognitive map:a new opportunity of
local path planning[J].Intelligent Service Robotics,2021,14(2):285—301.DOI:10.1007/sl 1370—02
1-00352-z.

[133] Bhattacharya S,Lildaachev M,Kumar V R,Topological constraints in search.based robot path plan.
ning[J].Autonomous Robots,2012,33:273—290.
[134] Jaillet L.Simeon T.Path Deformation Roadmaps:Compact Graphs with Useful Cycles for Motion

Planning;叨.The International Journal ofRobotics Research,2008,27(11.12):1175.1188.DOI:10


.1177/0278364908098411.

【135] 0uispe A H,Kunz T,Stilman M.Generation ofdiverse paths in 3D environments[C[//20 l 3 IEEE/RSJ


Intemational Conference on IntelligentRobors and Systems.2013:5994.5999.DOI:10。1109/ⅡlOS
.2013.6697226.

[136]Yi D,Goodrich M A,Seppi K D.Homotopy—aware RRT+:Toward human—robot topological path-


planning[C[//2016 1 lth ACM/IEEE International Conference OH Human-Robot Interaction(I-m0.
2016:279.286.DOI:10.1109棚.2016.7451763.
【137] Zhou B,Pan J,Gao F,et a1.RAPTOR:Robust and Perception-Aware Trajectory Replaoning for

Quadrotor Fast Flight[J].IEEE Transactions on Robotics,2021,37(6):1992-2009.DOI:10.1 109/T


RO.2021.3071527.

[138] Zbou B,Gao F,Pan J,et a1.Robust Real-time UAV Replanning Using Guided Gradient-based Opri.
mization and Topological Paths[C[//2020 IEEE Intemational Conference on Robotics and Automa-

tion(ICRA).2020:1208—1214.DOI:10.1 109/ICRA40945.2020.91 96996.


【139] Lewis A S,Ovcrton M L.Nonsmooth optimization via quasi-Newton methods『J1.Mathematical Pro.

gramming,2013,141(1):135-163.
【140] Nocedal J.Updating quasi-Newton matrices with limited storage[J[.Mathematics of computation,

1980.35(1511:773.782.
[141] ~-mijo L.Minimizafion offuncfiOns having Lipschitz continuous first partial derivatives[J].Pacific
Journal ofMathemaries,1966,l 6f11:1-3.

【142] Wblfe P.Convergence Conditions for Ascent Methods[J].SL州Review,1969,11f2):226.235.

万方数据
浙江大学博士专业学位论文 参考文献

128

万方数据
浙江大学博士专业学位论文 附录

附录

A 固定步长采样泛函积分的连续不可徼性

给定一段多项式轨迹p(£),t∈【0,卅,其系数向量为c。记任一以其为参数的泛函为
G(c,T,t),按固定时间I'a-J隔6取t在其上采样,使用梯形积分计算出轨迹的一个代价值,

如图A.1所示,记作如下:

歹(c,T,6)=6∑wjG(c,T,J6)
J20
(A一1)

+;(T—n占)【毋(c,T,n占)+毋(c,T,T)],礼=l了T
其中n=【叫副为采样点个数,(CdO,u1,…,%一,,%)=(1/2,l,・一,1,1/2)为梯形求积
法则中的系数。

-Ⅵv’~V 、

.八


\厂√
U /l

简絮吵罔6日6硝6两6吲6
I I

I 莩 。一Il
t=-85 t

图A.1固定步长采样泛函积分牙}意图

有如下命题成立:

命题2.若泛函9(c,T,t)关于c和T连续,则函数S(c,T,6)关于c和T连续。

证明.将T视作常量,当T不变时,采样点个数n不变,若泛函a(c,T,t)关于c的变

化连续,则显然函数了(c,T,J)关于c连续。

将C视作常量,当T变化时,采样点个数几可能变化,取莱一

T=丑=k8+6一E,k∈N+, (A一2)

129

万方数据
浙江大学博士专业学位论文 附录

其中e为正无穷小量,此时n=后,函数了(c,T,d)计算为


况cc,正,6,=6
一k-1:9
cc,正,J∞+互19
cc,丑,七∞]。A一3,
+三(6一e)【夕(c,矗,忌6)+9(c,rl,kcf+5一e)】.
取另一

T=T2=凫6+6, (A一4)

此时n=七十1,函数J(c,正,J)计算为

孙剐=6防删+圭j=l绯忍弼垮1㈦驸川)] (A-5)

当e趋近于0时,即在采样点个数礼发生变化的时刻点处,计算历(c,丑,巧)与

况(c,死,6)的极限值,若二者相等,则说明函数歹(c,T,6)关于T连续。
由于tim。-+o眵(c,乃,t)一乡(c,正,£)】=0,可计算

l。i.+m。[历(c,丑,6)一况(c,马,6)]
吖)f

2≮滁麓G¨(c,Th,k5+町6T
=0
+言E[夕(c, ,七d)+夕(c, T
,七d+d—E)]}
.㈣

得证。

万方数据
浙江大学博士专业学位论文 攻读学位期间科研成果

作者简历

叶鸿凯,男,浙江云和人,2013年9月至2017年6月就读于浙江大学控制科学与

工程学院,学习自动化(控制)专业,获得工学学士学位。2017年9月保研进入浙江大

学控制科学与工程学院攻读硕士学位,师从许超教授,并于2020年3月转为硕博连读,

师从高飞特聘副研究员、许超教授。攻读研究生学位期间,致力于无人系统自主导航,

尤其是空中机器人运动规划方面的研究。

万方数据
浙江大学博士专业学位论文 攻读学位期间科研成果

132

万方数据
浙江大学博士专业学位论文 攻读学位期间科研成果

攻读学位期间科研成果
1.TGK-Planner:An Efficient Topology Guided Kinodynamic Planner for Autonomous

Quadrotors.IEEE Robotics and Automation Letters.2021,6(2):494-501.(SCI,第一

作者)

2.Learning—based 3D Occupancy Prediction for Autonomous Navigation in Occluded En—

vironments.IEEE International Conference on Intelligent Robots and Systems.2021,

4509-4516.(EI,共同第一作者)

3.Generating large—scale trajectories efficiently using double descriptions ofpolynomials.

IEEE International Conference on Robotics and Automation.202 1,7436-7442.(EI,第

二作者1

4.EGO-Planner:An ESDF—free gradient-based local planner for quadrotors.IEEE Robotics

and Automation Letters.2020,6(2):478-485.(SCI,第三作者)

5.An Experiment Implementation ofOutdoor Formation Flight.IEEE Annual International

Conference on CYBER Technology in Automation,Control,and Intelligent Systems.

2018,93—98.(El,第一作者)

6.Spatio—temporal Deformable Trees for Sampling-based Multirotor Kinodynamic Plan—

ning.IEEE Internmional Conference on Intelligent Robots and Systems.2022,审稿中

(EI,第一作者)

7.Efficient Sampling-based Kinodynamic Planning with Regional Optimization and Bidi—

rectional Search for Multirotors.IEEE International Conference on Intelligent Robots

and Systems.2022,审稿中(El,第一作者)

8.Flexible Local Replanning for Multirotors Trajectory Following.撰写中(第一作者)

9.一种考虑视场角限制以及运动不确定性的结合记忆的旋翼飞行器高速飞行避障方

法:CN 109634301 B 2021.01.26(授权发明专利,第一作者)

133

万方数据
浙江大学博士专业学位论文 攻读学位期间科研成果

10.一种四旋翼飞行器室外编队灯光表演系统及控制方法:CN 10815332782020.05.19

(授权发明专利,第二作者)

11.2017国际空中机器人大赛IARC第一名

12.2018国际空中机器人大赛IARC第一名,第七代任务总冠军(第一完成人)

13.ICRA 2018DJIRoboMaster国际人工智能挑战赛决赛圈(第一完成人)

万方数据

You might also like