You are on page 1of 71

与模式识别相关的学科

• 统计学
• 概率论
• 线性代数(矩阵计算)
• 形式语⾔言

• 机器器学习
• ⼈人⼯工智能
• 图像处理理
• 计算机视觉
• …

2019-9-9 1/71
• 模式识别:

– ⼈人⼯工智能重要的⽀支撑技术

– 迅猛发展

2019-9-9
识别对象: ⼈人、事、物

3
应⽤用实例例

2019-9-9
应⽤用实例例

• 静 简单 -----> 复杂

• 动

5
应⽤用实例例
• ⼯工业

商业 娱乐 智能制造
出⾏行行

6
应⽤用分类

国防
医疗

⽣生活 教育
7
什什么是模式(Pattern)?

2019-9-9 8/71
• ⼴广义地说,存在于时间和空间中可观察的物体,
如果我们可以区别它们是否相同或是否相似,都
可以称之为模式。

• 模式所指的不不是事物本身,⽽而是从事物获得的信
息,因此,模式往往表现为具有时间和空间分布
的信息。

• 模式的直观特性:
– 可观察性
– 可区分性
– 相似性
2019-9-9 10/71
• 模式的表达
– 模式通过数据反映:例例如,图像中的⼀一个对
像或某些感兴趣本质的数量量或结构的描述
– 模式的表达:由⼀一个或多个描述⼦子来组成,
换句句话说,模式表达为⼀一个描述⼦子的序列列
(名词“特征”经常被⽤用来代指描述⼦子)
– 模式被⼀一组特征或⼀一组描述⼦子表达

2019-9-9 11/71
模式识别的概念
• 模式识别 – 直观,⽆无所不不在,“⼈人以类聚,物以群分”
– 周围物体的认知:桌⼦子、椅⼦子
– ⼈人的识别:张三、李李四
– 声⾳音的辨别:汽⻋车、⽕火⻋车,狗叫、⼈人语
– ⽓气味的分辨:炸带⻥鱼、红烧⾁肉

• 模式识别的定义
– 根据图像中对像的特征组成的模式,确定对像是属于那⼀一
个模式类,即为模式识别
• ⼈人和动物的模式识别能⼒力力是极其平常的,但对计算机
来说却是⾮非常困难的。

2019-9-9 12/71
• 鲨⻥鱼:利利⽤用特殊细胞发现隐藏猎物

• ⿎鼓⻥鱼:⽤用⻥鱼鳔识别声⾳音

2019-9-9 13/71
模式识别研究
• ⽬目的:利利⽤用计算机对物理理对像进⾏行行分类,在
错误概率最⼩小的条件下,使识别的结果尽量量
与客观物体相符合。
• Y = F(X)
– X的定义域取⾃自特征集
– Y的值域为类别的标号集
– F是模式识别的判别⽅方法

2019-9-9 14/71
模式识别⽅方法
• 模式识别系统的⽬目标:在特征空间和解释
空间之间找到⼀一种映射关系,这种映射也
称之为假说。
– 特征空间:从模式得到的对分类有⽤用的度量量、
属性或基元构成的空间。
– 解释空间:将类别所属集合,称为解释空间。

2019-9-9 15/71
映射(函数)

2019-9-9
假说的两种获得⽅方法
• 监督学习、概念驱动或归纳假说:在特征空间中
找到⼀一个与解释空间的结构相对应的假说。在给
定模式下假定⼀一个解决⽅方案,任何在训练集中接
近⽬目标的假说也都必须在“未知”的样本上得到近
似的结果。
– 依靠已知所属类别的的训练样本集,按它们特征向量量的
分布来确定假说 (通常为⼀一个判别函数),只有在判
别函数确定之后才能⽤用它对未知的模式进⾏行行分类;
– 对分类的模式要有⾜足够的先验知识,通常需要采集⾜足够
数量量的具有典型性的样本进⾏行行训练。

2019-9-9 17/71
监督学习

2019-9-9
假说的两种获得⽅方法
• ⾮非监督学习、数据驱动或演绎假说:在解释空间
中找到⼀一个与特征空间的结构相对应的假说。这
种⽅方法试图找到⼀一种只以特征空间中的相似关系
为基础的有效假说。
– 在没有先验知识的情况下,通常采⽤用聚类分析⽅方法,基
于“物以类聚”的观点,⽤用数学⽅方法分析各特征向量量之间
的距离及分散情况;

2019-9-9 19/71
⾮非监督学习、数据驱动或演绎假说:

如果特征向量量集聚集若⼲干个群,可按群间距离远近把它们划分
成类;

这种按各类之间的亲疏程度的划分,若事先能知道应划分成⼏几
类,则可获得更更好的分类结果

2019-9-9
进展

• 智能驾驶

• ⽆无⼈人机

• ⼈人机交互

• 新兴技术
2019-9-9
模式识别+智能驾驶
• 智能汽⻋车是汽⻋车产业未来发展⽅方向,使⽤用⽆无⼈人驾驶技术,现
在全球多个国家和公司都在开发,并且Tesla公司已将该技术
应⽤用到产品。⼀一家市场调查机构Juniper Research今天发布
的最新调查报告显示,未来⽆无⼈人驾驶汽⻋车市场价值到2020年年
或达6亿美元。

22
模式识别+智能驾驶
• ⻋车道线识别
• 交通信号识别
• (前后⽅方)⻋车辆识别
• ⾏行行⼈人、障碍物识别
• ⻋车距判识等

2019-9-9
模式识别+电商
图像搜索,是通过搜索图像⽂文本或者视觉特征,为⽤用户提供互联⽹网上相关
图形图像资料料检索服务的专业搜索引擎系统,是搜索引擎的⼀一种细分。这些
搜索引擎和APP代表了了图像检索和识别技术在业界的各类具有代表性的应⽤用
场景:1)海海量量互联⽹网图⽚片搜索;2)商品购物搜索;3)移动端的商品或物体
搜索。

24
模式识别+电商

吸引眼球 == 商业机会(产品、⼴广告)

25
虚拟现实----⾼高尔夫

2019-9-9
⽆无⼈人机:
模式识别+视觉技术

利利⽤用摄像头和传感器器结合
来模拟类似⼈人脸和⼤大脑的
作⽤用来得到三维空间的距
离,进⽽而识别物体、判断物
体的运⾏行行状态。

27
⽆无⼈人机:模式识别+视觉技术

⾼高品质、⾼高保真??

28
模式分类的主要⽅方法

• 统计分类

• 结构模式识别

• 句句法模式识别

• 连接主义----神经⽹网络:传统神经⽹网络、深度学习中
的深度⽹网络等
2019-9-9 29/71
统计分类

• 基于概率统计模型得到各类别的特征
向量量的分布,以取得分类的⽅方法。

• ⼀一般基于⼀一个类别已知的训练样本集
获得特征向量量的分布。

• 经常使⽤用监督分类的⽅方法,分类器器是
概念驱动的。
2019-9-9 30/71
“监督”学习

2019-9-9 31/71
结构模式识别
• 该⽅方法通过考虑识别对像的各部分之间的联
系来达到识别分类的⽬目的。
• 识别采⽤用结构匹配的形式,通过计算⼀一个匹配
程度值来评估⼀一个未知的对像或未知对像某
些部分与某种典型模式的关系如何。
• 当成功地制定出了了⼀一组可以描述对像部分之
间关系的规则后,可以应⽤用⼀一种特殊的结构模
式识别⽅方法 – 句句法模式识别,来检查⼀一个模
式基元的序列列是否遵守某种规则,即句句法规则
或语法。

2019-9-9 32/71
• 空间结构

• ⼏几何结构

• 句句法结构

2019-9-9
句句法模式识别
• 基于模式特征的⼀一组测量量值来组成特征向量量,
⽤用决策理理论划分特征空间的⽅方法进⾏行行分类
• 基于描述模式的结构信息,⽤用形式语⾔言中的规
则进⾏行行分类,更更典型地应⽤用于景物图⽚片的分析
• 因为在这类问题中,所研究的模式通常⼗十分复
杂,需要的特征也很多,仅⽤用数值上的特征不不
⾜足以反映它们的类别。

2019-9-9 34/71
• 句句法模式识别系统的组成

– 图像预处理理
– 图像分割
– 基元及其关系识别
– 句句法分析

2019-9-9 35/71
• 问题:如何利利⽤用对图像的结构信息描述,识
别如下所示图⽚片

2019-9-9 36/71
句句法模式识别:数据(图像)的“分解”
• 将整个场景图像结构分解成⼀一些⽐比较简单
的⼦子图像的组合;
• ⼦子图像⼜又⽤用⼀一些更更为简单的基本图像单元
来表示,直⾄至⼦子图像达到了了我们认为的最简
单的图像单元(基元);
• 所有这些基元按⼀一定的结构关系来表示

2019-9-9 37/71
• 句句法模式识别系统处理理过程
– 待识别的输⼊入图像,经过增强、去噪声等处理理
后,按识别的具体对像分割成⼦子图;
• 三⻆角体D和⻓长⽅方体E
– 然后将⼦子图分割成更更简单的模式基元;
• 组成三⻆角体和⻓长⽅方体的各个⾯面{L,T}和{X,Y,Z}
– 判别基元之间的关系。
• 三⻆角体D是由相互邻接的四边形L和三⻆角形T组成
• ⻓长⽅方体E是有三个相互邻接的四边形X,Y和Z组成

2019-9-9 38/71
• 句句法模式识别学习过程
– 为了了要事先确定⼀一个⽂文法来描述所要研究模式
的结构信息,同样需要采⽤用模式的训练样本集
把⽂文法推断出来。
– 有了了推断出来的⽂文法,才可以对未知类别的字
符串串进⾏行行句句法分析,达到分类的⽬目的。
– 这⼀一过程类似于统计模式识别中的学习过程,
但⽂文法推断过程远不不及统计学习来的成熟。

2019-9-9 39/71
句句法模式识别代表⼈人物

傅京孙

性别: 男
⽣生卒年年: 1930—1985
国别: 美国(美籍华裔)
籍贯: 浙江省丽⽔水
美籍华裔模式识别与机器器智能专家,美国⼯工
程科学院院⼠士,台湾中央科学院院⼠士

2019-9-9
术语

2019-9-9 哈尔滨⼯工业⼤大学超精密光电仪器器⼯工程研究所 41/71


• 训练过程:确定规则或⽂文法(算法)

– ⽤用已知结构信息的图像作为训练样本,先识别出
基元(⽐比如场景图中的X、Y、Z等简单平⾯面)和它
们之间的连接关系(例例如⻓长⽅方体E是由X、Y和Z三
个⾯面拼接⽽而成),并⽤用字⺟母符号代表之;
– 然后⽤用构造句句⼦子的⽂文法来描述⽣生成这幅场景的过
程,由此推断出⽣生成该场景的⼀一种⽂文法。

2019-9-9 42/71
• 识别过程:

– 先对未知结构信息的图像进⾏行行基元提取及其相
互结构关系的识别;
– 然后⽤用训练过程获得的⽂文法做句句法分析;
– 如果能被已知结构信息的⽂文法分析出来,则该
幅未知图像与训练样本具有相同的结构(识别
成功),否则就不不是这种结构(识别失败)。

2019-9-9 43/71
连接主义--神经⽹网络

• 神经⽹网络是受⼈人脑组织的⽣生理理学启发⽽而创
⽴立的。
• 由⼀一系列列互相联系的、相同的单元(神经元)
组成。相互间的联系可以在不不同的神经元之
间传递增强或抑制信号。

2019-9-9 44/71
神经⽹网络

• 增强或抑制是通过调整神经元相互间联系
的权重系数来实现。

• 神经⽹网络可以实现监督和⾮非监督学习条件
下的分类。

2019-9-9 45/71
2018 年年度图灵奖:深度学习“三巨头

2019-9-9
深度学习技术的介绍

图像分类:输⼊入只是图⽚片,输出就是它⾃自⼰己的标签。⽐比如输⼊入是⼀一个明
星的头像,出来的标签就是⼀一个向量量。

47
• 深度学习的模型:

48
任务+数据驱动
⽬目前,计算机视觉技术已经应⽤用到国防、救灾、医疗以及教育等多
个⽅方⾯面。典型的计算机视觉⽅方法;Deep Learning,图像搜索等。

深度学习+⼤大数据(海海量量的有标注数据)成为机器器视觉领域的主流
技术路路线
⽹网络变⼤大变深
数据量量不不断增⼤大(Deep Face 400万,Face Net2亿)

⼤大数据成为提⾼高基于数据的识别性能的关键,⾼高性能计
算设备提供硬件保障!

49
2019-9-9 哈尔滨⼯工业⼤大学超精密光电仪器器⼯工程研究所 50/71
• 模式识别中的重要阶段:

• 训练(学习)

• 识别

2019-9-9
• 模式识别中的重要阶段:

• 训练(学习)

• 识别

2019-9-9
• 模式识别中的重要阶段:

• ⼀一.训练(学习)阶段:建⽴立模型并设定参数等

2019-9-9
• 模式识别中的重要阶段:

• ⼆二. 识别阶段: 应⽤用模型

2019-9-9
• 模式识别中的重要术语:

• 训练样本:⽤用于建⽴立模型并设定参数等

• 验证样本集:检验模型的性能

• 测试样本:应⽤用模型
2019-9-9
图像样本的统计模式识别

2019-9-9 56/71
模式识别系统
• 模式识别系统的基本构成
分类器器
设计
数据 特征提取
预处理理
获取 和选择
分类
决策

2019-9-9 57/71
模式识别系统组成单元
• 数据获取:⽤用计算机可以运算的符号来表示
所研究的对像
– ⼆二维图像:⽂文字、指纹、地图、照⽚片等
– ⼀一维波形:脑电图、⼼心电图、季节震动波形等
– 物理理参量量和逻辑值:体温、化验数据、参量量正常与否的
描述
• 预处理理单元:去噪声,提取有⽤用信息,并对
输⼊入测量量仪器器或其它因素所造成的退化现像
进⾏行行复原

2019-9-9 58/71
• 特征提取和选择:对原始数据进⾏行行变换,得到最能
反映分类本质的特征
– 测量量空间:原始数据组成的空间
– 特征空间:分类识别赖以进⾏行行的空间
– 模式表示:维数较⾼高的测量量空间->维数较低的特征空间
• 分类决策:在特征空间中⽤用模式识别⽅方法把被识别
对像归为某⼀一类别
– 基本做法:在样本训练集基础上确定某个判决规则,使
得按这种规则对被识别对像进⾏行行分类所造成的错误识别
率最⼩小或引起的损失最⼩小

2019-9-9 尔滨⼯工业⼤大学超精密光电仪器器⼯工程研究所 59/71


模式识别⽆无敌?

2019-9-9
⼈人⽓气爆棚的⼈人⼯工智能与模式识别
• 未来VR和AR技术将会改变我们的⽣生活、⼯工作,让我们获
得信息更更简单、更更快捷。

通过⼿手机获取周围所有
的信息

虚拟试⾐衣间

道路路情况显示在挡⻛风玻璃上
61
• ⽜牛⽓气的娱乐机器器⼈人

弹钢琴

弹古筝

62
⼈人⼯工智能 vs ⼈人类智能

• ⼈人⼯工智能是⼈人类智能的物化,⼈人类智能⼜又借助⼈人⼯工智能⽽而增强,但是
⼈人⼯工智能⽐比⼈人类智能更更先进。
• 例例如: AlphaGo 4 VS 1 李李世⽯石
AlphaGo超越“中国天才少年年”柯洁,获得“世界第⼀一宝座”

63
谁是谁?

64
美国⼀一辆特斯拉MODEL S在
⾃自动驾驶时发⽣生⻋车祸导致驾
驶员死亡,这是⽬目前⾃自动驾
驶技术应⽤用以来第⼀一起⼰己知
的导致死亡的⻋车祸,并且类
似事件已发⽣生3起。

可考虑的改进⽅方案:
1、增加传感器器的数量量,增加4个
24G毫⽶米波雷雷达来判断⻋车周的障碍
物。或者增加⼀一个激光雷雷达对周围
障碍物进⾏行行扫描。
2、加强对⾃自动驾驶的算法,提⾼高
传感器器的弹性设置,增加摄像头滤
镜等。

65
波⾳音⻜飞机空难

2019-9-9
受⼈人类掌控的机器器智能

2019-9-9
道德与伦理理、法制制约
的⼈人⼯工智能技术

2019-9-9
• ⼈人⼯工智能帮⼈人与害⼈人?

• 波⾳音⻜飞机智能⻜飞控系统引发的灾难
– 介绍

– 动画演示

2019-9-9
技术辅助下的⼈人⼯工智能

• ⾃自动发送的交通灯信号

• 智能化的交通道路路--- 任⼀一⻋车辆每⼀一时刻的
位置、速度、⽅方向

• 计算机视觉 + 技术

70
现存的问题

1. 如何让智能驾驶更更安全、更更智能?
• 技术持续进步
• ⼈人机切换
• 辅助技术⽅方案
• 道路路信号灯电⼦子化、路路标电⼦子化

2. 娱乐机器器⼈人如何讨⼈人欢⼼心?
• 功能升级、开放平台、内容丰富与完美
• 娱乐与实⽤用结合,扫地+娱乐
• 未固定模式与“标准答案” 的智能

3. ⼈人⼯工智能与⼈人类智能有效结合?

71

You might also like