You are on page 1of 9

第 31 卷摇 第 1 期 模式识别与人工智能 Vol. 31摇 No.

1
2018 年 1 月 Pattern Recognition and Artificial Intelligence Jan. 摇 2018
摇 摇 摇 摇 摇
摇 摇 摇 摇 摇
摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇
*
语 义通讯———智能时代的产物
摇 摇 摇 摇 摇
摇 摇 摇 摇 摇
摇 摇 摇 摇 摇
摇 摇 摇 摇 摇
1
石光明 摇 摇 李莹玉 摇 摇 谢雪梅
摇 1 1

摘摇 要摇 通讯技术从信源信道编码,到载波调制机制,再到超宽带通讯,这些信号层面的通讯技术已逼近香农界,
以传送数据或信号波形的当前通信技术往哪里发展? 文中总结新型人工智能技术对通讯技术变革的引导作用,提
出新的通讯方式,即语义通讯. 相比当前通讯中的“ 形式通讯冶 ,语义通讯的核心是“ 达意通讯冶 或“ 内容通讯冶 . 它通
过知识库的建立实现类似的目的,即“ 达意冶 通讯而非数据通讯,并且通过信息发送方与接收方之间知识库的匹配,
实现信道的混用,提高容错率. 这是一种真正意义上的人工智能通讯方式,即类脑通讯的方式. 这种以“ 达意冶 为基
础的类脑通讯将极大地减少实际需要传输的数据量,有效解决大数据时代对通讯技术带来的挑战. 文中提出语义
通讯的构想,并阐述语义通讯的基本特征,语义的基本元素、语义编码和解码,待研究内容以及需要解决的挑战
问题.
关键词摇 语义通讯, 语义基元, 智能通讯, 达意交互, 语义网络
引用格式摇 石光明,李莹玉,谢雪梅. 语义通讯———智能时代的产物. 模式识别与人工智能, 2018, 31(1) : 91-99.
DOI摇 10. 16451 / j. cnki. issn1003鄄6059. 201801008

Semantic Communications: Outcome of the Intelligence Era


SHI Guangming1 , LI Yingyu1 , XIE Xuemei1

ABSTRACT摇 Communication technology develops greatly, especially in source and channel coding,
modulation mechanisms and ultra鄄wideband communications. From the aspect of signal processing,
current technologies have already approached the Shannon capacity. Directions for future researches in
traditional data and signal transmission鄄based communication industry become unclear. According to the
recent state鄄of鄄the鄄art artificial intelligence technologies and their influences on the revolution of the
communication industry, a new communication mechanism, namely semantic communications, is
proposed. Compared with the traditional communication technology based on pattern transmission, the
key point of semantic communications is idea鄄passing communication, and it can also be referred to as
content transmission. In such a revolutionary communication mechanism, the transmission is conducted
upon ideas instead of data through the construction of a certain knowledge library. The error tolerance of
the channel can also be improved via the matching between the idea transmitter and receiver. It could be
considered as the artificial intelligence induced communication with its true meaning since it is a
brain鄄resembling communication mechanism. The introduced brain鄄resembling communication mechanism
based on idea鄄passing significantly reduces the data amount to be transmitted, and it is an efficient way to
address the challenge to the communication industry due to the arrival of big data era. In this paper, the
tentative idea of semantic communications is presented and the fundamental elements, semantic coding
and decoding, future research directions and major challenges in semantic communications are discussed.

收稿日期:2017-09-25;录用日期:2017-11-27 the National Natural Science Foundation of China ( No.


Manuscript received September 25, 2017; 61621005)
accepted November 27, 2017 本文责任编委 高新波
国家自然科学基金项目( No. 61632019) 、国家自然科学基金 Recommended by Associate Editor GAO Xinbo
创新群体项目( No. 61621005) 资助 1. 西安电子科技大学 人工智能学院摇 西安 710071
Supported by National Natural Science Foundation of China( No. 1. School of Artificial Intelligence, Xidian University, Xi忆 an
61632019) , the Foundation for Innovative Research Groups of 710071
92 模式识别与人工智能( PR&AI) 摇 摇 摇 第 31 卷

Key Words 摇 Semantic Communications, Semantic Elements, Intelligence Communications, Idea鄄Passing


Interaction, Semantic Networks
Citation摇 SHI G M, LI Y Y, XIE X M. Semantic Communications: Outcome of the Intelligence Era. Pattern
Recognition and Artificial Intelligence, 2018, 31(1) : 91-99.

摇 摇 后 5G 的通讯技术向何方发展? 移动通讯技术从 息技术、大数据、深度学习、脑神经科学的巨大进步


1981 年开始的 1G 模拟通讯,到 1991 年 2G 时代的数 推动人工智能技术再一次飞跃. 人工智能正呈现以
字通信 GSM & CDMA,再到 1998 年出现的 UMTS & 信息和知识处理为主、与人类知识混合、能自主完成
IMT鄄2000 3G 移动通讯、2008 年以 LTE鄄A & WiMax 更多认知性工作等新特点. 当今是“ 电子信息 +冶 和
为代表的 4G 通讯时代,目前 5G 通讯正成为全面商 “ 互联网+冶 的信息时代,第三次人工智能浪潮正促
用的前序. 移动通讯技术几乎每隔十年更新一代,通 使现代社会从信息化向智能化发展,人工智能的迅
讯速率越来越高,已逼近香农限,同时应用的载波频 速发展将深刻改变人类社会生活,改变世界. “ 万物
谱也越来越宽,导致频谱资源奇缺. 互联冶 正在向“ 万物智联冶 方向发展, “ AI+冶 时代的
华为公司在通讯技术方面已由过去的国际跟跑 热浪正扑面而来.
者发展到 国 际 领 跑 者. 华 为 公 司 董 事 长 任 正 非 在 智能体之间通讯有了新需求. 当前通讯技术以
2016 年 5 月 30 日全国科技创新大会、全国两院院 准确传输数据或精确传送信号波形为目标,而其中
士大会上发言指出 “ 华为现在的水平尚停留在工程 承载的是什么含义信息并未受到特别关注,也就是
数学、物理算法等工程科学的创新层面,尚未真正进 说,人们并没有把准确传输数据或载波波形承载的
入基础理论研究冶 . 随着逐步逼近香农定理、摩尔定 信息含义作为目标. 通讯的初衷是要“ 达意冶 ,即让
律的极限,还未创造大流量、低时延的理论,华为已 接收者明白或理解发送者的本意. 通信真正的目的
感到前途茫茫,找不到方向. 华为已经攻入通信领域 是接收方理解发送方的信息含义,降低接收者对信
科技“ 无人区冶 ,处在无人领航、无既定规则、无人跟 息的不确定性或者说使接收到的信息熵减少至 0,
随的困境,科技工作者们在惊呼,通信产业往哪里发 使接收者正确理解发送者的信息内容,即“ 达意冶 通
展,通讯技术发展的路在何方? 华为的迷茫正是电 讯. 例如,很多人讲话有口音,发音不标准,但听者的
子信息科学技术的迷茫. 目的是期望透过口音辨识理解说者的含义. 达意通
大数据时代期盼新型通讯技术. 当今是大数据 讯关注载波中的信息内容,不再关注载波波形的具
移动云服务时代,带来大量的移动通讯需求. 根据美 体形式,而现有通讯恰恰相反,只关注载波形式而不
国网络互联供应巨头思科公司 2014 年发布的虚拟 关注内容. 这也是造成大数据通讯给现有通讯产生
网络索引白皮书显示 [1]
,以无线通讯网络中的数据 巨大压力的原因,大数据 [3]具有大冗余( Redundan鄄
量为例,年增长率高达 61% . 其中,2014 年全球每月 cy) 特性,造成通讯资源的巨大浪费. 因此,大数据时
产生的移动数据量为 2. 6 艾字节(Exabyte / EB, 1EB = 代呼唤达意的语义通讯技术诞生.
2 字节),而这一数字将在 2019 年预计达到 24. 3 艾
60
智能技术发展促成新一代通讯技术诞生. 在上
字节,约为 2014 年的 10 倍之多. 全球移动设备的总 述的大数据背景下及随着深度学习技术的出现与快
数量也将在 2018 年达到百亿余台,这将给当前的无 速发展,人工智能领域的研究也随之蓬勃发展,当今
线通讯网络带来巨大的负担与挑战. 无线通讯网络 的社会正从信息化向智能化方向急速发展,无处不
中可用的带宽资源十分稀少且有限,难以为呈指数 在的智能体将要或正在充满社会的各方面. 人与机、
增长的移动设备数量、数据流提供可靠、稳定的数据 机与机、人与生物、机与生物、人与人等多种智能体
传输服务. 而在以准确传输数据为目标的当前通讯 之间的非精确的会意交互需求正逐步增多,预示各
技术领域, 大 数 据 的 高 冗 余 特 性 浪 费 大 量 的 通 讯 种智能体之间的交互已从基于数据发展到会意交
资源. 互,万物数据互联正在演变成万物智能达意互联.
当今信息时代,除大数据、云计算、互联网,已沉 语义通讯是智能体之间的一种必然通讯方式.
寂一段时间的人工智能技术( Artificial Intelligence, 相比当前通讯中的“ 形式通讯冶 ,语义通讯的核心是
AI) [2] 已被唤醒. 信息技术的巨大进步推动人工智 “ 达意通讯冶 或“ 内容通讯冶 . 这是一种真正意义上的
能的基础理论、方法和技术向纵深发展. 1956 年达 人工智能通讯方式,即类脑通讯的方式. 无论是人或
特茅斯会议提出人工智能,此技术经历三起三落,信 动物,同种生物之间进行的通讯都是以不断学习中
第1 期 摇 摇 摇 摇 石光明摇 等:语义通讯———智能时代的产物 93

积累的“ 知识库冶 为基础. 语义通讯与当前通讯的区 法,如 变 换 编 码 压 缩 ( H26X 系 列 [8] , JPEG2000 系


别也主要在于语义通讯是基于知识库的高效内容通 列 [9] ) ,用于提升传送效率.
讯. 例如,在当前通讯的框架下,当机器接收到的信 香农信息论 [10] 表明,通讯的速率与带宽相关,
息解码为“ mouse冶 时,无法判断这一词语的含义是 而目前大家普遍默认数据率越高,传输的信息量也
作为动物的“ 老鼠冶 还是电脑的输入设备“ 鼠标冶 ;当 越大. 所以现有的通讯方式都在信号层面上研究各
人接收到类似信息时,可通过上下文及已有的知识 种方法提升传输速率. 然而,在语义层面上,至今尚
库简单地判断其具体含义. 语义通讯也可以通过知 未研究出一种通讯方式.
识库的建立实现类似的目的,即“ 达意冶 通讯而非数
据通讯. 2摇 语义通讯的基本概念与特点

1摇 通讯技术发展回顾 2. 1摇 智能生物之间通讯的特点
比特量真的代表真正包含语义的信息量吗? 多
自从发现电磁波后,人们就开始利用它传递消 语义信息量一定要宽带传输吗? 认真想想不难找到

息. 现有的通讯指导思想是传送的数据或发射信号 答案. 比特量多并不意味着语义信息量多. 人与人之


间的直接通讯是利用声波,声波的带宽有限. 按照香
波形保真,期望使用最少的频谱资源实现最大速率
农信息论,它能承载的信息容量有限,但它不妨碍人
的数据比特传送同时误码率最低. 然而,频谱资源、
与人之间的大容量信息交流. 人们说话交流目的不
传 输 速 率、 误 码 率 三 者 之 间 存 在 难 以 调 和 的
是为了听清楚说者的声音,而是为了听明白其中的
矛盾 [4] .
含义. 当对话的两人的知识( 对要表达的信息而言)
众所周知,可以按信号、特征和语义不同层次空
差别很小时,或者两人之间有较好的默契时,一个简
间刻画和处理信息. 人们在信号层面花费大量的精
单的语言,就能让听者明白说者的意思. 而当两人之
力开发通讯技术,用于扩大通讯效能.
间的知识差别很大时,他们之间的通讯交流就变得
在频率域方面,通讯技术经历从长波、到短波、
非常困难,需要花费更多的语言,才能让听者明白说
再利用微波、太赫兹通讯、以及光通讯 [5] 的过程. 信
者含意.
道包括双绞线信道( kHz 级别) 、同轴电缆信道( MHz
生物之间的通讯基础是经过不断学习而积累的
级别) 和波导( GHz鄄THz 级别) 、光纤通讯( PHz) 等.
知识,通讯效率完全不受限于带宽. 因此,生物之间
光纤信道是一种特殊的有线信道,相比同轴电缆信
的通讯效能很难使用现代通讯技术的理论解释. 以
道,提供的带宽增大若干数量级. 无线通讯系统中使
人类为例,从婴幼儿时期就受到父母及周围的人耳
用无线电磁信道. 根据电磁波的波长不同,无线电磁
濡目染,慢慢丰富自己的知识库并学会以同样的语
信道的频段可分为声频带(100 km) 、甚低频( VLF,
言进行交流,即自己的母语. 使用不同语言的人不能
10 km) 、低频 ( LF,1 km) 、中频 ( MF,100 m) 、高频
直接进行交流是由于他们的知识库并不相同,但当
( HF,10 m) 、甚高频( VHF,1 m) 、特高频( UHF,10 他们在学习并掌握对方的语言之后,即进一步丰富
cm) 、超高频( SHF,1 cm) 、毫米波( EHF,1 mm) 等. 自身的知识库之后,就可以进行有效的交流.
在调制方式上 [6] ,通讯技术经历振幅键控、频移键 没有这种学习的过程,生物就无法构建正常的
控、相移键控等方式,使用正交振幅调制( Quadrature 知识库,也无法完成与同类之间的交流. 以著名的印
Amplitude Modulation, QAM ) 及 正 交 频 分 复 用 度“ 狼孩冶 为例,他们从小就没有与父母共同生活的
( Orthogonal Frequency Division Multiplexing, OFDM) 经历,而是由狼抚育长大,那么他们无法掌握人类的
等数 字 调 制 技 术. 在 复 用 方 式 上 [6] , 有 频 分 多 址 语言,行为、生活方式也是与狼类似. 由此可见,有效
( Frequency Division Multiple Access, FDMA) 、 时分 的“ 达意通讯冶 完全取决于知识库的建立,只有拥有
多址( Time Division Multiple Access, TDMA) 和码分 相同或类似的知识库的人或生物、机器之间才能进
多址( Code Division Multiple Access, CDMA) . 在天 行正常的语义通讯. 从这种意义上讲,语义通讯可被
线分集方式上,有单输入单输出( Single Input Single 看做是“ 类脑通讯冶 ,即真正意义上的智能通讯与信
Output, SISO ) 、 多 输 入 多 输 出 ( Multiple Input 息交互的方式.
Multiple Output, MIMO) [7] 通讯. 2. 2摇 通讯的本意与语义通讯概念
同样,在信息层面,人们也研发多种数据压缩方 通讯的本意是达意通讯. 克劳德·香农在其奠
94 模式识别与人工智能( PR&AI) 摇 摇 摇 第 31 卷

定现在信息论基础的论文中已提及信息在语义层面 定值 S.
的定义 [11]
. 进一步地,他在 1949 年出版的《 通讯的 语义通讯与当前通讯特点对比如表 1 所示. 在
[12]
数学理论》 一书中对“ 通讯的语义方面与工程问 传统通讯方式中,承载的信息量与所需的比特码数
题无关冶 的认识做出重要补充. 他在书中指出,“ 语 正相关,即待传输的信息量越大,需要使用的二进制
义问题关心的是收信者对含义的理解是否与发信者 比特码数越多,所需的信道带宽越宽,如图 1 所示.
预表达的含义一致或接近冶 ,并将通讯问题归为 3 而在语义通讯中,由于智能体与发送端耦合在一起,
个层面. 传输的信息量与语义相对应,因此可以大幅降低所
层面 A( 技术问题) :通讯符号如何准确地加以 需的传输信道带宽,窄带传输即可满足需求,如图 2
传输? 所示.
层面 B( 语义问题) :传输的符号如何精确地传
达含义? 表 1摇 通讯特点对比
层面 C( 效用问题) :收到的含义如何以期望的 Table 1摇 Comparison of communications properties

方式有效地影响行为? 当前通讯 语义通讯


尽管如此,受到当时技术发展水平的限制,人们 通讯的目的 信号数据准确 达意、会意
通讯的对象 非智能体之间 智能体之间
在根据香农信息论进行通讯系统的相关研究时,仍
通讯的形式 非协作交流与互动 协作交流互动
然以数据保真为基础. 1962 年 Brillouin 在《 科学与 通讯的目标 高速、大容量 占最少资源,多理解对方
信息论》 [13] 一书中进一步指出:“ 香农信息论忽略 通讯的单位 信息比特 语义基元
信息的含义是因为通讯工程的特殊需要;但这并不
意味人们 永 远 都 应 该 这 样 做. 冶 . 同 样 的,2012 年
$%
Sudan [14] 指出,克劳德·香农把语义问题搁置的一
$% ()*+
!"# &' ,- !"#

个主要原因是有历史背景. 当时通讯工程面临的紧
图 1摇 传统通讯中带宽使用
迫问题是如何有效地将不可靠信道变成可靠信道.
Fig. 1摇 Bandwidth usage in traditional communications
经过近 70 年的发展,有关可靠性及有效性的问题基
本得到解决. 因此,人们有理由相信:随着人工智能
技术与通讯技术的巨大进步,过去认为是“ 次要的冶 !" !"
#$ ()*+ ,-
语义问题已经成为现阶段急需解决的问题.
%&' %&'
语义通讯泛指不同的智能体之间进行的以“ 达
意冶 为目的的通讯. 这里的“ 智能体冶 可以指人类、智 图 2摇 语义通讯中带宽使用
能机器甚至其它生物. 语义通讯的根本目的在于进 Fig. 2摇 Bandwidth usage in semantic communications
行信息交换,它并不追求对原始数据或信号进行保
真,而是在通讯的双方之间进行语义的准确传递. 相 语义通讯具有如下特点.
比当前以数据表达、保真为驱动的通讯方式,语义通 1) 语义基元替代数据比特. 传统通讯通过比特
讯的驱动在于对信源进行语义层面的信息提取与以 传输数据,数据承载信息,信息包含语义,构成数据
“ 保意冶 为目的的表达. 的最小单位是比特. 而语义通讯的目的是达意,达意
当前通讯技术是希望尽可能使用较少的通讯资 功能是通过对语义的理解完成. 语义具有层级化特
源快速传送更多且误差更少的数据比特,而语义通 点,正如一切物质都是由分子组成、分子是由原子组
讯就是使用最少的通讯资源代价尽快获得歧义最少 成、而原子是由电子和原子核组合相同,语义也存在
的发送来的最多语义. 语义通讯有 4 个因素:通讯资 层级关系. 最小的语义单位与理解的对象语义含义
源即带宽 B、传送时间 t、语义含量 C、语义误差 e,它 层级有关. 就像要理解分子,其最底层的单位是原
们相互约束. 也就是说语义通讯就是使用窄带信号 子. 要理解猫,其基本语义单位是猫脸、猫身、猫脚.
及时传输大容量无差错的语义信息. 语义含量和语 也就是说,语义通讯时语义的基本元素是理解对象
义误差是一个全新的概念,目前还没有一种数学度 下一层的基本语义元素.
量. 语义通讯的基本目标描述如下: 2) 底层信号容错性极强. 无论是当前的通讯还
min( e,B,t) ,摇 s. t. C = S, 是正在研究的语义通信,都需要依靠发送信号波形
其中约束条件 C = S 表示语义源中的语义含量 C 为 传递信息,信息传输的可靠性完全依赖于信号的保
第1 期 摇 摇 摇 摇 石光明摇 等:语义通讯———智能时代的产物 95

真程度. 但是在语义通讯中,接收到的信号波形可以
与发送的波形有很大的失真. 譬如,经过一段时间适
$%
)* !" /01
应,一般人能听懂广东口音的人讲普通话. 类似地, !"# &'
+, -. 23
!(
通过不断地学习、完善语义知识库,语义接收端会具
4556
备一定的自动纠错能力,语义传输的可靠性并不依 9: 78
$%
赖于信号的保真程度,而取决于对语义的定义. !" &' )* -. /01
>? !( +,
3) 基于智能技术先验信息导向的语义编解码.
;< =2
!"
传统通讯是依据信号特点采用空间变换方式编解
码. 采用的空间变换基不随使用时间长短而变化,固 图 4摇 语义通讯过程架构
Fig. 4摇 Structure of semantic communications
定不变. 而达意通讯是智能体之间的信息交流,依据
知识库和智能技术进行预测和编解码,知识可以通
当前通讯技术与语义通讯技术最大的差别在
过一段时间学习而更新和丰富. 语义编解码最重要
于:编码方式、载波信号的调制方式、传送端和接收
的特点是唯一性,即要求语义通讯的收发两端之间
端的误差度量.
需满足编码唯一性、解码唯一性的要求,以保证语义
1) 编码方式不同. 目前通讯是以数据压缩形式
信息的准确传递,完成达意通讯的目的. 随着智能体
对其编码. 数据压缩是以信号特征为基础的一种稀
离线训练和在线学习,拥有的知识库不断扩展和完
疏变换表达. 基于信号的波形特征选用特定的基函
善,编码和解码的效率越来越高.
数,进行稀释变换编码,理论上此过程完全可逆. 而
4) 带有反馈机制的通讯. 传统通讯中,收发两
语义编码是针对信源中的语义内容高度抽象与压
端是按照既定的协议完成通讯,通讯过程是单向、无
缩. 语义分为具象语义和抽象语义. 具象语义针对具
反馈机制. 在语义通讯中,收发两端可以根据实时的
体事物的含义,而抽象语义针对概念事物的含义. 语
通讯质 量 ( 如 语 义 编 解 码 的 效 率、 通 讯 的 准 确 性
义编码就是对信源中有含义的信息进行编码表达.
等) ,对发送端语义编码的复杂度进行反馈调节,而
其过程实际就是对信源中的语义概念的抽象过程.
接收端可通过不断学习扩充自己的知识库,降低后
抽象的层级越高,所用的表达数据越少,对事物的描
续通讯的复杂度.
述也就越抽象. 这种对语义概念进行抽象、压缩的过
程需满足唯一性,即压缩后的结果与语义源中的核
3摇 语义通讯的架构 心语义需一一对应. 语义编码可以以类脑的语义计
算网络或卷积深度网络等实现,也可使用脉冲神经
无论是当前通讯,还是语义通讯,基本架构相 网络实现. 具体的实现方法将在后续论文中给出.
同. 对于当前通讯,即在发送端,无论是文字、图像或 2) 载波调制方式不同. 传统通讯调制解调采用
语音等信息源,都需要经过数码表达、数据编码、数 可逆正交的调频、调幅、调相或矢量编码方式调制,
码调制,然后由载波传到接收端. 在接收端经过数码 而语义通讯可以采用非正交的不可逆的混叠编码调
解调、数据解码和数码还原成文字、图像或语音. 从 制,智能鉴别解码方式解调,如图 5 所示. 具体地,发
通讯结构上讲,对于语义通讯,最大的不同是语义编 送端首先对语义源进行智能语义编码,然后构造非
码的不同. 图 3 与图 4 分别展示并对比当前通讯与 正交时域混叠调制信号集,并进行调制. 接收端首先
语义通讯的过程架构不同之处. 利用已知训练序列及标准知识库训练分类解调神经
网络,然后利用该网络对实际接收信号进行智能分
类解调,并进行语义解码输出.
'(
,- 01 45 3) 误差度量不同. 传统通讯是采用绝对的波形
!"# )*
./ 23 67
!+ 误差或比特误差方式:
899:
e
,
;<
'( BER =
$%& )* ,- 23 45 s
!" !+ => ?0 ?6
其中, e 表示误码序列的长度, s 表示传输序
列的长度. 而语义通讯采用内容含义上的误差方式:
图 3摇 当前通讯过程架构 sr - st
BER = ,
Fig. 3摇 Structure of traditional communications st
96 模式识别与人工智能( PR&AI) 摇 摇 摇 第 31 卷

其中,s r 为接收端语义,s t 为发送端语义. 线、横线、斜线和红、绿、蓝等基本影像特征敏感的神


经元 [15] . 这种相同的基本感觉是构成具象语义基元
345 的基础. 因此,被定义的具象语义基元都代表一种基
!"#$%&
3467 本感觉,而不同的语义都是由这些基础语义基元的
不同集合构成. 因此,针对语义基元和语义构成,有
!"'(
如下 2 个发现.
89'()*
)*+,-
'(,- :;<=>)? 1)人的基本感觉 ( 视、听、嗅、味、触) 就是语义
KLMN
&@ABCD 的基元. 语义由多个子语义组合而成,子语义又由其
!"./012
EFGH' 子语义组合,如此按层级结构细分直至基本语义基
3467IJ 元,这一过程就是语义定义. 一个信号能够包含语义
一定是能让接收者基本感觉神经元产生兴奋.
图 5摇 语义通讯中的调制解调
Fig. 5摇 Modulation and demodulation in semantic communications
$%#

4摇 语义基元 !"# )*#

百度百科中有关语义定义是“ 数据的含义就是
语义( Semantic) 冶 . 从通讯的角度上讲, 语义就是传 +,
送的信号数据中用于被人理解的含义. 正如大家所
"&# '(#
知,语义分层级. 正如物质是由分子组成,分子由原
子组成,原子由原子核和电子组成,原子核可以再细 图 6摇 嗅觉六基元图
分. 从物质的物理特性分,最小的单位是分子,而从 Fig. 6摇 Six fundamental elements in smell
化学的特性看,最小的单位是原子( 离子) . 最少语
义最小单位或最基本的元素是什么? 一个概念可以 !"#
由多个子概念定义. 例如,猫的概念可以这样定义: '"# '"#
头圆、颜面部短,前肢五指,后肢四趾,趾端具有锐利
%"#
而弯曲的爪子,爪子能伸缩. 爪子可以再继续使用更 &"# &"#
细的含义定义.
正如比特是通常表达信息的基本单位一样,语 $"#
义基元是描述语义的基本单位. 按照其不同的含义,
语义基元又可进一步分为具象语义基元与抽象语义 图 7摇 味觉六基元图
基元. Fig. 7摇 Six fundamental elements in taste
具象语义基元. 具象语义基元多与语言中的名
词、动词等相对应. 顾名思义,具象语义基元通常用 可以使用如下的集合描述视觉、听觉、嗅觉、味
于客观表示某一具体的事物. 觉、触觉的基本语义元素.
当人们第一次感知到陌生的事物时,通常可以 视觉集合:
直观表达某种“ 感觉冶 的词汇对其进行描述. 例如, L = { 颜色( 红、绿、蓝、对比度、饱和度) ,
它的形状( 方形或圆形) 、颜色( 红色或蓝色) 、温度 形状( 点、线、面、体) } ;
( 冷或热) 、味道( 清新或刺激性气味) 、触感( 平滑或 听觉集合:
尖锐) 等. 这些用于描述基本感觉的词汇并不会因 H = { 音调,响度,音色} ;
为人们的知识储备不同而不同,即同类的生物具有 嗅觉集合:
相同的基本感觉,正如一个饱读诗书的学者与一名 O = { 花香气,香料气,树脂气,水果气,腐烂气,
深山中孤独生活的行者对“ 甜冶 味的感知一样. 人类 焦臭( 即“ 嗅觉柱冶 的顶点) } ;
都具有视觉、听觉、嗅觉( 图 6) 、味觉( 图 7) 、触觉这 味觉集合:
5 种基本感觉. 神经科学家指出,视觉具有专门对竖 S = { 甜味,酸味,苦味,咸味} ;
第1 期 摇 摇 摇 摇 石光明摇 等:语义通讯———智能时代的产物 97

触觉集合: 时,发送端需要对接收端的语义知识库进行预判,即
T = { 温度,湿度,疼痛,压力,振动} . 判断接收端已有的语义知识库和缺失的语义知识
2) 基本语义具有互定义特性,如听觉与其它感 库,并将缺失的语义知识库中元素进行进一步分解
觉互相定义语义. 至对方可以感知的语义层级再进行通讯. 如图 9 所
一段语音可以与视觉或味觉、触觉、嗅觉中的语 示,与传统通讯方式不同,语义通讯中发送端可以根
义基元的集合相互定义. 例如,人们发音“ 妈妈冶 与 据对接收端语义知识库预判的结果进行语义元素分
长头发且非常关心爱护自己女性相互关联,并形成 解,而不必每次都将待传输的语义内容分解至最底
“ 妈妈冶 语义. 这也是人类语言的基础. 这种相互定 层的语义基元,从而提高通讯的效率,降低语义编解
义的模式是形成复杂语义的重要基础. 码的复杂度.
语义组合方式. 复杂的语义可以由子语义组合
而成,组合过程是高级智能过程. 尽管现阶段人们将
!"#
机器学习看作是一种人工智能,但它与人类大脑的
工作方式仍然存在本质上的区别. 当前的机器学习 $%!" $%!"

识别方法通过对目标事件进行数学刻画,并提取其
'%!" '%!" '%!" '%!"
不同特征,估计不同的概率分布,做出相应的判断.
而人类的识别可以看作是一种基于知识库的组成识 &%!" &%!" &%!" &%!" &%!"
别,即通过不同的感觉基元进行不同的组合而完成.
!"() !"() !"() !"() !"()
这个识别模式是建立在人的神经网络基础之上. 如
图 8 所示,在神经末梢获得基本语义基元的输入后, *+,-./0,123!"456

大脑会根据这些基元的组合方式判断其表达的语义 0*7,893!"456
信息. 例如,当人们看到一支笔时,决定性语义基元
图 9摇 语义通讯方式
的输入为{ 圆柱体,笔尖,墨水} ,然后大脑会根据这
Fig. 9摇 Semantic communication method
些输入的组合得到结论,即该输入集合对应的语义
为“ 笔冶 . 采用加权链接网络可以组合形成高 级 语
义. 本文使用 m (t i) 表示第 i 个语义层中的第 t 个语义 抽象语义基元. 具象语义基元多与语言中的名
基元,每个语义基元都可以由其底层语义基元的加 词、动词等相对应,多用于描述人们基于自身情感、
权形式表示: 想象力、逻辑分析得到的主观感受. 由此可见抽象语

m (t i) = 移 琢 (t i -1) m (t i -1) , 义基元是对具象语义基元的补充,是准确描述语义


t沂K ( i -1) 信息中不可或缺的一部分. 有关抽象语义的基本基
其中,K ( i -1) 为第 i - 1 个语义层中的所有语义基元 元将在后续的论文中进行探讨.
的集合,琢 (t i -1) 为对应于 m (t i -1) 的权重系数.

5摇 语义编码和解码
# 正如传统通讯,语义编解码在语义通讯中非常
$
& 重要,语义编解码的效率直接关系到通讯的效率和
'
- !"#$ 达意的准确度.
. -/
%"#$ 语义编码就是发送端根据自身的知识库及预判
-/
#$&'()*+, 接收端知识库,针对欲发送的语义源,利用深度神经
图 8摇 语义基元加权组合构成语义信息 网络进行语义编码,编码对传输信号进行调制,转变
Fig. 8摇 Weighted combination of semantic elements 成能并行传输的信号. 这是一个高度抽象的过程,如
图 10 所示. 首先根据发送端拥有的知识点和预判接
语义通讯方式的核心步骤包括语义编码与语义 收端的知识点的差异,修正深度神经网络,然后对语
解码. 语义编码为发送端对语义源分层编码,即分解 义源进行抽象编码,获得语义码,最后进行基带调
语义信息源成为不同的层级,直至语义基元层. 同 制,按正常信号发送.
98 模式识别与人工智能( PR&AI) 摇 摇 摇 第 31 卷

的形式,即在压缩编码后的数据中添加纠错码,保证
!" 通讯的可靠性. 这种方式会给信息的传输过程带来
+, /0
'() #$ '(*
%& -. 12 很多冗余. 在语义通讯中,可以采用类脑体制,利用
强大的知识库对接收到的信息进行智能纠错. 如何
345 + 9:;<5
678 678 根据通讯的目标、先验信息与接受信息的上下文设
计有效的纠错方法仍有待研究.
图 10摇 语义的编码过程
4) 语义信号耦合编码传输机制. 由于不同用户
Fig. 10摇 Semantic coding
之间的知识库并不相同,因此在码流层传输时可以
允许不同的用户同时共用同一信道. 当然,这种信号
语义解码是编码逆过程,但这个逆过程不是完
耦合传输的方式会提高接收端的语义信息解译过程
全重构原始语义源,而是要重构接收者可以理解的
的复杂度. 如何设计有效的算法使接收端的不同用
语义. 也就是说发送的语义码通过解码过程还原的
户能够有效、可靠地解译自己所需的语义信息是语
语义信息直接被人们感知器感知和被大脑理解. 语
义通讯中的重要问题之一.
义解码同样需要满足唯一性,即解码后还原的语义
5) 语义先验解意机制. 语义通讯的各个环节都
信息必须唯一. 其解码过程如图 11 所示,接收到传
离不开强大的先验信息指导,尤其是接收端如何根
输信号后,并由收端知识点训练的神经网络对接收
据先验信息对接收信号进行有效的解译,准确理解
信号按语义解码.
发射端想要表达的语义信息. 如何设计合理、低复杂
度的算法,使接收端能够有效地在先验信息的指导
!" #$%&
+,- ./0123 下,进行可靠的语义信息解译是保证语义通讯质量
23 '()*
的关键点之一.
6) 语义先验创建与维护. 语义通讯中先验信息
4#$567

图 11摇 语义的解码过程 的获取方式分为离线学习与在线学习两种. 其中,只


Fig. 11摇 Semantic decoding 有设计有效的离线学习机制,才能保证构建的知识
库的有效性. 而对于在线学习而言,需要设计接收端

6摇 语义通讯中有待解决的问题 与发射端之间不断交流与反馈的机制,不断提高语
义传输的准确性.

1) 语义的基元刻画. 语义基元刻画的准确性决
定语义通讯的可靠性,也是语义通讯中最基本的问 7摇 结 束 语
题. 如何理解语义信息,探索语义刻画和传统的香农
信息论之间的差别并寻找语义信息的刻画与度量方 随着人工智能技术的发展,智能体之间的交互
法都是亟需解决的问题. 其中,探讨经典的稀疏表达 越来越多,面向准确数据传送的通讯模式不能适合
与语义刻画之间的关系,尤其是在多域稀疏表达的 智能体之间的协同通讯,仿生的达意语义通讯模式
基础上进行语义的提取与刻画具有非常重要的研究 必将成为一个新的研究热点. 本文讨论语义通讯的
意义. 基本概念,找到具象语义基元,描述语义的组成方式
2) 语义层级结构刻画. 如前所述,语义基元满 和语义通讯的基本框架. 这其中还有很多不成熟之
足金字塔结构. 因此,如何根据先验信息进行目标导 处,希望通过此文引起学者和工程师等广泛关注,共
向式的构建语义金字塔至关重要. 其中的关键点在 同打造一代通讯模式,迎接智能互联的时代来临.
于寻找不同的稀疏域与不同的语义金字塔层级之间
的对应关系. 另外,如何针对不同的应用场景、用户、 致摇 谢摇 感谢参与此文相关讨论的西安电子科技大
知识库对所需的最小语义表达进行理论推导与定性 学通讯工程学院院长沈八中教授、中信信龙投资合
描述也是重要研究方向之一. 伙人谭茗州先生、中国科学院上海神经科学研究所
3) 语义容错纠错机制. 通讯中由于信号不可避 李澄宇研究员、作者指导的研究生张飞、赵翊君等.
免地会受到各种噪声与干扰带来的损伤,因此接收 感谢西安电子科技大学“ 三个一流冶 学科建设经费
端在解译过程中难免出错. 传统通讯采用纠错编码 的资助.
第1 期 摇 摇 摇 摇 石光明摇 等:语义通讯———智能时代的产物 99

参 考 文 献 Information Theory Workshop. Washington, USA: IEEE, 2012:


158-161.
[1] Cisco. Visual Networking Index[ EB / OL] . [2017-11-20] . www. [15] NICHOLLS J G, MARTIN A R, WALLACE B G, et al. From
cisco. com. Neuron to Brain: A Cellular and Molecular Approach to the Func鄄
[2 ] LUGER G F. Artificial Intelligence: Structures and Strategies for tion of the Nervous System. 4th Edition. Sunderland, USA: Si鄄
Complex Problem Solving. 5th Edition. Addison, USA: Wesley, nauer Associates, 2001.
2004.
[3] MANYIKA J, CHUI M, BROWN B, et al. Big Data: The Next 作者简介
Frontier for Innovation, Competition, and Productivity. New York, 石光明( 通讯作者) ,博士,教授,主要研究
USA: McKinsey Global Institute, 2011. 方向为压缩感知理论及应用、脑认知与脑
[4] TSE D, VISWANATH P. Fundamentals of Wireless Communica鄄 机通讯、深度神经网络. E鄄mail:gmshi@ xidian.
tion. Cambridge, UK: Cambridge University Press, 2005. edu. cn.
[5 ] PROAKIS J, SALEHI M. Digital Communications. New York, ( SHI Guangming ( Corresponding author ) ,
USA: McGraw鄄Hill, 1995. Ph. D. , professor. His research interests in鄄
[6] RAPPAPORT T S. Wireless Communications: Principles and Prac鄄 clude compressive sensing theory and its applications, brain un鄄
tice. Upper Saddle River, USA: Prentice Hall, 1996.
derstanding and brain鄄machine communications, deep neural
[7] GESBERT D, SHAFI M, SHIU D, et al. From Theory to Practice:
networks. )
An Overview of MIMO Space鄄Time Coded Wireless Systems. IEEE
Journal on Selected Areas in Communications, 2003, 21(3) : 281-
李莹玉,博士研究生,主要研究方向为大数
302.
据感知与处理、无线通信网络及物联网中
[8] VETRIVEL S, SUBA K, ATHISHA G. An Overview of H. 26x Se鄄
分布式数据分流与资源分配. E鄄mail:yingyu
ries and Its Applications. International Journal of Engineering Sci鄄
_li@ out look. com.
ence and Technology, 2010, 2(9) : 4622-4631.
( LI Yingyu, Ph. D. candidate. Her research
[9] PENNEBAKER W B. JPEG: Still Image Data Compression Stan鄄
interests include big data collection and analy鄄
dard. Berlin, Germany: Springer Science & Business Media, 1992.
sis, distributed data offloading and resource allocation in wire鄄
[10] SHANNON C E. A Mathematical Theory of Communication. The
Bell System Technical Journal, 1948, 27(3) : 379-423. less communication networks as well as internet of things. )
[11] COVER T M, THOMAS J A. Elements of Information Theory. New
谢雪梅,博士,教授,主要研究方向为视频
York, USA: John Wiley & Sons, 2012.
[12] SHANNON C E, WEAVER W, BURKS A W. The Mathematical 与图像处理、深度学习、压缩感知. E鄄mail:
Theory of Communication. Illinois, USA: The University of Illinois xmxie@ mail. xidian. edu. cn.
Press, 1951. ( XIE Xuemei, Ph. D. , professor. Her re鄄
[ 13] BRILLOUIN L. Science and Information Theory. New York, USA: search interests include video and image pro鄄
Dover Publications, 2013. cessing, deep learning and compressive sens鄄
[14] SUDAN M. Communication Amid Uncertainty / / Proc of the IEEE ing. )

You might also like