You are on page 1of 38

中国AI数字人市场现状与机会分析,2022

卢言霞, 助理研究总监
王丽萌,高级市场分析师
1 中国AI数字人市场现状

2 中国AI数字人市场生态

3 AI数字人典型行业实践案例
目录
4 主流AI数字人厂商分析

5 初步评估中国市场的AI数字人

6 趋势与建议

© IDC | 2
目前数字人分类尚无统一方案,此次报告重在关注企业级服务型数字人
2022年开年以来,数字人几乎成为AI第一热门赛道。数字人在2021年即有20家以上的企业获得新一轮的融资,且都在数千万人民币以上的规模。
进入2022年,数字人更是在诸多应用场景大放光彩。
q 按照应用范畴,可以大致分为泛娱乐数字人以及企业级服务数字人。泛娱乐数字人,即用于音乐、美术等艺术创作的数字人,用于影视节目
或者游戏的二次元、三次元虚拟人。企业级服务数字人,即为企业内外部提供服务,典型的场景有智能客服、保险代理人、AI数字员工等。
q 从交互方式来看,又可以分为文字、图文、声音、声音+文字、多模态交互数字人。早期的数字人往往仅具备单一的文字交互、图文交互或者
语音交互能力。最高级的形态则是实时沉浸式交互数字人。
q 从是否具有真实身份来看,又可以分为真人替代型和身份型虚拟人。真人替代型即替代人类进行工作,如虚拟主播、虚拟导购等。身份型虚
拟人是指完全虚拟的身份,也有可能是真人偶像的虚拟形象。
q 按照背后是否有真人支撑,又可以分为真人驱动型和计算驱动型。真人驱动型代表数字人的行动背后有真人在指挥操控或者演示。计算驱动
型没有真人操作,完全由计算机模拟而成。真人驱动型的数字人通常不在AI数字人的范畴。

应用范畴 按交互方式 是否具有真实身份 背后是否有真人支撑

文字型、声音、声音+文字、
泛娱乐数字人 真人替代型 真人驱动型
图文型

企业级服务数字人 多模态交互数字人 身份型虚拟人 计算驱动型

© IDC | 3
IDC对于AI数字人的定义:真正由AI驱动的数字人
根据IDC人工智能自动化五级演进框架,我们将数字人发展历程分为如下5个阶段。
L5
业务价值提升

L4 完全实现智能化交互

语言交互智能化,但在特定场
L3 合需要人工接管

L2
依赖算法驱动肢体、姿态、口
型、表情等 • 由数字人自主决策、自主执
行任务
L1 依赖外部动捕设备采集肢体、
表情和口型信息 • 数字人进行决策,并执行指
令为主
依赖辅助人工制作形象和动画 • 在数字人无法满足需求时,
效果 • 数字人具备人的外形,只能
执行简单的决策和操作 由人工接管
• 在交互模式上,可能仅是文 • 在交互模式上,较少做到多
• 人类在后台决策并操作 本交互、图文交互 模态实时交互
• 输出实时的数字人形象
• 人类进行决策并操作
• 以数字人形象对外输出

智能化水平
• 并不是当前市面上所有的数字人都是基于AI技术驱动。IDC在本研究中将AI数字人定义为:采用人工智能技术驱动生成的数字化的虚
拟人物——具备人的外观,感知互动能力以及表达能力。
• 如上图所示,今天的数字人大多处于L1-L3的阶段,而未来的AI数字人将是L4-L5的水平。
• 当然,在现阶段,并不是所有的场景都要用到完全AI驱动的数字人。在真实场景中,还是以实际上线应用的需求为首要考量,可能会
用到中之人方案,逐步过渡到纯AI驱动的数字人。
© IDC | 4
AI数字人的商业价值与社会价值巨大

q 提升员工生产力、创造力:AI辅助设计的场景,AI数
字员工的场景
q 为残障人士提供服务通道:手语主播应用在新闻播
报、赛事报导、公共场所指引等,属于AI向善的场

q 不断提升用户体验:展厅场景,智能客服升级
q 降低成本,提高效率:产品销售成本的下降(例: § 万科催收数字员工 § 央视AI手语主播
信用卡单卡推广成本)
q 作为虚拟品牌形象,避免真人代言可能引起的偶像
翻车事件、侵权事件等

§ 展厅讲解机器人 § 中纺虚拟设计师

© IDC | 5
市场发展由政策、应用价值、市场需求、资本支出、技术成熟多方驱动

q 政策驱动: q价值驱动:
q 2021年10月,广电总局发布《广播电视和网络视听“十四五”科技发展规划》指出: • 产生人类员工不具备/难以达成的创造力
“强化人工智能、大数据、区块链在内容选题、素材集成、编辑制作、内容审核、媒资管理、字幕制作等环 • 7*24小时代替人类执行工作任务
节的应用,促进制播流程智能化。推动虚拟主播、动画手语广泛应用于新闻播报、天气预报、综艺科教等节 q 市场需求驱动:
目生产,创新节目形态,提高制播效率和智能化水平。到 2025 年,IP 化制播标准体系基本完善;各级广播
电视播出机构制播系统广泛实现 IP 化,制播流程更加优化,内容生产智能化水平显著提升。 • 企业内在创新需求驱动
• 企业提升竞争力需求驱动
专栏 5 智慧制播
• 新政策要求下的数字人价值驱动
(5)AI 无障碍播报
q 资本市场驱动:
研究语音、文本到手语翻译中的情感分析、语义分析、手语动作驱动、表情驱动等关键技术,为节目提供手
语、表情、唇语等多模态的表达方式,提升翻译准确度,扩大播出内容影响力,满足听障人士、噪声场景观 • 截至2022Q2,数字人投融资规模已超过20亿元人民
众理解视听节目内容的需求。 币,市场需要寻找新的有潜力的AI赛道
(6)虚拟主播
面向新闻、综艺、体育、财经、气象等电视节目研究虚拟形象合成技术,包括 2D 虚拟形象的合成、3D 虚
拟形象的驱动、虚拟引擎构建、语音驱动、动作捕捉、面部表情捕捉等技术,提升节目制作效率及质量;同 q技术驱动:
时探索短视频主播、数字网红、直播带货等虚拟形象在节目互动环节中的应用,增加个性化和趣味性。
• AI技术的不断成熟:包括认知能力、多模态交互能力
• 支持“虚拟主播”的发展以提升节目制作效率及质量的同时,也鼓励探索短视频主播、数字网红、直播带 等全栈AI技术的不断成熟
货等虚拟形象在节目互动环节中的应用,增加个性化和趣味性。 • 算力(如GPU芯片)、硬件设施的成熟

© IDC | 6
1 中国AI数字人市场现状

2 中国AI数字人市场生态

3 AI数字人典型行业实践案例
目录
4 主流AI数字人厂商分析

5 初步评估中国市场的AI数字人

6 趋势与建议

© IDC | 7
数字人技术体系复杂,AI数字人的核心能力是AI驱动内容生成
q 数字人技术体系覆盖广泛 AI数字人必备能力
• CG(Computer Graph,计算机图形)建模:提供计算机建
模以及图形渲染能力。由计算机对虚拟数字人建立系统框
架,包括人物形象、语音生成、动画生成、音视频合成、 拟人形象 交互能力
交互模块等,并对数字人形象进行渲染。 • 建模能力 • 文本交互、对话式交
• 语音语义视觉等多模态AI能力:语音、视觉使其具备感知 • 形象设计:静态形 互、图文交互,以及
能力,语义使其具备认知能力。具备视听和理解能力的数 象,动态形象 多模态交互
字人,才算是具备多模态AI能力的数字人。 • AI驱动的表情、动作 • 实时交互能力
• 数字内容:定义虚拟人运行本身的内容,以及虚拟人运行 • 渲染
所需的周边内容。
• 动作捕捉:通过特定摄像头捕捉真人动作、形体、表情、
眼神、手势等,来形成数字人动作
多终端部署能力
• 决策智能:基于知识进行决策 决策能力
• APP,小程序,h5,
• …… • 知识库、知识管理
大屏,一体机……
• 知识图谱
• 数字人实体形式部署
• 智能决策

© IDC | 8
技术体系映射到产业链的生态图谱
应用层
跨行业应用 金融业 政府 传媒

数字人客服 AI面审官 党政展厅数字人 虚拟主播


从广义的数字人技术 数字员工 保险经纪人 AI导游 虚拟主持人
体系上看,目前可发
至分为: 端到端数字人生产厂商
• 硬件层, 百度云 阿里云 华为云 京东云 腾讯云
• 建模、动捕与渲 平安一账通 商汤 数字栩生 网易 拓尔思
染环节
小冰 中科闻歌 平安金融壹帐通 超次元 ……
• 形象设计&知识内
容提供环节, 建模、动补与渲染 形象、内容
• 端到端数字人平
台生产厂商, Adobe AutoDesk 数字王国 利亚德 相芯科技 万象文化
• 上层应用 Artec3D blender 凌云光 青瞳视觉 世悦星承 ……
Epic MAXON 原力 ……
硬件层
光学、传感设
芯片 算力 服务器 备等
英伟达 Intel 百度云 阿里云 华为云 京东云 华为 浪潮 Meta 微软
AMD …… 腾讯云 首都在线 浪潮 联想 联想 H3C 影创 ……

© IDC | 9
细分产业链的定位
q 基础硬件层:包括用于加速AI数字人训练与计算过程的芯片,云端算力,以及动作捕捉过程可能用到的光学器件、传感器,
交互环节可能用到的显示设备
q 建模、动捕与渲染:包括数字人的设计、3D建模,动作捕捉系统,以及数字人形象渲染。并不是每一种数字人都会用到
动捕环节
q 形象与内容:专为数字人市场提供形象设计、内容的企业。
q 端到端数字人生产厂商:具备数字人生成全栈技术,并且以平台形式对外开放
q 行业应用层:包括跨行业应用如数字人客服,数字人员工。行业垂直场景中,例如证券行业开户环节,保险业经纪人;政
务大厅或者旅游景点的讲解员

Ø 整体上,由于平台层端到端数字人生产厂商的出现,以及对于纯AI驱动的数字人的趋势,在企业级服务数字人市场,一定
程度上缩短了产业链,诸如动捕、渲染、形象库等环节可能被纯AI技术取代
Ø 从商业模式上,目前收费方式主要有:1)开放数字人能力API,可能是AI能力比如语音交互能力,也可能是数字人端到端
能力,比如诗词创作API、创意生成API等;2)开放数字人设计框架;3)按路数对数字人进行收费;4)按定制化项目收
费;5)在营销领域,也有很多按照代言人营销服务进行收费。

© IDC | 10
目录
1 中国AI数字人市场现状

2 中国AI数字人市场生态

3 AI数字人典型行业实践案例

4 主流AI数字人厂商分析

5 初步评估中国市场的AI数字人

6 趋势与建议

© IDC | 11
浦发银行:重点投入数字人,构建大规模数字员工队伍
已在多个场景中引入AI数字人,计划构建大规模数字员工队伍,使其真正在金融行业发挥价值

内部培训场景的AI 对客交互和销售领
数字人客服 文档审核数字员工 数字员工 域的AI数字员工
q 工作内容:智能呼入客服机 q 工作内容:审核业务领域的 q 工作内容:每2周都有十几 q 工作内容:数字理专场景,
器人,营销场景下的外呼机 文档,抽象出其中的关键要 场培训。目前已经完成了2 帮助客户解答理财产品的关
器人。客服的人工坐席仅有 素并且标准化,并标注出需 万人次的培训 键特性
600多个,但零售客群就有 要人工复核的领域,然后进
1.2亿,采用数字人客服可 行人工复核 q 工作效果:
以补充人工不足的情况 q 工作效果: q 工作效果:
• 由原来的书面式培训变成交
q 工作效果: • 识别准确率明显提升 互式、自适应式培训,体验 • 月活已经达到46万人,每
• 外呼坐席中,人工呼出量2 更好,效果更好 个月46万人通过数字员工的
• 由2路1校(2个业务人员输
万通左右,AI数字员工呼出 推荐选购理财产品
入内容,1人复核)变成1个
量能达到50-60万通 • 经数字员工培训的客服人员、
数字员工生成内容,1个人 • 数字人具备渠道流量优势,
理财经理,销售的开单率成
工复核 相比人工可以大幅提升服务
• 在呼入场景,85%都是由数 功率明显提升,销售单笔平
• 当前的数字员工场景,已经 效率
字人完成,15%是由人工完 均金额都有10-20个点的提
相当于200-300人员/年的
成 升
生产力

浦发银行对于AI技术高度重视且高额投入,希望AI为银行带来真正的价值,但未来的产出有一定的不确定性。百度作为一家纯粹的技术见长的
公司,愿意与浦发银行共同进行探索创新,目前在AI数字人领域大部分场景均是与百度合作。

© IDC | 12
中国纺织信息中心-以AI内容生成打造数字创造力
中国纺织信息中心依托丰富的纺织业数据积累,与小冰公司合作开发AI数字设计师,并以平台形式面向行业开放,提供流行趋
势设计定制化解决方案等。
背景:中国在纺织领域是当之无愧的大国,也有最先进的装备,但在创造力方面谈不上是强国,因此希望引进AI技术来提高创新创造能力。
q 引入AI技术的基础
• 中国纺织业有维度最丰富的数据,包括纺织行业企业以及消费端数据,有一定的创意设计资源数据库。
• AI能力上,中国已经在很多方面具备国际领先优势。尤其在本场景中,小冰公司也具备深厚的NLP、CV、AIC等全栈AI能力。
q 引入AI数字设计师提高创作能力
• 建设AI数字设计师:中纺与小冰公司一起将T台的色彩、图案特征提炼出来,针对品牌需求,采用具有流行趋势特征的纺织品图案设计方案。
• 开放DPI Space(www.dpispace.cn):基于AI内容生成能力面向行业开放流行趋势设计平台,目前已有注册企业400余家。
• 基于AI数字设计师以及开放的DPI Space平台,CTIC与小冰公司联合为企业提供定制化解决方案。例如,目前全棉时代已经就趣味卡通和时尚牛仔的AI图案设计等,
与鲁丰达成合作意向。
STEP 1:流行主题、色彩特征和 应用落地条件: 训练、调整、优化
情感关键词 发现产业需求+认知数字技术=产品设计逻辑 人工智能情感化设计算法
STEP 2:色彩特征与图案风格
产业场景
中国纺织信息中心 产业知识 算法训练 小冰
长期致力于中国纺织面料流行趋势研究 产业数据
人工智能视觉识别、自然语言处理技术、人工
及色彩管理应用技术开发,流行色应用
智能创造力等技术、研发支持。
分析与预测。
50% 30% 15% 5%
收集灵感素材 沟通与决策 制图描稿 生产跟进
中国纺织产品开发流程特别长,对数字化设计的需求非常迫切。开展技术创新,尤其是引进AI内容生成技术和AI数字设计师,将有助于借助数
DPI SPACE人工智能图案设计平台
字创造力提高行业效率和生产力。 ——国家纺织产品开发中心主任,李斌红
© IDC | 13
中信建投:首家在开户场景应用数字人的券商
在券商开户场景中引入AI数字人,与用户双向智能交互
q 建设背景:
在证券开户场景,传统上都是普通单向模式。根据中登新公布的开户实
施细则,监管要求开户环节需为双向服务
目前主要在单向服务中使用数字人,以为客户提供友好的服务体验
q 部署过程:
• 采集员工形象,前期先由腾讯云为其定制4个形象,后续为其他业务
场景再去扩展形象
• 使用场景:客户首次进入开户场景,会以数字人形象进行单向验证
• 在该场景中,一是对系统的安全性要求比较高,服务、资源等都要多
副本部署;二是对系统性能要求也比较高,需要引入GPU等异构资源;
三是对包括形象、体验、交互友好度等方面的效果也非常看重(E.g.,
交互过程中,600ms即可返回首帧图像)
q 案例特色:
• 是券商行业首个在开户场景中引入AI数字人的实践
• 在正式场景中,数字人可以与用户进行双向互动

选择腾讯云的原因:前期经过多家厂商的调研,经过POC和技术对比后,认为腾讯云的数字人,无论是形象效果还是性能,都非常好。

© IDC | 14
西安银行将智能客服升级为数字人客服

• 背景:西安银行是当地的城商行,作为陕西省地区政务类业务代理合作银行

• 业务场景:转账
• 业务需求:转账常用功能之一,方便老年人通过语音在线办理部分业务(其它智能语音助
手、语音播放理财产品规划)
• 上线时间:2020年12月底
• 部署:手机客户端集成SDK的形式,采购5路并发(数字人可以同时服务5个客户)
• 用量:每天1500人次
• 建设费用支出:60-90万
• 未来场景规划:网页版数字人转账功能,远程银行的贷款尽职调查功能(核实客户意愿,
完成线上签约)

© IDC | 15
AI数字人已在金融、零售、互联网、政府等行业初步落地
品牌
虚拟 AI理
展厅
数字 IP 财顾 数字
数字
人导 问 人客 AI保
讲解
AI客服 购 服 险代

代表 理人
零售 AI数
金融 字员
政府
工 • 目前来看,AI数字人是直
播带货、主动推荐营销场
虚拟
影视
AI交 景最为普及,价值也最为
偶像 易员
应用场 虚拟
主播
明显;其次是客服数字人

虚拟 互联 AI海
• 未来,AI数字人的数量也
演员 网 报设 许会超过人类的数量
计师
传媒
业 数字
数字 能源 医疗 体育 人直
人客 赛事 播带
服 货
AI主 AI裁
播/ 判
AI编辑 主持
人 虚拟 数字
AI助
医生 人陪
护 理教
虚拟 练
主播

© IDC | 16
目录
1 中国AI数字人市场现状

2 中国AI数字人市场生态

3 AI数字人典型行业实践案例

4 主流AI数字人厂商分析

5 初步评估中国市场的AI数字人

6 趋势与建议

© IDC | 17
百度智能云
通过新一代可视化语音交互,带来全新的交互与服务体验
• 百度智能云曦灵平台支持服务型和演艺型两类数字人,前者以智能 q 营收规模:2022年预计达到亿元级人民币。
交互及智能知识库为主提供一对一个性化服务;后者以智能内容生
产为核心提供虚拟主持人、虚拟偶像、虚拟带货主播等服务。 q 收费方式:1)“软件授权+服务许可”,服务许可以并发路数
• 这两类数字人在共用底层AI引擎的基础上,根据形象类型封装为三条
为单位;2)按业务效果计费,以业务运营指标的表现为计费
人像资产生产线,其定制周期由短到长分别为2D人像、3D卡通、3D 标准 3)SAAS平台订阅式收费
写实。完成基础形象生产后,共用三大产品运营平台实现快速生产, q 典型数字人案例:
包括人像配置、业务编排及内容创作等。
金融:浦发银行,民生银行,江苏银行,国泰君安证券
• 解决方案层面,服务型数字人产品类型丰富度高,从原有的企业服
务场景延伸到营销、办公等领域;演艺型数字人的核心场景相对收 媒体:央视新闻、央视网、人民日报、陕西广电
敛,通过手语、直播、运营三个子平台实现小时级别交付,提升效 其它:极幕科技、中国文物交流中心
率和质量。
q 优势:
• AI底层技术积累优势,包括视觉、NLP和语音交互等全栈AI技
术;及以PLATO、Ernie在内的文心大模型基础,在开放域对
话及AIGC智能创作等方面具备技术优势。
• 在智能客服领域积累了经验和客户。
• 产品类型、覆盖行业场景多样,尤其在金融、媒体领域落地
经验丰富。
q 部署规模:已上线20个左右
q 用户体验
百度能够为用户提供多种多样的数字人选择,能提供一站式数字
人平台
© IDC | 18
华为云
致力于打造批量生产、天级交付的个性化数字人SAAS应用

q 华为云在AI数字人领域的策略: q 注重强调AI能力:
q 依托AI的技术积累,充分发挥大模型、多模态交互能力,打 • 知识、技能的积累
造规模化、可量产的AI数字人
• 语音识别领域的感知能力
• 可以基于知识进行决策

q 典型数字人案例:
• 主要的案例积累在于展厅数字人场景、财经播报数字人场景
• 湖南小漾

q 部署方式:支持多种部署方式
q 优势:
• 华为云在AI领域已经有连续多年的技术和实践积累,尤其重视对话式
AI、多模态AI、智能决策、知识计算领域的投入,这些技术对于数字
人的自然交互能力至关重要

© IDC | 19
京东云
京东言犀多模态数字人平台,基于前沿的AI能力+大规模产业服务实践推出产业数字人平台,在电商和金融两大领域快速发展
• 京东言犀拥有100余款数字人形象、30+AI音色和亿万商品文案生成能
力 q 典型数字人案例:
• 由于大规模的服务实践,京东言犀多模态数字人平台的对话系统领先 • 金融:江南农商行( VTM虚拟柜员机),深圳农商行,京东金融,
于行业,积累了丰富的通用行业语料和知识图谱,迁移成本低,交互 弘康保险
体验好
• 零售:京东商城(数字人客服,运营短视频生产创作)
• 主要服务于政企客户,覆盖行业场景广泛,交付方式灵活
• 文旅:兰考党建,中关村未来科技展展会
q 部署方式:可选云端/本地端侧渲染方案。多渠道多终端兼容,支持
轻量化的数字人交互SDK,可在APP、智慧大屏一体机、PC、小程
序、H5、智能音箱等多终端集成。多渠道多终端兼容,也可兼容客
户已有的语音能力。
q 部署规模:项目形式的服务型数字人十余个,其中约75%的客户使
用京东云“智能客服+数字人”全套方案;SaaS形式的数字人客服已应
用于300+京东电商直播间。
q 优势:依托京东商城平台优势,有一定的用户资源积累,且京东云
在金融领域也有丰富的行业实践,能深入业务场景制定技术方案
q 应用效果:以江南农商行为例,已上线的VTM(虚拟柜员机)数字
人员工可解决90%业务,业务办理的平均时长从人工座席的“近300
秒/次”缩短到“215秒/次”,并且提高并发量,减少高峰期的顾客排队
等待时间,提升服务体验
京东云 言犀多模态数字人平台架构概览

© IDC | 20
平安金融壹帐通
从金融行业数字人做起,目前已在保险行业大规模部署
q 聚焦在金融行业,同时也服务于智慧城市等领域 q 应用场景:
q 专注打造AI数字人,尤其聚焦AI数字员工场景 • 远程推广:以AI虚拟助手的形式,为不同的客户做产品介绍
• 远程面审:以AI虚拟面审官的形式,替代真人进行全天候服
务,尤其在信贷推广、风控面审环境,AI坐席服务比例达到
33%
• 远程面试:在增员、面试环境通过形象分身代替真人进行AI
面试,实现智能增员
q 部署规模:
• 目前在平安内部部署的数字人,已经有几千路的并发
q 优势:
• 可依托平安体系内全栈AI技术能力
• 在大规模使用的实践中,对于使用过程中音视频流如何分发、
如何保证低延时,高并发下的负载均衡都有深刻的理解
• 在金融行业已有规模化部署的经验,可提供金融场景下专业
的AI数字员工

© IDC | 21
商汤科技:更高效、更低成本提供AI数字人
1)生成:照片生成模型,人物模型美化,虚拟试穿试戴,脸部/头发等AI生成;2)驱动:AI驱动准备,脸部AI驱动,肢体AI驱
动,语言文字AI驱动; 3)智能:交流对象识别分析,语音语义理解,知识库,运营管理平台

q 产品层面:提供丰富的数字人形象,包括超写实数字人,3D 商汤科技数字人目前已覆盖广泛的应用场景,包括零售业智能导购,金
拟真人,2D真人,3D卡通等 融业数字人客服,政务文旅领域等

q 技术架构:行业应用层,AI能力层,引擎层,全栈技术自研 q 典型数字人案例:
为主 • 零售:永旺商场智能导购
• 金融:宁波银行,浙江农业银行,兴业银行
• 政务:深圳地铁建材集团—可视化数字人大屏
q 部署方式:大屏,一体机,APP,线上……
q 优势
• 提供丰富的产品形态供用户选择
• 应用场景丰富,行业实践积累深厚
• 尤其在图像、视觉相关的技术领域具有领先优势
q 用户体验:
商汤提供的数字人可以由真人表情驱动,作为能力平台对外输出。该形
式在银行业内很新颖,可以在自助客服场景提供更加生动形式解决业务
常见问题,助力金融行业未来的元宇宙探索。——工商银行总行信息部

© IDC | 22
拓尔思
以“语义智能+”为技术战略,用语义智能赋予虚拟人“实用的灵魂”,目标是应用到业务场景中
• 拓尔思在智能虚拟人领域,业务定位是用语义智能赋予虚拟 q 典型案例:
人“实用的灵魂” ——智能驱动的大脑。通过NLP与业务场景 • 媒体:新疆日报(虚拟主播) ,冬奥会-虚拟主播小思
机器人结合,打造“虚拟人+”场景,使得虚拟人能够取代人
工操控,逐步代替真人工作的能力。 • 互联网:某头部直播公司(网红虚拟主播,虚拟人客服)
• 2022年初,成立专职虚拟数字人研发团队,打造数字虚拟 • 金融:在智能客服等客户业务场景中提供智能化、自动化的
人,推出了算法驱动的SaaS化的虚拟人赋能平台,主要提 “专业虚拟人”功能及服务。
供两类产品: q 合作伙伴:
• AI 数字分身:通过拍摄和语料处理实现个性化定制; • 形象方面,在自研的同时,与拍摄、模型训练等供应商合作
• 标准形象虚拟人:基于已制作的若干个标准形象,通过 AI • 思维方面,与行业服务厂商合作,以语义智能赋能“服务虚
变脸技术与用户照片融合,低成本打造自主形象。 拟人”的落地应用。
q 差异化优势:
• 技术方面,拥有20余年的NLP、文本挖掘及大数据相关技术
拓尔思语义智能+业 积累,中文文本处理能力成熟,研发投入较高(2021年研
务板块总体示意图 发投入比20%)
• 市场方面,可依托已有的客户积累,在优势赛道进行深耕

© IDC | 23
腾讯云
致力于AI技术保障形象表现力、识别力和理解能力,并保证最优服务性能
• 打造工具箱,探索在某些行业、场景打造SAAS级别数字人 q 典型案例
• 做了20+形象,以及发型、服装、饰品等形象库定制,可快 • 媒体:新华社&气象局
速交付 • 金融:中国工商银行,光大银行,南京银行,江苏银行,中国平安,
阳光保险,广发证券,
• 政府:汕头市人民政府(汕头城市发展和产业展示厅-虚拟讲解员),
广州地铁&青岛地铁(虚拟乘务员),
• 教育:国家电网-国网大学(虚拟讲师),腾讯教育
q 部署规模:目前已上线几十个数智人
q 差异化优势:
• 在国内较早落地,积累了底层算法和工程优化能力,产品成熟度高,
具体表现在: 1)生产高效,在播报场景中可短时间快速生成大量视
频,如输入文字后10分钟内产出1-2分钟视频;2)交互设计体验好,
在交互场景中的视频流延时低,虚拟人动作细腻流畅,而且给主播、
老师不同场景类型虚拟人打造不同的动作库
• 提供IP授权服务,具备与腾讯自有IP结合的潜力
q 用户体验
• 认为腾讯云数字人优势在于形象佳,性能好

© IDC | 24
网易伏羲
孵化自网易游戏雷火事业群,虚拟角色经验丰富,走精品化形象路线,持续提高标准化对外输出能力
网易伏羲成立于2017年,基于3D美术领域的多年积累,2021年正式推出有灵虚 q 典型虚拟人案例:
拟人产品,自研“形象创建”、“形象驱动” 等AI算法模块,目前主要面向2大 • 游戏:《逆水寒》、《永劫无间》、《倩女幽魂》,《倩女幽魂手游》,《天
场景提供服务,分别是: 谕手游》,《绝对演绎》,《漫威对决》
• 文娱:网易新闻,网易云音乐,LOOK直播,超次元-Vtmini,PrprLive
• 虚拟资源生产:更高效、高质地制作虚拟人资源,降低研发成本
• 文旅:西藏脱贫攻坚虚拟形象,杭州丝绸城(逆水寒IP联动),杭州星光大道
• 虚拟实时互动:用更拟人的方式(语音/视觉)驱动虚拟人,提高交互体验 牛小星,成都数字产业园书畅
有灵虚拟人主要面向游戏、娱乐行业垂直服务,并积极与其他行业伙伴共建生态。 • 电商直播及快消:网易严选虚拟代言人,麦当劳虚拟代言人
• 教育:有道乐读可可,有道纵横小七
q 部署方式:
• 以SDK产品为主,正推出游戏资源生产、直播、短视频等垂直行业的SaaS工具
q 部署规模:
• 50+企业级客户案例,日均AI服务调用次数超200万次

q 生态合作伙伴:
• 音视频服务-声网、网易云信,智能客服-网易七鱼&网易严选,文娱-超次元
q 优势:
• 以3D虚拟人为主,在美术研发和超写实人物制作方面能力突出。在技术上注
重交互表现力,提升语音&动画表现效果;在视觉渲染方面,深入材质重建算
法,提升质感。
© IDC | 25
网易伏羲客户案例:超次元
综合性虚拟活动应用运营商,4年虚拟化项目经验,提供“虚拟人+虚拟空间+虚拟内容”的矩阵式虚拟化服务

超次元成立于2015年,从VR/AR起步,后进入到虚拟偶像赛道,并在取得市场领先 p 典型数字人案例:
位置后展开元宇宙业务,在视觉算法方面与网易伏羲合作。 • 线上演出:Bilibili 冰火歌回3D演唱会、AcFun首届AC DERAM梦想演唱会
§ 主要服务场景:覆盖各大平台的虚拟内容制作及各类线下虚拟演出,在22年推 • 线下演出:Bilibili BML-VR、2018腾讯国漫演唱会、网易《楚留香》一周年嘉年华
出各类沉浸式实时虚拟活动。
• 虚拟电商直播:招商银行、美的、海尔、美赞臣、方太
§ 主营业务:以虚拟漫展、演唱会为代表的活动运营,也包括全3D沉浸式虚拟
活动应用-3DV虚拟人直播工具(专业级虚拟人直播系统VTPlus,桌面级虚拟 p 客户规模:
直播助手VTmini)和虚拟数字藏品。 § 企业级客户450+,终端用户4W+ (终端用户是指VTmini等工具的使用者,多为
§ 最近融资轮次:2022年4月 A轮 数千万元 个人主播,而非展会观众)
p 部署规模:
§ 截至2021年底共合作项目450+,服务600+ 知名IP
p 典型客户:
§ 企业类型以互联网公司为主,其次为知名传统品牌企业。例如腾讯、网易、B站、
抖音、阿里巴巴、快手(AcFun)、咪咕、HTC、蓝色光标……
p 优势:
• 在二次元虚拟人领域经验丰富。具备虚拟活动项目的全流程运营和制作能力,可
以满足多角色同台演出、全程多视角直播、多人实时互动需求,为现实观众提供
虚拟活动中的虚拟化身;设备载体支持多终端;已构建虚拟形象AVATAR库储备资
源3000+,以二次元风格为主。
• 使用门槛低,支持远程动捕。 VTPlus远程演出采用数据流传输,其核心技术是将
动捕数据压缩到原数据体积的5%以下,实现异地同步渲染。
© IDC | 26
小冰:AI数字人领域的先行者,聚焦AI being大规模生产和投放
定位AI数字人框架的生产者,坚持AIGC生成数字人,已积累了最为丰富的行业案例
q 商业模式:为企业提供订阅制虚拟员工、虚拟专家和虚拟陪伴,按使用时
q 产品:虚拟人主要分为四类,包括AI Employee(虚拟员工)、AI 间收费;提供AI being生成平台,通过生态网络售卖共同盈利;创造第一
Expert(虚拟专家)、AI Companion(虚拟陪伴)、AI 方AI being,作为虚拟偶像IP运营。
Entertainment(虚拟偶像)
q 典型数字人案例:
q 技术框架:底层的基础技术如自然语言处理技术、计算机视觉、计
• 房地产:万科崔筱盼(虚拟员工)
算机语音,人工智能创造力等。小冰框架对每个AI being都有六大要
素的设定,包括persona(性格特征),attitude(态度观点), • 媒体: 每日经济新闻N小黑(虚拟主播)、中国天气冯小殊(虚拟主播)
biological characteristics(生物学特征),creation(创造力), • 服装:国家纺织产品开发中心(虚拟设计师)、万事利丝绸(西湖一号,
knowledge(行业知识),skill(技能) 虚拟设计师)
• 体育:国家体育总局(观君,虚拟专家)
• 教育:中央美术学院(夏语冰,虚拟画家)、清华大学(华智冰,虚拟专
家)
q 部署方式:广泛支持各种方式,如手机APP、微信小程序、大屏、电视等,
可以多屏同时部署
q 部署规模:包括交付中的案例数量共计超过400个,最近一年部署案例增
长超300%
q 生态体系:为数字人IP、运营公司提供数字人生成框架或者AI能力;拥有
渠道与分销体系;与各领域具备专业知识的公司建立广泛合作。
q 用户体验:
• 看好并且认可小冰公司的AI生成技术,当前数字人上线效果,可以满足
企业对于虚拟员工、虚拟专家、虚拟陪伴和虚拟偶像的需求。

© IDC | 27
追一科技
较早开始做数字人。希望做成标准化产品,面向中小B,让AI数字员工服务每个组织与个人
q 营收规模:2021年收入千万级人民币
客户群和智能客服一致,在客服机器人的基础上增加多模态 q 收费方式:按服务计费,以并发路数为单位进行评估
方案分为:IVR(视频客服)、移动端、线下大屏
积累了十几个模特形象 q 典型案例
政府:大连市税务局
追一科技 多模态数字人产品框架 金融:西安银行(2D真人)
运营商:中移在线

q 生态合作:公司主攻对话式AI能力,3D形象以与外部合作
为主
q 部署规模:上线10个,私有云部署占比最高,也支持公有云
和混合云
应用效果:营销用户跳转率提升30
q 优势 :表情自然度高,产品成熟度好、易用性,多样性

© IDC | 28
中科闻歌:专注数智媒宣领域的AI数字人
目前在数字人领域积极投入,以高拟真形象为前提,提供更加便捷、低成本、高效率、可实时交互的AI数字虚拟人解决方案,
主要面向媒体与宣传应用场景满足客户多样化、定制化需求,将持续投入数字人全栈技术的研发。
q 产品技术:
q 应用场景:
• 快速定制型数字虚拟人技术:无需训练,快速生成
• 新闻播报:虚拟主播
• 高精复刻型数字虚拟人技术:真人素材训练,角色定制生成
• 教育行业:名师课堂
• 高拟真虚拟人实时问答技术:支持问答语料库与角色形象的
快速定制 • 党建相关:智慧党建
• 数字人智能创作平台:快速进行虚拟人视频制作、编排与渲 q 典型案例:
染 • 媒体:綦江融媒体,垫江融媒体
q 服务模式:一体机 & SaaS • 企业:泽桥医疗
q 技术架构: q 核心优势 :
• 快速高效:主播形象、姿态、场景自定义快速配置,逼真
自然,多语言播报能力凸显国际化
• 降本增效:文本内容到数字人视频一键生成,创作平台上
手简单方便,显著提升内容生产效率,节省运营成本
• 全链服务:媒宣领域产品条线完整,可实现融媒体智能化
生产与管理,提供端到端解决方案

© IDC | 29
英伟达:数字人计算平台的提供者
以 Omniverse 平台赋能超写实数字人,联合生态资源,提供算力支撑

英伟达储备了包括从抽象角色到超写实人物角色级别的数字人技术,在虚 q 产品:Omniverse Audio2Face 测试版APP


拟人创建方面,目前的实现方式主要通过Omniverse产品体系中基于
Omniverse 技术平台的Omniverse Audio2Face。
§ GTC2021 发布了用于生成交互式AI虚拟形象的技术平台——NVIDIA
Omniverse Avatar——将基础图像、模拟和AI技术结合在一起,目前
仍在开发中。
q Omniverse Audio2Face App功能分为五部分——
§ 2022年发布了AI驱动的面部动画应用程序Omniverse Audio2Face, • 音频录播:录制/回放声音轨迹,并生成实时动画
通过声音快速生成表情丰富的3D模型面部动画,是Omniverse • 实时直播模式:使用麦克风实时驱动Audio2Face
Avatar的虚拟形象动画驱动技术的一部分,目前已经公测。 • 重新定义目标(角色转化):将生成的动作重定向到自定义角色
画面
• 多实例:支持在同一场景使用多个角色运行Audio2Face
• 多形态转换:将生成结果实时转换输出到各种硬件载体,与各种
3D软件动画轻松集成

q 典型案例:英伟达初创加速计划成员 数字栩生、Charisma、
Resemble AI,虚拟人李星澜 Lydia
q 差异化优势:在生态方面, Omniverse平台提供了高效兼容的内容协
作底座,以USD(通用场景描述)技术打通各类内容设计软件平台,
英伟达GPU的光线追踪计算可简化DCC部分。
q 当前挑战:Audio2Face生成的面部动画(口型)更符合英语在发音
上的特征,有待完善对汉语的支持效果
© IDC | 30
目录
1 中国AI数字人市场现状

2 中国AI数字人市场生态

3 AI数字人典型行业实践案例

4 主流AI数字人厂商分析

5 初步评估中国市场的AI数字人

6 趋势与建议

© IDC | 31
现阶段可用于进行数字人能力评估的框架

一级分类 介绍 细粒度能力

产品基本功能 提供完整的AI数字人产品功能:形象设计,多模态交 形象设计能力(光学技术)


互 多模态交互(动捕技术,语音驱动口型/人脸)
工程化能力(动捕数据去噪、压缩传输)
内容/知识库,形象库等
AI能力 包括图像、语音、语义在内的全栈AI能力 人像能力(唇动匹配度,形象拟人度),语音能力(音色,交互方式,
糟杂环境下的自然交互negligible),对话能力,情感丰富性
市场及生态能 商业化落地能力:部署效率,制作成本 多终端部署的支持
力 数字人产业生态伙伴,可能包括上游供应商,中下游 部署上线效率:可快速接入不同终端,易操作
合作伙伴,以及与大客户建立的联盟等 服务的稳定性
服务器并发性能
整体制作成本

商业化能力 2021年至今营收规模 客户案例部署规模:上线的路数,交互的数据


包括落地的和POC过程中的商业化案例的多少 使用/观看用户数量
已部署上线的数字人数量
用户体验 终端用户对厂商产品的整体评价 表情动作流畅度:口型准确,动作自然,声音清晰,音唇同步
易用性,效果 交互的实时性

愿景 发展年限、发展策略、未来目标等

© IDC | 32
初步评估中国AI数字人主流参与者
• 可简单地将AI数字人分为2-3个梯队。第一梯队以百度智能云、商汤、小冰为主。
• 市场的参与者目前大多差异化竞争,分别在已有客户群体的领域依托自身技术优势进行深耕。
• 整体市场离成熟仍有较长一段距离,但并不影响在一些领域可以进行探索式创新。

© IDC | 33
目录
1 中国AI数字人市场现状

2 中国AI数字人市场生态

3 AI数字人典型行业实践案例

4 主流AI数字人厂商分析

5 初步评估中国市场的AI数字人

6 趋势与建议

© IDC | 34
中国AI数字人市场规模预测,2021-2026
初步评估2021年中国AI数字人(企业级服务型数字人)市场规模约5.2亿元人民币,而在2022年呈现
出高速增长趋势,预计到2026年,市场规模将达到102.4亿元人民币,2021-2026年CAGR达81.5% 。
中国AI数字人市场规模预测,2021-2026
(亿元人民币)
120 120.00%

100 100.00%

80 80.00%

60 60.00%

40 40.00%

20 20.00%

0 0.00%
2021 2022 2023 2024 2025 2026

• 注:以上市场规模预测不包括演绎型、互娱型数字人,仅代表企业级市场服务型数字人的市场规模预测。

© IDC | 35
未来发展趋势展望

产品技术趋势:未来的数字人都将是由AI驱动内容生成,多模态AI技术
是核心;交互会越来越智能;形象越来越逼真,由拟人到类人到同人

行业应用趋势:未来几年将是人类员工与数字人并存的方式,AI辅助/
支持人类进行工作。首先规模化落地的场景包括:虚拟偶像,虚拟直播
带货,数字人客服,AI数字人员工

产业落地趋势:AI数字人将以平台工具的形式输出,赋能给各行各业;
在数字人平台型公司以外,数字人运营赛道也有可能产出独角兽

整体发展趋势:本报告研究的是企业级服务型数字人,未来AI数字人另
外一大高潜力赛道即演艺型数字人

未来在生活与工作中,必将有大规模的数字人与人类共存。

© IDC | 36
给技术买家的建议
q 当前数字人价值最明显的领域:数字人直播带货,数字人客服,RPA+数字员工,数字人主播
q AI数字人对企业的价值:1)优化/替代企业内部正在执行的工作任务,提供更加稳定、高效、持续的任务表现,节约人
力成本,提升业务效果,改善员工的工作体验;2)重塑当前的业务模式,创新工作流程,
q 演艺型的核心是低成本、高频率的内容生产,AI换脸生产视频和海报、自动化24小时直播 、AI声音定制
q 关于部署,现阶段部署的方式有很多,包括数字人大屏,一体机,App/h5/小程序,云端
q 在未来2-3年内,仍需要真人与数字人配合,在无法达到用户满意的情况下由真人接管
q 在3-5年内,AI数字人的自主决策程度将不断提高
q AI数字人的应用相比其他AI场景,会需要企业配合一些流程再造
q 对以AI数字人为代表的AI应用场景保持耐心,不设置过高的期望值,准备一定的预算

© IDC | 37
更多信息,请联络:
卢言霞
18101095739
ylu@idc.com

CHC48744822 IDC.com linkedin.com/company/idc twitter.com/idc blogs.idc.com

© IDC

You might also like