Professional Documents
Culture Documents
IDC中国AI数字人市场现状与机会分析 2022
IDC中国AI数字人市场现状与机会分析 2022
卢言霞, 助理研究总监
王丽萌,高级市场分析师
1 中国AI数字人市场现状
2 中国AI数字人市场生态
3 AI数字人典型行业实践案例
目录
4 主流AI数字人厂商分析
5 初步评估中国市场的AI数字人
6 趋势与建议
© IDC | 2
目前数字人分类尚无统一方案,此次报告重在关注企业级服务型数字人
2022年开年以来,数字人几乎成为AI第一热门赛道。数字人在2021年即有20家以上的企业获得新一轮的融资,且都在数千万人民币以上的规模。
进入2022年,数字人更是在诸多应用场景大放光彩。
q 按照应用范畴,可以大致分为泛娱乐数字人以及企业级服务数字人。泛娱乐数字人,即用于音乐、美术等艺术创作的数字人,用于影视节目
或者游戏的二次元、三次元虚拟人。企业级服务数字人,即为企业内外部提供服务,典型的场景有智能客服、保险代理人、AI数字员工等。
q 从交互方式来看,又可以分为文字、图文、声音、声音+文字、多模态交互数字人。早期的数字人往往仅具备单一的文字交互、图文交互或者
语音交互能力。最高级的形态则是实时沉浸式交互数字人。
q 从是否具有真实身份来看,又可以分为真人替代型和身份型虚拟人。真人替代型即替代人类进行工作,如虚拟主播、虚拟导购等。身份型虚
拟人是指完全虚拟的身份,也有可能是真人偶像的虚拟形象。
q 按照背后是否有真人支撑,又可以分为真人驱动型和计算驱动型。真人驱动型代表数字人的行动背后有真人在指挥操控或者演示。计算驱动
型没有真人操作,完全由计算机模拟而成。真人驱动型的数字人通常不在AI数字人的范畴。
文字型、声音、声音+文字、
泛娱乐数字人 真人替代型 真人驱动型
图文型
© IDC | 3
IDC对于AI数字人的定义:真正由AI驱动的数字人
根据IDC人工智能自动化五级演进框架,我们将数字人发展历程分为如下5个阶段。
L5
业务价值提升
L4 完全实现智能化交互
语言交互智能化,但在特定场
L3 合需要人工接管
L2
依赖算法驱动肢体、姿态、口
型、表情等 • 由数字人自主决策、自主执
行任务
L1 依赖外部动捕设备采集肢体、
表情和口型信息 • 数字人进行决策,并执行指
令为主
依赖辅助人工制作形象和动画 • 在数字人无法满足需求时,
效果 • 数字人具备人的外形,只能
执行简单的决策和操作 由人工接管
• 在交互模式上,可能仅是文 • 在交互模式上,较少做到多
• 人类在后台决策并操作 本交互、图文交互 模态实时交互
• 输出实时的数字人形象
• 人类进行决策并操作
• 以数字人形象对外输出
智能化水平
• 并不是当前市面上所有的数字人都是基于AI技术驱动。IDC在本研究中将AI数字人定义为:采用人工智能技术驱动生成的数字化的虚
拟人物——具备人的外观,感知互动能力以及表达能力。
• 如上图所示,今天的数字人大多处于L1-L3的阶段,而未来的AI数字人将是L4-L5的水平。
• 当然,在现阶段,并不是所有的场景都要用到完全AI驱动的数字人。在真实场景中,还是以实际上线应用的需求为首要考量,可能会
用到中之人方案,逐步过渡到纯AI驱动的数字人。
© IDC | 4
AI数字人的商业价值与社会价值巨大
q 提升员工生产力、创造力:AI辅助设计的场景,AI数
字员工的场景
q 为残障人士提供服务通道:手语主播应用在新闻播
报、赛事报导、公共场所指引等,属于AI向善的场
景
q 不断提升用户体验:展厅场景,智能客服升级
q 降低成本,提高效率:产品销售成本的下降(例: § 万科催收数字员工 § 央视AI手语主播
信用卡单卡推广成本)
q 作为虚拟品牌形象,避免真人代言可能引起的偶像
翻车事件、侵权事件等
§ 展厅讲解机器人 § 中纺虚拟设计师
© IDC | 5
市场发展由政策、应用价值、市场需求、资本支出、技术成熟多方驱动
q 政策驱动: q价值驱动:
q 2021年10月,广电总局发布《广播电视和网络视听“十四五”科技发展规划》指出: • 产生人类员工不具备/难以达成的创造力
“强化人工智能、大数据、区块链在内容选题、素材集成、编辑制作、内容审核、媒资管理、字幕制作等环 • 7*24小时代替人类执行工作任务
节的应用,促进制播流程智能化。推动虚拟主播、动画手语广泛应用于新闻播报、天气预报、综艺科教等节 q 市场需求驱动:
目生产,创新节目形态,提高制播效率和智能化水平。到 2025 年,IP 化制播标准体系基本完善;各级广播
电视播出机构制播系统广泛实现 IP 化,制播流程更加优化,内容生产智能化水平显著提升。 • 企业内在创新需求驱动
• 企业提升竞争力需求驱动
专栏 5 智慧制播
• 新政策要求下的数字人价值驱动
(5)AI 无障碍播报
q 资本市场驱动:
研究语音、文本到手语翻译中的情感分析、语义分析、手语动作驱动、表情驱动等关键技术,为节目提供手
语、表情、唇语等多模态的表达方式,提升翻译准确度,扩大播出内容影响力,满足听障人士、噪声场景观 • 截至2022Q2,数字人投融资规模已超过20亿元人民
众理解视听节目内容的需求。 币,市场需要寻找新的有潜力的AI赛道
(6)虚拟主播
面向新闻、综艺、体育、财经、气象等电视节目研究虚拟形象合成技术,包括 2D 虚拟形象的合成、3D 虚
拟形象的驱动、虚拟引擎构建、语音驱动、动作捕捉、面部表情捕捉等技术,提升节目制作效率及质量;同 q技术驱动:
时探索短视频主播、数字网红、直播带货等虚拟形象在节目互动环节中的应用,增加个性化和趣味性。
• AI技术的不断成熟:包括认知能力、多模态交互能力
• 支持“虚拟主播”的发展以提升节目制作效率及质量的同时,也鼓励探索短视频主播、数字网红、直播带 等全栈AI技术的不断成熟
货等虚拟形象在节目互动环节中的应用,增加个性化和趣味性。 • 算力(如GPU芯片)、硬件设施的成熟
© IDC | 6
1 中国AI数字人市场现状
2 中国AI数字人市场生态
3 AI数字人典型行业实践案例
目录
4 主流AI数字人厂商分析
5 初步评估中国市场的AI数字人
6 趋势与建议
© IDC | 7
数字人技术体系复杂,AI数字人的核心能力是AI驱动内容生成
q 数字人技术体系覆盖广泛 AI数字人必备能力
• CG(Computer Graph,计算机图形)建模:提供计算机建
模以及图形渲染能力。由计算机对虚拟数字人建立系统框
架,包括人物形象、语音生成、动画生成、音视频合成、 拟人形象 交互能力
交互模块等,并对数字人形象进行渲染。 • 建模能力 • 文本交互、对话式交
• 语音语义视觉等多模态AI能力:语音、视觉使其具备感知 • 形象设计:静态形 互、图文交互,以及
能力,语义使其具备认知能力。具备视听和理解能力的数 象,动态形象 多模态交互
字人,才算是具备多模态AI能力的数字人。 • AI驱动的表情、动作 • 实时交互能力
• 数字内容:定义虚拟人运行本身的内容,以及虚拟人运行 • 渲染
所需的周边内容。
• 动作捕捉:通过特定摄像头捕捉真人动作、形体、表情、
眼神、手势等,来形成数字人动作
多终端部署能力
• 决策智能:基于知识进行决策 决策能力
• APP,小程序,h5,
• …… • 知识库、知识管理
大屏,一体机……
• 知识图谱
• 数字人实体形式部署
• 智能决策
© IDC | 8
技术体系映射到产业链的生态图谱
应用层
跨行业应用 金融业 政府 传媒
© IDC | 9
细分产业链的定位
q 基础硬件层:包括用于加速AI数字人训练与计算过程的芯片,云端算力,以及动作捕捉过程可能用到的光学器件、传感器,
交互环节可能用到的显示设备
q 建模、动捕与渲染:包括数字人的设计、3D建模,动作捕捉系统,以及数字人形象渲染。并不是每一种数字人都会用到
动捕环节
q 形象与内容:专为数字人市场提供形象设计、内容的企业。
q 端到端数字人生产厂商:具备数字人生成全栈技术,并且以平台形式对外开放
q 行业应用层:包括跨行业应用如数字人客服,数字人员工。行业垂直场景中,例如证券行业开户环节,保险业经纪人;政
务大厅或者旅游景点的讲解员
Ø 整体上,由于平台层端到端数字人生产厂商的出现,以及对于纯AI驱动的数字人的趋势,在企业级服务数字人市场,一定
程度上缩短了产业链,诸如动捕、渲染、形象库等环节可能被纯AI技术取代
Ø 从商业模式上,目前收费方式主要有:1)开放数字人能力API,可能是AI能力比如语音交互能力,也可能是数字人端到端
能力,比如诗词创作API、创意生成API等;2)开放数字人设计框架;3)按路数对数字人进行收费;4)按定制化项目收
费;5)在营销领域,也有很多按照代言人营销服务进行收费。
© IDC | 10
目录
1 中国AI数字人市场现状
2 中国AI数字人市场生态
3 AI数字人典型行业实践案例
4 主流AI数字人厂商分析
5 初步评估中国市场的AI数字人
6 趋势与建议
© IDC | 11
浦发银行:重点投入数字人,构建大规模数字员工队伍
已在多个场景中引入AI数字人,计划构建大规模数字员工队伍,使其真正在金融行业发挥价值
内部培训场景的AI 对客交互和销售领
数字人客服 文档审核数字员工 数字员工 域的AI数字员工
q 工作内容:智能呼入客服机 q 工作内容:审核业务领域的 q 工作内容:每2周都有十几 q 工作内容:数字理专场景,
器人,营销场景下的外呼机 文档,抽象出其中的关键要 场培训。目前已经完成了2 帮助客户解答理财产品的关
器人。客服的人工坐席仅有 素并且标准化,并标注出需 万人次的培训 键特性
600多个,但零售客群就有 要人工复核的领域,然后进
1.2亿,采用数字人客服可 行人工复核 q 工作效果:
以补充人工不足的情况 q 工作效果: q 工作效果:
• 由原来的书面式培训变成交
q 工作效果: • 识别准确率明显提升 互式、自适应式培训,体验 • 月活已经达到46万人,每
• 外呼坐席中,人工呼出量2 更好,效果更好 个月46万人通过数字员工的
• 由2路1校(2个业务人员输
万通左右,AI数字员工呼出 推荐选购理财产品
入内容,1人复核)变成1个
量能达到50-60万通 • 经数字员工培训的客服人员、
数字员工生成内容,1个人 • 数字人具备渠道流量优势,
理财经理,销售的开单率成
工复核 相比人工可以大幅提升服务
• 在呼入场景,85%都是由数 功率明显提升,销售单笔平
• 当前的数字员工场景,已经 效率
字人完成,15%是由人工完 均金额都有10-20个点的提
相当于200-300人员/年的
成 升
生产力
浦发银行对于AI技术高度重视且高额投入,希望AI为银行带来真正的价值,但未来的产出有一定的不确定性。百度作为一家纯粹的技术见长的
公司,愿意与浦发银行共同进行探索创新,目前在AI数字人领域大部分场景均是与百度合作。
© IDC | 12
中国纺织信息中心-以AI内容生成打造数字创造力
中国纺织信息中心依托丰富的纺织业数据积累,与小冰公司合作开发AI数字设计师,并以平台形式面向行业开放,提供流行趋
势设计定制化解决方案等。
背景:中国在纺织领域是当之无愧的大国,也有最先进的装备,但在创造力方面谈不上是强国,因此希望引进AI技术来提高创新创造能力。
q 引入AI技术的基础
• 中国纺织业有维度最丰富的数据,包括纺织行业企业以及消费端数据,有一定的创意设计资源数据库。
• AI能力上,中国已经在很多方面具备国际领先优势。尤其在本场景中,小冰公司也具备深厚的NLP、CV、AIC等全栈AI能力。
q 引入AI数字设计师提高创作能力
• 建设AI数字设计师:中纺与小冰公司一起将T台的色彩、图案特征提炼出来,针对品牌需求,采用具有流行趋势特征的纺织品图案设计方案。
• 开放DPI Space(www.dpispace.cn):基于AI内容生成能力面向行业开放流行趋势设计平台,目前已有注册企业400余家。
• 基于AI数字设计师以及开放的DPI Space平台,CTIC与小冰公司联合为企业提供定制化解决方案。例如,目前全棉时代已经就趣味卡通和时尚牛仔的AI图案设计等,
与鲁丰达成合作意向。
STEP 1:流行主题、色彩特征和 应用落地条件: 训练、调整、优化
情感关键词 发现产业需求+认知数字技术=产品设计逻辑 人工智能情感化设计算法
STEP 2:色彩特征与图案风格
产业场景
中国纺织信息中心 产业知识 算法训练 小冰
长期致力于中国纺织面料流行趋势研究 产业数据
人工智能视觉识别、自然语言处理技术、人工
及色彩管理应用技术开发,流行色应用
智能创造力等技术、研发支持。
分析与预测。
50% 30% 15% 5%
收集灵感素材 沟通与决策 制图描稿 生产跟进
中国纺织产品开发流程特别长,对数字化设计的需求非常迫切。开展技术创新,尤其是引进AI内容生成技术和AI数字设计师,将有助于借助数
DPI SPACE人工智能图案设计平台
字创造力提高行业效率和生产力。 ——国家纺织产品开发中心主任,李斌红
© IDC | 13
中信建投:首家在开户场景应用数字人的券商
在券商开户场景中引入AI数字人,与用户双向智能交互
q 建设背景:
在证券开户场景,传统上都是普通单向模式。根据中登新公布的开户实
施细则,监管要求开户环节需为双向服务
目前主要在单向服务中使用数字人,以为客户提供友好的服务体验
q 部署过程:
• 采集员工形象,前期先由腾讯云为其定制4个形象,后续为其他业务
场景再去扩展形象
• 使用场景:客户首次进入开户场景,会以数字人形象进行单向验证
• 在该场景中,一是对系统的安全性要求比较高,服务、资源等都要多
副本部署;二是对系统性能要求也比较高,需要引入GPU等异构资源;
三是对包括形象、体验、交互友好度等方面的效果也非常看重(E.g.,
交互过程中,600ms即可返回首帧图像)
q 案例特色:
• 是券商行业首个在开户场景中引入AI数字人的实践
• 在正式场景中,数字人可以与用户进行双向互动
选择腾讯云的原因:前期经过多家厂商的调研,经过POC和技术对比后,认为腾讯云的数字人,无论是形象效果还是性能,都非常好。
© IDC | 14
西安银行将智能客服升级为数字人客服
• 背景:西安银行是当地的城商行,作为陕西省地区政务类业务代理合作银行
• 业务场景:转账
• 业务需求:转账常用功能之一,方便老年人通过语音在线办理部分业务(其它智能语音助
手、语音播放理财产品规划)
• 上线时间:2020年12月底
• 部署:手机客户端集成SDK的形式,采购5路并发(数字人可以同时服务5个客户)
• 用量:每天1500人次
• 建设费用支出:60-90万
• 未来场景规划:网页版数字人转账功能,远程银行的贷款尽职调查功能(核实客户意愿,
完成线上签约)
© IDC | 15
AI数字人已在金融、零售、互联网、政府等行业初步落地
品牌
虚拟 AI理
展厅
数字 IP 财顾 数字
数字
人导 问 人客 AI保
讲解
AI客服 购 服 险代
员
代表 理人
零售 AI数
金融 字员
政府
工 • 目前来看,AI数字人是直
播带货、主动推荐营销场
虚拟
影视
AI交 景最为普及,价值也最为
偶像 易员
应用场 虚拟
主播
明显;其次是客服数字人
景
虚拟 互联 AI海
• 未来,AI数字人的数量也
演员 网 报设 许会超过人类的数量
计师
传媒
业 数字
数字 能源 医疗 体育 人直
人客 赛事 播带
服 货
AI主 AI裁
播/ 判
AI编辑 主持
人 虚拟 数字
AI助
医生 人陪
护 理教
虚拟 练
主播
© IDC | 16
目录
1 中国AI数字人市场现状
2 中国AI数字人市场生态
3 AI数字人典型行业实践案例
4 主流AI数字人厂商分析
5 初步评估中国市场的AI数字人
6 趋势与建议
© IDC | 17
百度智能云
通过新一代可视化语音交互,带来全新的交互与服务体验
• 百度智能云曦灵平台支持服务型和演艺型两类数字人,前者以智能 q 营收规模:2022年预计达到亿元级人民币。
交互及智能知识库为主提供一对一个性化服务;后者以智能内容生
产为核心提供虚拟主持人、虚拟偶像、虚拟带货主播等服务。 q 收费方式:1)“软件授权+服务许可”,服务许可以并发路数
• 这两类数字人在共用底层AI引擎的基础上,根据形象类型封装为三条
为单位;2)按业务效果计费,以业务运营指标的表现为计费
人像资产生产线,其定制周期由短到长分别为2D人像、3D卡通、3D 标准 3)SAAS平台订阅式收费
写实。完成基础形象生产后,共用三大产品运营平台实现快速生产, q 典型数字人案例:
包括人像配置、业务编排及内容创作等。
金融:浦发银行,民生银行,江苏银行,国泰君安证券
• 解决方案层面,服务型数字人产品类型丰富度高,从原有的企业服
务场景延伸到营销、办公等领域;演艺型数字人的核心场景相对收 媒体:央视新闻、央视网、人民日报、陕西广电
敛,通过手语、直播、运营三个子平台实现小时级别交付,提升效 其它:极幕科技、中国文物交流中心
率和质量。
q 优势:
• AI底层技术积累优势,包括视觉、NLP和语音交互等全栈AI技
术;及以PLATO、Ernie在内的文心大模型基础,在开放域对
话及AIGC智能创作等方面具备技术优势。
• 在智能客服领域积累了经验和客户。
• 产品类型、覆盖行业场景多样,尤其在金融、媒体领域落地
经验丰富。
q 部署规模:已上线20个左右
q 用户体验
百度能够为用户提供多种多样的数字人选择,能提供一站式数字
人平台
© IDC | 18
华为云
致力于打造批量生产、天级交付的个性化数字人SAAS应用
q 华为云在AI数字人领域的策略: q 注重强调AI能力:
q 依托AI的技术积累,充分发挥大模型、多模态交互能力,打 • 知识、技能的积累
造规模化、可量产的AI数字人
• 语音识别领域的感知能力
• 可以基于知识进行决策
q 典型数字人案例:
• 主要的案例积累在于展厅数字人场景、财经播报数字人场景
• 湖南小漾
q 部署方式:支持多种部署方式
q 优势:
• 华为云在AI领域已经有连续多年的技术和实践积累,尤其重视对话式
AI、多模态AI、智能决策、知识计算领域的投入,这些技术对于数字
人的自然交互能力至关重要
© IDC | 19
京东云
京东言犀多模态数字人平台,基于前沿的AI能力+大规模产业服务实践推出产业数字人平台,在电商和金融两大领域快速发展
• 京东言犀拥有100余款数字人形象、30+AI音色和亿万商品文案生成能
力 q 典型数字人案例:
• 由于大规模的服务实践,京东言犀多模态数字人平台的对话系统领先 • 金融:江南农商行( VTM虚拟柜员机),深圳农商行,京东金融,
于行业,积累了丰富的通用行业语料和知识图谱,迁移成本低,交互 弘康保险
体验好
• 零售:京东商城(数字人客服,运营短视频生产创作)
• 主要服务于政企客户,覆盖行业场景广泛,交付方式灵活
• 文旅:兰考党建,中关村未来科技展展会
q 部署方式:可选云端/本地端侧渲染方案。多渠道多终端兼容,支持
轻量化的数字人交互SDK,可在APP、智慧大屏一体机、PC、小程
序、H5、智能音箱等多终端集成。多渠道多终端兼容,也可兼容客
户已有的语音能力。
q 部署规模:项目形式的服务型数字人十余个,其中约75%的客户使
用京东云“智能客服+数字人”全套方案;SaaS形式的数字人客服已应
用于300+京东电商直播间。
q 优势:依托京东商城平台优势,有一定的用户资源积累,且京东云
在金融领域也有丰富的行业实践,能深入业务场景制定技术方案
q 应用效果:以江南农商行为例,已上线的VTM(虚拟柜员机)数字
人员工可解决90%业务,业务办理的平均时长从人工座席的“近300
秒/次”缩短到“215秒/次”,并且提高并发量,减少高峰期的顾客排队
等待时间,提升服务体验
京东云 言犀多模态数字人平台架构概览
© IDC | 20
平安金融壹帐通
从金融行业数字人做起,目前已在保险行业大规模部署
q 聚焦在金融行业,同时也服务于智慧城市等领域 q 应用场景:
q 专注打造AI数字人,尤其聚焦AI数字员工场景 • 远程推广:以AI虚拟助手的形式,为不同的客户做产品介绍
• 远程面审:以AI虚拟面审官的形式,替代真人进行全天候服
务,尤其在信贷推广、风控面审环境,AI坐席服务比例达到
33%
• 远程面试:在增员、面试环境通过形象分身代替真人进行AI
面试,实现智能增员
q 部署规模:
• 目前在平安内部部署的数字人,已经有几千路的并发
q 优势:
• 可依托平安体系内全栈AI技术能力
• 在大规模使用的实践中,对于使用过程中音视频流如何分发、
如何保证低延时,高并发下的负载均衡都有深刻的理解
• 在金融行业已有规模化部署的经验,可提供金融场景下专业
的AI数字员工
© IDC | 21
商汤科技:更高效、更低成本提供AI数字人
1)生成:照片生成模型,人物模型美化,虚拟试穿试戴,脸部/头发等AI生成;2)驱动:AI驱动准备,脸部AI驱动,肢体AI驱
动,语言文字AI驱动; 3)智能:交流对象识别分析,语音语义理解,知识库,运营管理平台
q 产品层面:提供丰富的数字人形象,包括超写实数字人,3D 商汤科技数字人目前已覆盖广泛的应用场景,包括零售业智能导购,金
拟真人,2D真人,3D卡通等 融业数字人客服,政务文旅领域等
q 技术架构:行业应用层,AI能力层,引擎层,全栈技术自研 q 典型数字人案例:
为主 • 零售:永旺商场智能导购
• 金融:宁波银行,浙江农业银行,兴业银行
• 政务:深圳地铁建材集团—可视化数字人大屏
q 部署方式:大屏,一体机,APP,线上……
q 优势
• 提供丰富的产品形态供用户选择
• 应用场景丰富,行业实践积累深厚
• 尤其在图像、视觉相关的技术领域具有领先优势
q 用户体验:
商汤提供的数字人可以由真人表情驱动,作为能力平台对外输出。该形
式在银行业内很新颖,可以在自助客服场景提供更加生动形式解决业务
常见问题,助力金融行业未来的元宇宙探索。——工商银行总行信息部
© IDC | 22
拓尔思
以“语义智能+”为技术战略,用语义智能赋予虚拟人“实用的灵魂”,目标是应用到业务场景中
• 拓尔思在智能虚拟人领域,业务定位是用语义智能赋予虚拟 q 典型案例:
人“实用的灵魂” ——智能驱动的大脑。通过NLP与业务场景 • 媒体:新疆日报(虚拟主播) ,冬奥会-虚拟主播小思
机器人结合,打造“虚拟人+”场景,使得虚拟人能够取代人
工操控,逐步代替真人工作的能力。 • 互联网:某头部直播公司(网红虚拟主播,虚拟人客服)
• 2022年初,成立专职虚拟数字人研发团队,打造数字虚拟 • 金融:在智能客服等客户业务场景中提供智能化、自动化的
人,推出了算法驱动的SaaS化的虚拟人赋能平台,主要提 “专业虚拟人”功能及服务。
供两类产品: q 合作伙伴:
• AI 数字分身:通过拍摄和语料处理实现个性化定制; • 形象方面,在自研的同时,与拍摄、模型训练等供应商合作
• 标准形象虚拟人:基于已制作的若干个标准形象,通过 AI • 思维方面,与行业服务厂商合作,以语义智能赋能“服务虚
变脸技术与用户照片融合,低成本打造自主形象。 拟人”的落地应用。
q 差异化优势:
• 技术方面,拥有20余年的NLP、文本挖掘及大数据相关技术
拓尔思语义智能+业 积累,中文文本处理能力成熟,研发投入较高(2021年研
务板块总体示意图 发投入比20%)
• 市场方面,可依托已有的客户积累,在优势赛道进行深耕
© IDC | 23
腾讯云
致力于AI技术保障形象表现力、识别力和理解能力,并保证最优服务性能
• 打造工具箱,探索在某些行业、场景打造SAAS级别数字人 q 典型案例
• 做了20+形象,以及发型、服装、饰品等形象库定制,可快 • 媒体:新华社&气象局
速交付 • 金融:中国工商银行,光大银行,南京银行,江苏银行,中国平安,
阳光保险,广发证券,
• 政府:汕头市人民政府(汕头城市发展和产业展示厅-虚拟讲解员),
广州地铁&青岛地铁(虚拟乘务员),
• 教育:国家电网-国网大学(虚拟讲师),腾讯教育
q 部署规模:目前已上线几十个数智人
q 差异化优势:
• 在国内较早落地,积累了底层算法和工程优化能力,产品成熟度高,
具体表现在: 1)生产高效,在播报场景中可短时间快速生成大量视
频,如输入文字后10分钟内产出1-2分钟视频;2)交互设计体验好,
在交互场景中的视频流延时低,虚拟人动作细腻流畅,而且给主播、
老师不同场景类型虚拟人打造不同的动作库
• 提供IP授权服务,具备与腾讯自有IP结合的潜力
q 用户体验
• 认为腾讯云数字人优势在于形象佳,性能好
© IDC | 24
网易伏羲
孵化自网易游戏雷火事业群,虚拟角色经验丰富,走精品化形象路线,持续提高标准化对外输出能力
网易伏羲成立于2017年,基于3D美术领域的多年积累,2021年正式推出有灵虚 q 典型虚拟人案例:
拟人产品,自研“形象创建”、“形象驱动” 等AI算法模块,目前主要面向2大 • 游戏:《逆水寒》、《永劫无间》、《倩女幽魂》,《倩女幽魂手游》,《天
场景提供服务,分别是: 谕手游》,《绝对演绎》,《漫威对决》
• 文娱:网易新闻,网易云音乐,LOOK直播,超次元-Vtmini,PrprLive
• 虚拟资源生产:更高效、高质地制作虚拟人资源,降低研发成本
• 文旅:西藏脱贫攻坚虚拟形象,杭州丝绸城(逆水寒IP联动),杭州星光大道
• 虚拟实时互动:用更拟人的方式(语音/视觉)驱动虚拟人,提高交互体验 牛小星,成都数字产业园书畅
有灵虚拟人主要面向游戏、娱乐行业垂直服务,并积极与其他行业伙伴共建生态。 • 电商直播及快消:网易严选虚拟代言人,麦当劳虚拟代言人
• 教育:有道乐读可可,有道纵横小七
q 部署方式:
• 以SDK产品为主,正推出游戏资源生产、直播、短视频等垂直行业的SaaS工具
q 部署规模:
• 50+企业级客户案例,日均AI服务调用次数超200万次
q 生态合作伙伴:
• 音视频服务-声网、网易云信,智能客服-网易七鱼&网易严选,文娱-超次元
q 优势:
• 以3D虚拟人为主,在美术研发和超写实人物制作方面能力突出。在技术上注
重交互表现力,提升语音&动画表现效果;在视觉渲染方面,深入材质重建算
法,提升质感。
© IDC | 25
网易伏羲客户案例:超次元
综合性虚拟活动应用运营商,4年虚拟化项目经验,提供“虚拟人+虚拟空间+虚拟内容”的矩阵式虚拟化服务
超次元成立于2015年,从VR/AR起步,后进入到虚拟偶像赛道,并在取得市场领先 p 典型数字人案例:
位置后展开元宇宙业务,在视觉算法方面与网易伏羲合作。 • 线上演出:Bilibili 冰火歌回3D演唱会、AcFun首届AC DERAM梦想演唱会
§ 主要服务场景:覆盖各大平台的虚拟内容制作及各类线下虚拟演出,在22年推 • 线下演出:Bilibili BML-VR、2018腾讯国漫演唱会、网易《楚留香》一周年嘉年华
出各类沉浸式实时虚拟活动。
• 虚拟电商直播:招商银行、美的、海尔、美赞臣、方太
§ 主营业务:以虚拟漫展、演唱会为代表的活动运营,也包括全3D沉浸式虚拟
活动应用-3DV虚拟人直播工具(专业级虚拟人直播系统VTPlus,桌面级虚拟 p 客户规模:
直播助手VTmini)和虚拟数字藏品。 § 企业级客户450+,终端用户4W+ (终端用户是指VTmini等工具的使用者,多为
§ 最近融资轮次:2022年4月 A轮 数千万元 个人主播,而非展会观众)
p 部署规模:
§ 截至2021年底共合作项目450+,服务600+ 知名IP
p 典型客户:
§ 企业类型以互联网公司为主,其次为知名传统品牌企业。例如腾讯、网易、B站、
抖音、阿里巴巴、快手(AcFun)、咪咕、HTC、蓝色光标……
p 优势:
• 在二次元虚拟人领域经验丰富。具备虚拟活动项目的全流程运营和制作能力,可
以满足多角色同台演出、全程多视角直播、多人实时互动需求,为现实观众提供
虚拟活动中的虚拟化身;设备载体支持多终端;已构建虚拟形象AVATAR库储备资
源3000+,以二次元风格为主。
• 使用门槛低,支持远程动捕。 VTPlus远程演出采用数据流传输,其核心技术是将
动捕数据压缩到原数据体积的5%以下,实现异地同步渲染。
© IDC | 26
小冰:AI数字人领域的先行者,聚焦AI being大规模生产和投放
定位AI数字人框架的生产者,坚持AIGC生成数字人,已积累了最为丰富的行业案例
q 商业模式:为企业提供订阅制虚拟员工、虚拟专家和虚拟陪伴,按使用时
q 产品:虚拟人主要分为四类,包括AI Employee(虚拟员工)、AI 间收费;提供AI being生成平台,通过生态网络售卖共同盈利;创造第一
Expert(虚拟专家)、AI Companion(虚拟陪伴)、AI 方AI being,作为虚拟偶像IP运营。
Entertainment(虚拟偶像)
q 典型数字人案例:
q 技术框架:底层的基础技术如自然语言处理技术、计算机视觉、计
• 房地产:万科崔筱盼(虚拟员工)
算机语音,人工智能创造力等。小冰框架对每个AI being都有六大要
素的设定,包括persona(性格特征),attitude(态度观点), • 媒体: 每日经济新闻N小黑(虚拟主播)、中国天气冯小殊(虚拟主播)
biological characteristics(生物学特征),creation(创造力), • 服装:国家纺织产品开发中心(虚拟设计师)、万事利丝绸(西湖一号,
knowledge(行业知识),skill(技能) 虚拟设计师)
• 体育:国家体育总局(观君,虚拟专家)
• 教育:中央美术学院(夏语冰,虚拟画家)、清华大学(华智冰,虚拟专
家)
q 部署方式:广泛支持各种方式,如手机APP、微信小程序、大屏、电视等,
可以多屏同时部署
q 部署规模:包括交付中的案例数量共计超过400个,最近一年部署案例增
长超300%
q 生态体系:为数字人IP、运营公司提供数字人生成框架或者AI能力;拥有
渠道与分销体系;与各领域具备专业知识的公司建立广泛合作。
q 用户体验:
• 看好并且认可小冰公司的AI生成技术,当前数字人上线效果,可以满足
企业对于虚拟员工、虚拟专家、虚拟陪伴和虚拟偶像的需求。
© IDC | 27
追一科技
较早开始做数字人。希望做成标准化产品,面向中小B,让AI数字员工服务每个组织与个人
q 营收规模:2021年收入千万级人民币
客户群和智能客服一致,在客服机器人的基础上增加多模态 q 收费方式:按服务计费,以并发路数为单位进行评估
方案分为:IVR(视频客服)、移动端、线下大屏
积累了十几个模特形象 q 典型案例
政府:大连市税务局
追一科技 多模态数字人产品框架 金融:西安银行(2D真人)
运营商:中移在线
q 生态合作:公司主攻对话式AI能力,3D形象以与外部合作
为主
q 部署规模:上线10个,私有云部署占比最高,也支持公有云
和混合云
应用效果:营销用户跳转率提升30
q 优势 :表情自然度高,产品成熟度好、易用性,多样性
© IDC | 28
中科闻歌:专注数智媒宣领域的AI数字人
目前在数字人领域积极投入,以高拟真形象为前提,提供更加便捷、低成本、高效率、可实时交互的AI数字虚拟人解决方案,
主要面向媒体与宣传应用场景满足客户多样化、定制化需求,将持续投入数字人全栈技术的研发。
q 产品技术:
q 应用场景:
• 快速定制型数字虚拟人技术:无需训练,快速生成
• 新闻播报:虚拟主播
• 高精复刻型数字虚拟人技术:真人素材训练,角色定制生成
• 教育行业:名师课堂
• 高拟真虚拟人实时问答技术:支持问答语料库与角色形象的
快速定制 • 党建相关:智慧党建
• 数字人智能创作平台:快速进行虚拟人视频制作、编排与渲 q 典型案例:
染 • 媒体:綦江融媒体,垫江融媒体
q 服务模式:一体机 & SaaS • 企业:泽桥医疗
q 技术架构: q 核心优势 :
• 快速高效:主播形象、姿态、场景自定义快速配置,逼真
自然,多语言播报能力凸显国际化
• 降本增效:文本内容到数字人视频一键生成,创作平台上
手简单方便,显著提升内容生产效率,节省运营成本
• 全链服务:媒宣领域产品条线完整,可实现融媒体智能化
生产与管理,提供端到端解决方案
© IDC | 29
英伟达:数字人计算平台的提供者
以 Omniverse 平台赋能超写实数字人,联合生态资源,提供算力支撑
q 典型案例:英伟达初创加速计划成员 数字栩生、Charisma、
Resemble AI,虚拟人李星澜 Lydia
q 差异化优势:在生态方面, Omniverse平台提供了高效兼容的内容协
作底座,以USD(通用场景描述)技术打通各类内容设计软件平台,
英伟达GPU的光线追踪计算可简化DCC部分。
q 当前挑战:Audio2Face生成的面部动画(口型)更符合英语在发音
上的特征,有待完善对汉语的支持效果
© IDC | 30
目录
1 中国AI数字人市场现状
2 中国AI数字人市场生态
3 AI数字人典型行业实践案例
4 主流AI数字人厂商分析
5 初步评估中国市场的AI数字人
6 趋势与建议
© IDC | 31
现阶段可用于进行数字人能力评估的框架
一级分类 介绍 细粒度能力
愿景 发展年限、发展策略、未来目标等
© IDC | 32
初步评估中国AI数字人主流参与者
• 可简单地将AI数字人分为2-3个梯队。第一梯队以百度智能云、商汤、小冰为主。
• 市场的参与者目前大多差异化竞争,分别在已有客户群体的领域依托自身技术优势进行深耕。
• 整体市场离成熟仍有较长一段距离,但并不影响在一些领域可以进行探索式创新。
© IDC | 33
目录
1 中国AI数字人市场现状
2 中国AI数字人市场生态
3 AI数字人典型行业实践案例
4 主流AI数字人厂商分析
5 初步评估中国市场的AI数字人
6 趋势与建议
© IDC | 34
中国AI数字人市场规模预测,2021-2026
初步评估2021年中国AI数字人(企业级服务型数字人)市场规模约5.2亿元人民币,而在2022年呈现
出高速增长趋势,预计到2026年,市场规模将达到102.4亿元人民币,2021-2026年CAGR达81.5% 。
中国AI数字人市场规模预测,2021-2026
(亿元人民币)
120 120.00%
100 100.00%
80 80.00%
60 60.00%
40 40.00%
20 20.00%
0 0.00%
2021 2022 2023 2024 2025 2026
• 注:以上市场规模预测不包括演绎型、互娱型数字人,仅代表企业级市场服务型数字人的市场规模预测。
© IDC | 35
未来发展趋势展望
产品技术趋势:未来的数字人都将是由AI驱动内容生成,多模态AI技术
是核心;交互会越来越智能;形象越来越逼真,由拟人到类人到同人
行业应用趋势:未来几年将是人类员工与数字人并存的方式,AI辅助/
支持人类进行工作。首先规模化落地的场景包括:虚拟偶像,虚拟直播
带货,数字人客服,AI数字人员工
产业落地趋势:AI数字人将以平台工具的形式输出,赋能给各行各业;
在数字人平台型公司以外,数字人运营赛道也有可能产出独角兽
整体发展趋势:本报告研究的是企业级服务型数字人,未来AI数字人另
外一大高潜力赛道即演艺型数字人
未来在生活与工作中,必将有大规模的数字人与人类共存。
© IDC | 36
给技术买家的建议
q 当前数字人价值最明显的领域:数字人直播带货,数字人客服,RPA+数字员工,数字人主播
q AI数字人对企业的价值:1)优化/替代企业内部正在执行的工作任务,提供更加稳定、高效、持续的任务表现,节约人
力成本,提升业务效果,改善员工的工作体验;2)重塑当前的业务模式,创新工作流程,
q 演艺型的核心是低成本、高频率的内容生产,AI换脸生产视频和海报、自动化24小时直播 、AI声音定制
q 关于部署,现阶段部署的方式有很多,包括数字人大屏,一体机,App/h5/小程序,云端
q 在未来2-3年内,仍需要真人与数字人配合,在无法达到用户满意的情况下由真人接管
q 在3-5年内,AI数字人的自主决策程度将不断提高
q AI数字人的应用相比其他AI场景,会需要企业配合一些流程再造
q 对以AI数字人为代表的AI应用场景保持耐心,不设置过高的期望值,准备一定的预算
© IDC | 37
更多信息,请联络:
卢言霞
18101095739
ylu@idc.com
© IDC