Professional Documents
Culture Documents
因果推断在海外游戏
增长中的应用
张洁
腾讯 IEG Global
目录 CONTENT
01 游戏中的实验场景 03 实验驱动用户运营
02 实验驱动广告投放 04 总结 & 讨论
|
|
01 游戏中的实验场景
游戏中的实验场景
广泛、多样、复杂
02 实验驱动广告投放
实验驱动回流广告投放 行为主体 流程
量化投放效果,优化投放策略
流失玩家
随着游戏运营时间的推移,拉新的难度越来越高,
用户筛选 否
盘活流失玩家成为提升游戏活跃的主要来源。
是
某游戏上线后累计玩家数趋势 广告设置
Target
累计注册玩家 budget
CPA
累计流失玩家
竞价排序
Target
流失玩家占累计注 CPM = 转化 X
率 CPA X 1k
册玩家的78%
是否 否
竞得
上线
6月17日 2周
7月7日 4周
7月27日 6周
8月16日 8周 是
广告曝光 未曝光广告
强势的自有渠道(qq/wx)在海外缺位
否 是否 是
回流
挑战 高昂的用户触达成本 不回流 回流
必须找到真正值得干预的用户 |
实验驱动回流广告投放
量化投放效果,优化投放策略
分析:高概率回流的用户不需要投放广告也会回流,因此投放与否对这个
方案:训练二分类模型,识别自然回流率最高的玩家,向他们投放
群体影响不大。
广告
各预测概率区间的回流率(干预VS不干预)
训练样本:流失玩家
50% 账号量 不干预 干预 200,000
训练 自然回流
正样本:回流
率
回流率
预测模型 传
负样本:未回流 统
方
0% 案 0
预测样本 预测 向自然回流率高 0-0.1 0.1-0.2 0.2-0.30.3 -0.4 0.4- 0.50.5-0.60.6-0.70.7 -0.8 0.8- 0.9 0.9-1
流失玩家 预测概率区间
的用户投放广告
问题:响应模型越来越准确,但干预未带来显著提升。 基于传统方案的优化:干预中高概率区间的用户(预测概率:0.5~0.9)
回流率(%) 显著性检验
某游戏回流UA投放(回流率) 显著性检验 干预策略
干预 不干预 X2 P
X2 P
26.88% 27.36%
精准包 0.17 0.68 优化后(预测概率0.5~0.9) 8.75% 7.34% 12.25 <0.001
随机包 11.17 <0.001
2.61% 2.91% 优化前(预测概率0.9~1.0) 27.36 26.88 0.17 0.68
99%置信度下,干预对精准
包无显著影响,对随机包有
缺点:依赖强假设:预测为中高概率自然回流的用户,对干预更敏感。实
预
预
预
显著影响
干
干
干
际上不一定成立。
|
包
包
不
不
准
机
包
注:
精
随
准
精准包:预测自然转化率0.9以上的用户
精
随
实验驱动回流广告投放
量化投放效果,优化投放策略
思路: Meta- Learner Tree Based Deep Learning
调整问题定义:预测干预对用户的影响
4.18%
5.56%
附:sleeping dog特征分析
1.23% 1.40% 在游戏内花费较长时间,但进展不足的用户对UA广告持负面响应
RCT实验设计 真实投放环境
Google隐私政策:
总体 总体
禁止回传用户粒度的数据
随机切分 随机切分 随机切分 随机切分
禁止回传曝光人数50人以下的
控制组 干预组 控制组 干预组 群体的数据
……
广告平台策略
(黑盒)
方案:分组,组内的用户特征尽量相似;组间的用户特征尽量不同
与广告平台(FB/Google)
用户id
的竞价策略强相关,由广告
平台决定向哪些用户曝光广 游戏内特征 广告曝光数据
告
(Tencent) (Google/FB)
不曝光广告 曝光广告 不曝光广告 曝光广告
聚类
无偏样本 是否有偏? √
|
实验驱动回流广告投放
量化投放效果,优化投放策略
分析:
1、干预组中,只有13%用户被广告曝光 2、是否曝光广告与用户特征不独立 3、 广告媒体倾向于给原本就会回流的人投放广告
各cluster用户的广告曝光率 各Cluster用户的曝光率与自然回流率
广告曝光率
(预测)强相关
曝光账号量 未曝光用户量 40%
30%
R² = 0.9882
12~16% 30%
曝光率
9% 20%
9%
10%
0%
控制组 干预组
0% 20% 40% 60%
自然回流率(预测)
影响:
控制组 干预组(全体) 控制组 干预组(曝光广告群体) 由于曝光率与特征不独立,预测CATE
cluster cluster
回流率 回流率 CATE 占干预组全
回流率
体
回流率 CATE 值向曝光倾向性高的群体倾斜
7 29.38% 30.51% 1.13% √
0 13.70% 14.74% 1.04%
7
0
29.38%
13.70%
30%
12%
33.13%
22.39%
3.76%
8.69% √ |
实验驱动回流广告投放
量化投放效果,优化投放策略
思路:预测CATE值之前,先进行样本去偏,使得曝光与特征X独立 凝聚
X与T不独立,即干 继续凝聚
预组内不同样本被 𝑃(𝑇):干预组内的
X X 𝑃(𝑇) 样本X被曝光的概
曝光的概率不同 率。
T T
物理意义:给定
Y Y
𝑃(𝑇)下, X与T独立 ADH能否返回曝光率 否
(曝光人数是否达50)
是 退出凝聚
𝑃 𝑇 = 𝑃(𝑇 = 1|𝑋)
得到簇的曝光率
" &'"
去偏:样本权重 𝑤! = #(") + &'#(")
效果
如何估计每个玩家的𝑃 𝑇 ? 干预增益比
固定CPA($4)下,竞价竞争力与转化率(回流率)呈正比 |
实验驱动回流广告投放
量化投放效果,优化投放策略
|
|
03 实验驱动用户运营
实验驱动用户运营
优化用户体验,提升活跃和留存
实验设计
|
实验驱动用户运营
果真如此简单?
Q1 账号如何分流? Q3 公平性舆情危机?
Q2 实验灵敏度低怎么办? Q4 用户间互动导致对照组污染?
|
实验驱动用户运营
Q1: 账号分流:并行实验、前后实验污染(Carry-over Effect)
0 1 2 3 4 5 6 7 8 9
对照组 实验组
实验一
分流方式1:
用户尾号
对照组 实验组
实验二
1. 效果重叠,无法区分效果
2. 前置实验污染,导致后续实验分流有偏
分流方式2: 1. 需存储中间表记录账号的分组情况,容易错乱或丢失,管理难度大,给回溯带来风险
rand生成随机数 2. 伪随机
|
实验驱动用户运营
Q1: 账号分流:推荐分流方式:哈希(Hash)方程
|
实验驱动用户运营
Q2: 实验指标灵明度差怎么办
CUPED(微软) Log变换
原始
指标
Log
提升实验灵敏度: 变换
> 增加样本量
增加实验流量
power: 0.574 vs power
增加实验时间 log: 0.871 (+50%)
> 减小指标方差
应用方差削减(CUPED) Power = 0.8 , alpha=0.05
时, 建议样本数: 29060
更换指标(如:金额->超过某金额的比例)
vs 14600 (降低一半)
指标Log变换
|
实验驱动用户运营
Q3: 影响公平性,无法做AB测试怎么办
无法实验的场景 在国家、服务器粒度上分实验组和对
照组
对照组 实验组
无新装备 新装备
道具定价差异引起舆情危机
……
|
实验驱动用户运营
Q4: 用户之间相互影响
想像中的AB实验: 实际上的AB实验:
实验组和对照组的用户互相隔离 实验组和对照组的用户互相影响
分享
分享
|
实验驱动用户运营
Q4: 用户之间相互影响:不同的产品,会有不同的网络效应
Facebook的网络效应 Uber的网络效应
实验组 实验组
观测到的对照组 观测到的对照组
真实的对照组(未观测到) 真实的对照组(未观测到)
Day0 Day1 Day2 Day3 Day4 Day5 Day6 Day0 Day1 Day2 Day3 Day4 Day5 Day6
|
实验驱动用户运营
Q4: 用户之间相互影响:网络效应的解决
第6步
第4步
大盘ATE估计 按cluster采样下
第5步 发实验
ATE评估
|
|
04 总结
总结
Q1 如何选择用户 Q1 账号分流方法
Q2 如何在隐私条款下进行曝光去偏 Q2 实验灵敏度提升
Q3 如何优化出价 Q3 不可实验的场景
Q4 网络效应的解决
|
谨慎
成本 决策降级
增长曲线 文化
|
非常感谢您的观看
|
联系讲师
张洁
腾讯 IEG Global
资深数据科学家