You are on page 1of 23

大数据成就未来

第六届“泰迪杯”B题赛前指导  
张敏  
18/3/11
目录  

1   问题解读  

2   数据解读  

3   智能推荐介绍  

4   你要注意的  

大数据挖掘专家 2
问题解读  

一、产品的精准营销推荐    

根据附件1所给出的用户观看记录信息数据,试分析用户的收视偏好,并给出附件2中产品的营销推荐方案。    

1.  个性化的、非广播式的。  

2.  用户/产品间的关联。  

3.  用户特征/画像。  

4.  产品功能匹配。  

大数据挖掘专家 3
问题解读  

二、相似偏好用户的产品打包推荐    

为了更好地为用户服务,扩大营销范围,利用附件1~附件3的数据,试对相似偏好的用户进行分类(用户标签),对
产品进行分类打包(产品标签),并给出营销推荐方案。    

1.  对第一问综合深化。  

2.  用户分类依据(人口、家庭成员、职业?)。  

3.  单个产品功能如何互补/组合打包(产品功能如何标签化)。  

大数据挖掘专家 4
目录  

1   问题解读  

2   数据解读  

3   智能推荐介绍  

4   你要注意的  

大数据挖掘专家 5
数据解读  

用户在广电网络上的绝大部分行为  

用户收视信息:  

1.  用户收视信息:观看的频道,观看的起止时间。  

2.  用户回看信息:回看频道,回看起止时间。  

3.  用户点播信息:点播节目,点播金额。  

我们希望得到类似这样的信息:  

1.  张三家喜欢看体育类节目吗?他家有没有老人?小孩儿是男生还是女生?几岁了?  

2.  A节目和B节目有关系吗?互补还是互斥呢?  

大数据挖掘专家 6
数据解读  

目前的产品打包  

1.  单个产品组合形成套餐,目前有多个套餐,但区别度不高。  

2.  各个产品缺少标签自动生成机制。  

3.  套餐产品组合缺少数据支撑。  

4.  用户的主流需求有哪些。  

大数据挖掘专家 7
目录  

1   问题解读  

2   数据解读  

3   智能推荐介绍  

4   你要注意的  

大数据挖掘专家 8
智能推荐  

推荐系统概述  

2006年10月2日,Netflix(一家提供在线视频租赁服务的网站)开出100万美元奖金,奖励能把他们网站的产
品推荐精确度提高10%的人[1]。从上世纪90年代中期开始,推荐系统就成为一个独立的研究领域[2]。    

大数据挖掘专家 9
智能推荐  

从京东商城网站走进智能推荐    

大数据挖掘专家 10
智能推荐  

从电商网站网站认识智能推荐    

!
大数据挖掘专家 11
智能推荐  

电商网站用户画像  

据VentureBeat统计,全球最大的在线零售商之一Amazon的推荐系统为其提供了35%的商品销售额  

常见推荐方式  :  

•  热点推荐/爆款/人气单品  

•  经常一起购买的产品:打包销售  

•  购买此产品的顾客同时也购买了:协同过滤-显式需求  

•  看过此商品后顾客购买的其他商品:协同过滤-隐式需求  

•  用户评论(打分)列表  

大数据挖掘专家 12
智能推荐  

用户在电商网站商的绝大部分行为  

用户行为 类型 特征 作用
评分 显式 整数量化的偏好,可能的取值是[0,n] 通过用户对物品的评分,可以精确得到用户的偏好
投票 显式 布尔量化的偏好,取值是0或1 通过用户对物品的投票,可以较精确地得到用户地偏好
通过用户对物品的投票,可以精确得到用户的偏好。如果是
转发 显式 布尔量化的偏好,取值是0或1
站内,同时可以推理得到被转发人的偏好(不精确)
保存书签 显式 布尔量化的偏好,取值是0或1 通过用户对物品的投票,可以精确得到用户的偏好
一段文字,需要进行文本分析,得到
评论 显式 通过分析用户的评论,可以得到用户的情感:喜欢还是讨厌
偏好
单击流 一组用户的点击,用户对物品感兴趣,用户的单击一定程度上反映了用户的注意力,所以它也可以
隐式
(查看) 需要进行分析,得到偏好 从一定程度上反应用户的偏好
页面停留 一组时间信息,噪声大,需要去噪, 用户的页面停留时间一定程度上反映了用户的注意力和偏好,
隐式
时间 分析得到偏好 但噪声偏大,不好利用
购买 显式 布尔量化的偏好,取值是0或1 用户的购买行为很明确地说明他对这个项目感兴趣

大数据挖掘专家 13
智能推荐  

推荐系统的功能  

1.  增加物品销售数量;  

2.  出售更多种类物品;  

3.  增加用户满意度;  

4.  增加用户忠诚度;  

5.  更好地了解用户需求;  

6.  扩大用户规模;  

7.  提升广告位价值。  

大数据挖掘专家 14
智能推荐  

常用推荐算法[4]    

90年代中期推荐系统成为一个学科领域开始,目前经常用到的一些算法有:    

1.  关联规则  

2.  Collaborative  Filtering(协同过滤)  

3.  SVD(隐语义分析模型)  

4.  KNN(K近邻)  

5.  Deep  Learning(深度学习)  

6.  ……  

大数据挖掘专家 15
推荐  

Collaborative  Filtering(协同过滤)  

2种基本方法:  

•  基于用户的协同过滤推荐(UBCF)  

•  基于物品的协同过滤推荐(IBCF)  

需要以下几个步骤:  

1.  收集用户偏好;  

2.  找到相似的用户或物品;  

3.  计算推荐  

大数据挖掘专家 16
推荐  

基于物品的协同过滤推荐(IBCF)  

用户101
物品A

物品B

用户102
物品C

物品D 用户103

大数据挖掘专家 17
推荐  

Collaborative  Filtering(协同过滤)  

A B C D

101 1 1 0 1
102 1 1 1 0
103 1

物品Jaccard相似系数:

| B∩ A | 2 | B ∩C | 1 | B∩D | 1
P= = =1 P= = = 0.5 P= = = 0.5
| B∪ A | 2 | B ∪C | 2 | B∪D | 2

大数据挖掘专家 18
推荐  

Collaborative  Filtering(协同过滤)  

A B C D

A 0 1 0.5 0.5
A B C D
B 1 0 0.5 0.5
101 1 1 0 1
C 0.5 0.5 0 0
102 1 1 1 0
D 0.5 0.5 0 0

用户物品矩阵 物品相似度矩阵

大数据挖掘专家 19
推荐  

Collaborative  Filtering(协同过滤)  

A B C D

A B C D A 0 1 0.5 0.5

101 3 4 3 5 夹角余弦 B 1 0 0.5 0.5


102 3 4 2 4 C 0.5 0.5 0 0
103 2 3 4 3
D 0.5 0.5 0 0

用户物品矩阵 物品/用户相似度矩阵

大数据挖掘专家 20
目录  

1   问题解读  

2   数据解读  

3   智能推荐介绍  

4   你要注意的  

大数据挖掘专家 21
你要注意的  

温馨提示  

1.  广电用户以家庭为单位,不同于购物网站用户。  

2.  电视产品的标签数据来源可不限于电视产品信息表。  

3.  你要善用文本挖掘和爬虫技术。  

4.  如何证明你的推荐方案是有效的。  

大数据挖掘专家 22
大数据成就未来

泰迪科技:www.tipdm.com  
热线电话:40068-40020  

You might also like