You are on page 1of 1

商务智能与数据挖掘课后作业—推荐系统部分

下表显示了用户 Donnie 合其他用户对电影的评分数据


忠犬八公的
用户 阿甘正传 盗梦空间 泰坦尼克 教父
故事
用户 1 3 1 2 3 3
用户 2 4 3 4 3 5
用户 3 3 3 1 5 4
用户 4 1 5 5 2 1
Donnie 5 3 4 4

1.使用皮尔逊相关系数计算 Dannie 与其他三个用户(用户 2、用户 3、用户 4)的评分相似


程度,据此从四个用户中选择 Dannie 的两个近邻用户。(6 分)
提示:因为 Donnie 在《教父》上的打分缺失,所以在计算皮尔逊相似度时,每个用户的打
分均值考虑前四部电影的平均分,例如用户 1 和 Donnie 的皮尔逊相似度计算如下:
𝑠𝑖𝑚1
(5 − 4) ∗ (3 − 2.25) + (3 − 4) ∗ (1 − 2.25) + (4 − 4) ∗ (2 − 2.25) + (4 − 4) ∗ (3 − 2.25)
=
√(5 − 4)2 + (3 − 4)2 + (4 − 4)2 + (4 − 4)2 )√(3 − 2.25)2 + (1 − 2.25)2 + (2 − 2.25)2 + (3 − 2.25)2
=0.853

2.利用两个近邻用户预测 Dannie 对电影《教父》的评分,并使用均值中心化方法消除不同用


户的评分偏差。(4 分)
提示:在计算均值时,每个邻近用户的打分均值考虑全部五部电影的平均分。

作业提交截止时间:
2019 年 1 月 2 日晚 24:00

作业提交方式:纸版作业提交商学院 6 层张瑾信箱

You might also like