Netflix的建议
Netflix网站使用推荐算法自动做出这些推荐。该算法指示Netflix的服务器处理来自数据库的信息,以确定客户可能喜欢哪些电影。该算法考虑了以下因素:
- 电影本身,被安排成一组常见的电影
- 客户的评分,租的电影和当前排队
- 所有网飞用户的综合评分
这些推荐背后的第一个算法叫做CineMatch。CineMatch算法运行了很长时间,并被证明在预测订阅者喜欢的电影方面相当成功。根据Netflix的说法,这些预测有75%的准确率在半颗星以内,有一半的Netflix用户在租了cinematch推荐的电影后给了他们五星的评价。
广告
Netflix意识到总有更好的方法来做某事,于是在2006年发起了一场竞赛,寻找一种可以击败CineMatch的算法。这场名为“Netflix大奖”(Netflix Prize)的比赛承诺,第一个达到根据用户个人喜好推荐电影的准确性目标的人或团队将获得100万美元。Netflix还发布了测试数据,供算法开发人员跟踪:匿名用户对1亿部电影的评分,从1星到5星不等。三年后,100万美元的奖金被授予BellKor的Pragmatic Chaos,这是一个七人团队,其中包括两名AT&T的研究人员。BellKor的Pragmatic Chaos只比另一个团队The Ensemble早24分钟提交了获胜算法。每个提交的算法都比CineMatch提高了10%[来源:网飞公司,霍夫曼].
推荐系统会不断自我更新,每秒钟根据超过50亿的电影评分给出数千条推荐。Netflix报告称,Netflex用户平均为大约200部电影评分,每天的新评分约为400万部。大约60%的Netflix用户是根据这些推荐来选择电影的。你可以在网站上的“给你的建议”部分找到这些建议,你可以在对更多电影评分时刷新这些建议[来源:网飞公司].
推荐好的电影似乎需要本能或情感。例如,如果你向朋友推荐一部你看过的电影,你会综合考虑这部电影给你的感觉、你的口味和你朋友的口味。另一方面,Netflix的推荐完全是数学运算。Netflix将你的观看和评级历史与有类似历史的人进行匹配。它利用这些相似的资料来预测你可能喜欢的电影。这就是这些推荐的真正含义——预测你会喜欢哪些电影。
这些预测依赖于算法和统计数据。它首先将电影相互匹配,而不是将人与电影匹配,因为库中的电影数量远远少于Netflix的订阅者。为了进行匹配,计算机:
- 在CineMatch数据库中搜索给同一部电影打分的人,例如“绝地归来”。
- 决定哪些人也给第二部电影评分,比如《黑客帝国》
- 计算喜欢《绝地归来》的人也会喜欢《黑客帝国》的统计可能性
- 继续这一过程,建立用户对许多不同电影的评分之间的相关性模式
通常,这些预测合乎逻辑。如果网飞公司的用户给《指环王》三部曲中的两部电影打了五星,他可能也会喜欢第三部电影。然而,花大量时间给他们的电影评分并查看他们的推荐的Netflix用户可能会发现一些令人惊讶的相关性。这是因为保持推荐系统运行的算法不一定与情节或演员有任何关系。相反,它们必须与其他用户的租赁和评级历史有关。
根据《纽约时报》的一篇文章,这种推荐系统极大地改变了人们的电影偏好。它让独立发行的电影和票房不佳的电影获得了更广泛的发行[来源:《纽约时报》].随着越来越多的Netflix用户看到这些不太知名的电影并对其进行评分,系统就会向更多人推荐这些电影。
不管人们租的是经典电影、独立电影还是新上映的电影,Netflix的发行系统都以同样的方式处理。在下一节中,我们将看看电影是如何进入你的家庭并返回Netflix的。