查看原文
其他

Netflix内容决策“新方法论”:同品味用户群

东西流媒体研究组 东西文娱 2019-07-26

本文为东西流媒体研究组根据此前研究和海外相关报道梳理,转载请后台联系。


关键词:Netflix|算法|用户推荐|同品味用户群



人们在Netflix上观看的电视节目中,超过80%是通过该平台的推荐系统发现的。Netflix使用机器学习和算法来帮助打破观众的先入之见,找到他们最初可能并不会选择的节目。为了做到这一点,Netflix关注的是内容中微妙的线索,而不是依靠广泛的类型来做出预测。

 

推荐基于“同品味用户群”


Netflix在算法中所运用的数据可以分为两种——隐性数据和显性数据。显性数据就是用户字面上所表达的意思,比如用户给剧集《皇冠》点赞(a thumbs up)了;隐性数据实际上是用户行为数据,用户没有明确地表明“我喜欢某一部剧”,但花了两个晚上就把这个剧全看完了。

 

关于显性数据,我们之前已经分析过(相关链接:Netflix革新用户评价体系:点赞取代星级后,再移除用户评论)。而为了完善自己的内容推荐系统,Netflix不止在显性数据方面发力,因为事实上大多数有用的数据都是隐性的。

 

近日,Netflix负责原创内容的副总裁Cindy Holland分享了公司内部在做许多有关内容和用户推荐的决策时所考虑的核心因素。


她表示,Netflix做内容和用户推荐的决策,并不是基于广泛的人口统计数据,这些是广告商所关心的,而Netflix并没有广告;相反,Netflix是基于“同品味用户群(taste communities)”来决定是否订购一部新剧以及向用户推荐什么样的内容。


“同品味用户群”即喜欢看相同内容的用户群体,Netflix目前已识别出2000个这样的用户群。这些同品味用户群也可能会喜欢看似完全不同的内容,比如,Netflix的算法发现单口喜剧演员Dave Chappelle的粉丝群与霍金传记电影《万物理论》的粉丝群之间存在着令人意想不到的联系。”Cindy Holland说。

 

《万物理论》


之前,Netflix根据用户的地理位置进行内容推荐,比如,德国人喜欢看的内容可能与南美人喜欢看的内容有所不同,但Netflix的产品副总裁Yellin去年在接受采访时表示,“我们越来越发现这是无稽之谈。”所以,Netflix转而根据“同品味用户群”来进行用户推荐。

 

 “同品味用户群”形成的三大基础

 

假设同品味用户群是一个有三条腿的凳子(这个比喻也是蛮奇怪的,但人家就是这么比喻的)。这个凳子的三条腿分别是Netflix的用户行为数据、节目内容标签数据和机器学习算法。

 

虽然Netflix在全球拥有超过1亿的用户,但如果将每个用户的多个用户配置文件计算在内,那活跃的用户配置文件总数将达到2.5亿左右。“我们从这些资料中看到的是以下类型的数据——人们看了什么,之前看了什么,之后看了什么,一年前看了什么,最近看了什么,每天什么时候看。”这些数据构成了凳子的第一条腿。 

 

凳子的第二条腿是指旨在理解节目内容的数据。这些数据基础构建由数十名内部员工和自由职业者组成,他们观看Netflix平台上的每一场节目,甚至每一分钟的节目,并将其贴上标签(tag)。从作品的思想性,到演员整容的完整性,标签范围很广。

 


“我们把所有这些标签和用户行为数据结合起来,然后使用非常复杂的机器学习算法,找出最重要的、我们应该重视的,”根据Netflix产品副总裁Yellin的说法,他们会沿着用户收看的轨迹去摸清楚用户的品味。“如果一个用户昨天看了某个内容,这有什么关系?这和他们一年前看的内容的量相比,是两倍多还是十倍多?和一个月前相比呢?如果某个内容他们只看了十分钟就放弃了,或者花了两晚一下子全看完了,我们该如何权衡这些?这就是机器学习的意义所在。”

 

❸ 

“同品味用户群”的决策作用和用户影响

 

Netflix分析这些“同品味用户群(taste communities)”--内部用户们的观看习惯,并根据从这些群体收集的数据开发新的节目。


当Netflix高管们在决定是否要订购一部新剧集时,他们会看这个剧集是否能够聚集足够多的这些“同品味用户群(taste communities),以证明一部剧集的成本是否合理。”Holland表示,“我们的内容是为了迎合他们的口味,而不是迎合我们自己的口味。” 

 

此外,这种方法也直接影响到用户在登录到服务平台时看到的内容推荐。事实上,Netflix的内容推荐在用户层面的影响主要分为两个部分:

 

首先,根据Netflix员工们在Medium上发表的一篇文章,截至2017年12月,Netflix主要使用一种算法来给出关于用户接下来应该看什么的建议。

 

对于那些不熟悉的人来说,算法基本上就是一套指令,告诉你的电脑——或者是你的Netflix应用——该怎么做。算法通常被用来促进机器学习(如你的应用程序如何识别你的浏览习惯),而不是反复处理一系列稳定的指令,比如基于机器学习的系统(如Netflix)工作时都在进行重写。所以,每次用户在Netflix上观看内容时,他们都在收集数据,从而为算法提供依据。用户看得越多,算法就越频繁地进行重写,希望用户能得到更好的内容推荐。

 

Netflix为了进行内容推荐而收集的数据是多方面的,有点复杂,但它涉及的不仅仅是内容的类型。每一个数据因素都有不同的分量,但所有的这些因素都是为了帮助确定用户到底属于哪一个"同品味用户群"。

 

Yellin指出,单个用户可以同属于多个"同品味用户群"。 

 

其次,2017年12月之后,Netflix通过测试一种基于艺术作品的新推荐功能,在合适的时间、为用户提供合适的内容。这里说的艺术作品不是在巴黎卢浮宫看到的那种艺术品,而是那种用户在屏幕上看到的内容推荐中所带的图片。

 

这个测试虽然也考虑了很多第一部分已经考虑过的相同的数据因素,但在决定下一步该看什么时,显然图片对用户来说更加重要。

 

Netflix的全球创意服务经理Nick Nelson在2016年的一篇公司博客上对此做出了解释。“研究表明,图片不仅是用户决定观看内容时的最大影响因素,而且在用户浏览Netflix时也占了他们82%的注意力。我们还发现,对于Netflix所推荐的每个内容,用户平均花1.8秒进行考虑。

 

举一个易于理解的例子来说明Netflix是如何切换内容照片,以迎合用户之前的观看历史。以如电影《心灵捕手Good Will Hunting》,基本上,如果用户在推荐中看到这部电影,Netflix已经在假设用户可能想看它了。然而,在推荐时根据这部电影所显示的图片反映了他们认为用户想看它的原因之一。

 


Nick Nelson指出,如果用户过去看过很多爱情电影,那推荐时用户看到的图片可能是影片中男女主人公接吻的画面;而如果用户是一个喜剧迷,用户很可能看到的是另一主演Robin Williams(他本身是美国喜剧电影导演及演员)的照片。

 

“其实《心灵捕手》并不是一部真正的喜剧电影(当然它也有一些有趣的时刻),浪漫爱情故事也只是这部电影的一个次要情节。也就是说,《心灵捕手》本身是一部很出色的励志剧情电影,这可能是它被推荐给用户的首要原因,这是一个宽泛的品味群体。但用户在推荐中所看到的图片就反映了那些次要的对内容类型的倾向,就相当于用户所属的另一个品味群体。”

 

 

前期阅读

(点击链接或图片阅读)

争议Spotify:音乐流媒体的“平台梦” 

Netflix革新用户评价体系:移除用户评论

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存