注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

沈禄政的博客

关于互联网、移动互联网的记录,以及个人的雪茄爱好

 
 
 

日志

 
 
关于我

人大经济学研究生,7年互联网从业经历。专注于新媒体、移动营销。

网易考拉推荐
 
 

《纸牌屋》背后的大数据生产力  

2014-04-04 10:10:37|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

  深夜,刹车声和犬吠打破了住宅区的宁静。弗朗西斯·安德伍德从屋里冲出来,身后跟着他的司机兼保镖。

  一辆车撞到了邻居家的狗。安德伍德蹲下身查看狗的伤情,然后面对镜头说:“世界上有两种痛苦,一种让你更加强大,另一种毫无价值,后者只会徒增折磨。我对毫无价值的东西没有耐心。这种时候需要有人采取行动,做一些不好的事,也是必要的事。”

  安德伍德掐死这只受了重伤的狗:“好了,痛苦消失了。”随后,他盛装出席了白宫的新年晚会。

  这是去年《纸牌屋》第一季第一集极为出色的开场,安德伍德的扮演者是凯文史派西,本剧导演是大卫芬奇。《纸牌屋》的原版是英国的一部迷你电视剧,Netflix买下版权、请来导演大卫芬奇和老戏骨凯文史派西、在Netflix网络上做独播,首次进军原创剧集就一炮而红,在美国及40多个国家成为最热门的在线剧集。这部剧也是互联网从业者讨论的重点,不仅仅是剧集剧情和明星,而是其特别的诞生方式。

  数据预测未来

  《纸牌屋》的诞生最重要的一个关键词是大数据。在任何一个国家的电视剧行业都没有什么是确定的。特别是美国这种竞争充分的市场,即便是找齐了金牌导演、实力演员和时下最流行的题材剧本,结果很可能仍然不受用户的待见。但在《纸牌屋》这部剧集上,Netflix通过业务所沉淀的用户数据判断用户喜好,成功催生了热门剧集。应该说《纸牌屋》的成功得益于Netflix海量的用户数据积累和分析。坦白的说,将《纸牌屋》的成功与大数据紧密绑定有很大一部分原因是Netflix的营销策略,但即便如此《纸牌屋》诞生前Netflix一定在它繁复的数据中提炼了很有价值的信息。

  Netflix是一家美国公司,在美国、加拿大提供互联网随选流媒体播放,定额制DVD、蓝光光碟在线出租业务。该公司成立于1997年,总部位于加利福尼亚州洛斯盖图,1999年开始订阅服务。2009年,该公司可提供多达10万部DVD电影,并有1千万的订户。早在2007年2月25日,Netflix宣布已经售出第10亿份DVD。现在Netflix在美国有2700万订阅用户,在全世界则有3300万,它比谁都清楚大家喜欢看什么样的电影和电视。有研究表明每天的高峰时段网络下载量都是出自Netflix的流媒体服务,去年人们在网上看流媒体视频的时间比看实体DVD的时间还多。每天用户在Netflix上产生3000万多个行为,比如你暂停、回放或者快进时都会产生一个行为,Netflix的订阅用户每天还会给出400万个评分,还会有300万次搜索请求,询问剧集播放时间和设备。

  从成立伊始起,Netflix就把计算作为公司的核心竞争力和发展战略的核心。通过推荐引擎、数据算法等方式,Netflix可以提前知晓观众喜欢看的内容,从而进行准确的影视内容采购,此外流媒体的广泛应用彻底改变了观众以往静态守候电视节目的习惯,让Netflix颇为受益。作为世界上最大的在线影片租恁服务商,Netflix几乎比所有人都清楚大家喜欢看什么。它已经知道它的用户很喜欢大卫芬奇(社交网络、七宗罪的导演),也知道凯文史派西主演的片子表现都不错,还知道英剧版的《纸牌屋》很受欢迎,三者的交集表明,值得在这件事上赌一把。

  对于《纸牌屋》剧集的播放,Netflix采取这样的策略——一开始就把整季内容全放出来,而不是以前传统美剧采用的周播制,以每周一集的方式的掉观众胃口。可能有人会质疑这样会剥夺观众等待剧集的乐趣。但Netflix的观点是,由于DVD和网络剧集的流行,很多观众已经习惯了一下子就能得到整部剧集。总体来说,后者会让观众获得更大的满足感。这就是互联网用户的观看习惯。网络的让用户有更多选择的同时,用户也期望得到更多。

  网络让用户能够在一个集中的时间看喜欢的视频或内容,这一点从bbs时代就有所显现,bbs存在很多的文章连载,有些确实很扣人心弦,不少的用户看到有吸引力的开头后会将帖子保存养肥了再看。显然Netflix比其他的电视剧制作商更了解网络用户。也正是基于用户大数据的挖掘才让Netflix有更多的底气投入1亿美元来赌《纸牌屋》的成功。

  永不停止的计算

  互联网不仅已经成为现代人生活的重要一部分,实质上已经是现代生活的基础服务,所有的产品、服务都可以通过网络完成信息的沉淀、流转。随之而来的是个体信息化,我们对键盘或鼠标的每一次敲击所产生的信息都会与在网络账号上定义的个体发生精确的关联。不同于人,互联网没有遗忘机制,依靠计算机,它拥有强大的存储和记录能力。于是,用户的个体特性、地理位置、好友网络、个人资料、浏览习惯、消费偏好、购物情况、信用记录等都会变成信息流为各个互联网公司所挖掘和分析。

  网络用户面对互联网公司的数据收集、分析避无可避,每个人只要在网络中生存就必然数字化。同时互联网公司对所服务的用户进行信息分析是公司能提供更为贴心服务的基础,只有全局洞察用户才能在用户需要的时候适时出现。从这个角度上来看,沉淀最多用户数据的公司将会在未来的竞争中占据更有利的位置,数据已经成为互联网竞争的一个核心竞争力。

  移动互联的发展催生了更为多样化的数据,同时包含结构化和非结构化的数据。在传统的企业中,被有效管理的数据都是以表格的形式保存在数据库中,所有的信息格式都一样,便于编程处理。而如今的海量数据中,包括各种各样的数据类型,最常见的普通文本、照片、视频等等,还有像位置信息、链接信息等XML类型的数据。这些数据很难通过传统的技术手段进行提炼和分析。这是绝大多企业面对大数据无所适从的主要原因。这也催生了企业之间的跨界合作,即便是Netflix也不是独立完成所有的数据挖掘工作,他也有赖于Amazon的协作。依靠Amazon,Netflix每天可以分析超过3000万条播放记录,包括用户在何时、何地、何种设备上观看什么内容,用户给节目添加的恐怖、必看等个性标签;并在记录暂停、倒退、快进、评分、搜索的同时,进行大量截图,试图分析用户在音量、画面色彩甚至场景选取上的喜好。

  Amazon是Netflix最重要的一个合作伙伴之一,Netflix几乎每时每刻都会调用到Amazon数据中心一万到两万台的服务器,这些计算机需要控制用户资料的存储、视频推荐、数字版权管理、视频文件转码以及控制不同系统中的播放效果。当有最新的Xbox或者Samsung智能手机面市,Netflix还需要调用额外的服务器来转换视频格式,以保证这些新设备上的用户可以正常观看视频。所以每一个白天,服务器得忙着流媒体视频的传送分发,而到了晚上,这些服务器又得转身变为数据分析的计算机。同时由于Netflix依赖着Amazon的数据中心,所以700位Netflix工程师必须不断开发软件工具,让数以千机的云服务器可以自动实现启动并且完成配置。这种永不停息的计算模式,让Netflix能在任何时刻了解他得观众。

  未来是全局数据的时代

  很快我们会看到大数据时代所分析的是全局数据,通过数据的相关性洞察用户,甚至能实现用户在还没有明确需求的时候就能先一步提供能够被广泛用户接受的产品或服务,这就是逆向产品研发,实际上是大数据指向了研发方向。跨越不同界别所沉淀的数据更有价值,通过对用户社交、媒体、商务、购物等一系列行为的数据挖掘很容易洞察用户在某一类细分服务的需求。换一句话说,用户在网络上的任何行为都有可能成为产品的设计依据和营销方向。

  大数据时代不可抗拒,应该是毋庸置疑的,但对于绝大多数企业大数据本身仅是一个空泛的概念,不仅难以参与更难于控制。大数据与传统的数据分析有很大的不同,大数据有4个特点:第一,数据体量巨大,从TB级别跃升到PB级别;第二,数据类型繁多,网络日志、视频、图片、地理位置信息等等无所不包;第三,价值密度低,商业价值高。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒;第四,处理速度快。这都和传统的数据挖掘技术有着本质的不同。

  几乎任何规模企业,每时每刻都在产生大量的数据,但这些数据如何归集、提炼始终是一个困扰。这种感觉好像是守着金山却无从下手。大数据技术的意义确实不在于掌握规模庞大的数据信息,而在于对这些数据进行智能处理,从中分析和挖掘出有价值的信息,但前提是拥有大量的数据。这个全局数据的时代很快来临,现在所要做的就是拥有并尊重数据(沈禄政/文)。


  评论这张
 
阅读(102)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017