你们大多数人可能都没听说过Roy Price
不过在2013年4月19日那天,他可能要为让你们
度过无聊的22分钟负责
当然有些人觉得那22分钟非常有趣
不过这些人很少
为什么要这样说呢,这还得追溯到
Roy三年前做出的一个决定
Roy Price 是亚马逊制片室的高级主管
专门负责亚马逊的电视制作
他47岁,很瘦,头发有点竖起
推特上的签名是“电影,电视,技术,墨西哥玉米薄卷饼”
Roy Pric负责为亚马逊挑选要制作的
原创电视剧
美国电视剧竞争非常激烈
那么多的电视节目
Roy也不知道选哪个
他得选出特别特别好的剧
也就是说,他得找
在这曲线靠近最右边的电视剧
这条曲线是2500多部电视剧在网站IMDB上
的评分分布图
评分从0到10
高度表示有多少电视剧是那个分数
如果你制作的电视剧超过9分,那太牛了
击败了98%的电视剧
这就是像“绝命毒师”,“权利的游戏”,“火线”那样的电视剧
非常容易上瘾
看完一季你就会
非常期待下一季
这就是超过9分的剧
在曲线左边
就是像"Toddlers and Tiaras"这种剧
(笑)
你们都知道在曲线左边的剧
是怎样的
现在,Roy Price不担心制作出曲线最左边的剧
要做出比"Toddlers and Tiaras"还左边的
剧脑力得多强大啊
他担心的是制作出中间的那种剧
很一般
不好不坏
看了没什么激情
所以他得确保制作出靠近最右边的剧
压力山大
当然,这也是亚马逊
第一次做这样的事情
Roy Price不想冒险
他要创造成功
他要确保成功
所以他这样做:搞一个比赛
他拿了一堆电视节目的点子
从这些点子中
选出8个来制作电视节目
每个都制做试播集
将它们放到网上给人们看
当亚马逊提供免费的东西时
我们都买帐,对吧?
所以成千上万的人收看这些节目
他们没有意识到的是,当他们在看节目的时候
实际上被看的是他们
他们被Roy Price 和他们的团队“观看”
并被记录
他们记录他们什么时候点播放,什么时候点暂停
哪些部分被跳过,哪些部分被重播
因此他们采集了大量的数据
因为他们需要这些数据
来决定他们应该制作什么电视剧
毫无疑问,他们收集了所有的数据
他们对数据进行分析然后得到一个结果
这个结果就是
亚马逊应该制作一个关于四个美国共和党参议员的情景喜剧
于是就做出来了
有谁知道那个节目的名字吗
阿尔法屋
对,阿尔法屋
不过看起来记得那个节目的人不多
因为它不是特别地精彩
实际上它只是一个很普通的剧
这条曲线的平均分是7.4
而阿尔法屋是7.5分
只是稍微高过平均分
这个显然不是Roy Price和他的团队的目标
然而,几乎与此同时
在另一家公司
另一个制作人却成功地使用数据分析选出了一个顶级剧
他的名字就是Ted
Ted Sarandos是Netflix的首席内容官
和Roy一样他也要经常寻找
顶级电视剧
而且他也使用数据分析
不过有一点不同
他们不举办比赛,而是利用
Netflix已经有的用户数据
那就是用户对节目的评分
用户观看历史,用户喜欢什么节目等等
然后他们用这些数据发现
观众各种零碎的信息
比如他们喜欢什么节目
他们喜欢哪些制片人,哪些演员
当他们把这些零碎的信息汇总
他们带着很大的信心
决定制作
关于一个参议员的剧情剧
而不是四个参议员的情景喜剧
你们知道那部剧吗?
(笑)
是的,纸牌屋。Netflix正确地选中那部剧
至少前两季是这样
(笑)
纸牌屋在这条曲线上取得9.1的高分
这就是他们想要的结果
现在问题来了,发生什么事了?
两家非常有竞争力的、数据处理能力非常强的公司
他们收集这些庞大的数据
一个起作用
另一个却不起作用
为什么呢?
因为按照逻辑应该都起作用
我的意思是,如果你收集大量的数据
来做一个决定
那你应该能做出一个很好的决定
你有200年的数据可以依赖
你通过强大的计算机将它放大
你至少能得到一部好的电视剧吧?
而且如果那样做数据分析不起作用
那就有点可怕了
因为现在我们越来越多地依赖数据
来做出远比电视剧更重要的决定
有人知道Multi-Health Systems这家公司吗
没有人吗?好吧,这其实是好事
Multi-Health Systems是一家软件公司
我希望在座没有人
会接触到这个软件
因为如果你接触了,说明你入狱了
(笑)
在美国,如果有人入狱然后他们申请假释
那很有可能会用到这家公司的软件进行数据分析
来决定是否批准假释
这和亚马逊还有 Netflix是一样的原理
只不过现在是决定你是个好人还是坏人
而不是预测一个电视节目是好是坏
看一个一般般的电视剧22分钟确实挺糟糕的
但在监狱多待几年那就更惨了
不幸的是,有证据显示这个数据分析
尽管包含大量数据,但却不能总是得到最佳的结果
然而这不是因为像 Multi-Health Systems这样的公司
不会做数据分析
即使是数据分析能力很强的公司也有搞错的时候
Google也不例外
2009年,谷歌宣布他们能够
通过对谷歌搜索的数据进行分析
来预测流感的爆发
而且工作得很好,在新闻上产生很大反响
还在自然杂志上发文
可以说在学术上也是巨大成功
很多年这分析都工作得很好
直到有一年失败了
没有人明确知道为什么
那一年就是不起作用了
当然这又是一个巨大的新闻
自然杂志也撤回了
出版的文章
所以即使是像亚马逊和谷歌这种数据处理这么强的公司
都有出错的时候
尽管有这么多失败的例子
数据分析发展很快,无论是在生活中做决定
还是在工作中
法律实施中
医药中我们都会用到
所以我们最好确保数据有用
现在,我个人是看过很多这种数据不起作用的
因为我在计算遗传学领域工作
在这个领域工作的很多高智商的人
都要利用庞大的数据来做一些重大决定
比如决定癌症治疗或者开发药物
这么多年,我已经发现一些
关于利用数据
做出成功决定
还是失败决定的规律
我觉得這个规律值得分享,这个规律是这样的
每次当你要解决一个复杂问题时
其实你是在做两件重要的事情
第一是将问题分解成很多很小的一部分
这样你才能更深入地去分析这些小部分
然后就是第二件事
你把所有这些小部分汇总起来
得出你的结论
有时你还再做一次
但还是那两件事
分解再汇总
比较残酷的是
数据还有数据分析
只对第一部分起作用
数据还有数据分析,无论多么强大
只能帮你把问题分解成小部分,然后帮你理解这些小部分
把数据汇总后再分析
然后得出结论就不适合了
不过有一种工具可以做汇总这件事
那就是大脑
大脑擅长一件事
那就是将碎片信息重新汇总
即使你的信息并不完整
然后得出结论
特别是专家的脑子
这就是我觉得为什么Netflix会这么成功
因为他们让数据还有大脑各司其职
他们先使用数据了解观众的一些零碎信息
如果没有数据他们不可能了解这么深入
但是将这些零碎信息汇总
决定要制作纸牌屋这样的电视剧
这些就不是在数据里
Ted Sarandos和他的团队做出要制作这样剧的决定
这也意味着
他们冒着很大的个人风险
但是另一方面亚马逊却用了完全错误的方法
他们一路上都依赖数据做决定
开始他们举行电视剧点子的比赛
然后他们又选择制作阿尔法屋
当然对于他们这是个非常安全的决定
因为他们总是将责任可以推给数据
看,这就是数据告诉我们的
但这也没有给他们带来预期的结果
因此数据确实是做出更好决定的有用工具
但我相信当数据开始驱使决定时
事情就出错了
无论多么强大,数据只是一个工具
要记住这个,我发现一个设备非常有用
你们很多人会...
(笑)
在数据之前
这个是用来做决定的设备
(笑)
你们很多人都知道这个
这个玩具叫做魔力8号球
这个真的很神奇
因为如果你要做出一个决定,是或否的问题
你只需要摇这个球,就得到一个答案
“很可能” 这次在这里显示的是这个结果
稍后我再将它用在科技样品上
(笑)
在我的生命中我做过一些决定
现在看来,其实我只要听从这个球就行了
当然,如果你有数据
你想要一些更加理智的东西来代替这个球
做决定,比如数据分析
但这不会改变最初的设定
所以这个球会变得越来越聪明
但我相信还是由我们来做决定
如果我们想要在这个曲线的最右边
取得非凡的成就
我发现一个非常鼓舞人心的信息
事实上即使面对庞大的数据
做出选择仍然是值得的
在你做的领域做一个专家
去承担风险
因为在最后,不是数据
而是承担的风险让你取得曲线右边的成就
谢谢
掌声