Return to Video

如何应对大数据?| 苏珊•埃特林格|TED@IBM

  • 0:01 - 0:04
    科技极大程度上改变了世界:
  • 0:04 - 0:09
    登月计划,互联网,基因组测序。
  • 0:09 - 0:13
    但随之而来的是我们内心深处的忧虑,
  • 0:13 - 0:15
    大约30年前,
  • 0:15 - 0:17
    文学评论家尼尔•波兹曼出了一本书,
  • 0:17 - 0:19
    名为《娱乐至死》,
  • 0:19 - 0:22
    将这个问题展现得淋漓尽致。
  • 0:22 - 0:24
    他这样写道,
  • 0:24 - 0:27
    将乔治•奥威尔和阿道司•赫胥黎
  • 0:27 - 0:30
    两人的反乌托邦观点做比较,
  • 0:30 - 0:35
    奥威尔害怕我们的文化成为「受制文化」。
  • 0:35 - 0:39
    赫胥黎担心的是我们的文化成为「琐碎文化」
  • 0:39 - 0:43
    奥威尔害怕的是真理被隐瞒,
  • 0:43 - 0:45
    赫胥黎担心的是我们被淹没在
  • 0:45 - 0:48
    无聊烦琐的世事中。
  • 0:48 - 0:52
    简言之,这是「老大哥」看你
  • 0:52 - 0:55
    还是你看「老大哥」的选择。
    (译者注:「老大哥」典出奥威尔名著《1984》)
  • 0:55 - 0:57
    (笑声)
  • 0:57 - 0:59
    但事实不尽然,
  • 0:59 - 1:02
    我们不是只能被动地接受数据和科技。
  • 1:02 - 1:04
    我们能改变科技在我们生活中扮演的角色,
  • 1:04 - 1:07
    也能改变享受数据带来的恩惠的方式,
  • 1:07 - 1:08
    但要实现这一目的,
  • 1:08 - 1:12
    思考方式固然重要, 我们也要对如何解读数据
  • 1:12 - 1:14
    投以同样高的关注度。
  • 1:14 - 1:17
    我们需要问问题,要问深刻的问题,
  • 1:17 - 1:19
    不再单纯地统计数据,
  • 1:19 - 1:21
    而是要进一步理解数据。
  • 1:21 - 1:24
    我们身边充斥着那些
  • 1:24 - 1:26
    讲述世界上有海量数据的故事,
  • 1:26 - 1:28
    但当我们面临大数据,
  • 1:28 - 1:30
    面临理解大数据所的挑战,
  • 1:30 - 1:32
    数据量的大小不代表一切。
  • 1:32 - 1:35
    还有数据传播的速度,
  • 1:35 - 1:37
    数据的类型,
  • 1:37 - 1:40
    举几个例子:
  • 1:40 - 1:42
    图像,
  • 1:42 - 1:46
    文字,
  • 1:46 - 1:48
    视频,
  • 1:48 - 1:50
    音频。
  • 1:50 - 1:53
    不同类型的数据能有机地结合在一起,
  • 1:53 - 1:55
    因为正是人类创造了这些数据,
  • 1:55 - 1:58
    而且要在一定背景前提下理解特定数据。
  • 1:58 - 2:02
    目前,一个来自伊利诺大学
    芝加哥分校的数据科学家团队,
  • 2:02 - 2:05
    自称「健康媒体合作实验室」,
  • 2:05 - 2:08
    正与疾控中心合作,
  • 2:08 - 2:09
    试图进一步了解
  • 2:09 - 2:12
    人们谈论戒烟的方式,
  • 2:12 - 2:15
    谈论电子烟的方式,
  • 2:15 - 2:17
    以及他们如何协作
  • 2:17 - 2:19
    来帮助人们戒烟。
  • 2:19 - 2:21
    有趣的是,如果你想了解
  • 2:21 - 2:23
    人们谈论吸烟的方式,
  • 2:23 - 2:25
    首先需要了解
  • 2:25 - 2:27
    「烟」在他们口中的含义。
  • 2:27 - 2:31
    在Twitter上,「烟」的含义通常有四类:
  • 2:31 - 2:34
    第一,吸烟;
  • 2:34 - 2:37
    第二,抽大麻;
  • 2:37 - 2:40
    第三,烟熏肋排;
  • 2:40 - 2:43
    第四,闻香识女。
  • 2:43 - 2:46
    (笑声)
  • 2:46 - 2:49
    然后你就会想,
  • 2:49 - 2:51
    人们是如何谈论电子烟的呢?
  • 2:51 - 2:53
    人们谈论电子烟的方式非常多,
  • 2:53 - 2:58
    从屏幕上你们可以看到谈论的方式是如此繁多。
  • 2:58 - 3:01
    这就让我们想到,
  • 3:01 - 3:04
    语言是人类创造的,
  • 3:04 - 3:06
    人类的语言是复杂混乱的,
  • 3:06 - 3:12
    我们用各种语言,无时无刻不在讲着比喻,
    说着俚语和术语,
  • 3:12 - 3:15
    好不容易弄清了,立马就又变掉了。
  • 3:15 - 3:20
    那么,疾控中心投放的广告,
  • 3:20 - 3:23
    以及电视上那种看起来让人非常不安的
  • 3:23 - 3:27
    形象地画了一个喉咙烧出来洞的女性的广告,
  • 3:27 - 3:31
    这些广告会影响人们戒烟吗?
  • 3:31 - 3:35
    健康媒体合作实验室承认其数据的有限性,
  • 3:35 - 3:37
    但他们还是做了这样的结论,
  • 3:37 - 3:40
    那些广告——或许你们都见到过——
  • 3:40 - 3:42
    确实会震颤人的内心,
  • 3:42 - 3:44
    让他们有所思考,
  • 3:44 - 3:48
    这样或许会影响他们未来的行为。
  • 3:48 - 3:52
    这个项目让我尊重和欣赏的地方,
  • 3:52 - 3:57
    不仅在于该项目基于人们的真实需求,
  • 3:57 - 4:02
    还在于它充分诠释了面对「无聊烦琐的世事」
  • 4:02 - 4:05
    展现出来的勇气。
  • 4:05 - 4:09
    因此,并不只是大数据在挑战我们对事物的理解,
  • 4:09 - 4:11
    让我们直面这一事实吧,
  • 4:11 - 4:13
    不管处理多少数据,哪怕再少的数据,
  • 4:13 - 4:16
    人们也能把它搞得一团糟,
  • 4:16 - 4:17
    「见多不怪」了。
  • 4:17 - 4:21
    你或许会记得,几年前,
  • 4:21 - 4:24
    前总统罗纳德•里根
  • 4:24 - 4:25
    在声称「事实是愚蠢的」后
  • 4:25 - 4:29
    被严厉指责。
  • 4:29 - 4:31
    平心而论,这是一个口误。
  • 4:31 - 4:34
    他原本是想引用约翰•亚当斯
  • 4:34 - 4:36
    在波士顿惨案审判为英军士兵的辩言
  • 4:36 - 4:40
    「事实是顽固不化的。」
  • 4:40 - 4:42
    但事实上,我认为
  • 4:42 - 4:46
    里根总统那句话蕴含着些许智慧,
  • 4:46 - 4:48
    事实固然顽固不化,
  • 4:48 - 4:51
    有时确实是愚蠢的。
  • 4:51 - 4:53
    这对我意义深远,
  • 4:53 - 4:57
    我讲一个私人故事来告诉你们为什么。
  • 4:57 - 4:59
    我要深吸一口气。
  • 4:59 - 5:02
    我的儿子艾萨克,在他两岁的时候,
  • 5:02 - 5:04
    被诊断出患有自闭症,
  • 5:04 - 5:07
    在我们眼里,他是个幸福、欢快、
  • 5:07 - 5:09
    充满爱意、惹人喜欢的小孩,
  • 5:09 - 5:12
    但该发展水平评估
  • 5:12 - 5:14
    关注的指标是诸如言多言寡——
  • 5:14 - 5:17
    当时,是零——
  • 5:17 - 5:21
    互动性姿势和最少目光接触,
  • 5:21 - 5:23
    根据这套评估标准的结果,
  • 5:23 - 5:27
    他的发展水平相当于9月大的婴儿。
  • 5:27 - 5:30
    按照这套标准,结果无可厚非,
  • 5:30 - 5:33
    但这不是全部。
  • 5:33 - 5:35
    一年半之后,
  • 5:35 - 5:37
    在他快要四岁的时候,
  • 5:37 - 5:39
    有一天我发现他坐在电脑前,
  • 5:39 - 5:45
    在Google图片搜索中搜索「women」
  • 5:45 - 5:48
    拼成了「wimen」
  • 5:48 - 5:51
    接下来我做了任何有心的父母都会做的事,
  • 5:51 - 5:53
    我立马就按了后退按钮,
  • 5:53 - 5:56
    看看他还搜索了什么。
  • 5:56 - 5:58
    查到了,按顺序来:男人,
  • 5:58 - 6:06
    学校,汽车和电脑。
  • 6:06 - 6:08
    我目瞪口呆,
  • 6:08 - 6:10
    因为我们还不知道他会拼单词,
  • 6:10 - 6:12
    更别说读写了,因此我问他,
  • 6:12 - 6:14
    「艾萨克,你是如何做到的?」
  • 6:14 - 6:16
    他很严肃地看着我说,
  • 6:16 - 6:20
    「在搜索框里输入。」
  • 6:20 - 6:23
    他一直在自我学习如何去沟通,
  • 6:23 - 6:26
    但我们将注意力投在了别处,
  • 6:26 - 6:29
    很显然,那些发展水平评估
  • 6:29 - 6:31
    过分注重了一个指标——
  • 6:31 - 6:34
    言语沟通——
  • 6:34 - 6:39
    而忽视了其他指标,如问题解决能力。
  • 6:39 - 6:42
    沟通对于艾萨克而言很难,
  • 6:42 - 6:44
    所以他找到了一个变通方法,
  • 6:44 - 6:47
    自己去探索想要知道的信息。
  • 6:47 - 6:48
    你考虑一下,这确实很有道理,
  • 6:48 - 6:51
    因为提出一个问题
  • 6:51 - 6:53
    是复杂的过程,
  • 6:53 - 7:00
    但他能通过在搜索框中输入单词来达到同样目的。
  • 7:00 - 7:03
    因此,这一个小插曲
  • 7:03 - 7:07
    深深影响了我和我的家庭,
  • 7:07 - 7:12
    因为它让我们对发生在他身上的一切
    有了全新的认识,
  • 7:12 - 7:14
    也不那么担心他了,
  • 7:14 - 7:17
    而且更加欣赏他的「人小鬼大」。
  • 7:17 - 7:20
    事实是愚蠢的,
  • 7:20 - 7:23
    极容易被误用,
  • 7:23 - 7:24
    有意或无意地。
  • 7:24 - 7:27
    我有一个叫Emily Willingham的朋友,是科学家,
  • 7:27 - 7:30
    不久前他为福布斯杂志写过一篇文章,
  • 7:30 - 7:34
    名为《十个最奇怪的跟自闭症相关的事情》
  • 7:34 - 7:37
    此文深得我心。
  • 7:37 - 7:40
    「互联网」,一切罪恶的源头,对吧?
  • 7:40 - 7:44
    当然,「母亲」也是其中一条。
  • 7:44 - 7:46
    事实上,没这么简单,
  • 7:46 - 7:49
    「母亲」还进一步细分为多条。
  • 7:49 - 7:54
    你们可以看到这个清单真的内涵丰富又有趣。
  • 7:54 - 8:00
    我很「欣赏」那些在在高速路旁怀孕的人。
  • 8:00 - 8:01
    最后一条很有趣,
  • 8:01 - 8:06
    因为「冰箱母亲」在最初被认为是
  • 8:06 - 8:08
    孩童自闭症的原因,
  • 8:08 - 8:11
    这个词表示那些冰冷的、没有爱心的人。
  • 8:11 - 8:13
    话已至此,你们也许会问,
  • 8:13 - 8:14
    「好吧,苏珊,我们明白了,
  • 8:14 - 8:16
    你能理解数据,你可以决定数据的意义。」
  • 8:16 - 8:21
    这是对的,这绝对是没问题的,
  • 8:21 - 8:26
    但挑战在于,
  • 8:26 - 8:31
    你们自己也有机会明白数据的意义,
  • 8:31 - 8:37
    因为,坦白地讲,数据自己不会创造意义,
    是我们创造数据的意义。
  • 8:37 - 8:40
    因此,作为商人,作为消费者,
  • 8:40 - 8:42
    作为病人,作为公民,
  • 8:42 - 8:45
    我认为我们都有责任
  • 8:45 - 8:50
    花更多时间来锻炼批判性思维能力。
  • 8:50 - 8:51
    为什么?
  • 8:51 - 8:54
    因为历史发展到今天,
  • 8:54 - 8:56
    我们总是听到这样的说法,
  • 8:56 - 8:58
    我们能以闪电般速度
  • 8:58 - 9:00
    处理海量数据,
  • 9:00 - 9:05
    这就意味着我们能以更快地速度做出错误的决策,
  • 9:05 - 9:10
    带给我们史无前例的巨大影响。
  • 9:10 - 9:12
    没错吧?
  • 9:12 - 9:15
    因此,我们需要做的就是
  • 9:15 - 9:17
    多花一点时间在
  • 9:17 - 9:20
    人文学,
  • 9:20 - 9:23
    社会学,社会科学,
  • 9:23 - 9:26
    修辞学,哲学,伦理学,
  • 9:26 - 9:31
    因为这些知识非常有助于帮助我们理解大数据,
  • 9:31 - 9:33
    而且也能锻炼我们的批判性思维。
  • 9:33 - 9:39
    毕竟,如果我能在一个论断中发现问题,
  • 9:39 - 9:43
    这个问题是以文字还是数字的形式呈现并不那么重要。
  • 9:43 - 9:46
    而且,这些知识会
  • 9:46 - 9:50
    让我们有能力辨识出事实与偏见,
  • 9:50 - 9:52
    错误的关联信息,
  • 9:52 - 9:56
    有能力在30码开外就看透赤裸裸的情感诉求,
  • 9:56 - 9:58
    因为,乙事件发生在甲事件之后,
  • 9:58 - 10:01
    并不意味着是甲导致乙的发生,
  • 10:01 - 10:03
    允许我耍一下酷,
  • 10:03 - 10:08
    罗马人称之为
    「post hoc ergo propter hoc」
  • 10:08 - 10:11
    即「后此谬误」。
  • 10:11 - 10:15
    这意味着我们要对人口统计学
    这样的学科打个问号。
  • 10:15 - 10:17
    为什么?因为这样的学科基于的假设是
  • 10:17 - 10:20
    性别、年龄和住址等数据
  • 10:20 - 10:21
    决定我们的身份,
  • 10:21 - 10:24
    而不是基于我们的思想和行为。
  • 10:24 - 10:26
    我们获取了这些数据,
  • 10:26 - 10:29
    我们需要做好隐私控制,
  • 10:29 - 10:33
    并保证民众的选择权,
  • 10:33 - 10:38
    除此之外,我们需要弄清楚所做的假设,
  • 10:38 - 10:41
    采用的研究方法,
  • 10:41 - 10:43
    以及对结果的信任。
  • 10:43 - 10:46
    就像高中代数老师曾对我说的,
  • 10:46 - 10:47
    给我看看你的解题步骤,
  • 10:47 - 10:51
    因为如果我不知道你的步骤,
  • 10:51 - 10:53
    我就不知道你落下了哪些步骤,
  • 10:53 - 10:55
    如果我不知道你问了些什么,
  • 10:55 - 10:58
    我就不知道哪些问题你没有问。
  • 10:58 - 11:00
    我们应该问自己这个最难回答的问题,
  • 11:00 - 11:01
    这真是值得的:
  • 11:01 - 11:05
    数据真的显示出了这个结果,
  • 11:05 - 11:11
    还是这样的结果让我们感觉更成功、更舒服?
  • 11:11 - 11:14
    因此,健康媒体合作实验室
  • 11:14 - 11:16
    在该项目结束时发现,
  • 11:16 - 11:21
    谈论那些很形象、令人不安的广告的推特中,
  • 11:21 - 11:25
    有87%的表达出了恐惧,
  • 11:25 - 11:30
    但他们做出这些广告让人戒烟的结论了吗?
  • 11:30 - 11:33
    没有。这是科学,但不是魔法。
  • 11:33 - 11:36
    因此,如果我们想要激发
  • 11:36 - 11:39
    数据中潜在的能量,
  • 11:39 - 11:42
    我们没必要盲目地
  • 11:42 - 11:45
    游走于奥威尔所谓的极端未来,
  • 11:45 - 11:49
    或赫胥黎所谓的琐碎的未来,
  • 11:49 - 11:52
    或两种思想的杂糅。
  • 11:52 - 11:54
    我们需要做的就是,
  • 11:54 - 11:57
    积极进行批判性思维,
  • 11:57 - 12:01
    并学习健康媒体合作实验室的做法,
  • 12:01 - 12:04
    就像超级英雄电影里说的那样,
  • 12:04 - 12:05
    力量用在行善上。
  • 12:05 - 12:08
    谢谢。
  • 12:08 - 12:10
    (掌声)
Title:
如何应对大数据?| 苏珊•埃特林格|TED@IBM
Speaker:
苏珊•埃特林格
Description:

一组数据让你感觉更舒服了?感觉更成功了?那很有可能是你解读错了。在这个发人深省的演讲中,苏珊•埃特林格解释了为何我们在面对越来越多的数据时,应锻炼批判性思维能力。否则,我们很难从统计数据的层面上更进一步,真正地理解数据。

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
12:23

Chinese, Simplified subtitles

Revisions