如何应对大数据?| 苏珊•埃特林格|TED@IBM
-
0:01 - 0:04科技极大程度上改变了世界:
-
0:04 - 0:09登月计划,互联网,基因组测序。
-
0:09 - 0:13但随之而来的是我们内心深处的忧虑,
-
0:13 - 0:15大约30年前,
-
0:15 - 0:17文学评论家尼尔•波兹曼出了一本书,
-
0:17 - 0:19名为《娱乐至死》,
-
0:19 - 0:22将这个问题展现得淋漓尽致。
-
0:22 - 0:24他这样写道,
-
0:24 - 0:27将乔治•奥威尔和阿道司•赫胥黎
-
0:27 - 0:30两人的反乌托邦观点做比较,
-
0:30 - 0:35奥威尔害怕我们的文化成为「受制文化」。
-
0:35 - 0:39赫胥黎担心的是我们的文化成为「琐碎文化」
-
0:39 - 0:43奥威尔害怕的是真理被隐瞒,
-
0:43 - 0:45赫胥黎担心的是我们被淹没在
-
0:45 - 0:48无聊烦琐的世事中。
-
0:48 - 0:52简言之,这是「老大哥」看你
-
0:52 - 0:55还是你看「老大哥」的选择。
(译者注:「老大哥」典出奥威尔名著《1984》) -
0:55 - 0:57(笑声)
-
0:57 - 0:59但事实不尽然,
-
0:59 - 1:02我们不是只能被动地接受数据和科技。
-
1:02 - 1:04我们能改变科技在我们生活中扮演的角色,
-
1:04 - 1:07也能改变享受数据带来的恩惠的方式,
-
1:07 - 1:08但要实现这一目的,
-
1:08 - 1:12思考方式固然重要, 我们也要对如何解读数据
-
1:12 - 1:14投以同样高的关注度。
-
1:14 - 1:17我们需要问问题,要问深刻的问题,
-
1:17 - 1:19不再单纯地统计数据,
-
1:19 - 1:21而是要进一步理解数据。
-
1:21 - 1:24我们身边充斥着那些
-
1:24 - 1:26讲述世界上有海量数据的故事,
-
1:26 - 1:28但当我们面临大数据,
-
1:28 - 1:30面临理解大数据所的挑战,
-
1:30 - 1:32数据量的大小不代表一切。
-
1:32 - 1:35还有数据传播的速度,
-
1:35 - 1:37数据的类型,
-
1:37 - 1:40举几个例子:
-
1:40 - 1:42图像,
-
1:42 - 1:46文字,
-
1:46 - 1:48视频,
-
1:48 - 1:50音频。
-
1:50 - 1:53不同类型的数据能有机地结合在一起,
-
1:53 - 1:55因为正是人类创造了这些数据,
-
1:55 - 1:58而且要在一定背景前提下理解特定数据。
-
1:58 - 2:02目前,一个来自伊利诺大学
芝加哥分校的数据科学家团队, -
2:02 - 2:05自称「健康媒体合作实验室」,
-
2:05 - 2:08正与疾控中心合作,
-
2:08 - 2:09试图进一步了解
-
2:09 - 2:12人们谈论戒烟的方式,
-
2:12 - 2:15谈论电子烟的方式,
-
2:15 - 2:17以及他们如何协作
-
2:17 - 2:19来帮助人们戒烟。
-
2:19 - 2:21有趣的是,如果你想了解
-
2:21 - 2:23人们谈论吸烟的方式,
-
2:23 - 2:25首先需要了解
-
2:25 - 2:27「烟」在他们口中的含义。
-
2:27 - 2:31在Twitter上,「烟」的含义通常有四类:
-
2:31 - 2:34第一,吸烟;
-
2:34 - 2:37第二,抽大麻;
-
2:37 - 2:40第三,烟熏肋排;
-
2:40 - 2:43第四,闻香识女。
-
2:43 - 2:46(笑声)
-
2:46 - 2:49然后你就会想,
-
2:49 - 2:51人们是如何谈论电子烟的呢?
-
2:51 - 2:53人们谈论电子烟的方式非常多,
-
2:53 - 2:58从屏幕上你们可以看到谈论的方式是如此繁多。
-
2:58 - 3:01这就让我们想到,
-
3:01 - 3:04语言是人类创造的,
-
3:04 - 3:06人类的语言是复杂混乱的,
-
3:06 - 3:12我们用各种语言,无时无刻不在讲着比喻,
说着俚语和术语, -
3:12 - 3:15好不容易弄清了,立马就又变掉了。
-
3:15 - 3:20那么,疾控中心投放的广告,
-
3:20 - 3:23以及电视上那种看起来让人非常不安的
-
3:23 - 3:27形象地画了一个喉咙烧出来洞的女性的广告,
-
3:27 - 3:31这些广告会影响人们戒烟吗?
-
3:31 - 3:35健康媒体合作实验室承认其数据的有限性,
-
3:35 - 3:37但他们还是做了这样的结论,
-
3:37 - 3:40那些广告——或许你们都见到过——
-
3:40 - 3:42确实会震颤人的内心,
-
3:42 - 3:44让他们有所思考,
-
3:44 - 3:48这样或许会影响他们未来的行为。
-
3:48 - 3:52这个项目让我尊重和欣赏的地方,
-
3:52 - 3:57不仅在于该项目基于人们的真实需求,
-
3:57 - 4:02还在于它充分诠释了面对「无聊烦琐的世事」
-
4:02 - 4:05展现出来的勇气。
-
4:05 - 4:09因此,并不只是大数据在挑战我们对事物的理解,
-
4:09 - 4:11让我们直面这一事实吧,
-
4:11 - 4:13不管处理多少数据,哪怕再少的数据,
-
4:13 - 4:16人们也能把它搞得一团糟,
-
4:16 - 4:17「见多不怪」了。
-
4:17 - 4:21你或许会记得,几年前,
-
4:21 - 4:24前总统罗纳德•里根
-
4:24 - 4:25在声称「事实是愚蠢的」后
-
4:25 - 4:29被严厉指责。
-
4:29 - 4:31平心而论,这是一个口误。
-
4:31 - 4:34他原本是想引用约翰•亚当斯
-
4:34 - 4:36在波士顿惨案审判为英军士兵的辩言
-
4:36 - 4:40「事实是顽固不化的。」
-
4:40 - 4:42但事实上,我认为
-
4:42 - 4:46里根总统那句话蕴含着些许智慧,
-
4:46 - 4:48事实固然顽固不化,
-
4:48 - 4:51有时确实是愚蠢的。
-
4:51 - 4:53这对我意义深远,
-
4:53 - 4:57我讲一个私人故事来告诉你们为什么。
-
4:57 - 4:59我要深吸一口气。
-
4:59 - 5:02我的儿子艾萨克,在他两岁的时候,
-
5:02 - 5:04被诊断出患有自闭症,
-
5:04 - 5:07在我们眼里,他是个幸福、欢快、
-
5:07 - 5:09充满爱意、惹人喜欢的小孩,
-
5:09 - 5:12但该发展水平评估
-
5:12 - 5:14关注的指标是诸如言多言寡——
-
5:14 - 5:17当时,是零——
-
5:17 - 5:21互动性姿势和最少目光接触,
-
5:21 - 5:23根据这套评估标准的结果,
-
5:23 - 5:27他的发展水平相当于9月大的婴儿。
-
5:27 - 5:30按照这套标准,结果无可厚非,
-
5:30 - 5:33但这不是全部。
-
5:33 - 5:35一年半之后,
-
5:35 - 5:37在他快要四岁的时候,
-
5:37 - 5:39有一天我发现他坐在电脑前,
-
5:39 - 5:45在Google图片搜索中搜索「women」
-
5:45 - 5:48拼成了「wimen」
-
5:48 - 5:51接下来我做了任何有心的父母都会做的事,
-
5:51 - 5:53我立马就按了后退按钮,
-
5:53 - 5:56看看他还搜索了什么。
-
5:56 - 5:58查到了,按顺序来:男人,
-
5:58 - 6:06学校,汽车和电脑。
-
6:06 - 6:08我目瞪口呆,
-
6:08 - 6:10因为我们还不知道他会拼单词,
-
6:10 - 6:12更别说读写了,因此我问他,
-
6:12 - 6:14「艾萨克,你是如何做到的?」
-
6:14 - 6:16他很严肃地看着我说,
-
6:16 - 6:20「在搜索框里输入。」
-
6:20 - 6:23他一直在自我学习如何去沟通,
-
6:23 - 6:26但我们将注意力投在了别处,
-
6:26 - 6:29很显然,那些发展水平评估
-
6:29 - 6:31过分注重了一个指标——
-
6:31 - 6:34言语沟通——
-
6:34 - 6:39而忽视了其他指标,如问题解决能力。
-
6:39 - 6:42沟通对于艾萨克而言很难,
-
6:42 - 6:44所以他找到了一个变通方法,
-
6:44 - 6:47自己去探索想要知道的信息。
-
6:47 - 6:48你考虑一下,这确实很有道理,
-
6:48 - 6:51因为提出一个问题
-
6:51 - 6:53是复杂的过程,
-
6:53 - 7:00但他能通过在搜索框中输入单词来达到同样目的。
-
7:00 - 7:03因此,这一个小插曲
-
7:03 - 7:07深深影响了我和我的家庭,
-
7:07 - 7:12因为它让我们对发生在他身上的一切
有了全新的认识, -
7:12 - 7:14也不那么担心他了,
-
7:14 - 7:17而且更加欣赏他的「人小鬼大」。
-
7:17 - 7:20事实是愚蠢的,
-
7:20 - 7:23极容易被误用,
-
7:23 - 7:24有意或无意地。
-
7:24 - 7:27我有一个叫Emily Willingham的朋友,是科学家,
-
7:27 - 7:30不久前他为福布斯杂志写过一篇文章,
-
7:30 - 7:34名为《十个最奇怪的跟自闭症相关的事情》
-
7:34 - 7:37此文深得我心。
-
7:37 - 7:40「互联网」,一切罪恶的源头,对吧?
-
7:40 - 7:44当然,「母亲」也是其中一条。
-
7:44 - 7:46事实上,没这么简单,
-
7:46 - 7:49「母亲」还进一步细分为多条。
-
7:49 - 7:54你们可以看到这个清单真的内涵丰富又有趣。
-
7:54 - 8:00我很「欣赏」那些在在高速路旁怀孕的人。
-
8:00 - 8:01最后一条很有趣,
-
8:01 - 8:06因为「冰箱母亲」在最初被认为是
-
8:06 - 8:08孩童自闭症的原因,
-
8:08 - 8:11这个词表示那些冰冷的、没有爱心的人。
-
8:11 - 8:13话已至此,你们也许会问,
-
8:13 - 8:14「好吧,苏珊,我们明白了,
-
8:14 - 8:16你能理解数据,你可以决定数据的意义。」
-
8:16 - 8:21这是对的,这绝对是没问题的,
-
8:21 - 8:26但挑战在于,
-
8:26 - 8:31你们自己也有机会明白数据的意义,
-
8:31 - 8:37因为,坦白地讲,数据自己不会创造意义,
是我们创造数据的意义。 -
8:37 - 8:40因此,作为商人,作为消费者,
-
8:40 - 8:42作为病人,作为公民,
-
8:42 - 8:45我认为我们都有责任
-
8:45 - 8:50花更多时间来锻炼批判性思维能力。
-
8:50 - 8:51为什么?
-
8:51 - 8:54因为历史发展到今天,
-
8:54 - 8:56我们总是听到这样的说法,
-
8:56 - 8:58我们能以闪电般速度
-
8:58 - 9:00处理海量数据,
-
9:00 - 9:05这就意味着我们能以更快地速度做出错误的决策,
-
9:05 - 9:10带给我们史无前例的巨大影响。
-
9:10 - 9:12没错吧?
-
9:12 - 9:15因此,我们需要做的就是
-
9:15 - 9:17多花一点时间在
-
9:17 - 9:20人文学,
-
9:20 - 9:23社会学,社会科学,
-
9:23 - 9:26修辞学,哲学,伦理学,
-
9:26 - 9:31因为这些知识非常有助于帮助我们理解大数据,
-
9:31 - 9:33而且也能锻炼我们的批判性思维。
-
9:33 - 9:39毕竟,如果我能在一个论断中发现问题,
-
9:39 - 9:43这个问题是以文字还是数字的形式呈现并不那么重要。
-
9:43 - 9:46而且,这些知识会
-
9:46 - 9:50让我们有能力辨识出事实与偏见,
-
9:50 - 9:52错误的关联信息,
-
9:52 - 9:56有能力在30码开外就看透赤裸裸的情感诉求,
-
9:56 - 9:58因为,乙事件发生在甲事件之后,
-
9:58 - 10:01并不意味着是甲导致乙的发生,
-
10:01 - 10:03允许我耍一下酷,
-
10:03 - 10:08罗马人称之为
「post hoc ergo propter hoc」 -
10:08 - 10:11即「后此谬误」。
-
10:11 - 10:15这意味着我们要对人口统计学
这样的学科打个问号。 -
10:15 - 10:17为什么?因为这样的学科基于的假设是
-
10:17 - 10:20性别、年龄和住址等数据
-
10:20 - 10:21决定我们的身份,
-
10:21 - 10:24而不是基于我们的思想和行为。
-
10:24 - 10:26我们获取了这些数据,
-
10:26 - 10:29我们需要做好隐私控制,
-
10:29 - 10:33并保证民众的选择权,
-
10:33 - 10:38除此之外,我们需要弄清楚所做的假设,
-
10:38 - 10:41采用的研究方法,
-
10:41 - 10:43以及对结果的信任。
-
10:43 - 10:46就像高中代数老师曾对我说的,
-
10:46 - 10:47给我看看你的解题步骤,
-
10:47 - 10:51因为如果我不知道你的步骤,
-
10:51 - 10:53我就不知道你落下了哪些步骤,
-
10:53 - 10:55如果我不知道你问了些什么,
-
10:55 - 10:58我就不知道哪些问题你没有问。
-
10:58 - 11:00我们应该问自己这个最难回答的问题,
-
11:00 - 11:01这真是值得的:
-
11:01 - 11:05数据真的显示出了这个结果,
-
11:05 - 11:11还是这样的结果让我们感觉更成功、更舒服?
-
11:11 - 11:14因此,健康媒体合作实验室
-
11:14 - 11:16在该项目结束时发现,
-
11:16 - 11:21谈论那些很形象、令人不安的广告的推特中,
-
11:21 - 11:25有87%的表达出了恐惧,
-
11:25 - 11:30但他们做出这些广告让人戒烟的结论了吗?
-
11:30 - 11:33没有。这是科学,但不是魔法。
-
11:33 - 11:36因此,如果我们想要激发
-
11:36 - 11:39数据中潜在的能量,
-
11:39 - 11:42我们没必要盲目地
-
11:42 - 11:45游走于奥威尔所谓的极端未来,
-
11:45 - 11:49或赫胥黎所谓的琐碎的未来,
-
11:49 - 11:52或两种思想的杂糅。
-
11:52 - 11:54我们需要做的就是,
-
11:54 - 11:57积极进行批判性思维,
-
11:57 - 12:01并学习健康媒体合作实验室的做法,
-
12:01 - 12:04就像超级英雄电影里说的那样,
-
12:04 - 12:05力量用在行善上。
-
12:05 - 12:08谢谢。
-
12:08 - 12:10(掌声)
- Title:
- 如何应对大数据?| 苏珊•埃特林格|TED@IBM
- Speaker:
- 苏珊•埃特林格
- Description:
-
一组数据让你感觉更舒服了?感觉更成功了?那很有可能是你解读错了。在这个发人深省的演讲中,苏珊•埃特林格解释了为何我们在面对越来越多的数据时,应锻炼批判性思维能力。否则,我们很难从统计数据的层面上更进一步,真正地理解数据。
- Video Language:
- English
- Team:
- closed TED
- Project:
- TEDTalks
- Duration:
- 12:23
Tony Yet approved Chinese, Simplified subtitles for What do we do with all this big data? | ||
Jin Ge accepted Chinese, Simplified subtitles for What do we do with all this big data? | ||
Yumeng Guo edited Chinese, Simplified subtitles for What do we do with all this big data? | ||
Yumeng Guo edited Chinese, Simplified subtitles for What do we do with all this big data? | ||
Yumeng Guo edited Chinese, Simplified subtitles for What do we do with all this big data? | ||
Yumeng Guo edited Chinese, Simplified subtitles for What do we do with all this big data? | ||
Yumeng Guo edited Chinese, Simplified subtitles for What do we do with all this big data? |