统计学如何具有误导性 - 马克·利德尔
-
0:07 - 0:09统计数据的说服力很高,
-
0:09 - 0:13以至于很多个人、机构甚至整个国家
-
0:13 - 0:18在做最重要的决定时都会参考统计数据。
-
0:18 - 0:19但其实这样做有一个问题。
-
0:19 - 0:23任何一系列的统计数据都也许有一些隐藏的因素,
-
0:23 - 0:27可以颠覆整个结果。
-
0:27 - 0:31例如,想象你现在需要在两家医院中选择一家
-
0:31 - 0:33为家里的老人做手术。
-
0:33 - 0:36在每个医院最近收治的1000例患者中,
-
0:36 - 0:40A医院有900例患者存活。
-
0:40 - 0:43然而,B医院只有800例患者存活。
-
0:43 - 0:46这样看来,A医院是更好的选择。
-
0:46 - 0:48但是,在你做出决定前,
-
0:48 - 0:51要记得,这两家医院收治的患者入院时,
-
0:51 - 0:54健康状态并不一致。
-
0:54 - 0:57如果我们将1000例患者分为两组,
-
0:57 - 1:01入院时健康状态好的
和入院时健康状态不好的, -
1:01 - 1:04结果就截然不同。
-
1:04 - 1:08A医院只有100例入院时健康状况不好,
-
1:08 - 1:10其中30例存活。
-
1:10 - 1:15B医院有400例入院时健康状况不好,
210例被救活了。 -
1:15 - 1:17对于重症患者来说,
-
1:17 - 1:20去B医院的生存率为52.5%。
-
1:21 - 1:25所以,B医院是更好的选择。
-
1:25 - 1:28那如果您的亲人入院时健康状态好呢?
-
1:28 - 1:32出人意料,轻症患者在B医院的生存率超过98%,
-
1:32 - 1:36B医院依旧是更好的选择。
-
1:36 - 1:39既然B医院两组病人的生存率都更高,
-
1:39 - 1:45为什么A医院的总体生存率会更高呢?
-
1:45 - 1:49我们遇到的这种现象被称为“辛普森悖论”——
-
1:49 - 1:52同一批数据仅因为分组不同,
-
1:52 - 1:55得出的结果完全相悖。
-
1:55 - 1:58“辛普森悖论”常常发生在总体数据隐藏了条件变量时,
-
1:59 - 2:01条件变量有时被称为潜伏变量。
-
2:01 - 2:07这个隐藏的额外变量会显著影响结果。
-
2:07 - 2:10这里,隐藏变量是患者到达医院时
-
2:10 - 2:13健康状况的构成比。
-
2:13 - 2:17“辛普森悖论”并非只是假说,
-
2:17 - 2:19它时不时出现在现实生活中,
-
2:19 - 2:22有时,是很重要的背景下。
-
2:22 - 2:24英国一项看起来展示出,
-
2:24 - 2:28在20年里,
-
2:28 - 2:30吸烟者生存率高于不吸烟者。
-
2:30 - 2:33但根据参与者的年龄分组后,
-
2:33 - 2:38发现不吸烟组人群的平均年龄显著较高,
-
2:38 - 2:41所以,不吸烟组在随访过程中更容易死亡,
-
2:41 - 2:44恰巧是因为不吸烟者通常更长寿。
-
2:44 - 2:47在这个例子中,年龄就是潜伏变量,
-
2:47 - 2:50而且它对于正确解释数据至关重要。
-
2:50 - 2:52另外一个例子中,
-
2:52 - 2:54佛罗里达州一项在死刑犯中所进行的分析显示,
-
2:54 - 2:58在黑人和白人在被指控谋杀的时候,
-
2:58 - 3:02判刑轻重没有种族差别,
-
3:02 - 3:06但根据受害者的种族分组后,结果大不相同。
-
3:06 - 3:08无论在何种情况下,
-
3:08 - 3:11黑人都更容易被判处死刑。
-
3:11 - 3:15白人之所以总体被判刑的比例高,
-
3:15 - 3:19是因为当受害者是白人的时候,
-
3:19 - 3:21相比于受害者是黑人而言,
-
3:21 - 3:24更容易导致死刑的判决;
-
3:24 - 3:28而且,大部分的谋杀都发生在同一个种族内的。
-
3:28 - 3:31我们怎样才能不被“辛普森悖论”所误导呢?
-
3:31 - 3:35不幸的是,并没有统一的答案。
-
3:35 - 3:39数据可以有无数种分组方法,
-
3:39 - 3:42相对于将数据分成具有误导性的,主观性的类别而言,
-
3:42 - 3:47总体数字有时能更给出更加精准的图景。
-
3:47 - 3:52我们能做的就是仔细地研究这些数据所描述的实际情况,
-
3:52 - 3:56并且考虑是否有潜伏变量。
-
3:56 - 4:01否则,那些用数据去操纵别人,同时推进自己的日程的人,
-
4:01 - 4:03可以轻松伤害我们。
- Title:
- 统计学如何具有误导性 - 马克·利德尔
- Speaker:
- Mark Liddell
- Description:
-
观看整个课程:http://ed.ted.com/lessons/how-statistics-can-be-misleading-mark-liddell
统计学是具有说服力的。强大的说服力以至于人们,组织,和整个国家以有组织的数据为根据来做他们最重要的决定。但是,任何一系列的统计数字或许会有一些隐藏的因素,可以颠覆整个结果。马克·利德尔来调查辛普森悖论。
课程:马克·利德尔,动画:锡鼠动画工作室
- Video Language:
- English
- Team:
- closed TED
- Project:
- TED-Ed
- Duration:
- 04:19
TED Translators admin approved Chinese, Simplified subtitles for How statistics can be misleading | ||
Retired user accepted Chinese, Simplified subtitles for How statistics can be misleading | ||
Retired user commented on Chinese, Simplified subtitles for How statistics can be misleading | ||
Retired user edited Chinese, Simplified subtitles for How statistics can be misleading | ||
Retired user edited Chinese, Simplified subtitles for How statistics can be misleading | ||
Zihan Zhao-Holland edited Chinese, Simplified subtitles for How statistics can be misleading | ||
Zihan Zhao-Holland edited Chinese, Simplified subtitles for How statistics can be misleading | ||
Zihan Zhao-Holland edited Chinese, Simplified subtitles for How statistics can be misleading |
Retired user
翻得不错!
请注意多使用现汉的规则,比如“在20年里”这种时间状语提前。记得根据需要调整语序哦~
加油q(≧▽≦q)!