Return to Video

统计学如何具有误导性 - 马克·利德尔

  • 0:07 - 0:09
    统计数据的说服力很高,
  • 0:09 - 0:13
    以至于很多个人、机构甚至整个国家
  • 0:13 - 0:18
    在做最重要的决定时都会参考统计数据。
  • 0:18 - 0:19
    但其实这样做有一个问题。
  • 0:19 - 0:23
    任何一系列的统计数据都也许有一些隐藏的因素,
  • 0:23 - 0:27
    可以颠覆整个结果。
  • 0:27 - 0:31
    例如,想象你现在需要在两家医院中选择一家
  • 0:31 - 0:33
    为家里的老人做手术。
  • 0:33 - 0:36
    在每个医院最近收治的1000例患者中,
  • 0:36 - 0:40
    A医院有900例患者存活。
  • 0:40 - 0:43
    然而,B医院只有800例患者存活。
  • 0:43 - 0:46
    这样看来,A医院是更好的选择。
  • 0:46 - 0:48
    但是,在你做出决定前,
  • 0:48 - 0:51
    要记得,这两家医院收治的患者入院时,
  • 0:51 - 0:54
    健康状态并不一致。
  • 0:54 - 0:57
    如果我们将1000例患者分为两组,
  • 0:57 - 1:01
    入院时健康状态好的
    和入院时健康状态不好的,
  • 1:01 - 1:04
    结果就截然不同。
  • 1:04 - 1:08
    A医院只有100例入院时健康状况不好,
  • 1:08 - 1:10
    其中30例存活。
  • 1:10 - 1:15
    B医院有400例入院时健康状况不好,
    210例被救活了。
  • 1:15 - 1:17
    对于重症患者来说,
  • 1:17 - 1:20
    去B医院的生存率为52.5%。
  • 1:21 - 1:25
    所以,B医院是更好的选择。
  • 1:25 - 1:28
    那如果您的亲人入院时健康状态好呢?
  • 1:28 - 1:32
    出人意料,轻症患者在B医院的生存率超过98%,
  • 1:32 - 1:36
    B医院依旧是更好的选择。
  • 1:36 - 1:39
    既然B医院两组病人的生存率都更高,
  • 1:39 - 1:45
    为什么A医院的总体生存率会更高呢?
  • 1:45 - 1:49
    我们遇到的这种现象被称为“辛普森悖论”——
  • 1:49 - 1:52
    同一批数据仅因为分组不同,
  • 1:52 - 1:55
    得出的结果完全相悖。
  • 1:55 - 1:58
    “辛普森悖论”常常发生在总体数据隐藏了条件变量时,
  • 1:59 - 2:01
    条件变量有时被称为潜伏变量。
  • 2:01 - 2:07
    这个隐藏的额外变量会显著影响结果。
  • 2:07 - 2:10
    这里,隐藏变量是患者到达医院时
  • 2:10 - 2:13
    健康状况的构成比。
  • 2:13 - 2:17
    “辛普森悖论”并非只是假说,
  • 2:17 - 2:19
    它时不时出现在现实生活中,
  • 2:19 - 2:22
    有时,是很重要的背景下。
  • 2:22 - 2:24
    英国一项看起来展示出,
  • 2:24 - 2:28
    在20年里,
  • 2:28 - 2:30
    吸烟者生存率高于不吸烟者。
  • 2:30 - 2:33
    但根据参与者的年龄分组后,
  • 2:33 - 2:38
    发现不吸烟组人群的平均年龄显著较高,
  • 2:38 - 2:41
    所以,不吸烟组在随访过程中更容易死亡,
  • 2:41 - 2:44
    恰巧是因为不吸烟者通常更长寿。
  • 2:44 - 2:47
    在这个例子中,年龄就是潜伏变量,
  • 2:47 - 2:50
    而且它对于正确解释数据至关重要。
  • 2:50 - 2:52
    另外一个例子中,
  • 2:52 - 2:54
    佛罗里达州一项在死刑犯中所进行的分析显示,
  • 2:54 - 2:58
    在黑人和白人在被指控谋杀的时候,
  • 2:58 - 3:02
    判刑轻重没有种族差别,
  • 3:02 - 3:06
    但根据受害者的种族分组后,结果大不相同。
  • 3:06 - 3:08
    无论在何种情况下,
  • 3:08 - 3:11
    黑人都更容易被判处死刑。
  • 3:11 - 3:15
    白人之所以总体被判刑的比例高,
  • 3:15 - 3:19
    是因为当受害者是白人的时候,
  • 3:19 - 3:21
    相比于受害者是黑人而言,
  • 3:21 - 3:24
    更容易导致死刑的判决;
  • 3:24 - 3:28
    而且,大部分的谋杀都发生在同一个种族内的。
  • 3:28 - 3:31
    我们怎样才能不被“辛普森悖论”所误导呢?
  • 3:31 - 3:35
    不幸的是,并没有统一的答案。
  • 3:35 - 3:39
    数据可以有无数种分组方法,
  • 3:39 - 3:42
    相对于将数据分成具有误导性的,主观性的类别而言,
  • 3:42 - 3:47
    总体数字有时能更给出更加精准的图景。
  • 3:47 - 3:52
    我们能做的就是仔细地研究这些数据所描述的实际情况,
  • 3:52 - 3:56
    并且考虑是否有潜伏变量。
  • 3:56 - 4:01
    否则,那些用数据去操纵别人,同时推进自己的日程的人,
  • 4:01 - 4:03
    可以轻松伤害我们。
Title:
统计学如何具有误导性 - 马克·利德尔
Speaker:
Mark Liddell
Description:

观看整个课程:http://ed.ted.com/lessons/how-statistics-can-be-misleading-mark-liddell

统计学是具有说服力的。强大的说服力以至于人们,组织,和整个国家以有组织的数据为根据来做他们最重要的决定。但是,任何一系列的统计数字或许会有一些隐藏的因素,可以颠覆整个结果。马克·利德尔来调查辛普森悖论。

课程:马克·利德尔,动画:锡鼠动画工作室

more » « less
Video Language:
English
Team:
closed TED
Project:
TED-Ed
Duration:
04:19
  • 翻得不错!
    请注意多使用现汉的规则,比如“在20年里”这种时间状语提前。记得根据需要调整语序哦~
    加油q(≧▽≦q)!

Chinese, Simplified subtitles

Revisions