Return to Video

統計數據如何能誤導我們? - 馬克.利德爾

  • 0:07 - 0:09
    統計數據深具說服力
  • 0:09 - 0:13
    以致很多人、機構甚至整個國家
  • 0:13 - 0:18
    將已整理的數據
    作為他們一些最重要決定的依據
  • 0:18 - 0:19
    但這做法有一個問題
  • 0:19 - 0:23
    任何一組統計數據
    都有可能潛伏一些因素
  • 0:23 - 0:27
    這些因素有時可能完全改變結論
  • 0:27 - 0:31
    例如,想像你需要
    從兩間醫院中選擇一間
  • 0:31 - 0:34
    適合年老的親人來做手術
  • 0:34 - 0:36
    在各自醫院最近收治的 1000 個病人中
  • 0:36 - 0:40
    醫院 A 有 900 人存活
  • 0:40 - 0:43
    而醫院 B 只有 800 人存活
  • 0:43 - 0:46
    所以看起來醫院 A 是比較好的選擇
  • 0:46 - 0:48
    但在你作決定前
  • 0:48 - 0:51
    要記得並不是所有病人入院時
  • 0:51 - 0:54
    都有相同的健康情況
  • 0:54 - 0:57
    若我們把各間醫院最近收治的 1000 個病人
  • 0:57 - 1:01
    分成入院時健康良好和欠佳這兩組
  • 1:01 - 1:04
    情況變得截然不同
  • 1:04 - 1:10
    醫院 A 只有 100 人入院時健康欠佳,
    而當中 30 人存活
  • 1:10 - 1:15
    但醫院 B 則有 400 人,
    而他們能保住 210 人的性命
  • 1:15 - 1:21
    所以對於入院時健康欠佳的病人,
    醫院 B 是較好的選擇
  • 1:21 - 1:25
    其存活率達 52.5 %
  • 1:25 - 1:28
    那麼如果你的親人入院時
    健康良好呢?
  • 1:28 - 1:32
    非常奇怪的是,
    醫院 B 仍是較好的選擇
  • 1:32 - 1:36
    其存活率超過 98 %
  • 1:36 - 1:45
    所以若醫院 B 在這兩組都有較高存活率,
    為何卻是醫院 A 有較高的整體存活率?
  • 1:45 - 1:49
    這是我們碰巧遇到的
    一個「辛普森悖論」的情況
  • 1:49 - 1:55
    同一套數據依據其分組方法,
    能呈現出相反的走向
  • 1:55 - 1:59
    這經常發生在當已收集的數據中
    隱藏了一個「條件變項」
  • 1:59 - 2:01
    有時也稱為「潛在變項」
  • 2:01 - 2:07
    它是另一個隱藏因素,
    會顯著地影響結果
  • 2:07 - 2:10
    在此,隱藏因素是
    兩組病人的相對比例
  • 2:10 - 2:13
    即入院時健康情況好或壞
  • 2:13 - 2:17
    辛普森悖論並不限於假設的情境
  • 2:17 - 2:19
    它在真實世界時有出現
  • 2:19 - 2:22
    有時甚至在重要的情況
  • 2:22 - 2:24
    一個英國的研究發現
  • 2:24 - 2:28
    吸煙者比非吸煙者有較高存活率
  • 2:28 - 2:30
    這研究長達二十多年
  • 2:30 - 2:33
    然而,當把參與者按年齡分組
  • 2:33 - 2:38
    便顯現非吸煙者的
    平均年齡明顯地比較高
  • 2:38 - 2:41
    因此,較可能在研究期間死亡
  • 2:41 - 2:44
    這正是因為非吸煙者
    普遍較長壽的緣故
  • 2:44 - 2:47
    在此,年齡分組是潛在變項
  • 2:47 - 2:50
    這對正確解讀數據非常重要
  • 2:50 - 2:52
    另一例子是
  • 2:52 - 2:54
    佛羅里達州死刑案件的研究分析
  • 2:54 - 3:02
    似乎顯示因謀殺罪的黑人或白人
    被判死刑的情況,並無種族差異
  • 3:02 - 3:06
    但當按受害人的種族來分組,
    就截然不同了
  • 3:06 - 3:11
    無論受害人的種族如何,
    黑人被告都較可能被判死刑
  • 3:11 - 3:15
    白人被告在整體上
    被判死刑的機率稍微較高
  • 3:15 - 3:19
    是因為涉及白人受害者的案件
  • 3:19 - 3:24
    比涉及黑人受害者的
    較有可能被判死刑
  • 3:24 - 3:28
    而謀殺案又多數發生在相同種族之間
  • 3:28 - 3:31
    那我們要如何避免掉入這種悖論呢?
  • 3:31 - 3:35
    不幸的是,
    並沒有一個適合各種情況的答案
  • 3:35 - 3:39
    數據能夠以各種方法進行分組
  • 3:39 - 3:42
    而整體數據有時
    能給我們一個更準確的描述
  • 3:42 - 3:47
    相較於誤導或任意分組的數據
  • 3:47 - 3:52
    我們唯一能做的是仔細研究
    統計數據所描述的真實情況
  • 3:52 - 3:56
    並考慮當中是否存在「潛在變項」
  • 3:56 - 4:03
    否則,我們便很容易受到
    運用數據達到目的人的操弄了
  • 4:04 - 4:10
    翻譯:Crystal Yip
Title:
統計數據如何能誤導我們? - 馬克.利德爾
Speaker:
Mark Liddell
Description:

觀看完整課堂:http://ed.ted.com/lessons/how-statistics-can-be-misleading-mark-liddell

統計數據深具說服力。以致很多個人、機構甚至整個國家,將已整理的數據
作為他們一些最重要決定的依據。但任何一組統計數據都可能潛伏一些因素,
這些因素有時可能完全改變結論。馬克.利德爾探究「辛普森悖論」。

課堂內容:馬克.利德爾
動畫創作:Tinmouse 動畫工作室

more » « less
Video Language:
English
Team:
closed TED
Project:
TED-Ed
Duration:
04:19

Chinese, Traditional subtitles

Revisions