Return to Video

어떻게 통계가 오해를 불러 일으킬 수 있는가 |마크 리델 (Mark Liddell)

  • 0:07 - 0:09
    통계는 설득력이 있습니다.
  • 0:09 - 0:13
    너무 설득력이 있어서
    사람들, 단체, 그리고 국가들은
  • 0:13 - 0:18
    그 정리된 데이터를 기반으로
    중대한 결정을 내립니다.
  • 0:18 - 0:19
    하지만 거기에는 문제가 있습니다.
  • 0:19 - 0:23
    어떤 통계든,결과를
    완전히 뒤집을 수 있는
  • 0:23 - 0:27
    무언가가 숨어있을 수도 있습니다.
  • 0:27 - 0:31
    예를 들어, 여러분이 나이 든
    친척 어른의 수술을 위해
  • 0:31 - 0:34
    두 병원 중 하나를 골라야
    한다고 생각해봅시다.
  • 0:34 - 0:36
    최근 두 병원에서 치료받은
    1,000명의 환자 중에
  • 0:36 - 0:40
    병원 A에서는 900명이 살아남았고
  • 0:40 - 0:43
    반면, 병원 B에서는
    800명이 살아 남았습니다.
  • 0:43 - 0:46
    그렇다면 병원 A가
    더 나은 선택 같이 보입니다.
  • 0:46 - 0:48
    하지만 그러한 결정을 내리기 전에
  • 0:48 - 0:51
    모든 환자가 똑같은 건강
    상태로 병원에 오는 것이
  • 0:51 - 0:54
    아니라는 사실을 기억해야 합니다.
  • 0:54 - 0:57
    최근에 두 병원에 온
    환자 1,000명을
  • 0:57 - 1:01
    건강한 사람과 아픈 사람으로 나눠 보면
  • 1:01 - 1:04
    상황이 달라 보이기 시작할 것입니다.
  • 1:04 - 1:08
    병원 A에는 나쁜 건강 상태의
    환자가 100명 밖에 오지 않았고
  • 1:08 - 1:10
    그 중에 30명이 살았습니다.
  • 1:10 - 1:12
    병원 B에는 나쁜 건강 상태의
    환자 400명이 왔고
  • 1:12 - 1:15
    210명을 살릴 수 있었습니다.
  • 1:15 - 1:17
    따라서 병원 B가 더 나은 선택입니다.
  • 1:17 - 1:21
    나쁜 건강 상태로 병원에 온
    환자들에게 말이죠.
  • 1:21 - 1:25
    생존율이 52.5%나 되니까요.
  • 1:25 - 1:26
    하지만 만약 당신의 친척이
  • 1:26 - 1:28
    좋은 건강 상태로
    병원을 가신다면 어떨까요?
  • 1:28 - 1:32
    이상하게도, 병원 B가 여전히
    더 나은 선택입니다.
  • 1:32 - 1:36
    생존율이 98%나 되니까요.
  • 1:36 - 1:39
    그런데도 어떻게 병원 A의 전반적인
    생존율이 더 높을 수 있을까요?
  • 1:39 - 1:42
    병원 B가 각각 2개 그룹
    환자의 더 높은
  • 1:42 - 1:45
    생존율을 가지고 있는데도 말입니다.
  • 1:45 - 1:49
    여기서 우리가 알아야 할 것이
    바로 심슨의 역설입니다.
  • 1:49 - 1:52
    같은 자료라도 어떻게
    분류하는 지에 따라
  • 1:52 - 1:55
    정반대의 결과를 보일 수 있는 거죠.
  • 1:55 - 1:59
    이는 취합한 데이터가 조건부 변수를
    감추고 있을 때 종종 발생합니다.
  • 1:59 - 2:01
    그 변수를 잠복 변수라고도 합니다.
  • 2:01 - 2:07
    결과에 중대한 영향을 미치는
    숨겨진 추가적 요인이죠.
  • 2:07 - 2:10
    이 병원 사례에서 숨겨진 요인은
    병원에 온 환자들의
  • 2:10 - 2:13
    건강 상태에 대한 상대적인
    비율이라고 할 수 있습니다.
  • 2:13 - 2:17
    심슨의 역설은 단지
    가상 시나리오가 아닙니다.
  • 2:17 - 2:19
    그것은 현실에서도 종종 나타납니다.
  • 2:19 - 2:22
    때로는 중요한 순간에 말입니다.
  • 2:22 - 2:24
    영국의 한 연구에서는
  • 2:24 - 2:28
    흡연자들이 비흡연자들보다
    더 높은 생존율을 보였습니다.
  • 2:28 - 2:30
    20년 동안 연구를 한 결과 말이죠.
  • 2:30 - 2:33
    그것은 참가자들을 연령대별로
    분류하기 전까지 맞는 말이었습니다.
  • 2:33 - 2:38
    그런데 비흡연 참가자들은 평균적으로
    나이가 많은 사람들이었습니다.
  • 2:38 - 2:41
    그래서 연구 기간 동안
    사망할 확률이 더 높았던거죠.
  • 2:41 - 2:44
    정확히 말하면, 그들이 그냥 더 오래
    살았기 때문이었어요.
  • 2:44 - 2:47
    여기서는 연령대가 숨은 변수이자
  • 2:47 - 2:50
    데이터를 바르게 해석하기 위한
    필수적인 요소였습니다.
  • 2:50 - 2:52
    다른 예에서는
  • 2:52 - 2:54
    플로리다주의 사형 사건들을 분석해 보면
  • 2:54 - 2:58
    살인죄로 유죄를 선고받은
    흑인과 백인 피고인들 사이에
  • 2:58 - 3:02
    인종 차별이 없는 것을
    알 수 있습니다.
  • 3:02 - 3:06
    하지만 사건을 피해자의 인종에 따라
    분류할 경우, 이야기는 달라집니다.
  • 3:06 - 3:08
    각각의 경우
  • 3:08 - 3:11
    흑인 피고인이 사형을 선고받은
    확률이 더 높았습니다.
  • 3:11 - 3:15
    백인 피고인에 대한 전체적인
    사형 선고율이 조금 높아지는 이유는
  • 3:15 - 3:19
    피해자가 백인인 경우의 사건에서
  • 3:19 - 3:21
    사형 선고를 받을 가능성이
    높기 때문입니다.
  • 3:21 - 3:24
    피해자가 흑인일 경우보다 말입니다.
  • 3:24 - 3:28
    그리고 대부분의 살인은 같은
    인종 간에 발생했습니다.
  • 3:28 - 3:31
    그렇다면 우리는 어떻게 하면 이러한
    역설을 피할 수 있을까요?
  • 3:31 - 3:35
    불행히도, 딱 정해진 답이 없습니다.
  • 3:35 - 3:39
    자료는 수많은 기준에
    따라 분류 될 수 있으며
  • 3:39 - 3:42
    오히려 데이터 전체가 더 정확한
    그림을 보여주기도 합니다.
  • 3:42 - 3:47
    자의적이고 잘못된 방식으로
    분류된 데이터보다 말이죠.
  • 3:47 - 3:52
    우리가 할 수 있는 것은 통계가
    묘사하는 실제 상황을 꼼꼼히 연구하고
  • 3:52 - 3:56
    숨은 변수가 있지는 않은지
    생각해보는 것입니다.
  • 3:56 - 3:59
    그렇지 않으면 우리는
    스스로를 지키기 힘들어집니다.
  • 3:59 - 4:03
    사람들이 오해하게 데이터를
    이용하는 사람들로부터 말입니다.
Title:
어떻게 통계가 오해를 불러 일으킬 수 있는가 |마크 리델 (Mark Liddell)
Speaker:
Mark Liddell
Description:

전체 강의 보기: http://ed.ted.com/lessons/how-statistics-can-be-misleading-mark-liddell

통계는 설득력이 있습니다. 너무 설득력이 있어서 사람들, 단체, 그리고 국가들은 그 정리된 데이터를 기반으로 몇 가지 중대한 결정을 내립니다. 그러나 어떤 통계든, 그 결과를 완전히 뒤집을 수 있는 무언가가 숨어있을 수도 있습니다. 마크 리델은 심슨의 역설에 대해 연구합니다.

강연: 마크 리델, 영상: 틴마우스 애니메이션 스튜디오.

more » « less
Video Language:
English
Team:
closed TED
Project:
TED-Ed
Duration:
04:19

Korean subtitles

Revisions