[Script Info] Title: [Events] Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text Dialogue: 0,0:00:06.64,0:00:09.08,Default,,0000,0000,0000,,통계는 설득력이 있습니다.\N Dialogue: 0,0:00:09.08,0:00:12.54,Default,,0000,0000,0000,,너무 설득력이 있어서 \N사람들, 단체, 그리고 국가들은 Dialogue: 0,0:00:12.54,0:00:17.75,Default,,0000,0000,0000,,그 정리된 데이터를 기반으로 \N중대한 결정을 내립니다. Dialogue: 0,0:00:17.75,0:00:19.48,Default,,0000,0000,0000,,하지만 거기에는 문제가 있습니다. Dialogue: 0,0:00:19.48,0:00:23.30,Default,,0000,0000,0000,,어떤 통계든,결과를 \N완전히 뒤집을 수 있는 Dialogue: 0,0:00:23.30,0:00:27.25,Default,,0000,0000,0000,,무언가가 숨어있을 수도 있습니다. Dialogue: 0,0:00:27.25,0:00:30.92,Default,,0000,0000,0000,,예를 들어, 여러분이 나이 든 \N친척 어른의 수술을 위해 Dialogue: 0,0:00:30.92,0:00:33.74,Default,,0000,0000,0000,,두 병원 중 하나를 골라야 \N한다고 생각해봅시다. Dialogue: 0,0:00:33.74,0:00:36.43,Default,,0000,0000,0000,,최근 두 병원에서 치료받은 \N1,000명의 환자 중에 Dialogue: 0,0:00:36.43,0:00:39.61,Default,,0000,0000,0000,,병원 A에서는 900명이 살아남았고 Dialogue: 0,0:00:39.61,0:00:43.02,Default,,0000,0000,0000,,반면, 병원 B에서는 \N800명이 살아 남았습니다. Dialogue: 0,0:00:43.02,0:00:46.17,Default,,0000,0000,0000,,그렇다면 병원 A가 \N더 나은 선택 같이 보입니다. Dialogue: 0,0:00:46.17,0:00:47.84,Default,,0000,0000,0000,,하지만 그러한 결정을 내리기 전에 Dialogue: 0,0:00:47.84,0:00:51.41,Default,,0000,0000,0000,,모든 환자가 똑같은 건강 \N상태로 병원에 오는 것이 Dialogue: 0,0:00:51.41,0:00:53.81,Default,,0000,0000,0000,,아니라는 사실을 기억해야 합니다. Dialogue: 0,0:00:53.81,0:00:56.70,Default,,0000,0000,0000,,최근에 두 병원에 온 \N환자 1,000명을 Dialogue: 0,0:00:56.70,0:01:01.13,Default,,0000,0000,0000,,건강한 사람과 아픈 사람으로 나눠 보면 Dialogue: 0,0:01:01.13,0:01:03.77,Default,,0000,0000,0000,,상황이 달라 보이기 시작할 것입니다. Dialogue: 0,0:01:03.77,0:01:07.85,Default,,0000,0000,0000,,병원 A에는 나쁜 건강 상태의 \N환자가 100명 밖에 오지 않았고 Dialogue: 0,0:01:07.85,0:01:10.32,Default,,0000,0000,0000,,그 중에 30명이 살았습니다. Dialogue: 0,0:01:10.32,0:01:11.85,Default,,0000,0000,0000,,병원 B에는 나쁜 건강 상태의 \N환자 400명이 왔고 Dialogue: 0,0:01:11.85,0:01:14.85,Default,,0000,0000,0000,,210명을 살릴 수 있었습니다. Dialogue: 0,0:01:14.85,0:01:17.17,Default,,0000,0000,0000,,따라서 병원 B가 더 나은 선택입니다. Dialogue: 0,0:01:17.17,0:01:20.74,Default,,0000,0000,0000,,나쁜 건강 상태로 병원에 온 \N환자들에게 말이죠. Dialogue: 0,0:01:20.74,0:01:24.53,Default,,0000,0000,0000,,생존율이 52.5%나 되니까요. Dialogue: 0,0:01:24.53,0:01:25.53,Default,,0000,0000,0000,,하지만 만약 당신의 친척이 Dialogue: 0,0:01:25.53,0:01:28.44,Default,,0000,0000,0000,,좋은 건강 상태로 \N병원을 가신다면 어떨까요? Dialogue: 0,0:01:28.44,0:01:32.27,Default,,0000,0000,0000,,이상하게도, 병원 B가 여전히 \N더 나은 선택입니다. Dialogue: 0,0:01:32.27,0:01:35.68,Default,,0000,0000,0000,,생존율이 98%나 되니까요. Dialogue: 0,0:01:35.68,0:01:38.73,Default,,0000,0000,0000,,그런데도 어떻게 병원 A의 전반적인 \N생존율이 더 높을 수 있을까요? Dialogue: 0,0:01:38.73,0:01:41.83,Default,,0000,0000,0000,,병원 B가 각각 2개 그룹\N환자의 더 높은 Dialogue: 0,0:01:41.83,0:01:44.83,Default,,0000,0000,0000,,생존율을 가지고 있는데도 말입니다. Dialogue: 0,0:01:44.83,0:01:48.59,Default,,0000,0000,0000,,여기서 우리가 알아야 할 것이 \N바로 심슨의 역설입니다. Dialogue: 0,0:01:48.59,0:01:51.90,Default,,0000,0000,0000,,같은 자료라도 어떻게 \N분류하는 지에 따라 Dialogue: 0,0:01:51.90,0:01:54.66,Default,,0000,0000,0000,,정반대의 결과를 보일 수 있는 거죠. Dialogue: 0,0:01:54.66,0:01:58.74,Default,,0000,0000,0000,,이는 취합한 데이터가 조건부 변수를 \N감추고 있을 때 종종 발생합니다. Dialogue: 0,0:01:58.74,0:02:01.38,Default,,0000,0000,0000,,그 변수를 잠복 변수라고도 합니다. Dialogue: 0,0:02:01.38,0:02:06.58,Default,,0000,0000,0000,,결과에 중대한 영향을 미치는 \N숨겨진 추가적 요인이죠. Dialogue: 0,0:02:06.58,0:02:10.02,Default,,0000,0000,0000,,이 병원 사례에서 숨겨진 요인은 \N병원에 온 환자들의 Dialogue: 0,0:02:10.02,0:02:13.26,Default,,0000,0000,0000,,건강 상태에 대한 상대적인 \N비율이라고 할 수 있습니다. Dialogue: 0,0:02:13.26,0:02:16.54,Default,,0000,0000,0000,,심슨의 역설은 단지 \N가상 시나리오가 아닙니다. Dialogue: 0,0:02:16.54,0:02:18.92,Default,,0000,0000,0000,,그것은 현실에서도 종종 나타납니다. Dialogue: 0,0:02:18.92,0:02:22.13,Default,,0000,0000,0000,,때로는 중요한 순간에 말입니다. Dialogue: 0,0:02:22.13,0:02:24.13,Default,,0000,0000,0000,,영국의 한 연구에서는 Dialogue: 0,0:02:24.13,0:02:27.60,Default,,0000,0000,0000,,흡연자들이 비흡연자들보다\N더 높은 생존율을 보였습니다. Dialogue: 0,0:02:27.60,0:02:29.85,Default,,0000,0000,0000,,20년 동안 연구를 한 결과 말이죠. Dialogue: 0,0:02:29.85,0:02:33.31,Default,,0000,0000,0000,,그것은 참가자들을 연령대별로 \N분류하기 전까지 맞는 말이었습니다. Dialogue: 0,0:02:33.31,0:02:37.82,Default,,0000,0000,0000,,그런데 비흡연 참가자들은 평균적으로 \N나이가 많은 사람들이었습니다. Dialogue: 0,0:02:37.82,0:02:40.93,Default,,0000,0000,0000,,그래서 연구 기간 동안 \N사망할 확률이 더 높았던거죠. Dialogue: 0,0:02:40.93,0:02:44.44,Default,,0000,0000,0000,,정확히 말하면, 그들이 그냥 더 오래 \N살았기 때문이었어요. Dialogue: 0,0:02:44.44,0:02:47.29,Default,,0000,0000,0000,,여기서는 연령대가 숨은 변수이자 Dialogue: 0,0:02:47.29,0:02:50.18,Default,,0000,0000,0000,,데이터를 바르게 해석하기 위한 \N필수적인 요소였습니다. Dialogue: 0,0:02:50.18,0:02:51.56,Default,,0000,0000,0000,,다른 예에서는 Dialogue: 0,0:02:51.56,0:02:54.28,Default,,0000,0000,0000,,플로리다주의 사형 사건들을 분석해 보면 Dialogue: 0,0:02:54.28,0:02:58.26,Default,,0000,0000,0000,,살인죄로 유죄를 선고받은 \N흑인과 백인 피고인들 사이에 Dialogue: 0,0:02:58.26,0:03:01.58,Default,,0000,0000,0000,,인종 차별이 없는 것을\N알 수 있습니다. Dialogue: 0,0:03:01.58,0:03:06.40,Default,,0000,0000,0000,,하지만 사건을 피해자의 인종에 따라 \N분류할 경우, 이야기는 달라집니다. Dialogue: 0,0:03:06.40,0:03:07.97,Default,,0000,0000,0000,,각각의 경우 Dialogue: 0,0:03:07.97,0:03:11.09,Default,,0000,0000,0000,,흑인 피고인이 사형을 선고받은 \N확률이 더 높았습니다. Dialogue: 0,0:03:11.09,0:03:15.07,Default,,0000,0000,0000,,백인 피고인에 대한 전체적인 \N사형 선고율이 조금 높아지는 이유는 Dialogue: 0,0:03:15.07,0:03:18.69,Default,,0000,0000,0000,,피해자가 백인인 경우의 사건에서 Dialogue: 0,0:03:18.69,0:03:21.36,Default,,0000,0000,0000,,사형 선고를 받을 가능성이 \N높기 때문입니다. Dialogue: 0,0:03:21.36,0:03:24.09,Default,,0000,0000,0000,,피해자가 흑인일 경우보다 말입니다. Dialogue: 0,0:03:24.09,0:03:28.48,Default,,0000,0000,0000,,그리고 대부분의 살인은 같은\N인종 간에 발생했습니다. Dialogue: 0,0:03:28.48,0:03:31.32,Default,,0000,0000,0000,,그렇다면 우리는 어떻게 하면 이러한 \N역설을 피할 수 있을까요? Dialogue: 0,0:03:31.32,0:03:34.69,Default,,0000,0000,0000,,불행히도, 딱 정해진 답이 없습니다. Dialogue: 0,0:03:34.69,0:03:38.50,Default,,0000,0000,0000,,자료는 수많은 기준에\N따라 분류 될 수 있으며 Dialogue: 0,0:03:38.50,0:03:42.11,Default,,0000,0000,0000,,오히려 데이터 전체가 더 정확한\N그림을 보여주기도 합니다. Dialogue: 0,0:03:42.11,0:03:46.64,Default,,0000,0000,0000,,자의적이고 잘못된 방식으로\N분류된 데이터보다 말이죠. Dialogue: 0,0:03:46.64,0:03:52.09,Default,,0000,0000,0000,,우리가 할 수 있는 것은 통계가\N묘사하는 실제 상황을 꼼꼼히 연구하고 Dialogue: 0,0:03:52.09,0:03:55.98,Default,,0000,0000,0000,,숨은 변수가 있지는 않은지\N생각해보는 것입니다. Dialogue: 0,0:03:55.98,0:03:59.38,Default,,0000,0000,0000,,그렇지 않으면 우리는\N스스로를 지키기 힘들어집니다. Dialogue: 0,0:03:59.38,0:04:02.65,Default,,0000,0000,0000,,사람들이 오해하게 데이터를\N이용하는 사람들로부터 말입니다.