[Script Info] Title: [Events] Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text Dialogue: 0,0:00:06.64,0:00:09.08,Default,,0000,0000,0000,,統計には説得力があります Dialogue: 0,0:00:09.08,0:00:12.54,Default,,0000,0000,0000,,それはそれは強力なので\N人々や組織 そして国が Dialogue: 0,0:00:12.54,0:00:17.75,Default,,0000,0000,0000,,最も重要な決定を下すときには\Nデータを参考にします Dialogue: 0,0:00:17.75,0:00:19.48,Default,,0000,0000,0000,,でもここに ある問題があります Dialogue: 0,0:00:19.48,0:00:23.30,Default,,0000,0000,0000,,どんな統計でも \Nその中に潜んでいるものが Dialogue: 0,0:00:23.30,0:00:27.25,Default,,0000,0000,0000,,結果を全く逆に\Nしてしまうことがあるのです Dialogue: 0,0:00:27.25,0:00:30.92,Default,,0000,0000,0000,,例えば 年をとった親戚の手術のため Dialogue: 0,0:00:30.92,0:00:33.74,Default,,0000,0000,0000,,2つの病院から1つを\N選ばねばならないとしましょう Dialogue: 0,0:00:33.74,0:00:36.43,Default,,0000,0000,0000,,各病院の直近1000人の患者のうち Dialogue: 0,0:00:36.43,0:00:39.61,Default,,0000,0000,0000,,A病院では900人が生存していましたが Dialogue: 0,0:00:39.61,0:00:43.02,Default,,0000,0000,0000,,B病院では800人だけでした Dialogue: 0,0:00:43.02,0:00:46.17,Default,,0000,0000,0000,,するとA病院を選ぶのが\N良いように見えます Dialogue: 0,0:00:46.17,0:00:47.84,Default,,0000,0000,0000,,でも決断する前に Dialogue: 0,0:00:47.84,0:00:51.41,Default,,0000,0000,0000,,思い出してください\N来院する患者の健康度は Dialogue: 0,0:00:51.41,0:00:53.81,Default,,0000,0000,0000,,全員が同一ではありません Dialogue: 0,0:00:53.81,0:00:56.70,Default,,0000,0000,0000,,各病院の直近1000人の患者を Dialogue: 0,0:00:56.70,0:01:01.13,Default,,0000,0000,0000,,健康状態が良い者と\N悪い者とに分けてみると Dialogue: 0,0:01:01.13,0:01:03.77,Default,,0000,0000,0000,,見えてくる状況は\N大きく変わってきます Dialogue: 0,0:01:03.77,0:01:07.85,Default,,0000,0000,0000,,A病院では 健康状態が悪い患者は\Nたった100人しか来ておらず Dialogue: 0,0:01:07.85,0:01:10.32,Default,,0000,0000,0000,,そのうち30人が生存していますが Dialogue: 0,0:01:10.32,0:01:14.85,Default,,0000,0000,0000,,B病院には状態の悪い患者が400人来て\N210人を救うことができました Dialogue: 0,0:01:14.85,0:01:17.17,Default,,0000,0000,0000,,だから健康状態が悪い患者の場合は Dialogue: 0,0:01:17.17,0:01:20.74,Default,,0000,0000,0000,,B病院を選ぶ方が良いんです Dialogue: 0,0:01:20.74,0:01:24.53,Default,,0000,0000,0000,,生存率は52.5%です Dialogue: 0,0:01:24.53,0:01:28.44,Default,,0000,0000,0000,,ではその親戚の健康状態が\N受診時に良好だったとしたら? Dialogue: 0,0:01:28.44,0:01:32.27,Default,,0000,0000,0000,,不思議なことに B病院の方が\Nやはり良い選択なんです Dialogue: 0,0:01:32.27,0:01:35.68,Default,,0000,0000,0000,,生存率は98%です Dialogue: 0,0:01:35.68,0:01:38.73,Default,,0000,0000,0000,,ではどちらのグループの生存率も\NB病院が勝っているのに Dialogue: 0,0:01:38.73,0:01:44.83,Default,,0000,0000,0000,,どうしてA病院の生存率の方が\N総計では上になるのでしょう? Dialogue: 0,0:01:44.83,0:01:48.59,Default,,0000,0000,0000,,私たちが陥っているのは\N「シンプソンのパラドックス」です Dialogue: 0,0:01:48.59,0:01:51.90,Default,,0000,0000,0000,,同一のデータでも\Nグループの分け方によって Dialogue: 0,0:01:51.90,0:01:54.66,Default,,0000,0000,0000,,逆の傾向を示すことがあるんです Dialogue: 0,0:01:54.66,0:01:58.74,Default,,0000,0000,0000,,これがよく起きるのは 集められたデータが\Nある条件変数を隠し持っているときです Dialogue: 0,0:01:58.74,0:02:01.38,Default,,0000,0000,0000,,それはときに\N潜伏変数と言われるもので Dialogue: 0,0:02:01.38,0:02:06.58,Default,,0000,0000,0000,,結果に重要な影響を与えるような\N隠れた別の要因のことです Dialogue: 0,0:02:06.58,0:02:10.02,Default,,0000,0000,0000,,ここでの隠れた要因とは\N訪れる患者の健康状態に関する Dialogue: 0,0:02:10.02,0:02:13.26,Default,,0000,0000,0000,,相対的な比率です Dialogue: 0,0:02:13.26,0:02:16.54,Default,,0000,0000,0000,,シンプトンのパラドックスは\N単なる仮説ではありません Dialogue: 0,0:02:16.54,0:02:18.92,Default,,0000,0000,0000,,現実の世界にときどき\N現れているんです Dialogue: 0,0:02:18.92,0:02:22.13,Default,,0000,0000,0000,,重要な場面でも起こっています Dialogue: 0,0:02:22.13,0:02:24.13,Default,,0000,0000,0000,,英国でのある研究では Dialogue: 0,0:02:24.13,0:02:27.60,Default,,0000,0000,0000,,喫煙者が非喫煙者よりも Dialogue: 0,0:02:27.60,0:02:29.85,Default,,0000,0000,0000,,20年間にわたり\N高い生存率を示しました Dialogue: 0,0:02:29.85,0:02:33.31,Default,,0000,0000,0000,,しかし対象者を\N年齢で区分してみると Dialogue: 0,0:02:33.31,0:02:37.82,Default,,0000,0000,0000,,非喫煙者の平均年齢が\N明らかに高いことが分かりました Dialogue: 0,0:02:37.82,0:02:40.93,Default,,0000,0000,0000,,したがって 研究期間中に\N死亡する確率がより高いわけです Dialogue: 0,0:02:40.93,0:02:44.44,Default,,0000,0000,0000,,そもそも長く生きていますからね Dialogue: 0,0:02:44.44,0:02:47.29,Default,,0000,0000,0000,,ここでは年齢が潜伏変数であり Dialogue: 0,0:02:47.29,0:02:50.18,Default,,0000,0000,0000,,それに基づくグループ分けは\N正確なデータ解釈に不可欠です Dialogue: 0,0:02:50.18,0:02:51.56,Default,,0000,0000,0000,,別の例は Dialogue: 0,0:02:51.56,0:02:54.28,Default,,0000,0000,0000,,フロリダの死刑に関する分析です Dialogue: 0,0:02:54.28,0:02:58.26,Default,,0000,0000,0000,,殺人で有罪となった被告が\N黒人か白人かで Dialogue: 0,0:02:58.26,0:03:01.58,Default,,0000,0000,0000,,死刑宣告について人種の偏りは\N全く見られませんでした Dialogue: 0,0:03:01.58,0:03:06.40,Default,,0000,0000,0000,,しかし被害者の人種でグループ分けすると\N別の結果が見えてきました Dialogue: 0,0:03:06.40,0:03:07.97,Default,,0000,0000,0000,,被害者がどちらの場合でも Dialogue: 0,0:03:07.97,0:03:11.09,Default,,0000,0000,0000,,黒人の被告の方が \N死刑宣告の確率が高かったのです Dialogue: 0,0:03:11.09,0:03:15.07,Default,,0000,0000,0000,,白人被告の死刑宣告率が\N総計するとわずかに高かったのは Dialogue: 0,0:03:15.07,0:03:18.69,Default,,0000,0000,0000,,被害者が白人の場合 Dialogue: 0,0:03:18.69,0:03:21.36,Default,,0000,0000,0000,,被害者が黒人の場合よりも Dialogue: 0,0:03:21.36,0:03:24.09,Default,,0000,0000,0000,,死刑判決が下されやすく Dialogue: 0,0:03:24.09,0:03:28.48,Default,,0000,0000,0000,,大半の殺人は同じ人種間で\N起きていたからです Dialogue: 0,0:03:28.48,0:03:31.32,Default,,0000,0000,0000,,ではこのパラドックスに陥るのを\Nどうすれば避けられるでしょう? Dialogue: 0,0:03:31.32,0:03:34.69,Default,,0000,0000,0000,,あいにく万能の答えはありません Dialogue: 0,0:03:34.69,0:03:38.50,Default,,0000,0000,0000,,データはどのようにも\Nグループ化 または分割できるうえ Dialogue: 0,0:03:38.50,0:03:42.11,Default,,0000,0000,0000,,誤解を招く あるいは恣意的な形で\Nカテゴリ化されたデータより Dialogue: 0,0:03:42.11,0:03:46.64,Default,,0000,0000,0000,,総計の方が正確である場合もあります Dialogue: 0,0:03:46.64,0:03:52.09,Default,,0000,0000,0000,,私たちにできることは\Nその統計が示す現実の状況を慎重に調べ Dialogue: 0,0:03:52.09,0:03:55.98,Default,,0000,0000,0000,,潜伏変数が存在する可能性を\N検討することです Dialogue: 0,0:03:55.98,0:03:59.38,Default,,0000,0000,0000,,そうでないとデータで他人を操って Dialogue: 0,0:03:59.38,0:04:02.65,Default,,0000,0000,0000,,自分の方針を通そうとする人たちに対し\N私たちは無防備になってしまいます