[Script Info]
Title: 
[Events]
Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text
Dialogue: 0,0:00:06.64,0:00:09.08,Default,,0000,0000,0000,,統計には説得力があります
Dialogue: 0,0:00:09.08,0:00:12.54,Default,,0000,0000,0000,,それはそれは強力なので\N人々や組織 そして国が
Dialogue: 0,0:00:12.54,0:00:17.75,Default,,0000,0000,0000,,最も重要な決定を下すときには\Nデータを参考にします
Dialogue: 0,0:00:17.75,0:00:19.48,Default,,0000,0000,0000,,でもここに ある問題があります
Dialogue: 0,0:00:19.48,0:00:23.30,Default,,0000,0000,0000,,どんな統計でも \Nその中に潜んでいるものが
Dialogue: 0,0:00:23.30,0:00:27.25,Default,,0000,0000,0000,,結果を全く逆に\Nしてしまうことがあるのです
Dialogue: 0,0:00:27.25,0:00:30.92,Default,,0000,0000,0000,,例えば 年をとった親戚の手術のため
Dialogue: 0,0:00:30.92,0:00:33.74,Default,,0000,0000,0000,,２つの病院から１つを\N選ばねばならないとしましょう
Dialogue: 0,0:00:33.74,0:00:36.43,Default,,0000,0000,0000,,各病院の直近1000人の患者のうち
Dialogue: 0,0:00:36.43,0:00:39.61,Default,,0000,0000,0000,,Ａ病院では900人が生存していましたが
Dialogue: 0,0:00:39.61,0:00:43.02,Default,,0000,0000,0000,,Ｂ病院では800人だけでした
Dialogue: 0,0:00:43.02,0:00:46.17,Default,,0000,0000,0000,,するとＡ病院を選ぶのが\N良いように見えます
Dialogue: 0,0:00:46.17,0:00:47.84,Default,,0000,0000,0000,,でも決断する前に
Dialogue: 0,0:00:47.84,0:00:51.41,Default,,0000,0000,0000,,思い出してください\N来院する患者の健康度は
Dialogue: 0,0:00:51.41,0:00:53.81,Default,,0000,0000,0000,,全員が同一ではありません
Dialogue: 0,0:00:53.81,0:00:56.70,Default,,0000,0000,0000,,各病院の直近1000人の患者を
Dialogue: 0,0:00:56.70,0:01:01.13,Default,,0000,0000,0000,,健康状態が良い者と\N悪い者とに分けてみると
Dialogue: 0,0:01:01.13,0:01:03.77,Default,,0000,0000,0000,,見えてくる状況は\N大きく変わってきます
Dialogue: 0,0:01:03.77,0:01:07.85,Default,,0000,0000,0000,,Ａ病院では 健康状態が悪い患者は\Nたった100人しか来ておらず
Dialogue: 0,0:01:07.85,0:01:10.32,Default,,0000,0000,0000,,そのうち30人が生存していますが
Dialogue: 0,0:01:10.32,0:01:14.85,Default,,0000,0000,0000,,Ｂ病院には状態の悪い患者が400人来て\N210人を救うことができました
Dialogue: 0,0:01:14.85,0:01:17.17,Default,,0000,0000,0000,,だから健康状態が悪い患者の場合は
Dialogue: 0,0:01:17.17,0:01:20.74,Default,,0000,0000,0000,,Ｂ病院を選ぶ方が良いんです
Dialogue: 0,0:01:20.74,0:01:24.53,Default,,0000,0000,0000,,生存率は52.5%です
Dialogue: 0,0:01:24.53,0:01:28.44,Default,,0000,0000,0000,,ではその親戚の健康状態が\N受診時に良好だったとしたら？
Dialogue: 0,0:01:28.44,0:01:32.27,Default,,0000,0000,0000,,不思議なことに Ｂ病院の方が\Nやはり良い選択なんです
Dialogue: 0,0:01:32.27,0:01:35.68,Default,,0000,0000,0000,,生存率は98%です
Dialogue: 0,0:01:35.68,0:01:38.73,Default,,0000,0000,0000,,ではどちらのグループの生存率も\NＢ病院が勝っているのに
Dialogue: 0,0:01:38.73,0:01:44.83,Default,,0000,0000,0000,,どうしてＡ病院の生存率の方が\N総計では上になるのでしょう？
Dialogue: 0,0:01:44.83,0:01:48.59,Default,,0000,0000,0000,,私たちが陥っているのは\N「シンプソンのパラドックス」です
Dialogue: 0,0:01:48.59,0:01:51.90,Default,,0000,0000,0000,,同一のデータでも\Nグループの分け方によって
Dialogue: 0,0:01:51.90,0:01:54.66,Default,,0000,0000,0000,,逆の傾向を示すことがあるんです
Dialogue: 0,0:01:54.66,0:01:58.74,Default,,0000,0000,0000,,これがよく起きるのは 集められたデータが\Nある条件変数を隠し持っているときです
Dialogue: 0,0:01:58.74,0:02:01.38,Default,,0000,0000,0000,,それはときに\N潜伏変数と言われるもので
Dialogue: 0,0:02:01.38,0:02:06.58,Default,,0000,0000,0000,,結果に重要な影響を与えるような\N隠れた別の要因のことです
Dialogue: 0,0:02:06.58,0:02:10.02,Default,,0000,0000,0000,,ここでの隠れた要因とは\N訪れる患者の健康状態に関する
Dialogue: 0,0:02:10.02,0:02:13.26,Default,,0000,0000,0000,,相対的な比率です
Dialogue: 0,0:02:13.26,0:02:16.54,Default,,0000,0000,0000,,シンプトンのパラドックスは\N単なる仮説ではありません
Dialogue: 0,0:02:16.54,0:02:18.92,Default,,0000,0000,0000,,現実の世界にときどき\N現れているんです
Dialogue: 0,0:02:18.92,0:02:22.13,Default,,0000,0000,0000,,重要な場面でも起こっています
Dialogue: 0,0:02:22.13,0:02:24.13,Default,,0000,0000,0000,,英国でのある研究では
Dialogue: 0,0:02:24.13,0:02:27.60,Default,,0000,0000,0000,,喫煙者が非喫煙者よりも
Dialogue: 0,0:02:27.60,0:02:29.85,Default,,0000,0000,0000,,20年間にわたり\N高い生存率を示しました
Dialogue: 0,0:02:29.85,0:02:33.31,Default,,0000,0000,0000,,しかし対象者を\N年齢で区分してみると
Dialogue: 0,0:02:33.31,0:02:37.82,Default,,0000,0000,0000,,非喫煙者の平均年齢が\N明らかに高いことが分かりました
Dialogue: 0,0:02:37.82,0:02:40.93,Default,,0000,0000,0000,,したがって 研究期間中に\N死亡する確率がより高いわけです
Dialogue: 0,0:02:40.93,0:02:44.44,Default,,0000,0000,0000,,そもそも長く生きていますからね
Dialogue: 0,0:02:44.44,0:02:47.29,Default,,0000,0000,0000,,ここでは年齢が潜伏変数であり
Dialogue: 0,0:02:47.29,0:02:50.18,Default,,0000,0000,0000,,それに基づくグループ分けは\N正確なデータ解釈に不可欠です
Dialogue: 0,0:02:50.18,0:02:51.56,Default,,0000,0000,0000,,別の例は
Dialogue: 0,0:02:51.56,0:02:54.28,Default,,0000,0000,0000,,フロリダの死刑に関する分析です
Dialogue: 0,0:02:54.28,0:02:58.26,Default,,0000,0000,0000,,殺人で有罪となった被告が\N黒人か白人かで
Dialogue: 0,0:02:58.26,0:03:01.58,Default,,0000,0000,0000,,死刑宣告について人種の偏りは\N全く見られませんでした
Dialogue: 0,0:03:01.58,0:03:06.40,Default,,0000,0000,0000,,しかし被害者の人種でグループ分けすると\N別の結果が見えてきました
Dialogue: 0,0:03:06.40,0:03:07.97,Default,,0000,0000,0000,,被害者がどちらの場合でも
Dialogue: 0,0:03:07.97,0:03:11.09,Default,,0000,0000,0000,,黒人の被告の方が \N死刑宣告の確率が高かったのです
Dialogue: 0,0:03:11.09,0:03:15.07,Default,,0000,0000,0000,,白人被告の死刑宣告率が\N総計するとわずかに高かったのは
Dialogue: 0,0:03:15.07,0:03:18.69,Default,,0000,0000,0000,,被害者が白人の場合
Dialogue: 0,0:03:18.69,0:03:21.36,Default,,0000,0000,0000,,被害者が黒人の場合よりも
Dialogue: 0,0:03:21.36,0:03:24.09,Default,,0000,0000,0000,,死刑判決が下されやすく
Dialogue: 0,0:03:24.09,0:03:28.48,Default,,0000,0000,0000,,大半の殺人は同じ人種間で\N起きていたからです
Dialogue: 0,0:03:28.48,0:03:31.32,Default,,0000,0000,0000,,ではこのパラドックスに陥るのを\Nどうすれば避けられるでしょう？
Dialogue: 0,0:03:31.32,0:03:34.69,Default,,0000,0000,0000,,あいにく万能の答えはありません
Dialogue: 0,0:03:34.69,0:03:38.50,Default,,0000,0000,0000,,データはどのようにも\Nグループ化 または分割できるうえ
Dialogue: 0,0:03:38.50,0:03:42.11,Default,,0000,0000,0000,,誤解を招く あるいは恣意的な形で\Nカテゴリ化されたデータより
Dialogue: 0,0:03:42.11,0:03:46.64,Default,,0000,0000,0000,,総計の方が正確である場合もあります
Dialogue: 0,0:03:46.64,0:03:52.09,Default,,0000,0000,0000,,私たちにできることは\Nその統計が示す現実の状況を慎重に調べ
Dialogue: 0,0:03:52.09,0:03:55.98,Default,,0000,0000,0000,,潜伏変数が存在する可能性を\N検討することです
Dialogue: 0,0:03:55.98,0:03:59.38,Default,,0000,0000,0000,,そうでないとデータで他人を操って
Dialogue: 0,0:03:59.38,0:04:02.65,Default,,0000,0000,0000,,自分の方針を通そうとする人たちに対し\N私たちは無防備になってしまいます