0:00:06.636,0:00:09.077 A statisztika meggyőző. 0:00:09.077,0:00:12.541 Olyannyira, hogy magánszemélyek, [br]szervezetek, sőt egész országok 0:00:12.541,0:00:17.747 legfontosabb döntéseik némelyikét meg-[br]felelően kiválasztott adatokra alapozzák. 0:00:17.747,0:00:19.484 De van itt egy bökkenő. 0:00:19.484,0:00:23.301 A statisztikában megbújhat [br]valami, ami teljesen 0:00:23.301,0:00:27.251 a feje tetejére állítja az eredményeket. 0:00:27.251,0:00:30.920 Képzeljük el pl., hogy választanunk [br]kell két kórház között, 0:00:30.920,0:00:33.737 hogy melyikben műtsék idős rokonunkat. 0:00:33.737,0:00:36.434 A legutolsó 1000 eset közül[br]a túlélések száma 0:00:36.434,0:00:39.612 az A kórházban 900, 0:00:39.612,0:00:43.021 míg a B kórházban 800 volt. 0:00:43.021,0:00:46.170 Úgy látszik, hogy jobb [br]az A kórházat választani. 0:00:46.170,0:00:47.843 De mielőtt döntenénk, ne feledjük, 0:00:47.843,0:00:51.411 hogy nem minden fölvett beteg 0:00:51.411,0:00:53.811 egészségi állapota azonos. 0:00:53.811,0:00:56.703 Ha mindkét kórház utolsó 1000 [br]betegét két csoportra osztjuk, 0:00:56.703,0:01:01.132 aszerint, hogy ki érkezett jó, [br]és ki rossz állapotban, 0:01:01.132,0:01:03.772 a kép teljesen megváltozik. 0:01:03.772,0:01:07.849 Az A kórház 100 rossz állapotú[br]betegei közül 0:01:07.849,0:01:10.325 30 túlélő volt, 0:01:10.325,0:01:14.852 míg a B kórházba bekerült[br]400 közül 210-et meg tudtak menteni. 0:01:14.852,0:01:17.169 Így hát a B kórház a jobb választás 0:01:17.169,0:01:20.741 a rossz állapotban bekerülők számára, 0:01:20.741,0:01:24.526 52,5%-os túlélési aránnyal. 0:01:24.526,0:01:28.445 De mi a helyzet, ha a néni [br]jó állapotban kerül kórházba? 0:01:28.445,0:01:32.271 Elég meglepő, hogy még mindig[br]a B kórház a jobb megoldás, 0:01:32.271,0:01:35.676 mert ott a túlélési arány 98%. 0:01:35.676,0:01:38.733 Hogyan lehet az általános túlélési[br]arány jobb az A kórházban, 0:01:38.733,0:01:44.830 ha a B kórházban a túlélési arány [br]mindkét csoport esetében jobb? 0:01:44.830,0:01:48.589 Belebotlottunk az ún. Simpson-paradoxonba, 0:01:48.589,0:01:51.899 ahol ugyanazokból az adatokból [br]a csoportosításuktól függően 0:01:51.899,0:01:54.664 ellentétes eredményre juthatunk. 0:01:54.664,0:01:58.744 Ilyen gyakran előadódhat, ha az aggregált[br]adatok feltételes változót rejtenek. 0:01:58.744,0:02:01.377 Ezt néha lappangó változónak nevezzük, 0:02:01.377,0:02:06.584 ami az eredményt szignifikánsan [br]befolyásoló rejtett kiegészítő tényező. 0:02:06.584,0:02:10.023 Itt a rejtett tényező[br]a jó és a rossz állapotban érkező 0:02:10.023,0:02:13.264 betegek relatív aránya. 0:02:13.264,0:02:16.544 A Simpson-paradoxon [br]nem mondvacsinált jelenség, 0:02:16.544,0:02:18.924 időről-időre előfordul a gyakorlatban, 0:02:18.924,0:02:22.132 néha fontos összefüggésben. 0:02:22.132,0:02:23.860 Egy kutatás az Egyesült Királyságban 0:02:23.860,0:02:27.750 kimutatta, hogy egy 20 éves időszakban[br]a dohányzók túlélési aránya nagyobb volt, 0:02:27.750,0:02:29.846 mint a nemdohányzóké. 0:02:29.846,0:02:33.307 Ez a helyzet, amíg a vizsgáltak [br]korcsoportokra bontása meg nem mutatta, 0:02:33.307,0:02:37.823 hogy a nemdohányzók átlagos kora [br]szignifikánsan magasabb volt, 0:02:37.823,0:02:40.930 és így valószínűbb, hogy a vizsgált [br]időszakban meghalnak, 0:02:40.930,0:02:44.438 pont azért, mert általában [br]már idősebbek voltak. 0:02:44.438,0:02:47.286 Itt a korcsoport a lappangó változó. 0:02:47.286,0:02:50.176 Rendkívül fontos, hogy helyesen [br]értelmezzük az adatokat. 0:02:50.176,0:02:51.559 Egy másik példában 0:02:51.559,0:02:54.281 a floridai halálbüntetéseket elemezve 0:02:54.281,0:02:58.265 úgy látszott, hogy az ítéletekben nem [br]mutatható ki rasszista megkülönböztetés 0:02:58.265,0:03:01.581 a gyilkossággal vádolt feketék [br]és fehérek között. 0:03:01.581,0:03:06.396 Ám az áldozatok bőrszíne szerint felosztva[br]az ügyeket, egészen más kép tárul elénk. 0:03:06.396,0:03:07.969 Bármely esetben 0:03:07.969,0:03:11.091 a feketéket nagyobb [br]valószínűséggel ítélték halálra. 0:03:11.091,0:03:15.066 A fehér vádlottak kissé nagyobb [br]elítélési arányát az magyarázza, 0:03:15.066,0:03:18.692 hogy fehér áldozat esetén 0:03:18.692,0:03:21.359 esélyesebb volt a halálos ítélet, 0:03:21.359,0:03:24.091 mint fekete áldozat esetében, 0:03:24.091,0:03:28.483 és a legtöbb gyilkosság azonos [br]bőrszínűek között történt. 0:03:28.483,0:03:31.319 Miként kerülhetjük el, [br]hogy bedőljünk a paradoxonnak? 0:03:31.319,0:03:34.686 Sajnos, nincs általános recept. 0:03:34.686,0:03:38.504 Az adatokat sokféleképpen [br]csoportosíthatjuk vagy oszthatjuk föl, 0:03:38.504,0:03:42.106 és néha, ha mindent számba veszünk. [br]pontosabb képet kapunk, 0:03:42.106,0:03:46.638 mint a félrevezető vagy önkényes [br]kategorizálás alapján. 0:03:46.638,0:03:52.089 Csak az segít, ha gondosan megvizsgáljuk[br]a statisztika által leírt helyzetet, 0:03:52.089,0:03:55.977 és figyelünk, hogy vannak-e[br]lappangó változók. 0:03:55.977,0:03:59.378 Különben azok hálójába kerülünk, 0:03:59.378,0:04:02.649 akik másokat adatokkal manipulálnak [br]önző céljaik érdekében.