WEBVTT 00:00:06.636 --> 00:00:09.077 Statisticile sunt convingătoare. 00:00:09.077 --> 00:00:12.541 Atât de mult încât oamenii, organizațiile și multe țări 00:00:12.541 --> 00:00:17.747 își bazează cele mai importante decizii pe acestea. 00:00:17.747 --> 00:00:19.484 Dar e o problemă. 00:00:19.484 --> 00:00:23.301 Orice statistică poate avea ceva înșelător în ea, 00:00:23.301 --> 00:00:27.251 ceea ce poate întoarce rezultatele complet pe dos. 00:00:27.251 --> 00:00:30.920 De exemplu, imaginează-ți că trebuie să alegi între două spitale 00:00:30.920 --> 00:00:33.737 pentru operația unei rude mai în vârstă. 00:00:33.737 --> 00:00:36.434 Din ultimii 1000 de pacienți din fiecare spital, 00:00:36.434 --> 00:00:39.612 900 au supraviețuit în Spitalul A, 00:00:39.612 --> 00:00:43.021 pe când doar 800 au supraviețuit în Spitalul B. 00:00:43.021 --> 00:00:46.170 Pare deci că Spitalul A e alegerea mai bună. 00:00:46.170 --> 00:00:47.843 Dar înainte să te hotărăști, 00:00:47.843 --> 00:00:51.411 amintește-ți că nu toți pacienții ajung la spital 00:00:51.411 --> 00:00:53.811 în aceeași stare de sănătate. 00:00:53.811 --> 00:00:56.703 Și dacă împărțim ultimii 1000 de pacienți ai fiecărui spital 00:00:56.703 --> 00:01:01.132 între cei care au ajuns într-o stare bună și cei care au ajuns într-o stare proastă, 00:01:01.132 --> 00:01:03.772 rezultatul începe să arate foarte diferit. 00:01:03.772 --> 00:01:07.849 Spitalul A a avut doar 100 de pacienți ce au ajuns într-o stare proastă, 00:01:07.849 --> 00:01:10.325 dintre care 30 au supraviețuit. 00:01:10.325 --> 00:01:14.852 Dar Spitalul B a avut 400, iar ei au reușit să salveze 210. 00:01:14.852 --> 00:01:17.169 Deci, Spitalul B e o alegere mai bună 00:01:17.169 --> 00:01:20.741 pentru pacienții ce ajung într-o stare proastă, 00:01:20.741 --> 00:01:24.526 cu o rată de supraviețuire de 52,5%. 00:01:24.526 --> 00:01:28.445 Dar dacă starea de sănătate a rudei tale e bună când ajunge la spital? 00:01:28.445 --> 00:01:32.271 Poate pare ciudat, dar tot Spitalul B e cea mai bună alegere, 00:01:32.271 --> 00:01:35.676 cu o rată de supraviețuire de peste 98%. 00:01:35.676 --> 00:01:39.203 Deci, cum poate Spitalul A să aibă o rată totală de supraviețuire mai bună 00:01:39.203 --> 00:01:44.830 dacă Spitalul B are rate de supraviețuire mai bune în ambele categorii de pacienți? 00:01:44.830 --> 00:01:48.589 Acest fenomen se numește paradoxul lui Simpson, 00:01:48.589 --> 00:01:51.899 în care aceleași date pot părea că au concluzii diferite 00:01:51.899 --> 00:01:54.664 în funcție de cum sunt grupate datele. 00:01:54.664 --> 00:01:58.744 Asta se întâmplă când datele agregate ascund o variabilă condiționată, 00:01:58.744 --> 00:02:01.377 alteori cunoscută ca variabilă ascunsă, 00:02:01.377 --> 00:02:06.584 ce e un factor adițional ce influențează semnificativ rezultatele. 00:02:06.584 --> 00:02:10.023 Aici factorul ascuns e proporția relativă de pacienți 00:02:10.023 --> 00:02:13.264 ce ajung într-o stare bună sau proastă de sănătate. 00:02:13.264 --> 00:02:16.544 Paradoxul lui Simpson nu e doar un scenariu ipotetic. 00:02:16.544 --> 00:02:18.924 Apare din când în când și în lumea reală, 00:02:18.924 --> 00:02:22.132 uneori în contexte importante. 00:02:22.132 --> 00:02:24.130 Un studiu din Regatul Unit părea că arată 00:02:24.130 --> 00:02:27.600 că fumătorii au o rată de supraviețuire mai mare decât nefumătorii 00:02:27.600 --> 00:02:29.846 pe o perioadă de 20 de ani. 00:02:29.846 --> 00:02:33.307 Asta până când au împărțit participanții pe grupuri de vârstă 00:02:33.307 --> 00:02:37.823 și au observat că nefumătorii erau mult mai în vârstă în medie, 00:02:37.823 --> 00:02:40.930 și deci, mult mai susceptibili să moară în perioada studiului, 00:02:40.930 --> 00:02:44.438 fix din cauza faptului că erau mai longevivi în general. 00:02:44.438 --> 00:02:47.286 Aici, grupele de vârstă sunt variabila ascunsă, 00:02:47.286 --> 00:02:50.176 și sunt importante pentru a interpreta corect datele. 00:02:50.176 --> 00:02:51.559 În alt exemplu, 00:02:51.559 --> 00:02:54.281 o analiză a cazurilor de condamnare la moarte din Florida 00:02:54.281 --> 00:02:58.265 părea să arate nicio diferență rasială în cazul sentințelor 00:02:58.265 --> 00:03:01.581 între acuzații albi și negri condamnați pentru omor. 00:03:01.581 --> 00:03:06.396 Dar împărțirea cazurilor pe baza rasei victimei spunea altceva. 00:03:06.396 --> 00:03:07.969 În fiecare dintre cazuri, 00:03:07.969 --> 00:03:11.347 acuzații de culoare erau mai susceptibili să fie condamnați la moarte. 00:03:11.347 --> 00:03:15.066 Rata puțin mai mare a condamnărilor pentru acuzații albi 00:03:15.066 --> 00:03:18.482 era cauzată de faptul că cazurile cu victime albe 00:03:18.482 --> 00:03:21.809 aveau o probabilitate mai mare de a conduce la o condamnare la moarte 00:03:21.809 --> 00:03:24.091 decât cazurile în care victima era de culoare, 00:03:24.091 --> 00:03:28.483 iar cele mai multe crime au avut loc între oameni de aceeași rasă. 00:03:28.483 --> 00:03:31.319 Deci, cum putem evita acest paradox? 00:03:31.319 --> 00:03:34.686 Din păcate nu există o soluție universală. 00:03:34.686 --> 00:03:38.504 Datele pot fi grupate și divizate în multe moduri, 00:03:38.504 --> 00:03:42.106 iar numerele totale pot uneori oferi o concluzie mult mai precisă 00:03:42.106 --> 00:03:46.638 decât datele divizate în categorii înșelătoare sau arbitrare. 00:03:46.638 --> 00:03:52.089 Tot ce putem face e să studiem cu atenție situația exactă pe care studiul o descrie 00:03:52.089 --> 00:03:55.977 și să ne gândim dacă ar putea exista variabile ascunse. 00:03:55.977 --> 00:03:59.378 Altfel, vom fi vulnerabili la cei care folosesc datele 00:03:59.378 --> 00:04:02.649 pentru a-i manipula pe ceilalți pentru a-și promova propria agendă.