0:00:06.636,0:00:09.077 Statisticile sunt convingătoare. 0:00:09.077,0:00:12.541 Atât de mult încât oamenii,[br]organizațiile și multe țări 0:00:12.541,0:00:17.747 își bazează cele mai importante decizii[br]pe acestea. 0:00:17.747,0:00:19.484 Dar e o problemă. 0:00:19.484,0:00:23.301 Orice statistică poate[br]avea ceva înșelător în ea, 0:00:23.301,0:00:27.251 ceea ce poate întoarce[br]rezultatele complet pe dos. 0:00:27.251,0:00:30.920 De exemplu, imaginează-ți că trebuie[br]să alegi între două spitale 0:00:30.920,0:00:33.737 pentru operația unei rude mai în vârstă. 0:00:33.737,0:00:36.434 Din ultimii 1000 de pacienți[br]din fiecare spital, 0:00:36.434,0:00:39.612 900 au supraviețuit în Spitalul A, 0:00:39.612,0:00:43.021 pe când doar 800 au supraviețuit[br]în Spitalul B. 0:00:43.021,0:00:46.170 Pare deci că Spitalul A[br]e alegerea mai bună. 0:00:46.170,0:00:47.843 Dar înainte să te hotărăști, 0:00:47.843,0:00:51.411 amintește-ți că nu toți pacienții[br]ajung la spital 0:00:51.411,0:00:53.811 în aceeași stare de sănătate. 0:00:53.811,0:00:56.703 Și dacă împărțim ultimii[br]1000 de pacienți ai fiecărui spital 0:00:56.703,0:01:01.132 între cei care au ajuns într-o stare bună[br]și cei care au ajuns într-o stare proastă, 0:01:01.132,0:01:03.772 rezultatul începe să arate foarte diferit. 0:01:03.772,0:01:07.849 Spitalul A a avut doar 100 de pacienți[br]ce au ajuns într-o stare proastă, 0:01:07.849,0:01:10.325 dintre care 30 au supraviețuit. 0:01:10.325,0:01:14.852 Dar Spitalul B a avut 400,[br]iar ei au reușit să salveze 210. 0:01:14.852,0:01:17.169 Deci, Spitalul B e o alegere mai bună 0:01:17.169,0:01:20.741 pentru pacienții ce ajung[br]într-o stare proastă, 0:01:20.741,0:01:24.526 cu o rată de supraviețuire de 52,5%. 0:01:24.526,0:01:28.445 Dar dacă starea de sănătate a rudei tale[br]e bună când ajunge la spital? 0:01:28.445,0:01:32.271 Poate pare ciudat, dar tot Spitalul B[br]e cea mai bună alegere, 0:01:32.271,0:01:35.676 cu o rată de supraviețuire de peste 98%. 0:01:35.676,0:01:39.203 Deci, cum poate Spitalul A să aibă[br]o rată totală de supraviețuire mai bună 0:01:39.203,0:01:44.830 dacă Spitalul B are rate de supraviețuire[br]mai bune în ambele categorii de pacienți? 0:01:44.830,0:01:48.589 Acest fenomen se numește[br]paradoxul lui Simpson, 0:01:48.589,0:01:51.899 în care aceleași date pot părea[br]că au concluzii diferite 0:01:51.899,0:01:54.664 în funcție de cum sunt grupate datele. 0:01:54.664,0:01:58.744 Asta se întâmplă când datele agregate[br]ascund o variabilă condiționată, 0:01:58.744,0:02:01.377 alteori cunoscută ca variabilă ascunsă, 0:02:01.377,0:02:06.584 ce e un factor adițional[br]ce influențează semnificativ rezultatele. 0:02:06.584,0:02:10.023 Aici factorul ascuns[br]e proporția relativă de pacienți 0:02:10.023,0:02:13.264 ce ajung într-o stare bună[br]sau proastă de sănătate. 0:02:13.264,0:02:16.544 Paradoxul lui Simpson[br]nu e doar un scenariu ipotetic. 0:02:16.544,0:02:18.924 Apare din când în când și în lumea reală, 0:02:18.924,0:02:22.132 uneori în contexte importante. 0:02:22.132,0:02:24.130 Un studiu din Regatul Unit părea că arată 0:02:24.130,0:02:27.600 că fumătorii au o rată de supraviețuire[br]mai mare decât nefumătorii 0:02:27.600,0:02:29.846 pe o perioadă de 20 de ani. 0:02:29.846,0:02:33.307 Asta până când au împărțit[br]participanții pe grupuri de vârstă 0:02:33.307,0:02:37.823 și au observat că nefumătorii[br]erau mult mai în vârstă în medie, 0:02:37.823,0:02:40.930 și deci, mult mai susceptibili[br]să moară în perioada studiului, 0:02:40.930,0:02:44.438 fix din cauza faptului[br]că erau mai longevivi în general. 0:02:44.438,0:02:47.286 Aici, grupele de vârstă[br]sunt variabila ascunsă, 0:02:47.286,0:02:50.176 și sunt importante[br]pentru a interpreta corect datele. 0:02:50.176,0:02:51.559 În alt exemplu, 0:02:51.559,0:02:54.281 o analiză a cazurilor de condamnare[br]la moarte din Florida 0:02:54.281,0:02:58.265 părea să arate nicio diferență rasială[br]în cazul sentințelor 0:02:58.265,0:03:01.581 între acuzații albi și negri[br]condamnați pentru omor. 0:03:01.581,0:03:06.396 Dar împărțirea cazurilor pe baza[br]rasei victimei spunea altceva. 0:03:06.396,0:03:07.969 În fiecare dintre cazuri, 0:03:07.969,0:03:11.347 acuzații de culoare erau mai susceptibili [br]să fie condamnați la moarte. 0:03:11.347,0:03:15.066 Rata puțin mai mare a condamnărilor[br]pentru acuzații albi 0:03:15.066,0:03:18.482 era cauzată de faptul[br]că cazurile cu victime albe 0:03:18.482,0:03:21.809 aveau o probabilitate mai mare [br]de a conduce la o condamnare la moarte 0:03:21.809,0:03:24.091 decât cazurile[br]în care victima era de culoare, 0:03:24.091,0:03:28.483 iar cele mai multe crime au avut loc[br]între oameni de aceeași rasă. 0:03:28.483,0:03:31.319 Deci, cum putem evita acest paradox? 0:03:31.319,0:03:34.686 Din păcate nu există o soluție universală. 0:03:34.686,0:03:38.504 Datele pot fi grupate[br]și divizate în multe moduri, 0:03:38.504,0:03:42.106 iar numerele totale pot uneori oferi[br]o concluzie mult mai precisă 0:03:42.106,0:03:46.638 decât datele divizate în categorii[br]înșelătoare sau arbitrare. 0:03:46.638,0:03:52.089 Tot ce putem face e să studiem cu atenție[br]situația exactă pe care studiul o descrie 0:03:52.089,0:03:55.977 și să ne gândim dacă ar putea exista[br]variabile ascunse. 0:03:55.977,0:03:59.378 Altfel, vom fi vulnerabili[br]la cei care folosesc datele 0:03:59.378,0:04:02.649 pentru a-i manipula pe ceilalți[br]pentru a-și promova propria agendă.