0:00:06.636,0:00:09.077 Las estadísticas son convincentes. 0:00:09.077,0:00:12.541 Tanto es así que personas, [br]organizaciones y países enteros 0:00:12.541,0:00:17.747 basan algunas de sus decisiones [br]más importantes en datos estadísticos. 0:00:17.747,0:00:19.484 Pero hay un problema en ellos. 0:00:19.484,0:00:23.301 Cualquier conjunto de datos estadísticos [br]podría contener algo 0:00:23.301,0:00:27.251 que puede poner los resultados al revés [br]y completamente patas arriba. 0:00:27.251,0:00:30.920 Por ejemplo, imagina que [br]tienes que elegir entre dos hospitales 0:00:30.920,0:00:33.737 para la operación de cirugía [br]de un pariente anciano. 0:00:33.737,0:00:36.434 De cada 1000 pacientes hospitalizados 0:00:36.434,0:00:39.612 900 sobrevivieron en el hospital A, 0:00:39.612,0:00:43.021 mientras que solo 800 lo hicieron [br]en el Hospital B. 0:00:43.021,0:00:46.170 Así que parece que el hospital A [br]es la mejor opción. 0:00:46.170,0:00:47.843 Pero antes de tomar la decisión, 0:00:47.843,0:00:51.411 recuerda que no todos [br]los pacientes llegan al hospital 0:00:51.411,0:00:53.811 con el mismo nivel de salud. 0:00:53.811,0:00:56.703 Y si dividimos los últimos 1000 pacientes [br]de cada hospital 0:00:56.703,0:01:01.132 en los que llegaron en buen estado de [br]salud y los que llegaron en mal estado, 0:01:01.132,0:01:03.772 esto empieza a verse muy diferente. 0:01:03.772,0:01:07.849 El hospital A solo tenía 100 pacientes [br]que llegaron en mal estado de salud, 0:01:07.849,0:01:10.325 de los cuales 30 sobrevivieron. 0:01:10.325,0:01:14.852 Pero el hospital B tenía 400, [br]y pudieron salvar a 210. 0:01:14.852,0:01:17.169 Así que el Hospital B es la mejor opción 0:01:17.169,0:01:20.741 para los pacientes que acuden [br]al hospital con problemas de salud, 0:01:20.741,0:01:24.526 con una tasa de supervivencia del 52,5 %. 0:01:24.526,0:01:28.445 ¿Y si la salud de tu familiar es buena [br]cuando llega al hospital? 0:01:28.445,0:01:32.271 Curiosamente, el hospital B [br]sigue siendo la mejor opción, 0:01:32.271,0:01:35.386 con una tasa de supervivencia [br]de más del 98 %. 0:01:35.386,0:01:38.733 ¿Cómo puede el hospital A tener [br]una mejor tasa de supervivencia 0:01:38.733,0:01:44.830 si el hospital B tiene mejores tasas de [br]supervivencia de pacientes en cada grupo? 0:01:44.830,0:01:48.589 Con lo que nos topamos aquí, es con [br]un caso de la paradoja de Simpson, 0:01:48.589,0:01:51.899 donde el mismo conjunto de datos [br]puede mostrar tendencias opuestas 0:01:51.899,0:01:54.664 dependiendo de cómo se agrupan. 0:01:54.664,0:01:58.744 Pasa a menudo cuando en datos agregados [br]se oculta una variable condicional, 0:01:58.744,0:02:01.377 conocida a veces como variable oculta, 0:02:01.377,0:02:06.584 que es un factor adicional oculto que [br]influye mucho en los resultados. 0:02:06.584,0:02:10.023 Aquí, el factor oculto es la proporción [br]relativa de pacientes 0:02:10.023,0:02:13.264 que llegan en buen o mal estado de salud. 0:02:13.264,0:02:16.544 La paradoja de Simpson [br]no es solo un escenario hipotético. 0:02:16.544,0:02:18.924 Aparece de vez en cuando [br]en el mundo real, 0:02:18.924,0:02:21.902 a veces en contextos importantes. 0:02:21.902,0:02:24.130 Un estudio en el Reino Unido [br]parecía demostrar 0:02:24.130,0:02:27.830 que los fumadores tenían una mayor tasa [br]de supervivencia que los no fumadores 0:02:27.830,0:02:29.846 durante un período de 20 años. 0:02:29.846,0:02:33.307 Es decir, hasta que dividieron [br]a los participantes por grupo de edad, 0:02:33.307,0:02:37.723 entonces demostraron que los no fumadores [br]eran mucho mayores en promedio, 0:02:37.723,0:02:41.210 y, por tanto, con mayor probabilidad [br]de morir durante el período de test, 0:02:41.210,0:02:44.438 precisamente porque vivían [br]más tiempo en general. 0:02:44.438,0:02:47.286 En este caso, los grupos de edad [br]son la variable oculta 0:02:47.286,0:02:50.176 y son vitales para interpretar [br]correctamente los datos. 0:02:50.176,0:02:51.559 En otro ejemplo, 0:02:51.559,0:02:54.281 un análisis de los casos de [br]pena de muerte de Florida 0:02:54.281,0:02:58.265 no parecía revelar ninguna [br]disparidad racial en las sentencias 0:02:58.265,0:03:01.581 entre los acusados blancos [br]y negros condenados por asesinato. 0:03:01.581,0:03:06.086 Pero la división de los casos por raza de [br]la víctima contó una historia diferente. 0:03:06.086,0:03:07.639 En cualquier situación, 0:03:07.639,0:03:11.281 los acusados negros tenían mayor [br]probabilidad de ser condenados a muerte. 0:03:11.281,0:03:15.066 La tasa global de la sentencia algo [br]superior para los acusados blancos 0:03:15.066,0:03:18.582 se debió al hecho de que [br]los casos con víctimas blancas 0:03:18.582,0:03:21.479 tenían mayor probabilidad [br]de obtener una sentencia de muerte 0:03:21.479,0:03:24.091 que en los casos [br]donde la víctima era negra, 0:03:24.091,0:03:28.483 y la mayoría de las muertes ocurrieron [br]entre personas de la misma raza. 0:03:28.483,0:03:31.319 Y ¿cómo evitar caer en la paradoja? 0:03:31.319,0:03:34.686 Desafortunadamente no hay [br]una receta única para todos los casos. 0:03:34.686,0:03:38.504 Los datos pueden agruparse y [br]dividirse en varias formas, 0:03:38.504,0:03:42.106 y los números generales a veces pueden [br]dar una imagen más precisa 0:03:42.106,0:03:46.008 que los datos divididos [br]en categorías erróneas o arbitrarias. 0:03:46.008,0:03:49.389 Lo que podemos hacer es estudiar [br]cuidadosamente las situaciones reales 0:03:49.389,0:03:52.089 que describen las estadísticas 0:03:52.089,0:03:55.977 y considerar si las variables ocultas [br]deberían estar presentes. 0:03:55.977,0:03:59.378 De lo contrario, nos hacemos vulnerables [br]a aquellos que usan los datos 0:03:59.378,0:04:02.649 para manipular a otros y [br]promover sus propias agendas.