0:00:06.486,0:00:09.077 As estatísticas são convincentes, 0:00:09.077,0:00:12.541 a ponto de pessoas, organizações[br]e países inteiros 0:00:12.541,0:00:17.487 basearem algumas de suas decisões[br]mais importantes em dados organizados. 0:00:17.487,0:00:19.484 Mas há um problema aí. 0:00:19.484,0:00:23.301 Qualquer grupo de dados estatísticos[br]pode estar escondendo algo 0:00:23.301,0:00:27.251 que pode acabar virando os resultados[br]de cabeça para baixo. 0:00:27.251,0:00:30.920 Por exemplo, imagine que você precise[br]escolher entre dois hospitais 0:00:30.920,0:00:33.737 para a cirurgia de uma parente idosa. 0:00:33.737,0:00:36.434 Tomando os últimos mil pacientes[br]de cada hospital, 0:00:36.434,0:00:39.612 no Hospital A, 900 sobreviveram, 0:00:39.612,0:00:43.021 enquanto, no Hospital B,[br]apenas 800 sobreviveram. 0:00:43.021,0:00:45.930 Portanto, aparentemente,[br]o Hospital A é a melhor escolha. 0:00:45.930,0:00:47.843 No entanto, antes de tomar a decisão, 0:00:47.843,0:00:51.411 lembre-se de que nem todos os pacientes[br]chegam a um hospital 0:00:51.411,0:00:53.811 nas mesmas condições de saúde. 0:00:53.811,0:00:56.813 Se dividirmos os mil pacientes[br]mais recentes de cada hospital 0:00:56.813,0:01:01.132 entre os que chegaram com boa saúde[br]e os que chegaram com a saúde precária, 0:01:01.132,0:01:03.772 um cenário bem diferente[br]começa a se descortinar. 0:01:03.772,0:01:07.849 No Hospital A, apenas 100 pacientes[br]chegaram com a saúde debilitada. 0:01:07.849,0:01:10.325 Destes, 30 sobreviveram. 0:01:10.325,0:01:14.852 Mas, no Hospital B, havia 400,[br]e eles foram capazes de salvar 210. 0:01:14.852,0:01:17.169 Assim, o Hospital B é a melhor escolha 0:01:17.169,0:01:20.741 para pacientes que chegam[br]com a saúde precária, 0:01:20.741,0:01:24.526 com uma taxa de sobrevivência de 52,5%. 0:01:24.526,0:01:28.445 Mas e se sua parente estiver com boa saúde[br]ao dar entrada no hospital? 0:01:28.445,0:01:32.271 Curiosamente, o Hospital B[br]ainda é a melhor escolha, 0:01:32.271,0:01:35.676 com uma taxa de sobrevivência[br]de cerca de 98%. 0:01:35.676,0:01:38.733 Como é possível o Hospital A ter[br]uma taxa de sobrevivência maior 0:01:38.733,0:01:44.830 se a taxa de sobrevivência do Hospital B é[br]maior para pacientes de ambos os grupos? 0:01:44.830,0:01:48.589 Esbarramos aqui num caso[br]do paradoxo de Simpson, 0:01:48.589,0:01:51.979 em que o mesmo conjunto de dados[br]parece mostrar tendências opostas, 0:01:51.979,0:01:54.664 dependendo de como agrupamos os dados. 0:01:54.664,0:01:58.744 Isso sempre ocorre quando dados agregados[br]escondem variáveis condicionais, 0:01:58.744,0:02:01.377 também chamadas de variáveis escondidas, 0:02:01.377,0:02:06.464 um fator adicional oculto que influencia[br]significativamente os resultados. 0:02:06.464,0:02:10.023 Neste caso, o fator oculto[br]é a proporção relativa de pacientes 0:02:10.023,0:02:13.264 que chegam com saúde boa ou ruim. 0:02:13.264,0:02:16.544 O paradoxo de Simpson não é[br]apenas um cenário hipotético. 0:02:16.544,0:02:18.924 Ele surge de tempos [br]em tempos na vida real, 0:02:18.924,0:02:22.132 algumas vezes em contextos importantes. 0:02:22.132,0:02:24.130 Um estudo inglês pareceu mostrar, 0:02:24.130,0:02:27.600 num período de 20 anos, que os fumantes[br]tinham uma taxa de sobrevivência 0:02:27.600,0:02:29.846 maior do que os não fumantes. 0:02:29.846,0:02:33.307 Isto é, até a divisão dos participantes[br]por grupos etários 0:02:33.307,0:02:37.903 mostrar que os não fumantes eram,[br]na média, significativamente mais velhos 0:02:37.903,0:02:40.930 e, assim, com maior chance de morrer[br]durante o período do teste, 0:02:40.930,0:02:44.438 justamente porque, em geral,[br]eles eram mais longevos. 0:02:44.438,0:02:47.286 Aqui, os grupos etários[br]são as variáveis ocultas, 0:02:47.286,0:02:50.176 e foram vitais para a interpretação[br]correta dos dados. 0:02:50.176,0:02:51.559 Em outro exemplo, 0:02:51.559,0:02:54.431 uma análise das mortes [br]por pena de morte na Flórida 0:02:54.431,0:02:58.265 parecia revelar não haver[br]disparidade racial nas sentenças 0:02:58.265,0:03:01.581 de réus negros e brancos[br]condenados por assassinato. 0:03:01.581,0:03:06.396 Mas, ao se dividir os casos pela raça[br]da vítima, revelou-se uma outra história. 0:03:06.396,0:03:07.969 Em ambas as situações, 0:03:07.969,0:03:11.091 havia maior probabilidade de réus[br]negros serem condenados à morte. 0:03:11.091,0:03:15.136 A condenação um pouco maior,[br]no geral, de réus brancos 0:03:15.136,0:03:18.692 deveu-se ao fato de que os casos[br]com vítimas brancas 0:03:18.692,0:03:21.359 tinham mais chance de receber[br]uma sentença de morte 0:03:21.359,0:03:24.041 do que os casos em que a vítima era negra, 0:03:24.041,0:03:28.483 e a maioria dos assassinatos ocorreram[br]entre pessoas da mesma raça. 0:03:28.483,0:03:31.319 Assim, como evitar cair no paradoxo? 0:03:31.319,0:03:34.686 Infelizmente, não há uma resposta[br]que resolva todos os casos. 0:03:34.686,0:03:38.504 Os dados podem ser agrupados[br]e divididos de inúmeras formas, 0:03:38.504,0:03:42.106 e os números totais às vezes podem[br]fornecer um quadro mais preciso 0:03:42.106,0:03:46.638 do que dados divididos em categorias[br]enganosas ou arbitrárias. 0:03:46.638,0:03:52.089 O ideal é estudar com cuidado[br]a situação real descrita pela estatística 0:03:52.089,0:03:55.967 e checar se as variáveis[br]enganosas estão presentes. 0:03:55.967,0:03:59.378 Do contrário, estaremos vulneráveis[br]aos que possam usar os dados 0:03:59.378,0:04:02.649 para manipular as pessoas[br]e promover as suas próprias agendas.