0:00:06.636,0:00:09.224 As estatísticas são convincentes. 0:00:09.224,0:00:12.819 A tal ponto que pessoas, organizações[br]e muitos países 0:00:12.819,0:00:17.747 baseiam algumas das suas decisões[br]mais importantes em dados organizados. 0:00:17.747,0:00:19.484 Mas há um problema com isso. 0:00:19.484,0:00:23.501 Qualquer conjunto de estatísticas[br]pode ter qualquer coisa escondida 0:00:23.501,0:00:27.251 qualquer coisa que pode [br]virar do avesso os resultados. 0:00:27.381,0:00:31.198 Por exemplo, imaginem que precisam[br]de escolher entre dois hospitais 0:00:31.198,0:00:33.737 para a cirurgia de um familiar idoso. 0:00:33.867,0:00:36.755 Entre os últimos 1000 doentes[br]de cada hospital, 0:00:36.755,0:00:39.829 no Hospital A sobreviveram 900 0:00:39.829,0:00:43.021 enquanto no Hospital B[br]só sobreviveram 800. 0:00:43.134,0:00:46.170 Parece portanto que o Hospital A[br]é a melhor escolha. 0:00:46.170,0:00:48.138 Mas, antes de tomarem uma decisão, 0:00:48.138,0:00:51.724 lembrem-se que nem todos os doentes[br]chegam ao hospital 0:00:51.724,0:00:53.811 com o mesmo nível de saúde. 0:00:54.190,0:00:57.760 Se dividirmos os últimos 1000 doentes[br]de cada hospital 0:00:57.760,0:01:01.332 entre os que chegaram de boa saúde[br]e os que chegaram em mau estado, 0:01:01.332,0:01:04.930 o quadro começa a ser muito diferente. 0:01:04.145,0:01:07.988 O Hospital A só teve 100 doentes[br]que chegaram em mau estado, 0:01:07.988,0:01:10.325 dos quais sobreviveram 30. 0:01:10.585,0:01:14.852 Mas o Hospital B teve 400,[br]e conseguiram salvar 210. 0:01:15.269,0:01:17.334 Portanto, o Hospital B é a melhor escolha 0:01:17.334,0:01:20.897 para doentes que chegam ao hospital[br]em mau estado, 0:01:20.897,0:01:24.526 com uma taxa de sobrevivência de 52,5%. 0:01:24.647,0:01:28.445 E se a saúde do vosso familiar[br]estiver boa quando ele chegar ao hospital? 0:01:28.662,0:01:32.505 É estranho, mas o Hospital B continua[br]a ser a melhor escolha, 0:01:32.505,0:01:35.493 com uma taxa de sobrevivência[br]de mais de 98%. 0:01:35.676,0:01:39.290 Como é que o Hospital A tem[br]uma melhor taxa de sobrevivência global 0:01:39.290,0:01:42.586 se o Hospital B tem melhores[br]taxas de sobrevivência para os pacientes 0:01:42.586,0:01:44.490 em cada um dos dois grupos? 0:01:44.830,0:01:48.754 Deparamo-nos com um caso[br]do paradoxo de Simpson, 0:01:48.754,0:01:52.620 em que o mesmo conjunto de dados[br]pode parecer mostrar tendências opostas 0:01:52.620,0:01:54.776 consoante a forma[br]como agruparmos os dados. 0:01:54.776,0:01:56.142 Isto ocorre com frequência, 0:01:56.142,0:01:59.650 quando os dados agregados[br]escondem uma variável condicional, 0:01:59.650,0:02:01.655 por vezes conhecida por variável oculta, 0:02:01.655,0:02:03.584 que é um fator oculto adicional 0:02:03.584,0:02:06.584 que influencia significativamente[br]os resultados. 0:02:06.705,0:02:10.214 Aqui, o fator oculto[br]é a proporção relativa dos doentes 0:02:10.214,0:02:13.264 que chegam de boa saúde [br]ou em mau estado. 0:02:13.264,0:02:16.544 O paradoxo de Simpson[br]não é apenas um cenário hipotético. 0:02:16.665,0:02:19.210 Aparece de vez em quando no mundo real, 0:02:19.210,0:02:21.844 por vezes em contextos importantes. 0:02:22.132,0:02:24.190 Um estudo no Reino Unido parecia mostrar 0:02:24.190,0:02:26.669 que os fumadores tinham [br]uma taxa de sobrevivência 0:02:26.669,0:02:28.469 mais alta que os não fumadores 0:02:28.469,0:02:30.141 num período de 20 anos. 0:02:30.141,0:02:33.541 Mas, quando se dividiram[br]os participantes em grupos etários, 0:02:33.541,0:02:38.205 verificou-se que os não fumadores[br]eram muito mais velhos do que a média 0:02:38.205,0:02:42.356 e, portanto, com maior probabilidade [br]de morrer durante o período da experiência, 0:02:42.356,0:02:45.460 precisamente porque, [br]em geral, viviam mais tempo. 0:02:45.460,0:02:47.598 Aqui, os grupos etários[br]são a variável oculta, 0:02:47.598,0:02:50.176 e são vitais para interpretar[br]os dados corretamente. 0:02:50.384,0:02:52.050 Noutro exemplo, 0:02:52.050,0:02:54.681 uma análise dos processos[br]de pena de morte na Flórida, 0:02:54.681,0:02:58.682 parecia revelar que não havia[br]disparidade racial nas condenações 0:02:58.682,0:03:01.789 entre réus negros e brancos,[br]condenados por homicídio. 0:03:01.789,0:03:06.526 Mas a divisão dos processos pelas etnias[br]das vítimas contou uma história diferente, 0:03:06.526,0:03:08.438 Em qualquer das situações, 0:03:08.438,0:03:11.543 os réus negros tinham mais hipóteses[br]de serem condenados à morte. 0:03:11.543,0:03:15.474 A taxa de condenação global levemente[br]mais alta para os réus brancos 0:03:15.474,0:03:19.170 devia-se ao facto de que os casos[br]com vítimas brancas 0:03:19.170,0:03:21.767 tinham mais hipóteses[br]de levar à pena de morte 0:03:21.767,0:03:24.317 do que os casos em que a vítima era negra, 0:03:24.317,0:03:28.483 e a maior parte dos crimes ocorria[br]entre pessoas da mesma etnia. 0:03:28.483,0:03:31.623 Então, como evitamos cair no paradoxo? 0:03:31.623,0:03:35.770 Infelizmente, não há uma resposta[br]que sirva para todos os casos. 0:03:35.770,0:03:38.686 Os dados podem ser agrupados[br]e divididos de infinitas maneiras 0:03:38.686,0:03:42.575 e os números globais, por vezes,[br]dão uma imagem mais rigorosa 0:03:42.575,0:03:46.829 do que os dados divididos em categorias[br]enganadoras ou arbitrárias. 0:03:46.829,0:03:52.480 Só podemos estudar cuidadosamente[br]as situações que as estatísticas descrevem 0:03:52.480,0:03:55.977 e considerar se pode haver[br]variáveis ocultas. 0:03:56.281,0:03:59.595 De outro modo, ficamos vulneráveis[br]aos que vão usar os dados 0:03:59.595,0:04:03.400 para manipular os outros[br]e promover os seus programas.