WEBVTT 00:00:06.636 --> 00:00:09.077 Статистиката е убедителна. 00:00:09.077 --> 00:00:12.541 Дотолкова, че хора, организации и цели държави 00:00:12.541 --> 00:00:17.747 основават някои от най-важните си решения на преработена информация. 00:00:17.747 --> 00:00:19.484 Но съществува проблем в това. 00:00:19.484 --> 00:00:23.301 Всяка статистика може да съдържа нещо подвеждащо в себе си, 00:00:23.301 --> 00:00:27.251 нещо, което преобръща резултатите с главата надолу. 00:00:27.251 --> 00:00:30.920 Например, представи си, че трябва да избереш между две болници 00:00:30.920 --> 00:00:33.737 за операция на възрастен роднина. 00:00:33.737 --> 00:00:36.434 От последните 1000 пациенти на всяка болница, 00:00:36.434 --> 00:00:39.612 900 оцелели в Болница А, 00:00:39.612 --> 00:00:43.021 докато само 800 оцелели в Болница Б. 00:00:43.021 --> 00:00:46.170 Изглежда, сякаш Болница А е по-добрият избор. 00:00:46.170 --> 00:00:47.843 Но преди да вземеш решение, 00:00:47.843 --> 00:00:51.411 помни, че не всички пациенти са приети в болницата 00:00:51.411 --> 00:00:53.811 с еднакво здравословно състояние. 00:00:53.811 --> 00:00:56.703 Ако разделим последните 1000 пациенти на всяка болница 00:00:56.703 --> 00:01:01.132 на приети в добро състояние и приети във влошено състояние, 00:01:01.132 --> 00:01:03.772 картинката придобива различен вид. 00:01:03.772 --> 00:01:07.849 Болница А е имала само 100 пациенти във влошено състояние, 00:01:07.849 --> 00:01:10.325 от които 30 оцелели. 00:01:10.325 --> 00:01:14.852 Но Болница Б е имала 400, от които успели да спасят 210. 00:01:14.852 --> 00:01:17.169 Така че Болница Б е по-добрият избор 00:01:17.169 --> 00:01:20.741 за пациенти, които пристигат с лошо здравословно състояние, 00:01:20.741 --> 00:01:24.526 тъй като шансът за оцеляване е 52,5%. 00:01:24.526 --> 00:01:28.445 А какво става, ако здравето на роднината е добро, когато е приет в болницата? 00:01:28.445 --> 00:01:32.271 Колкото и да е странно, Болница Б отново е по-добрият избор, 00:01:32.271 --> 00:01:35.676 защото шансът за оцеляване в този случай е над 98%. 00:01:35.676 --> 00:01:38.733 Но как може Болница А да има цялостно по-добър шанс за оцеляване, 00:01:38.733 --> 00:01:44.830 ако Болница Б има по-добра статистика за пациенти и в двете групи? 00:01:44.830 --> 00:01:48.589 Натъкнали сме се на случай, засягащ парадокса на Симпсън, 00:01:48.589 --> 00:01:51.899 където еднаква информация може да показва противоположни тендеции 00:01:51.899 --> 00:01:54.664 в зависимост от това как се групира. 00:01:54.664 --> 00:01:58.744 Това често се случва, когато обобщена информация крие условна променлива, 00:01:58.744 --> 00:02:01.377 понякога наричана подвеждаща променлива, 00:02:01.377 --> 00:02:06.584 която е скрит допълнителен фактор, значително повлияващ резултатите. 00:02:06.584 --> 00:02:10.023 Тук скритият фактор е относителната пропорция на пациенти, 00:02:10.023 --> 00:02:13.264 които са приети в добро или влошено състояние. 00:02:13.264 --> 00:02:16.544 Парадоксът на Симпсън не е просто хипотетичен сценарий. 00:02:16.544 --> 00:02:18.924 Появява се от време на време в реалния свят, 00:02:18.924 --> 00:02:22.132 понякога във важен контекст. 00:02:22.132 --> 00:02:24.130 Едно проучване във Великобритания показало 00:02:24.130 --> 00:02:27.600 по-висок шанс за оцеляване при пушачите, отколкото при непушачите 00:02:27.600 --> 00:02:29.846 за период от 20 години. 00:02:29.846 --> 00:02:33.307 Разделянето на участниците във възрастови групи 00:02:33.307 --> 00:02:37.823 показало, че непушачите били значително по-възрастни 00:02:37.823 --> 00:02:40.930 и, следователно, с по-голяма вероятност да починат по време на експеримента, 00:02:40.930 --> 00:02:44.438 именно защото живели по-дълго по принцип. 00:02:44.438 --> 00:02:47.286 Тук възрастовите групи са подвеждащата променлива 00:02:47.286 --> 00:02:50.176 и са ключови за правилното интерпретиране на данните. 00:02:50.176 --> 00:02:51.559 В друг пример, 00:02:51.559 --> 00:02:54.281 анализ на случаите на смъртна присъда във Флорида 00:02:54.281 --> 00:02:58.265 показал липса на расово пристрастие при осъждането 00:02:58.265 --> 00:03:01.581 между цветнокожи и бели обвиняеми, осъдени за убийство. 00:03:01.581 --> 00:03:06.396 Но разделянето на случая по раса на жертвата променило цялата история. 00:03:06.396 --> 00:03:07.969 И в двете ситуации, 00:03:07.969 --> 00:03:11.091 имало тенденция цветнокожите обвиняеми да бъдат осъдени на смърт. 00:03:11.091 --> 00:03:15.066 Малко по-високият процент на осъждане на бели обвиняеми 00:03:15.066 --> 00:03:18.692 се дължал на факта, че при случаите с бели жертви 00:03:18.692 --> 00:03:21.359 било по-вероятно да се издаде смъртна присъда, 00:03:21.359 --> 00:03:24.091 отколкото в случаите, където жертвата била цветнокожа 00:03:24.091 --> 00:03:28.483 и повечето убийства се случвали между хора с еднаква раса. 00:03:28.483 --> 00:03:31.319 Тогава как да избегнем попадането в този парадокс? 00:03:31.319 --> 00:03:34.686 За съжаление, няма универсален отговор. 00:03:34.686 --> 00:03:38.504 Информацията може да бъде групирана поделена по многобройни начини 00:03:38.504 --> 00:03:42.106 и обобщените показатели понякога предлагат по-точна картина, 00:03:42.106 --> 00:03:46.638 отколкото поделените в подвеждащи или случайни категории. 00:03:46.638 --> 00:03:52.089 Само можем внимателно да проучим реалните ситуации, които статистиките описват 00:03:52.089 --> 00:03:55.977 и да преценим дали съществуват подвеждащи променливи. 00:03:55.977 --> 00:03:59.378 В противния случай оставяме на тези, които използват информацията 00:03:59.378 --> 00:04:02.649 да манипулират останалите в полза на собствените си виждания.