0:00:06.636,0:00:09.077 Статистика переконлива. 0:00:09.077,0:00:12.541 Настільки, що люди, організації[br]та цілі країни 0:00:12.541,0:00:17.747 засновують одні з найважливіших рішень[br]на упорядкованих даних. 0:00:17.747,0:00:19.484 Однак у цьому існує проблема. 0:00:19.484,0:00:23.301 Будь-яка статистика може мати [br]в собі приховану сторону, 0:00:23.301,0:00:27.251 щось, що може перевернути результати[br]догори дриґом. 0:00:27.251,0:00:30.920 Наприклад, уявіть, що Вам необхідно[br]вибрати між двома лікарнями, 0:00:30.920,0:00:33.737 щоб прооперувати когось із [br]родичів похилого віку. 0:00:33.737,0:00:36.434 У кожній лікарні з 1000 пацієнтів 0:00:36.434,0:00:39.612 900 виживає у Лікарні А, 0:00:39.612,0:00:43.021 тоді як у Лікарні В - лише 800. 0:00:43.021,0:00:45.860 Виглядає, ніби лікарня А - [br]кращий варіант. 0:00:45.860,0:00:47.843 Але перед тим, як Ви приймете[br]рішення, 0:00:47.843,0:00:51.411 зверніть увагу, що не всі пацієнти[br]прибувають у лікарню 0:00:51.411,0:00:53.811 з однаковим станом здоров'я. 0:00:53.811,0:00:56.703 Якщо розділити 1000 пацієнтів [br]з кожної лікарні 0:00:56.703,0:01:01.132 на тих, хто прибуває в хорошому[br]здоров'ї, і тих, хто в поганому, 0:01:01.132,0:01:03.772 ситуація стає зовсім іншою. 0:01:03.772,0:01:07.849 У Лікарню А лише 100 пацієнтів, [br]які поступили, мали погане здоров'я, 0:01:07.849,0:01:10.325 з яких 30 вижило. 0:01:10.325,0:01:14.852 Але Лікарня В мала 400 таких[br]пацієнтів, де врятували 210 з них. 0:01:14.852,0:01:17.169 Отже, Лікарня 2 - кращий вибір 0:01:17.169,0:01:20.741 для пацієнтів, які поступають[br]в лікарню з поганим здоров'ям, 0:01:20.741,0:01:24.526 із 52,5% тих, що вижили. 0:01:24.526,0:01:28.445 А що, коли ваш родич добре[br]почувався, поступаючи в лікарню? 0:01:28.445,0:01:32.271 Як на диво, Лікарня В все ще [br]залишається кращим вибором, 0:01:32.271,0:01:35.676 із 98% тих, що вижили. 0:01:35.676,0:01:38.733 Як же вийшло, що Лікарня А має вищий[br]загальний рівень виживання, 0:01:38.733,0:01:44.830 якщо Лікарня В має вищий рівень[br]виживання у обох групах? 0:01:44.830,0:01:48.589 У цьому випадку ми маємо справу з [br]парадоксом Сімпсона, 0:01:48.589,0:01:51.899 де однакові дані можуть [br]демонструвати протилежні тенденції 0:01:51.899,0:01:54.664 залежно від того, як їх згрупувати. 0:01:54.664,0:01:58.744 Це часто трапляється, коли зведені [br]дані приховують умовну змінну, 0:01:58.744,0:02:01.377 іноді відому як прихована змінна, 0:02:01.377,0:02:06.584 що є додатковим прихованим фактором, [br]який суттєво впливає на результати. 0:02:06.584,0:02:10.023 У цьому випадку прихований фактор - [br]це відносна частка пацієнтів, 0:02:10.023,0:02:13.264 які приїжджають з[br]хорошим чи поганим станом здоров'я. 0:02:13.264,0:02:16.544 Парадокс Сімпсона - не лише[br]гіпотетичний сценарій. 0:02:16.544,0:02:18.924 Він час від часу проявляється [br]в реальному світі, 0:02:18.924,0:02:22.132 іноді у важливому контексті. 0:02:22.132,0:02:24.130 Дослідження[br]у Великобританії показало, 0:02:24.130,0:02:27.600 що курці мають вищий рівень[br]виживання ніж некурці 0:02:27.600,0:02:29.846 за 20-річний період. 0:02:29.846,0:02:33.307 Це було правдою, поки не розділили[br]пацієнтів за віковими групами, 0:02:33.307,0:02:37.823 що продемонструвало, що некурці були [br]в середньому значно старші, 0:02:37.823,0:02:40.930 а тому з більшою імовірністю могли [br]померти у випробувальний період, 0:02:40.930,0:02:44.438 точнісінько через те, що загалом [br]вони жили довше. 0:02:44.438,0:02:47.286 У цьому випадку вікові групи - [br]це прихована змінна, 0:02:47.286,0:02:50.176 яка важлива для правильної[br]інтерпретації даних. 0:02:50.176,0:02:51.559 В іншому прикладі 0:02:51.559,0:02:54.281 аналіз справ із смертними[br]вироками у Флориді 0:02:54.281,0:02:58.265 показав, що, на перший погляд, [br]при винесенні вироку не було расових відмінностей 0:02:58.265,0:03:01.581 між афроамериканцями і білими,[br]звинуваченими у вбивстві. 0:03:01.581,0:03:06.396 Однак якщо розділити справи за[br]расовою приналежністю - інша історія. 0:03:06.396,0:03:07.969 В обох випадках 0:03:07.969,0:03:11.091 афроамериканців частіше[br]засуджували до смертної кари. 0:03:11.091,0:03:15.066 Дещо вищий загальний рівень[br]засудження білошкірих обвинувачених 0:03:15.066,0:03:18.692 спричинений тим, що справи, жертвами [br]в яких були білошкірі, 0:03:18.692,0:03:21.359 частіше призводили до [br]смертної кари, 0:03:21.359,0:03:24.091 ніж справи, де жертвами[br]були афроамериканці, 0:03:24.091,0:03:28.483 а більшість вбивств ставалися[br]між представниками однієї раси. 0:03:28.483,0:03:31.319 Отже, як нам не[br]вестися на цей парадокс? 0:03:31.319,0:03:34.686 На жаль, не існує [br]універсальної відповіді. 0:03:34.686,0:03:38.504 Дані можна згрупувати та розділити[br]будь-якими способами, 0:03:38.504,0:03:42.106 а загальні числа іноді можуть[br]дати точніше уявлення, 0:03:42.106,0:03:46.638 ніж дані, поділені на оманливі[br]чи випадкові категорії. 0:03:46.638,0:03:52.089 Все, що ми можемо зробити - ретельно[br]дослідити ситуації, описані статистично 0:03:52.089,0:03:55.977 і обміркувати, чи присутні[br]там приховані змінні. 0:03:55.977,0:03:59.378 Інакше ми будемо вразливими перед [br]тими, хто використовує дані, 0:03:59.378,0:04:03.378 щоб маніпулювати іншими та [br]популяризувати власні погляди.