Якою оманливою може бути статистика - Марк Ліддел
-
0:07 - 0:09Статистика переконлива.
-
0:09 - 0:13Настільки, що люди, організації
та цілі країни -
0:13 - 0:18засновують одні з найважливіших рішень
на упорядкованих даних. -
0:18 - 0:19Однак у цьому існує проблема.
-
0:19 - 0:23Будь-яка статистика може мати
в собі приховану сторону, -
0:23 - 0:27щось, що може перевернути результати
догори дриґом. -
0:27 - 0:31Наприклад, уявіть, що Вам необхідно
вибрати між двома лікарнями, -
0:31 - 0:34щоб прооперувати когось із
родичів похилого віку. -
0:34 - 0:36У кожній лікарні з 1000 пацієнтів
-
0:36 - 0:40900 виживає у Лікарні А,
-
0:40 - 0:43тоді як у Лікарні В - лише 800.
-
0:43 - 0:46Виглядає, ніби лікарня А -
кращий варіант. -
0:46 - 0:48Але перед тим, як Ви приймете
рішення, -
0:48 - 0:51зверніть увагу, що не всі пацієнти
прибувають у лікарню -
0:51 - 0:54з однаковим станом здоров'я.
-
0:54 - 0:57Якщо розділити 1000 пацієнтів
з кожної лікарні -
0:57 - 1:01на тих, хто прибуває в хорошому
здоров'ї, і тих, хто в поганому, -
1:01 - 1:04ситуація стає зовсім іншою.
-
1:04 - 1:08У Лікарню А лише 100 пацієнтів,
які поступили, мали погане здоров'я, -
1:08 - 1:10з яких 30 вижило.
-
1:10 - 1:15Але Лікарня В мала 400 таких
пацієнтів, де врятували 210 з них. -
1:15 - 1:17Отже, Лікарня 2 - кращий вибір
-
1:17 - 1:21для пацієнтів, які поступають
в лікарню з поганим здоров'ям, -
1:21 - 1:25із 52,5% тих, що вижили.
-
1:25 - 1:28А що, коли ваш родич добре
почувався, поступаючи в лікарню? -
1:28 - 1:32Як на диво, Лікарня В все ще
залишається кращим вибором, -
1:32 - 1:36із 98% тих, що вижили.
-
1:36 - 1:39Як же вийшло, що Лікарня А має вищий
загальний рівень виживання, -
1:39 - 1:45якщо Лікарня В має вищий рівень
виживання у обох групах? -
1:45 - 1:49У цьому випадку ми маємо справу з
парадоксом Сімпсона, -
1:49 - 1:52де однакові дані можуть
демонструвати протилежні тенденції -
1:52 - 1:55залежно від того, як їх згрупувати.
-
1:55 - 1:59Це часто трапляється, коли зведені
дані приховують умовну змінну, -
1:59 - 2:01іноді відому як прихована змінна,
-
2:01 - 2:07що є додатковим прихованим фактором,
який суттєво впливає на результати. -
2:07 - 2:10У цьому випадку прихований фактор -
це відносна частка пацієнтів, -
2:10 - 2:13які приїжджають з
хорошим чи поганим станом здоров'я. -
2:13 - 2:17Парадокс Сімпсона - не лише
гіпотетичний сценарій. -
2:17 - 2:19Він час від часу проявляється
в реальному світі, -
2:19 - 2:22іноді у важливому контексті.
-
2:22 - 2:24Дослідження
у Великобританії показало, -
2:24 - 2:28що курці мають вищий рівень
виживання ніж некурці -
2:28 - 2:30за 20-річний період.
-
2:30 - 2:33Це було правдою, поки не розділили
пацієнтів за віковими групами, -
2:33 - 2:38що продемонструвало, що некурці були
в середньому значно старші, -
2:38 - 2:41а тому з більшою імовірністю могли
померти у випробувальний період, -
2:41 - 2:44точнісінько через те, що загалом
вони жили довше. -
2:44 - 2:47У цьому випадку вікові групи -
це прихована змінна, -
2:47 - 2:50яка важлива для правильної
інтерпретації даних. -
2:50 - 2:52В іншому прикладі
-
2:52 - 2:54аналіз справ із смертними
вироками у Флориді -
2:54 - 2:58показав, що, на перший погляд,
при винесенні вироку не було расових відмінностей -
2:58 - 3:02між афроамериканцями і білими,
звинуваченими у вбивстві. -
3:02 - 3:06Однак якщо розділити справи за
расовою приналежністю - інша історія. -
3:06 - 3:08В обох випадках
-
3:08 - 3:11афроамериканців частіше
засуджували до смертної кари. -
3:11 - 3:15Дещо вищий загальний рівень
засудження білошкірих обвинувачених -
3:15 - 3:19спричинений тим, що справи, жертвами
в яких були білошкірі, -
3:19 - 3:21частіше призводили до
смертної кари, -
3:21 - 3:24ніж справи, де жертвами
були афроамериканці, -
3:24 - 3:28а більшість вбивств ставалися
між представниками однієї раси. -
3:28 - 3:31Отже, як нам не
вестися на цей парадокс? -
3:31 - 3:35На жаль, не існує
універсальної відповіді. -
3:35 - 3:39Дані можна згрупувати та розділити
будь-якими способами, -
3:39 - 3:42а загальні числа іноді можуть
дати точніше уявлення, -
3:42 - 3:47ніж дані, поділені на оманливі
чи випадкові категорії. -
3:47 - 3:52Все, що ми можемо зробити - ретельно
дослідити ситуації, описані статистично -
3:52 - 3:56і обміркувати, чи присутні
там приховані змінні. -
3:56 - 3:59Інакше ми будемо вразливими перед
тими, хто використовує дані, -
3:59 - 4:03щоб маніпулювати іншими та
популяризувати власні погляди.
- Title:
- Якою оманливою може бути статистика - Марк Ліддел
- Speaker:
- Mark Liddell
- Description:
-
Переглянути весь урок: http://ed.ted.com/lessons/how-statistics-can-be-misleading-mark-liddell
Статистика переконлива. Настільки, що люди, організації та цілі країни засновують одні з найважливіших рішень на упорядкованих даних. Однак будь-яка статистика має приховану сторону, що може перевернути її догори дриґом. Марк Ліддел досліджує парадокс Сімпсона.
Урок Марка Ліддла, анімація анімаційної студії Tinmouse.
- Video Language:
- English
- Team:
- closed TED
- Project:
- TED-Ed
- Duration:
- 04:19
Hanna Leliv approved Ukrainian subtitles for How statistics can be misleading | ||
Hanna Leliv accepted Ukrainian subtitles for How statistics can be misleading | ||
Hanna Leliv edited Ukrainian subtitles for How statistics can be misleading | ||
Hanna Leliv edited Ukrainian subtitles for How statistics can be misleading | ||
Oksana Kukalets edited Ukrainian subtitles for How statistics can be misleading | ||
Oksana Kukalets edited Ukrainian subtitles for How statistics can be misleading | ||
Oksana Kukalets edited Ukrainian subtitles for How statistics can be misleading | ||
Oksana Kukalets edited Ukrainian subtitles for How statistics can be misleading |