Return to Video

Якою оманливою може бути статистика - Марк Ліддел

  • 0:07 - 0:09
    Статистика переконлива.
  • 0:09 - 0:13
    Настільки, що люди, організації
    та цілі країни
  • 0:13 - 0:18
    засновують одні з найважливіших рішень
    на упорядкованих даних.
  • 0:18 - 0:19
    Однак у цьому існує проблема.
  • 0:19 - 0:23
    Будь-яка статистика може мати
    в собі приховану сторону,
  • 0:23 - 0:27
    щось, що може перевернути результати
    догори дриґом.
  • 0:27 - 0:31
    Наприклад, уявіть, що Вам необхідно
    вибрати між двома лікарнями,
  • 0:31 - 0:34
    щоб прооперувати когось із
    родичів похилого віку.
  • 0:34 - 0:36
    У кожній лікарні з 1000 пацієнтів
  • 0:36 - 0:40
    900 виживає у Лікарні А,
  • 0:40 - 0:43
    тоді як у Лікарні В - лише 800.
  • 0:43 - 0:46
    Виглядає, ніби лікарня А -
    кращий варіант.
  • 0:46 - 0:48
    Але перед тим, як Ви приймете
    рішення,
  • 0:48 - 0:51
    зверніть увагу, що не всі пацієнти
    прибувають у лікарню
  • 0:51 - 0:54
    з однаковим станом здоров'я.
  • 0:54 - 0:57
    Якщо розділити 1000 пацієнтів
    з кожної лікарні
  • 0:57 - 1:01
    на тих, хто прибуває в хорошому
    здоров'ї, і тих, хто в поганому,
  • 1:01 - 1:04
    ситуація стає зовсім іншою.
  • 1:04 - 1:08
    У Лікарню А лише 100 пацієнтів,
    які поступили, мали погане здоров'я,
  • 1:08 - 1:10
    з яких 30 вижило.
  • 1:10 - 1:15
    Але Лікарня В мала 400 таких
    пацієнтів, де врятували 210 з них.
  • 1:15 - 1:17
    Отже, Лікарня 2 - кращий вибір
  • 1:17 - 1:21
    для пацієнтів, які поступають
    в лікарню з поганим здоров'ям,
  • 1:21 - 1:25
    із 52,5% тих, що вижили.
  • 1:25 - 1:28
    А що, коли ваш родич добре
    почувався, поступаючи в лікарню?
  • 1:28 - 1:32
    Як на диво, Лікарня В все ще
    залишається кращим вибором,
  • 1:32 - 1:36
    із 98% тих, що вижили.
  • 1:36 - 1:39
    Як же вийшло, що Лікарня А має вищий
    загальний рівень виживання,
  • 1:39 - 1:45
    якщо Лікарня В має вищий рівень
    виживання у обох групах?
  • 1:45 - 1:49
    У цьому випадку ми маємо справу з
    парадоксом Сімпсона,
  • 1:49 - 1:52
    де однакові дані можуть
    демонструвати протилежні тенденції
  • 1:52 - 1:55
    залежно від того, як їх згрупувати.
  • 1:55 - 1:59
    Це часто трапляється, коли зведені
    дані приховують умовну змінну,
  • 1:59 - 2:01
    іноді відому як прихована змінна,
  • 2:01 - 2:07
    що є додатковим прихованим фактором,
    який суттєво впливає на результати.
  • 2:07 - 2:10
    У цьому випадку прихований фактор -
    це відносна частка пацієнтів,
  • 2:10 - 2:13
    які приїжджають з
    хорошим чи поганим станом здоров'я.
  • 2:13 - 2:17
    Парадокс Сімпсона - не лише
    гіпотетичний сценарій.
  • 2:17 - 2:19
    Він час від часу проявляється
    в реальному світі,
  • 2:19 - 2:22
    іноді у важливому контексті.
  • 2:22 - 2:24
    Дослідження
    у Великобританії показало,
  • 2:24 - 2:28
    що курці мають вищий рівень
    виживання ніж некурці
  • 2:28 - 2:30
    за 20-річний період.
  • 2:30 - 2:33
    Це було правдою, поки не розділили
    пацієнтів за віковими групами,
  • 2:33 - 2:38
    що продемонструвало, що некурці були
    в середньому значно старші,
  • 2:38 - 2:41
    а тому з більшою імовірністю могли
    померти у випробувальний період,
  • 2:41 - 2:44
    точнісінько через те, що загалом
    вони жили довше.
  • 2:44 - 2:47
    У цьому випадку вікові групи -
    це прихована змінна,
  • 2:47 - 2:50
    яка важлива для правильної
    інтерпретації даних.
  • 2:50 - 2:52
    В іншому прикладі
  • 2:52 - 2:54
    аналіз справ із смертними
    вироками у Флориді
  • 2:54 - 2:58
    показав, що, на перший погляд,
    при винесенні вироку не було расових відмінностей
  • 2:58 - 3:02
    між афроамериканцями і білими,
    звинуваченими у вбивстві.
  • 3:02 - 3:06
    Однак якщо розділити справи за
    расовою приналежністю - інша історія.
  • 3:06 - 3:08
    В обох випадках
  • 3:08 - 3:11
    афроамериканців частіше
    засуджували до смертної кари.
  • 3:11 - 3:15
    Дещо вищий загальний рівень
    засудження білошкірих обвинувачених
  • 3:15 - 3:19
    спричинений тим, що справи, жертвами
    в яких були білошкірі,
  • 3:19 - 3:21
    частіше призводили до
    смертної кари,
  • 3:21 - 3:24
    ніж справи, де жертвами
    були афроамериканці,
  • 3:24 - 3:28
    а більшість вбивств ставалися
    між представниками однієї раси.
  • 3:28 - 3:31
    Отже, як нам не
    вестися на цей парадокс?
  • 3:31 - 3:35
    На жаль, не існує
    універсальної відповіді.
  • 3:35 - 3:39
    Дані можна згрупувати та розділити
    будь-якими способами,
  • 3:39 - 3:42
    а загальні числа іноді можуть
    дати точніше уявлення,
  • 3:42 - 3:47
    ніж дані, поділені на оманливі
    чи випадкові категорії.
  • 3:47 - 3:52
    Все, що ми можемо зробити - ретельно
    дослідити ситуації, описані статистично
  • 3:52 - 3:56
    і обміркувати, чи присутні
    там приховані змінні.
  • 3:56 - 3:59
    Інакше ми будемо вразливими перед
    тими, хто використовує дані,
  • 3:59 - 4:03
    щоб маніпулювати іншими та
    популяризувати власні погляди.
Title:
Якою оманливою може бути статистика - Марк Ліддел
Speaker:
Mark Liddell
Description:

Переглянути весь урок: http://ed.ted.com/lessons/how-statistics-can-be-misleading-mark-liddell

Статистика переконлива. Настільки, що люди, організації та цілі країни засновують одні з найважливіших рішень на упорядкованих даних. Однак будь-яка статистика має приховану сторону, що може перевернути її догори дриґом. Марк Ліддел досліджує парадокс Сімпсона.

Урок Марка Ліддла, анімація анімаційної студії Tinmouse.

more » « less
Video Language:
English
Team:
closed TED
Project:
TED-Ed
Duration:
04:19

Ukrainian subtitles

Revisions