Return to Video

Обманчивая статистика — Марк Лиддел

  • 0:07 - 0:09
    Статистика убедительна.
  • 0:09 - 0:13
    Настолько, что люди,
    организации и целые страны
  • 0:13 - 0:18
    принимают важнейшие решения,
    опираясь на систематизированные данные.
  • 0:18 - 0:19
    Но существует проблема.
  • 0:19 - 0:23
    В любом наборе статистических данных
    может таиться то,
  • 0:23 - 0:27
    что способно полностью перевернуть
    результаты с ног на голову.
  • 0:27 - 0:31
    Представьте, что вам нужно выбрать
    одну из двух больниц
  • 0:31 - 0:34
    для операции пожилого родственника.
  • 0:34 - 0:36
    Из последней тысячи пациентов этих больниц
  • 0:36 - 0:40
    в больнице А выжило 900 человек,
  • 0:40 - 0:43
    а в больнице Б — 800.
  • 0:43 - 0:46
    Похоже, что больница А — лучший выбор.
  • 0:46 - 0:48
    Но принимая решение, имейте в виду,
  • 0:48 - 0:51
    что состояние здоровья пациентов,
    прибывших в больницу,
  • 0:51 - 0:54
    было неодинаковым.
  • 0:54 - 0:57
    Если разделить последнюю тысячу
    пациентов обеих больниц
  • 0:57 - 1:01
    на тех, кто прибыл в хорошем
    и в плохом состоянии здоровья,
  • 1:01 - 1:04
    получится совсем другая картина.
  • 1:04 - 1:08
    В больницу А прибыло лишь 100 пациентов
    в плохом состоянии здоровья,
  • 1:08 - 1:10
    из которых 30 выжили.
  • 1:10 - 1:15
    В больницу Б поступило 400 тяжелобольных,
    из которых удалось спасти 210.
  • 1:15 - 1:17
    Таким образом больница Б —
    лучший выбор
  • 1:17 - 1:21
    для пациентов, прибывающих
    в плохом состоянии здоровья,
  • 1:21 - 1:25
    с коэффициентом выживаемости — 52,5 %.
  • 1:25 - 1:28
    А если на момент поступления в больницу
    здоровье вашего родственника в норме?
  • 1:28 - 1:32
    Удивительно, но и тут больница Б —
    лучший выбор
  • 1:32 - 1:36
    с коэффициентом выживаемости — 98%.
  • 1:36 - 1:39
    Но почему у больницы А
    суммарный показатель выживаемости выше,
  • 1:39 - 1:45
    если у больницы Б выше показатель
    выживаемости пациентов обеих групп?
  • 1:45 - 1:49
    То, с чем мы столкнулись,
    называется парадоксом Симпсона,
  • 1:49 - 1:52
    при котором набор данных
    может показывать обратную тенденцию
  • 1:52 - 1:55
    в зависимости от того,
    как он сгруппирован.
  • 1:55 - 1:59
    Такое случается, когда сводные данные
    содержат условную переменную,
  • 1:59 - 2:01
    также известную, как скрытая переменная.
  • 2:01 - 2:07
    Это скрытый дополнительный фактор,
    существенно влияющий на результаты.
  • 2:07 - 2:10
    В данном случае скрытый фактор —
    это доля пациентов,
  • 2:10 - 2:13
    прибывших в хорошем
    или плохом состоянии здоровья.
  • 2:13 - 2:17
    Парадокс Симпсона —
    это не просто гипотетический сценарий.
  • 2:17 - 2:19
    Время от времени
    он возникает в реальном мире,
  • 2:19 - 2:22
    иногда при важных обстоятельствах.
  • 2:22 - 2:24
    Исследование,
    проведённое в Великобритании,
  • 2:24 - 2:28
    показало более высокую долю выживаемости
    курящих людей, нежели некурящих,
  • 2:28 - 2:30
    более чем за 20-летний период времени.
  • 2:30 - 2:33
    Но разделение участников
    на возрастные группы
  • 2:33 - 2:38
    показало, что некурящие, в среднем,
    были существенно старше,
  • 2:38 - 2:41
    а значит имели больше шансов
    умереть во время испытательного срока
  • 2:41 - 2:44
    именно потому,
    что они в целом прожили больше.
  • 2:44 - 2:47
    Здесь скрытой переменной
    являются возрастные группы,
  • 2:47 - 2:50
    крайне важные для корректной
    интерпретации данных.
  • 2:50 - 2:52
    Другой пример:
  • 2:52 - 2:54
    анализ случаев смертной казни во Флориде
  • 2:54 - 2:58
    не выявил расового неравенства
    при вынесении приговоров
  • 2:58 - 3:02
    чернокожим и белым людям,
    обвиняемым в убийстве.
  • 3:02 - 3:06
    Но разделение дел по расам жертв
    рассказало другую историю.
  • 3:06 - 3:08
    При прочих равных обстоятельствах
  • 3:08 - 3:11
    чернокожим обвиняемым
    чаще выносили смертный приговор.
  • 3:11 - 3:15
    Немного большее количество приговоров
    для белых ответчиков было связано с тем,
  • 3:15 - 3:19
    что делá об убийстве белых людей
  • 3:19 - 3:21
    чаще приводили преступника
    к смертному приговору,
  • 3:21 - 3:24
    чем делá, где жертвы были чернокожими,
  • 3:24 - 3:28
    а большинство убийств совершалось
    между представителями одной расы.
  • 3:28 - 3:31
    Так как же избежать выводов,
    содержащих парадокс?
  • 3:31 - 3:35
    К несчастью,
    универсального ответа не существует.
  • 3:35 - 3:39
    Данные могут быть сгруппированы
    и разделены любым количеством способов,
  • 3:39 - 3:42
    и иногда суммарный показатель
    даёт более точную картину,
  • 3:42 - 3:47
    чем данные, разделённые
    на случайные категории.
  • 3:47 - 3:52
    Всё, что можно сделать — тщательно изучить
    ситуации, описываемые статистикой,
  • 3:52 - 3:56
    и решить, возможно ли здесь
    присутствие скрытой переменной.
  • 3:56 - 3:59
    В противном случае мы беззащитны
    перед теми, кто использует данные
  • 3:59 - 4:03
    для манипуляции другими людьми
    в собственных интересах.
Title:
Обманчивая статистика — Марк Лиддел
Speaker:
Mark Liddell
Description:

Смотрите полную версию урока: http://ed.ted.com/lessons/how-statistics-can-be-misleading-mark-liddell

Статистика убедительна настолько, что множество людей, организаций и даже стран принимают некоторые из важнейших решений, основываясь на её показателях. Но любой набор статистических данных может содержать в себе некий скрытый фактор, до неузнаваемости меняющий результаты исследования. В этом видео Марк Лиддел исследует парадокс Симпсона.

Урок Марка Лиддела, анимация — Tinmouse Animation Studio

more » « less
Video Language:
English
Team:
closed TED
Project:
TED-Ed
Duration:
04:19
Retired user edited Russian subtitles for How statistics can be misleading
Retired user edited Russian subtitles for How statistics can be misleading
Retired user approved Russian subtitles for How statistics can be misleading
Retired user edited Russian subtitles for How statistics can be misleading
Катерина Джусупова accepted Russian subtitles for How statistics can be misleading
Катерина Джусупова edited Russian subtitles for How statistics can be misleading
Катерина Джусупова edited Russian subtitles for How statistics can be misleading
Катерина Джусупова edited Russian subtitles for How statistics can be misleading
Show all

Russian subtitles

Revisions Compare revisions