Les statistiques peuvent être trompeuses - Mark Liddell
-
0:07 - 0:09Les statistiques sont convaincantes.
-
0:09 - 0:13Si bien que des personnes,
organisations et pays, -
0:13 - 0:18prennent d'importantes décisions
en se fondant sur ces données. -
0:18 - 0:19Mais il y a un problème.
-
0:19 - 0:23Toute statistique peut cacher
quelque chose, -
0:23 - 0:27qui peut complètement
transformer les résultats. -
0:27 - 0:31Par exemple, imaginez que vous deviez
choisir entre deux hôpitaux -
0:31 - 0:34pour une opération
sur une personne âgée. -
0:34 - 0:36Sur les 1000 derniers patients,
de chaque hôpital, -
0:36 - 0:40900 ont survécu dans l'hôpital A,
-
0:40 - 0:43contre seulement 800 dans l'hôpital B.
-
0:43 - 0:46Il semble donc que l'hôpital A
est le meilleur choix. -
0:46 - 0:48Mais avant de décider,
-
0:48 - 0:51rappelez-vous que tous les patients
n'arrivent pas à l'hôpital -
0:51 - 0:54dans le même état de santé.
-
0:54 - 0:57Et si l'on sépare
les 1000 derniers patients -
0:57 - 1:01entre ceux arrivés en bonne santé
et ceux arrivés en mauvaise santé, -
1:01 - 1:04la situation diffère significativement.
-
1:04 - 1:08L'hôpital A ne comptait que 100 patients
arrivés en mauvaise santé, -
1:08 - 1:10dont 30 ont survécu.
-
1:10 - 1:15Mais l'hôpital B en comptait 400,
et 210 purent être sauvés. -
1:15 - 1:17Donc l'hôpital B est le meilleur choix
-
1:17 - 1:21pour les patients qui arrivent à l'hôpital
en mauvaise santé, -
1:21 - 1:25avec un taux de survie de 52,5 %.
-
1:25 - 1:28Et si la santé de votre parente est bonne
quand elle arrive à l'hôpital ? -
1:28 - 1:32Curieusement, l'hôpital B
est toujours meilleur, -
1:32 - 1:36avec un taux de survie de 98%.
-
1:36 - 1:39Comment l'hôpital A peut-il avoir
un meilleur taux de survie global -
1:39 - 1:42si l'hôpital B
a de meilleurs taux de survie -
1:42 - 1:45pour les patients en bonne
et mauvaise santé ? -
1:45 - 1:49C'est le paradoxe de Simpson !
-
1:49 - 1:52Un même ensemble de données peut
montrer des tendances opposées, -
1:52 - 1:55selon la façon dont elles sont regroupées.
-
1:55 - 1:59Lorsque des données agrégées
masquent une variable conditionnelle, -
1:59 - 2:01parfois appelée variable cachée,
-
2:01 - 2:07ce facteur caché influence
significativement les résultats. -
2:07 - 2:10Ici, le facteur caché est
la proportion relative des patients -
2:10 - 2:13qui arrivent en bonne ou mauvaise santé.
-
2:13 - 2:17Le paradoxe de Simpson n'est pas
qu'un scénario hypothétique. -
2:17 - 2:19Il apparaît dans le monde réel,
-
2:19 - 2:22parfois dans des contextes importants.
-
2:22 - 2:24Une étude au Royaume-Uni semblait montrer
-
2:24 - 2:28que les fumeurs avaient un taux de survie
plus élevé que les non-fumeurs -
2:28 - 2:30sur une période de vingt ans.
-
2:30 - 2:33Mais répartir les participants
par groupe d'âge -
2:33 - 2:38a montré que les non-fumeurs
étaient en moyenne plus âgés, -
2:38 - 2:41et donc, plus susceptibles de décéder
durant l'étude, -
2:41 - 2:44justement parce qu'ils vivaient
plus longtemps en général. -
2:44 - 2:47Ici, les groupes d'âge
sont la variable cachée, -
2:47 - 2:50et sont essentiels
pour interpréter les données. -
2:50 - 2:52Dans un autre exemple,
-
2:52 - 2:54une étude sur la peine de mort en Floride
-
2:54 - 2:58semblait ne révéler
aucune disparité raciale, -
2:58 - 3:02entre accusés noirs et blancs,
reconnus coupables d'assassinat. -
3:02 - 3:06Mais, en répartissant selon la couleur
des victimes, l'histoire était tout autre. -
3:06 - 3:08Dans les deux cas,
-
3:08 - 3:11les accusés noirs étaient
plus susceptibles d'être condamnés. -
3:11 - 3:15Le taux de condamnation légèrement
supérieur pour les accusés blancs -
3:15 - 3:19était dû au fait que les cas
avec des victimes blanches -
3:19 - 3:21étaient plus susceptibles
d'entraîner la peine de mort -
3:21 - 3:24que les cas où la victime était noire.
-
3:24 - 3:28Et la plupart des meurtres avaient eu lieu
entre des gens de même couleur. -
3:28 - 3:31Alors, comment éviter
de tomber dans ce paradoxe ? -
3:31 - 3:35Malheureusement,
il n'y a pas de réponse unique. -
3:35 - 3:39Les données peuvent être regroupées
et divisées de plein de façons, -
3:39 - 3:42et les chiffres globaux peuvent parfois
donner une image plus précise -
3:42 - 3:47que des données divisées en catégories
trompeuses ou arbitraires. -
3:47 - 3:48Il faut étudier attentivement
-
3:48 - 3:52les situations décrites
par les statistiques -
3:52 - 3:56et se demander s'il peut y avoir
des variables cachées. -
3:56 - 3:59Faute de quoi, nous serions vulnérables
aux tentatives de manipulation -
3:59 - 4:03de personnes désirant utiliser ces données
à des fins personnelles.
- Title:
- Les statistiques peuvent être trompeuses - Mark Liddell
- Speaker:
- Mark Liddell
- Description:
-
Leçon complète: http://ed.ted.com/lessons/how-statistics-can-be-misleading-mark-liddell
Les statistiques sont convaincantes. A tel point que des personnes, des organisations voire des pays fondent certaines de leurs décisions les plus importantes sur ces données organisées. Mais les statistiques peuvent cacher des choses à même d'inverser complètement les résultats. Mark Liddell enquête sur le paradoxe de Simpson.
Leçon par Mark Liddell, animation par Tinmouse Animation Studio.
- Video Language:
- English
- Team:
- closed TED
- Project:
- TED-Ed
- Duration:
- 04:19
Elisabeth Buffard approved French subtitles for How statistics can be misleading | ||
Elisabeth Buffard edited French subtitles for How statistics can be misleading | ||
eric vautier accepted French subtitles for How statistics can be misleading | ||
eric vautier edited French subtitles for How statistics can be misleading | ||
Jerome Bohec edited French subtitles for How statistics can be misleading | ||
eric vautier declined French subtitles for How statistics can be misleading | ||
eric vautier declined French subtitles for How statistics can be misleading | ||
eric vautier declined French subtitles for How statistics can be misleading |