Return to Video

Wie Statistiken in die Irre führen können - Mark Liddell

  • 0:07 - 0:09
    Statistiken überzeugen.
  • 0:09 - 0:13
    So sehr, dass Menschen,
    Organisationen und ganze Länder
  • 0:13 - 0:18
    ihre wichtigsten Entscheidungen
    auf strukturierte Daten gründen.
  • 0:18 - 0:19
    Aber darin liegt das Problem.
  • 0:19 - 0:23
    In allen statistischen Daten
    hält sich vielleicht etwas versteckt,
  • 0:23 - 0:27
    dass die Befunde auf den Kopf stellt.
  • 0:27 - 0:31
    Zum Beispiel: Angenommen, man muss
    zwischen zwei Krankenhäusern wählen,
  • 0:31 - 0:34
    weil ein älterer Angehöriger
    operiert werden muss.
  • 0:34 - 0:36
    Von den letzten 1000 Patienten
    der beiden Krankenhäuser
  • 0:36 - 0:40
    überlebten 900 in Klinik A,
  • 0:40 - 0:43
    wohingegen nur 800 in Klinik B überlebten.
  • 0:43 - 0:46
    Also scheint Klinik A
    die bessere Wahl zu sein.
  • 0:46 - 0:49
    Aber bevor man sich entscheidet,
    sollte man bedenken,
  • 0:49 - 0:51
    dass Patienten nicht mit dem
    gleichen Gesundheitszustand
  • 0:51 - 0:54
    ins Krankenhaus aufgenommen werden.
  • 0:54 - 0:57
    Wenn man die letzten 1000 Patienten
    von beiden Krankenhäusern
  • 0:57 - 1:01
    in jene bei guter Gesundheit und solche
    bei schlechter Gesundheit einteilt,
  • 1:01 - 1:04
    sieht die Sache ganz anders aus.
  • 1:04 - 1:08
    Klinik A hatte nur 100 Patienten
    bei schlechter Gesundheit aufgenommen,
  • 1:08 - 1:10
    von denen 30 überlebten.
  • 1:10 - 1:15
    Aber Klinik B hatte 400
    und sie konnten 210 retten.
  • 1:15 - 1:19
    Also ist Klinik B für Patienten
    bei schlechter Gesundheit
  • 1:19 - 1:24
    mit einer Überlebensrate
    von 52,5 % die bessere Wahl.
  • 1:24 - 1:27
    Was, wenn man den Angehörigen
    bei guter Gesundheit
  • 1:27 - 1:29
    ins Krankenhaus aufnimmt?
  • 1:29 - 1:32
    Merkwürdigerweise ist Klinik B
    mit einer Überlebensrate von über 98 %
  • 1:32 - 1:36
    immer noch die bessere Wahl.
  • 1:36 - 1:39
    Wie kann Klinik A eine bessere
    Gesamtüberlebensrate haben,
  • 1:39 - 1:41
    wenn Klinik B
  • 1:41 - 1:45
    die besseren Überlebensraten
    bei beiden Patientengruppen hat?
  • 1:45 - 1:49
    Worauf wir zufällig stießen,
    ist ein Fall des Simpson-Paradoxon,
  • 1:49 - 1:52
    bei dem dieselbe Reihe von Daten,
    je nachdem wie sie gruppiert sind,
  • 1:52 - 1:55
    gegenläufige Tendenzen zu zeigen scheinen.
  • 1:55 - 1:58
    Das geschieht häufig,
    wenn aggregierte Daten
  • 1:58 - 2:01
    eine Bedingungsvariable verbergen,
    auch als Störvariable bekannt,
  • 2:01 - 2:04
    die ein verborgener,
    zusätzlicher Faktor ist,
  • 2:04 - 2:07
    der Ergebnisse signifikant beeinflusst.
  • 2:07 - 2:10
    Hier ist der versteckte Faktor
    der relative Anteil von Patienten
  • 2:10 - 2:13
    bei guter oder schlechter Gesundheit.
  • 2:13 - 2:17
    Das Simpson-Paradoxon ist nicht nur
    ein hypothetisches Szenario.
  • 2:17 - 2:19
    Es tritt von Zeit zu Zeit
    in der wirklichen Welt auf,
  • 2:19 - 2:22
    manchmal in wichtigen Zusammenhängen.
  • 2:22 - 2:25
    Einer Studie im Vereinigten
    Königreich zufolge,
  • 2:25 - 2:29
    schien die Überlebensrate von Rauchern
    über einen Zeitraum von zwanzig Jahren
  • 2:29 - 2:31
    höher wäre als die von Nichtrauchern.
  • 2:31 - 2:35
    Zumindest bis die Unterteilung
    der Teilnehmer in Altersgruppen zeigte,
  • 2:35 - 2:38
    dass die Nichtraucher im Durchschnitt
    signifikant älter waren
  • 2:38 - 2:41
    und daher mit höherer Wahscheinlichkeit
    während des Versuchszeitraums starben,
  • 2:41 - 2:44
    die Raucher im Allgemeinen länger lebten.
  • 2:44 - 2:47
    Hier sind die Altersgruppen
    die Störvariablen
  • 2:47 - 2:50
    und äußerst wichtig,
    um die Daten korrekt zu deuten.
  • 2:50 - 2:52
    In einem weiteren Beispiel
  • 2:52 - 2:54
    schien die Analyse der Fälle
    mit Todesstrafen aus Florida
  • 2:54 - 2:56
    keine ethnische Ungleichverteilung
  • 2:56 - 2:59
    zwischen schwarzen
    und weißen Mordangeklagten
  • 2:59 - 3:02
    bei der Verurteilung aufzudecken.
  • 3:02 - 3:05
    Die anhand der "Rasse"
    der Opfer eingeteilten Fälle
  • 3:05 - 3:06
    sagten aber etwas anderes.
  • 3:06 - 3:09
    Bei beiden Sachlagen
    wurden schwarze Angeklagte
  • 3:09 - 3:11
    mit höherer Wahrscheinlichkeit
    zum Tode verurteilt.
  • 3:11 - 3:15
    Die etwas höhere Verurteilungsrate
    für weiße Angeklagte insgesamt
  • 3:15 - 3:19
    ergab sich infolge der Tatsache,
    dass Fälle mit weißen Opfern
  • 3:19 - 3:22
    mit höherer Wahrscheinlichkeit
    ein Todesurteil hervorriefen
  • 3:22 - 3:24
    als Fälle mit schwarzen Opfern;
  • 3:24 - 3:28
    und die meisten Morde geschahen
    zwischen Menschen derselben "Rasse".
  • 3:28 - 3:31
    Wie vermeiden wir also
    auf das Paradoxon hereinzufallen?
  • 3:31 - 3:35
    Leider gibt es keine
    allgemeingültige Antwort.
  • 3:35 - 3:39
    Daten können auf unzählige Arten
    gruppiert und unterteilt werden
  • 3:39 - 3:42
    und Gesamtzahlen können manchmal
    ein genaueres Bild zeichnen
  • 3:42 - 3:47
    als Daten, die man in irreführende
    oder willkürliche Kategorien einteilt.
  • 3:47 - 3:51
    Alles was wir tun können, ist,
    die tatsächlichen Sachverhalte,
  • 3:51 - 3:53
    die Statistiken beschreiben,
    zu untersuchen
  • 3:53 - 3:56
    und zu überlegen, ob Störvariablen
    vorhanden sein könnten.
  • 3:56 - 3:59
    Andernfalls machen wir uns anfällig
    gegenüber denen, die Daten benutzen,
  • 3:59 - 4:03
    um uns zu manipulieren
    und ihre eigenen Interessen zu befördern.
Title:
Wie Statistiken in die Irre führen können - Mark Liddell
Speaker:
Mark Liddell
Description:

Die ganze Lektion unter: http://ed.ted.com/lessons/how-statistics-can-be-misleading-mark-liddell

Statistiken überzeugen. So sehr, dass Menschen, Organisationen und ganze Länder ihre wichtigsten Entscheidungen auf strukturierte Daten gründen. Aber in jedem Datensatz hält sich vielleicht etwas versteckt, das die Ergebnisse vollständig auf den Kopf stellen kann. Mark Liddell untersucht das Simpson-Paradox.

Lektion von Mark Liddell. Animation von Tinmouse Animation Studio.

more » « less
Video Language:
English
Team:
closed TED
Project:
TED-Ed
Duration:
04:19
Angelika Lueckert Leon approved German subtitles for How statistics can be misleading
Angelika Lueckert Leon accepted German subtitles for How statistics can be misleading
Angelika Lueckert Leon edited German subtitles for How statistics can be misleading
Johannes Duschner edited German subtitles for How statistics can be misleading
Johannes Duschner edited German subtitles for How statistics can be misleading
Johannes Duschner edited German subtitles for How statistics can be misleading

German subtitles

Revisions