Jak mylące mogą być statystyki - Mark Liddell
-
0:07 - 0:09Statystyki są przekonujące.
-
0:09 - 0:13Tak przekonujące, że ludzie, organizacje, a nawet całe kraje
-
0:13 - 0:18opierają część swoich kluczowych decyzji na zbiorach danych.
-
0:18 - 0:19Jest z tym jednak pewien problem.
-
0:19 - 0:23W każdym zestawie danych statystycznych może czaić się coś,
-
0:23 - 0:27co może wywrócić do góry nogami przedstawiane wyniki.
-
0:27 - 0:31Przykładowo, wyobraź sobie, że musisz wybrać jeden z dwóch szpitali,
-
0:31 - 0:34w którym Twój krewny w podeszłym wieku podda się operacji.
-
0:34 - 0:36Spośród 1000 ostatnich pacjentów każdego ze szpitali,
-
0:36 - 0:40900 przeżyło w Szpitalu A,
-
0:40 - 0:43podczas gdy zaledwie 800 przeżyło w Szpitalu B.
-
0:43 - 0:46Wygląda więc na to, że Szpital A to lepszy wybór.
-
0:46 - 0:48Jednak zanim podejmiesz decyzję
-
0:48 - 0:51pamiętaj, że nie wszyscy pacjenci przyjmowani do szpitala
-
0:51 - 0:54są w takim samym stanie zdrowia.
-
0:54 - 0:57Jeśli podzielimy ostatnich 1000 pacjentów każdego szpitala
-
0:57 - 1:01na tych w dobrym stanie zdrowia
i na tych w złym stanie zdrowia, -
1:01 - 1:04zarysowuje się zupełnie odmienny obraz sytuacji.
-
1:04 - 1:08Szpital A miał zaledwie 100 pacjentów, którzy zostali przyjęci w złym stanie zdrowia,
-
1:08 - 1:10z których przeżyło 30.
-
1:10 - 1:15Podczas gdy Szpital B miał 400, z których przeżyło 210.
-
1:15 - 1:17Zatem Szpital B jest lepszym wyborem
-
1:17 - 1:21dla pacjentów przyjętych do szpitala w słabym stanie
-
1:21 - 1:25ponieważ wskaźnik przeżycia to 52,5%.
-
1:25 - 1:28A co jeśli Twój krewny jest w dobrym stanie zgłaszając się w szpitalu?
-
1:28 - 1:32Co dziwne, Szpital B jest nadal lepszym wyborem
-
1:32 - 1:36ponieważ wskaźnik przeżycia wynosi 98%.
-
1:36 - 1:39Jak to możliwe, że Szpital A ma ogólnie lepsze wyniki przeżywalności
-
1:39 - 1:45skoro Szpital B ma lepsze wskaźniki w obu grupach pacjentów?
-
1:45 - 1:49Trafiliśmy tu na tzw. Paradoks Simpsona.
-
1:49 - 1:52Ten sam zestaw danych zdaje się pokazywać przeciwne trendy
-
1:52 - 1:55w zależności od sposobu pogrupowania danych.
-
1:55 - 1:59Dzieje się tak często, gdy zebrane dane ukrywają zmienną warunkową,
-
1:59 - 2:01czasem nazywaną ukrytą zmienną,
-
2:01 - 2:07która jest ukrytym dodatkowym czynnikiem istotnie wpływającym na wyniki.
-
2:07 - 2:10W tym przypadku ukrytym czynnikiem jest względna proporcja pacjentów
-
2:10 - 2:13przyjmowanych do szpitala w dobrym lub złym stanie zdrowia.
-
2:13 - 2:17Paradoks Simpsona nie jest jedynie scenariuszem hipotetycznym.
-
2:17 - 2:19Ujawnia się czasami w rzeczywistym świecie.
-
2:19 - 2:22Czasem w istotnych sytuacjach.
-
2:22 - 2:24Pewne badanie w Wlk. Brytanii zdawało się wskazywać,
-
2:24 - 2:28że palacze mają wyższe wskaźniki przeżywalności niż niepalący
-
2:28 - 2:30w okresie dwudziestu lat.
-
2:30 - 2:33Kiedy podzielono uczestników na grupy wiekowe
-
2:33 - 2:38wskazano, że niepalący byli znacząco starsi, a tym samym
-
2:38 - 2:41prawdopodobieństwo ich śmierci w okresie badania było większe
-
2:41 - 2:44właśnie dlatego, że ogólnie żyli dłużej.
-
2:44 - 2:47W tym przypadku ukrytą zmienną są grupy wiekowe,
-
2:47 - 2:50a ich znajomość jest kluczowa dla właściwego odczytania wyników.
-
2:50 - 2:52W innym przykładzie,
-
2:52 - 2:54analiza przypadków zastosowania kary śmierci na Florydzie
-
2:54 - 2:58wydawała się wskazywać na równowagę rasową w orzekaniu
-
2:58 - 3:02tej kary dla białych i ciemnoskórych skazanych za morderstwo.
-
3:02 - 3:06Jednak podzielenie tych przypadków według rasy ofiary ujawniło inny obraz sytuacji.
-
3:06 - 3:08W każdym z przypadków
-
3:08 - 3:11ciemnoskórzy oskarżeni częściej byli skazywani na śmierć.
-
3:11 - 3:15Niewiele wyższy całościowy wskaźnik orzekania kary śmierci wobec białych oskarżonych
-
3:15 - 3:19wynikał z tego, że bardziej prawdopodobne było, że sprawy dotyczące białych ofiar
-
3:19 - 3:21zakończą się karą śmierci
-
3:21 - 3:24niż sprawy, w których ofiara była ciemnoskóra,
-
3:24 - 3:28a do większości zabójstw dochodziło wśród ludzi tej samej rasy.
-
3:28 - 3:31Jak zatem uniknąć wpadnięcia w pułapkę tego paradoksu?
-
3:31 - 3:35Niestety nie ma jednej dobrej odpowiedzi.
-
3:35 - 3:39Dane mogą być łączone i dzielone na wiele sposobów,
-
3:39 - 3:42a ogólne liczby mogą czasem dać dokładniejszy obraz
-
3:42 - 3:47niż dane podzielone na wprowadzające w błąd lub arbitralne kategorie.
-
3:47 - 3:52Najważniejsze, aby uważnie analizować rzeczywiste sytuacje opisywane statystykami
-
3:52 - 3:56i uważać, czy nie ma w nich ukrytych zmiennych.
-
3:56 - 3:59W innym przypadku, sami wystawiamy się na wpływ tych, którzy używają danych,
-
3:59 - 4:03aby manipulować innymi i osiągać własne cele.
- Title:
- Jak mylące mogą być statystyki - Mark Liddell
- Speaker:
- Mark Liddell
- Description:
-
Statystyki są przekonujące. Tak przekonujące, że ludzie, organizacje, a nawet całe kraje opierają część swoich kluczowych decyzji na zbiorach danych. Jest z tym jednak pewien problem. W każdym zestawie danych statystycznych może czaić się coś, co może wywrócić do góry nogami przedstawiane wyniki. Mark Liddell analizuje Paradoks Simpsona.
- Video Language:
- English
- Team:
- closed TED
- Project:
- TED-Ed
- Duration:
- 04:19
TED Translators admin approved Polish subtitles for How statistics can be misleading | ||
Maria Jamrozik accepted Polish subtitles for How statistics can be misleading | ||
Dariusz Glazewski edited Polish subtitles for How statistics can be misleading | ||
Dariusz Glazewski edited Polish subtitles for How statistics can be misleading | ||
Dariusz Glazewski edited Polish subtitles for How statistics can be misleading | ||
Dariusz Glazewski edited Polish subtitles for How statistics can be misleading | ||
Dariusz Glazewski edited Polish subtitles for How statistics can be misleading | ||
Dariusz Glazewski edited Polish subtitles for How statistics can be misleading |