Return to Video

Dylemat Więźnia i Równowaga Nasha

  • 0:01 - 0:06
    Policja aresztowała dwie osoby tego samego dnia w początkowo niezwiązanych sprawach.
  • 0:06 - 0:09
    Aresztowano pana o imieniu Alan.
  • 0:09 - 0:11
    Złapano go na gorącym uczynku przy sprzedaży narkotyków.
  • 0:11 - 0:13
    Był to zatem oczywisty przypadek.
  • 0:13 - 0:17
    Tego samego dnia złapano pana o imieniu Bill
  • 0:17 - 0:20
    i on także został złapany na gorącym uczynku sprzedając narkotyki.
  • 0:20 - 0:23
    Przyprowadzono ich osobno na komisariat
  • 0:23 - 0:26
    i powiedziano im "no dobra, sprawa jest oczywista
  • 0:26 - 0:28
    zostaniesz skazany za sprzedaż narkotyków
  • 0:28 - 0:29
    i dostaniesz za to dwa lata".
  • 0:29 - 0:31
    Mówią to każdemu złapanych osobno.
  • 0:31 - 0:34
    Obaj sprzedają ten sam typ narkotyków.
  • 0:34 - 0:35
    Ale obaj robili to zupełnie niezależnie.
  • 0:35 - 0:40
    Dostaną po dwa lata za narkotyki,
  • 0:40 - 0:42
    jeśli nie mają na sumieniu nic więcej.
  • 0:42 - 0:44
    Ale Prokurator Okręgowy ma szansę
  • 0:44 - 0:46
    by porozmawiać z każdym panem osobno.
  • 0:46 - 0:49
    Podczas gdy z nimi rozmawia, trzyma się pomysłu, że
  • 0:49 - 0:51
    to jest jasna sprawa sprzedaży narkotyków.
  • 0:51 - 0:54
    Obaj dostaną 2 lata jeśli nic więcej się nie wydarzy.
  • 0:54 - 0:56
    Ale wtedy zaczyna sobie uświadamiać,
  • 0:56 - 0:59
    że te dwie postaci są podobne.
  • 0:59 - 1:01
    Z pewnego powodu zaczyna podejrzewać,
  • 1:01 - 1:03
    że ci dwaj właściwie dokonali
  • 1:03 - 1:06
    znacznie poważniejszego przestępstwa
  • 1:06 - 1:09
    dużego napad z bronią w ręku parę tygodni temu.
  • 1:09 - 1:13
    Prokurator Okręgowy musi podążać za
  • 1:13 - 1:18
    swoim przeczuciem, podejrzeniem. Nie ma żadnych twardych dowodów.
  • 1:18 - 1:20
    Postanawia więc spróbować osiągnąć porozumienie
  • 1:20 - 1:23
    z oboma facetami, tak, żeby mieli bodziec
  • 1:23 - 1:25
    by donieść na siebie nawzajem.
  • 1:25 - 1:27
    Dlatego mówi każdemu z nich
  • 1:27 - 1:29
    "słuchaj, dostaniesz dwa lata za sprzedaż narkotyków,
  • 1:29 - 1:33
    to masz prawie jak w banku". Ale mówi też
  • 1:33 - 1:45
    "słuchaj, jeśli ty zeznasz, a on nie,
  • 1:45 - 1:50
    dostaniesz rok
  • 1:50 - 1:56
    a on 10 lat".
  • 1:56 - 2:01
    Więc mówi Alowi: "słuchaj, złapaliśmy dzisiaj przypadkowo Billa,
  • 2:01 - 2:05
    jeśli zeznasz, że to ty i Bill zrobiliście ten napad,
  • 2:05 - 2:08
    twój wyrok zostanie skrócony z dwóch do jednego roku.
  • 2:08 - 2:11
    Ale Bill oczywiście będzie musiał spędzić znacznie więcej czasu w więzieniu,
  • 2:11 - 2:14
    zwłaszcza że nie współpracuje z nami,
  • 2:14 - 2:16
    nie zeznaje".
  • 2:16 - 2:19
    Ale również inne stwierdzenie jest prawdziwe:
  • 2:19 - 2:28
    Jeśli ty odmówisz, a on zezna
  • 2:28 - 2:30
    sytuacja się odwraca.
  • 2:30 - 2:33
    Dostaniesz 10 lat, ponieważ nie współpracujesz,
  • 2:33 - 2:38
    a on, twój wspólnik, dostanie krótszą karę,
  • 2:38 - 2:41
    tylko 1 rok. To tak jakby powiedzieć Alowi
  • 2:41 - 2:43
    "słuchaj, jeśli zaprzeczysz, że brałeś udział w tym napadzie
  • 2:43 - 2:45
    i Bill na Ciebie nakapuje,
  • 2:45 - 2:48
    dostaniesz 10 lat w więzieniu
  • 2:48 - 2:50
    a Bill dostanie tylko jeden rok odsiadki.
  • 2:50 - 2:58
    Jeśli obaj zeznacie,
  • 2:58 - 3:03
    obaj dostaniecie 3 lata.
  • 3:03 - 3:06
    Ten scenariusz nazywa się "Dylematem Więźnia".
  • 3:06 - 3:08
    Dlatego, że obaczymy za chwilę,
  • 3:08 - 3:10
    że istnieje globalnie optymalny scenariusz dla nich obu,
  • 3:10 - 3:15
    w którym obaj odmawiają zeznań i obaj dostają 2 lata.
  • 3:15 - 3:17
    Ale zobaczymy, że w oparciu o ich bodźce,
  • 3:17 - 3:20
    zakładając że nie są wobec siebie nadzwyczajnie lojalni
  • 3:20 - 3:22
    a ci tutaj, są, wiecie, zahartowanymi przestępcami.
  • 3:22 - 3:24
    Nie są ani braćmi ani związani ze sobą w żaden inny sposób.
  • 3:24 - 3:26
    Nie mają żadnego pakietu zobowiązań.
  • 3:26 - 3:30
    Zobaczymy, że wybiorą racjonalnie,
  • 3:30 - 3:33
    lub mogą wybrać racjonalnie, nieoptymalny scenariusz.
  • 3:33 - 3:35
    I aby to zrozumieć narysuję coś,
  • 3:35 - 3:39
    co nazywa się "macierzą wypłat".
  • 3:39 - 3:42
    Najpierw zrobię to dla Billa.
  • 3:42 - 3:50
    Bill ma dwie możliwości, może przyznać się do napadu z bronią w ręku
  • 3:50 - 3:52
    lub może się wyprzeć, że miał z nim cokolwiek wspólnego,
  • 3:52 - 3:55
    że wie cokolwiek o tym napadzie.
  • 3:55 - 3:57
    Al ma te same dwie możliwości.
  • 3:57 - 4:04
    Al może zeznać i może się wyprzeć.
  • 4:04 - 4:06
    A ponieważ nazywa się to macierzą wypłat
  • 4:06 - 4:11
    narysuję tu tabelę.
  • 4:11 - 4:13
    Pomyślmy o wszystkich możliwych scenariuszach
  • 4:13 - 4:15
    i jakie byłyby wypłaty.
  • 4:15 - 4:19
    Jeśli Al zeznaje i Bill zeznaje, wtedy obaj są w 4. scenariuszu,
  • 4:19 - 4:26
    obaj dostają 3 lata w więzieniu,
  • 4:26 - 4:30
    3 dla Ala i 3 dla Billa.
  • 4:30 - 4:36
    Teraz jeśli Alan zezna i Bill się wyprze,
  • 4:36 - 4:39
    jesteśmy w 2. scenariuszu, z punktu widzenia Alana,
  • 4:39 - 4:43
    Alan dostanie tylko rok,
  • 4:43 - 4:48
    ale Bill dostanie 10 lat.
  • 4:48 - 4:49
    Jeśli wydarzy się przeciwnie,
  • 4:49 - 4:51
    że Bill zeznaje i Alan się wyprze,
  • 4:51 - 4:53
    wtedy dzieje się odwrotnie.
  • 4:53 - 4:55
    Al dostanie 10 lat za brak współpracy i
  • 4:55 - 4:59
    Bill dostanie zmniejszoną karę jednego roku za współpracę.
  • 4:59 - 5:06
    Jeśli obaj się wyprą, są w 1. scenariuszu, w którym
  • 5:06 - 5:09
    obaj dostaną tylko swoje kary za sprzedaż narkotyków.
  • 5:09 - 5:16
    Więc Al dostałby 2 lata i BIll dostałby 2 lata.
  • 5:16 - 5:18
    Wspomniałem o tym wcześniej w filmie:
  • 5:18 - 5:22
    jaki scenariusz jest dla nich globalnie optymalny?
  • 5:22 - 5:23
    Więc istnieje scenariusz, w którym
  • 5:23 - 5:26
    obaj wypierają się udziału w napadzie
  • 5:26 - 5:29
    i obaj dostają po dwa lata.
  • 5:29 - 5:31
    Ale zobaczymy, że w pewien sposób racjonalne jest,
  • 5:31 - 5:34
    zakładając że nie mają względem siebie silnej lojalności,
  • 5:34 - 5:36
    silnego zaufania do siebie nawzajem,
  • 5:36 - 5:40
    że dla obu z nich racjonalne jest by zeznawać.
  • 5:40 - 5:43
    I zeznawanie jest "równowagą Nasha".
  • 5:43 - 5:45
    Powiemy o tym więcej.
  • 5:45 - 5:49
    Ale równowagę Nasha mamy gdy każda ze stron dokonała wyboru
  • 5:49 - 5:52
    biorąc jako dany wybór drugiej strony.
  • 5:52 - 5:56
    Więc każda strona dokonała optymalnego wyboru
  • 5:56 - 6:01
    biorąc jako dane decyzje podjęte przez innych, albo biorąc pod uwagę dowolną decyzję przeciwnej strony.
  • 6:01 - 6:03
    Więc z punktu widzenia Ala, Al mówi, słuchaj,
  • 6:03 - 6:07
    nie wiem czy Bill zeznaje czy się wypiera,
  • 6:07 - 6:10
    więc załóżmy, że zeznaje, co powinienem zrobić?
  • 6:10 - 6:13
    Jeśli on zeznaje i ja zeznaję, dostanę 3 lata.
  • 6:13 - 6:16
    Jeśli on zeznaje i ja się wypieram, dostaję 10 lat.
  • 6:16 - 6:19
    Więc jeśli on zeznaje, lepiej dla mnie będzie też zeznawać.
  • 6:19 - 6:23
    Więc ten scenariusz jest preferowany względem tego tutaj.
  • 6:23 - 6:26
    Nie wiem czy Bill zeznał, może się wyparł.
  • 6:26 - 6:30
    Jeśli założę, że Bill się wyparł, czy lepiej jest dla mnie zeznać
  • 6:30 - 6:33
    i dostać rok, czy wyprzeć się i dostać 2 lata?
  • 6:33 - 6:36
    Znowu lepiej jest zeznać.
  • 6:36 - 6:39
    Zatem niezależnie od tego czy Bill zeznaje, czy się wypiera,
  • 6:39 - 6:43
    więc ponownie, optymalnym wyborem Ala,
  • 6:43 - 6:46
    biorąc pod uwagę decyzje Billa, jest zeznawać.
  • 6:46 - 6:49
    Jeśli Bill zeznaje, Al woli zeznawać,
  • 6:49 - 6:51
    jeśli Bill się wypiera, Al woli zeznawać.
  • 6:51 - 6:53
    Jeśli teraz spojrzymy na to z punktu wdzenia Billa
  • 6:53 - 6:54
    zobaczymy, że sytuacja jest zupełnie symetryczna.
  • 6:54 - 6:59
    Bill mówi, no więc nie wiem czy Al zeznaje czy się wypiera.
  • 6:59 - 7:02
    Jeśli Al zeznaje, mogę zeznać i dostać 3 lata
  • 7:02 - 7:04
    albo mogę się wyprzeć i dostać 10 lat.
  • 7:04 - 7:06
    Cóż, 3 lata w więzieniu są lepsze niż 10,
  • 7:06 - 7:09
    więc wybrałbym 3.
  • 7:09 - 7:11
    Jeśli wiem, że Al zeznaje.
  • 7:11 - 7:14
    Ale jeśli nie wiem na pewno czy Al zeznaje, możliwe, że się wypiera.
  • 7:14 - 7:18
    Jeśli Al się wypiera, mógłbym zeznać i dostać rok
  • 7:18 - 7:20
    albo mógłbym się wyprzeć i dostać 2 lata.
  • 7:20 - 7:24
    Znowu wolałbym zeznać i dostać rok.
  • 7:24 - 7:28
    Więc Bill biorąc pod uwagę wszystkie możliwe scenariusze, które Bill może wybrać,
  • 7:28 - 7:33
    decyduje, że zawsze lepiej jest dla niego zeznawać.
  • 7:33 - 7:35
    To ciekawe.
  • 7:35 - 7:39
    Racjonalnie wnioskują, że powinni wybrać ten scenariusz,
  • 7:39 - 7:41
    ten stan równowagi Nasha,
  • 7:41 - 7:44
    zamiast tego globalnie optymalnego stanu.
  • 7:44 - 7:47
    Obaj dostają 3 lata, obaj zeznając
  • 7:47 - 7:49
    zamiast obaj dostać 2 lata dzięki wypieraniu się.
  • 7:49 - 7:54
    Problem w tym, że jest to stan niestabilny.
  • 7:54 - 7:58
    Jeśli jeden z nich zakłada, że drugi ma,
  • 7:58 - 7:59
    jeśli jeden z nich zakłada, że
  • 7:59 - 8:01
    są w pewien sposób w tym stanie tymczasowo.
  • 8:01 - 8:05
    Mówią "cóż, zawsze mogę poprawić moją sytuację
  • 8:05 - 8:08
    zmieniając moją, zmieniając, co chcę zrobić".
  • 8:08 - 8:10
    Jeśli Al myślał, że Bill na pewno się wypiera
  • 8:10 - 8:14
    Al mógłby poprawić swoje położenie przenosząc się z tego stanu
  • 8:14 - 8:16
    i zeznawać aby dostać tylko jeden rok.
  • 8:16 - 8:20
    Podobnie, jeśli Bill myśli, że Al prawdopodobnie się wyprze
  • 8:20 - 8:24
    zdaje sobie sprawę, że może poprawić swoją sytuację ruszając się w tym kierunku,
  • 8:24 - 8:26
    zamiast wypierać się i dostawać 2 i 2
  • 8:26 - 8:28
    mógłby ruszyć się w tym kierunku.
  • 8:28 - 8:31
    Więc to jest niestabilny, optymalny scenariusz,
  • 8:31 - 8:34
    ale to jest równowaga Nasha, ten stan tutaj
  • 8:34 - 8:37
    rzeczywiście jest bardzo, bardzo, bardzo stabilny.
  • 8:37 - 8:41
    Jeśli założą... to jest, lepiej dla każdego z nich zeznawać
  • 8:41 - 8:43
    niezależnie od tego, co robi drugi,
  • 8:43 - 8:47
    i zakładając że wszyscy pozostali wybrali już swoją strategię,
  • 8:47 - 8:50
    nie ma żadnego bodźca dla Billa.
  • 8:50 - 8:53
    Więc... jeśli założyć, że wszyscy inni zmienili strategie
  • 8:53 - 8:58
    możesz tylko ruszyć się w tym kierunku, jeśli jesteś Billem możesz albo...
  • 8:58 - 9:01
    możesz wyjść z równowagi Nasha polegającej na zeznawaniu przez wyparcie się,
  • 9:01 - 9:04
    ale wyjdziesz na tym gorzej, więc nie chcesz tego robić.
  • 9:04 - 9:06
    Albo możesz ruszyć się w tym kierunku,
  • 9:06 - 9:08
    gdzie to Al zmieniłby swoją decyzję.
  • 9:08 - 9:11
    Ale znowu to daje gorszy wynik dla Ala
  • 9:11 - 9:13
    przechodzisz z 3 lat do 10 lat.
  • 9:13 - 9:16
    Więc to jest stan równowagi, stan stabilny,
  • 9:16 - 9:18
    w którym obaj wybraliby coś
  • 9:18 - 9:20
    co nie jest globalnie optymalne.
Title:
Dylemat Więźnia i Równowaga Nasha
Description:

Klasyczna prezentacja Dylematu Więźnia jako wprowadzenie do konceptu równowagi Nasha.

more » « less
Video Language:
English
Duration:
09:21
Krzysztof Brzeziński edited Polish subtitles for Prisoners' Dilemma and Nash Equilibrium
Krzysztof Brzeziński added a translation

Polish subtitles

Revisions