-
Policja aresztowała dwie osoby tego samego dnia w początkowo niezwiązanych sprawach.
-
Aresztowano pana o imieniu Alan.
-
Złapano go na gorącym uczynku przy sprzedaży narkotyków.
-
Był to zatem oczywisty przypadek.
-
Tego samego dnia złapano pana o imieniu Bill
-
i on także został złapany na gorącym uczynku sprzedając narkotyki.
-
Przyprowadzono ich osobno na komisariat
-
i powiedziano im "no dobra, sprawa jest oczywista
-
zostaniesz skazany za sprzedaż narkotyków
-
i dostaniesz za to dwa lata".
-
Mówią to każdemu złapanych osobno.
-
Obaj sprzedają ten sam typ narkotyków.
-
Ale obaj robili to zupełnie niezależnie.
-
Dostaną po dwa lata za narkotyki,
-
jeśli nie mają na sumieniu nic więcej.
-
Ale Prokurator Okręgowy ma szansę
-
by porozmawiać z każdym panem osobno.
-
Podczas gdy z nimi rozmawia, trzyma się pomysłu, że
-
to jest jasna sprawa sprzedaży narkotyków.
-
Obaj dostaną 2 lata jeśli nic więcej się nie wydarzy.
-
Ale wtedy zaczyna sobie uświadamiać,
-
że te dwie postaci są podobne.
-
Z pewnego powodu zaczyna podejrzewać,
-
że ci dwaj właściwie dokonali
-
znacznie poważniejszego przestępstwa
-
dużego napad z bronią w ręku parę tygodni temu.
-
Prokurator Okręgowy musi podążać za
-
swoim przeczuciem, podejrzeniem. Nie ma żadnych twardych dowodów.
-
Postanawia więc spróbować osiągnąć porozumienie
-
z oboma facetami, tak, żeby mieli bodziec
-
by donieść na siebie nawzajem.
-
Dlatego mówi każdemu z nich
-
"słuchaj, dostaniesz dwa lata za sprzedaż narkotyków,
-
to masz prawie jak w banku". Ale mówi też
-
"słuchaj, jeśli ty zeznasz, a on nie,
-
dostaniesz rok
-
a on 10 lat".
-
Więc mówi Alowi: "słuchaj, złapaliśmy dzisiaj przypadkowo Billa,
-
jeśli zeznasz, że to ty i Bill zrobiliście ten napad,
-
twój wyrok zostanie skrócony z dwóch do jednego roku.
-
Ale Bill oczywiście będzie musiał spędzić znacznie więcej czasu w więzieniu,
-
zwłaszcza że nie współpracuje z nami,
-
nie zeznaje".
-
Ale również inne stwierdzenie jest prawdziwe:
-
Jeśli ty odmówisz, a on zezna
-
sytuacja się odwraca.
-
Dostaniesz 10 lat, ponieważ nie współpracujesz,
-
a on, twój wspólnik, dostanie krótszą karę,
-
tylko 1 rok. To tak jakby powiedzieć Alowi
-
"słuchaj, jeśli zaprzeczysz, że brałeś udział w tym napadzie
-
i Bill na Ciebie nakapuje,
-
dostaniesz 10 lat w więzieniu
-
a Bill dostanie tylko jeden rok odsiadki.
-
Jeśli obaj zeznacie,
-
obaj dostaniecie 3 lata.
-
Ten scenariusz nazywa się "Dylematem Więźnia".
-
Dlatego, że obaczymy za chwilę,
-
że istnieje globalnie optymalny scenariusz dla nich obu,
-
w którym obaj odmawiają zeznań i obaj dostają 2 lata.
-
Ale zobaczymy, że w oparciu o ich bodźce,
-
zakładając że nie są wobec siebie nadzwyczajnie lojalni
-
a ci tutaj, są, wiecie, zahartowanymi przestępcami.
-
Nie są ani braćmi ani związani ze sobą w żaden inny sposób.
-
Nie mają żadnego pakietu zobowiązań.
-
Zobaczymy, że wybiorą racjonalnie,
-
lub mogą wybrać racjonalnie, nieoptymalny scenariusz.
-
I aby to zrozumieć narysuję coś,
-
co nazywa się "macierzą wypłat".
-
Najpierw zrobię to dla Billa.
-
Bill ma dwie możliwości, może przyznać się do napadu z bronią w ręku
-
lub może się wyprzeć, że miał z nim cokolwiek wspólnego,
-
że wie cokolwiek o tym napadzie.
-
Al ma te same dwie możliwości.
-
Al może zeznać i może się wyprzeć.
-
A ponieważ nazywa się to macierzą wypłat
-
narysuję tu tabelę.
-
Pomyślmy o wszystkich możliwych scenariuszach
-
i jakie byłyby wypłaty.
-
Jeśli Al zeznaje i Bill zeznaje, wtedy obaj są w 4. scenariuszu,
-
obaj dostają 3 lata w więzieniu,
-
3 dla Ala i 3 dla Billa.
-
Teraz jeśli Alan zezna i Bill się wyprze,
-
jesteśmy w 2. scenariuszu, z punktu widzenia Alana,
-
Alan dostanie tylko rok,
-
ale Bill dostanie 10 lat.
-
Jeśli wydarzy się przeciwnie,
-
że Bill zeznaje i Alan się wyprze,
-
wtedy dzieje się odwrotnie.
-
Al dostanie 10 lat za brak współpracy i
-
Bill dostanie zmniejszoną karę jednego roku za współpracę.
-
Jeśli obaj się wyprą, są w 1. scenariuszu, w którym
-
obaj dostaną tylko swoje kary za sprzedaż narkotyków.
-
Więc Al dostałby 2 lata i BIll dostałby 2 lata.
-
Wspomniałem o tym wcześniej w filmie:
-
jaki scenariusz jest dla nich globalnie optymalny?
-
Więc istnieje scenariusz, w którym
-
obaj wypierają się udziału w napadzie
-
i obaj dostają po dwa lata.
-
Ale zobaczymy, że w pewien sposób racjonalne jest,
-
zakładając że nie mają względem siebie silnej lojalności,
-
silnego zaufania do siebie nawzajem,
-
że dla obu z nich racjonalne jest by zeznawać.
-
I zeznawanie jest "równowagą Nasha".
-
Powiemy o tym więcej.
-
Ale równowagę Nasha mamy gdy każda ze stron dokonała wyboru
-
biorąc jako dany wybór drugiej strony.
-
Więc każda strona dokonała optymalnego wyboru
-
biorąc jako dane decyzje podjęte przez innych, albo biorąc pod uwagę dowolną decyzję przeciwnej strony.
-
Więc z punktu widzenia Ala, Al mówi, słuchaj,
-
nie wiem czy Bill zeznaje czy się wypiera,
-
więc załóżmy, że zeznaje, co powinienem zrobić?
-
Jeśli on zeznaje i ja zeznaję, dostanę 3 lata.
-
Jeśli on zeznaje i ja się wypieram, dostaję 10 lat.
-
Więc jeśli on zeznaje, lepiej dla mnie będzie też zeznawać.
-
Więc ten scenariusz jest preferowany względem tego tutaj.
-
Nie wiem czy Bill zeznał, może się wyparł.
-
Jeśli założę, że Bill się wyparł, czy lepiej jest dla mnie zeznać
-
i dostać rok, czy wyprzeć się i dostać 2 lata?
-
Znowu lepiej jest zeznać.
-
Zatem niezależnie od tego czy Bill zeznaje, czy się wypiera,
-
więc ponownie, optymalnym wyborem Ala,
-
biorąc pod uwagę decyzje Billa, jest zeznawać.
-
Jeśli Bill zeznaje, Al woli zeznawać,
-
jeśli Bill się wypiera, Al woli zeznawać.
-
Jeśli teraz spojrzymy na to z punktu wdzenia Billa
-
zobaczymy, że sytuacja jest zupełnie symetryczna.
-
Bill mówi, no więc nie wiem czy Al zeznaje czy się wypiera.
-
Jeśli Al zeznaje, mogę zeznać i dostać 3 lata
-
albo mogę się wyprzeć i dostać 10 lat.
-
Cóż, 3 lata w więzieniu są lepsze niż 10,
-
więc wybrałbym 3.
-
Jeśli wiem, że Al zeznaje.
-
Ale jeśli nie wiem na pewno czy Al zeznaje, możliwe, że się wypiera.
-
Jeśli Al się wypiera, mógłbym zeznać i dostać rok
-
albo mógłbym się wyprzeć i dostać 2 lata.
-
Znowu wolałbym zeznać i dostać rok.
-
Więc Bill biorąc pod uwagę wszystkie możliwe scenariusze, które Bill może wybrać,
-
decyduje, że zawsze lepiej jest dla niego zeznawać.
-
To ciekawe.
-
Racjonalnie wnioskują, że powinni wybrać ten scenariusz,
-
ten stan równowagi Nasha,
-
zamiast tego globalnie optymalnego stanu.
-
Obaj dostają 3 lata, obaj zeznając
-
zamiast obaj dostać 2 lata dzięki wypieraniu się.
-
Problem w tym, że jest to stan niestabilny.
-
Jeśli jeden z nich zakłada, że drugi ma,
-
jeśli jeden z nich zakłada, że
-
są w pewien sposób w tym stanie tymczasowo.
-
Mówią "cóż, zawsze mogę poprawić moją sytuację
-
zmieniając moją, zmieniając, co chcę zrobić".
-
Jeśli Al myślał, że Bill na pewno się wypiera
-
Al mógłby poprawić swoje położenie przenosząc się z tego stanu
-
i zeznawać aby dostać tylko jeden rok.
-
Podobnie, jeśli Bill myśli, że Al prawdopodobnie się wyprze
-
zdaje sobie sprawę, że może poprawić swoją sytuację ruszając się w tym kierunku,
-
zamiast wypierać się i dostawać 2 i 2
-
mógłby ruszyć się w tym kierunku.
-
Więc to jest niestabilny, optymalny scenariusz,
-
ale to jest równowaga Nasha, ten stan tutaj
-
rzeczywiście jest bardzo, bardzo, bardzo stabilny.
-
Jeśli założą... to jest, lepiej dla każdego z nich zeznawać
-
niezależnie od tego, co robi drugi,
-
i zakładając że wszyscy pozostali wybrali już swoją strategię,
-
nie ma żadnego bodźca dla Billa.
-
Więc... jeśli założyć, że wszyscy inni zmienili strategie
-
możesz tylko ruszyć się w tym kierunku, jeśli jesteś Billem możesz albo...
-
możesz wyjść z równowagi Nasha polegającej na zeznawaniu przez wyparcie się,
-
ale wyjdziesz na tym gorzej, więc nie chcesz tego robić.
-
Albo możesz ruszyć się w tym kierunku,
-
gdzie to Al zmieniłby swoją decyzję.
-
Ale znowu to daje gorszy wynik dla Ala
-
przechodzisz z 3 lat do 10 lat.
-
Więc to jest stan równowagi, stan stabilny,
-
w którym obaj wybraliby coś
-
co nie jest globalnie optymalne.