1 00:00:00,860 --> 00:00:05,975 Op dezelfde dag, arresteert de politie twee mannen die elkaar niet kennen. 2 00:00:05,975 --> 00:00:08,896 Ze arresteren een man, genaamd Alan 3 00:00:08,896 --> 00:00:11,407 Ze hebben hem op heterdaad opgepakt omdat hij drug verkocht. 4 00:00:11,407 --> 00:00:13,079 Dus het is een uitgemaakte zaak. 5 00:00:13,079 --> 00:00:17,011 Op dezelfde dag, wordt er nog een man opgepakt, genaamd Bill, 6 00:00:17,011 --> 00:00:20,323 en hij is ook op heterdaad opgepakt voor het dealen van drugs. 7 00:00:20,323 --> 00:00:22,925 De mannen worden afzonderlijk vervoerd naar het politiebureau 8 00:00:22,925 --> 00:00:25,669 en ze vertellen hen, "Kijk, dit is een uitgemaakte zaak 9 00:00:25,669 --> 00:00:28,017 je wordt veroordeeld voor het dealen van drugs 10 00:00:28,017 --> 00:00:29,396 en je krijgt hiervoor twee jaar." 11 00:00:29,396 --> 00:00:31,123 En ze vertellen dit aan elk van hen afzonderlijk. 12 00:00:31,123 --> 00:00:33,506 Toevallig, dealde ze beide dezelfde type drugs. 13 00:00:33,506 --> 00:00:35,387 Maar deden ze dit volledig onafhankelijk. 14 00:00:35,387 --> 00:00:39,651 Hetgeen gaat gebeuren, is de twee jaar vastzitten voor het dealen van drug, 15 00:00:39,651 --> 00:00:41,597 ervan uitgaande dat er geen andere delicten zijn gepleegd. 16 00:00:41,597 --> 00:00:43,720 Vervolgens heeft de Officier van Justitie de kans 17 00:00:43,720 --> 00:00:46,376 om met beide heren afzonderlijk te praten 18 00:00:46,376 --> 00:00:49,047 en terwijl hij in gesprek is met hen, is het idee versterkt dat 19 00:00:49,047 --> 00:00:51,061 dit een uitgemaakte zaak is voor het dealen van drugs 20 00:00:51,061 --> 00:00:54,048 Ze krijgen hiervoor 2 jaar, als er geen andere delicten zijn gepleegd. 21 00:00:54,048 --> 00:00:56,079 Maar dan begint de Officier van Justitie te beseffen dat 22 00:00:56,079 --> 00:00:58,551 deze 2 personages ergens op lijken. 23 00:00:58,551 --> 00:01:00,854 Hij heeft opeens het vermoeden, voor welke reden dan ook... 24 00:01:00,854 --> 00:01:03,194 dat dit de 2 personages zijn, 25 00:01:03,194 --> 00:01:05,560 die een veel ernstiger overtreding hebben gepleegd 26 00:01:05,560 --> 00:01:09,150 een paar weken geleden, namelijk een grote gewapende overval, 27 00:01:09,150 --> 00:01:13,344 en de Officier van Justitie heeft de kans 28 00:01:13,344 --> 00:01:17,617 om zijn voorgevoel, zijn verdenking voor te leggen. Ook al zijn er geen harde bewijzen. 29 00:01:17,617 --> 00:01:20,129 Dus probeert hij om een deal te krijgen 30 00:01:20,129 --> 00:01:22,720 met elk van deze mannen, zodat ze gestimuleerd worden 31 00:01:22,720 --> 00:01:25,068 zodat, ze in wezen, elkaar verlinken. 32 00:01:25,068 --> 00:01:27,390 Dus vertelt hij elk van hen 33 00:01:27,390 --> 00:01:29,323 "Kijk, je krijgt twee jaar voor drugshandel, 34 00:01:29,323 --> 00:01:32,989 dat is gegarandeerd" Maar, zegt hij verder, 35 00:01:32,989 --> 00:01:44,610 "Kijk, als jij bekent, en de ander niet, 36 00:01:44,610 --> 00:01:50,235 dan krijg jij 1 jaar 37 00:01:50,235 --> 00:01:56,449 en die andere man, krijgt 10 jaars". 38 00:01:56,449 --> 00:02:00,963 Dus vertelt hij Al, "kijk, we hebben Bill toevallig ook opgepakt vandaag, 39 00:02:00,963 --> 00:02:04,565 als jij bekent dat je met Bill de gewapende overval hebt gepleegd, 40 00:02:04,565 --> 00:02:07,603 dan wordt jouw straf verlaagd, van 2 naar 1 jaar. 41 00:02:07,603 --> 00:02:11,014 Maar Bill gaat uiteraard veel meer tijd doorbrengen in de gevangenis, 42 00:02:11,014 --> 00:02:14,215 vooral omdat hij niet met ons samen meewerkt, 43 00:02:14,215 --> 00:02:15,808 hij ontkent alles". 44 00:02:15,808 --> 00:02:18,918 Maar dan de andere verklaring is ook waar: 45 00:02:18,918 --> 00:02:28,184 als jij alles ontkent, en de ander bekent 46 00:02:28,184 --> 00:02:29,879 dan is het andersom. 47 00:02:29,879 --> 00:02:33,255 Jij krijgt 10 jaar gevangenis omdat je niet wil meewerken, 48 00:02:33,255 --> 00:02:38,190 en de ander, jouw mede samenzweerder krijgt een verminderde straf 49 00:02:38,190 --> 00:02:40,808 en krijgt 1 jaar, dus dit wat is ik je vertel Al 50 00:02:40,808 --> 00:02:43,357 "kijk, als je ontkent dat jullie de gewapende overvallers waren 51 00:02:43,357 --> 00:02:45,388 en Bill verlinkt jou 52 00:02:45,388 --> 00:02:47,837 dan krijg jij straks 10 jaar gevangenisstraf 53 00:02:47,837 --> 00:02:50,394 en Bill krijgt alleen maar 1 jaar gevangenisstraf". 54 00:02:50,394 --> 00:02:57,738 en als jullie beide bekennen, 55 00:02:57,738 --> 00:03:02,521 dan krijgen jullie beide 3 jaar gevangenisstraf. 56 00:03:02,521 --> 00:03:06,418 Dit scenario is genoemd "The Prisoner's Dilemma" ofwel "het gevangenendilemma". 57 00:03:06,418 --> 00:03:07,867 Omdat we beide in een tel zien, 58 00:03:07,867 --> 00:03:10,466 dat er een optimaal scenario is voor ze 59 00:03:10,466 --> 00:03:15,100 als ze beide ontkennen, dan krijgen ze beide 2 jaar 60 00:03:15,100 --> 00:03:17,262 Maar wat we ook zien, gebaseerd op hun stimulans 61 00:03:17,262 --> 00:03:20,487 ervan uitgaande, dat er geen loyaliteit is naar elkaar toe 62 00:03:20,487 --> 00:03:22,379 en dit zijn, zoals je begrijpt, twee echte criminelen hier. 63 00:03:22,379 --> 00:03:24,461 Dit zijn geen broers van elkaar of op andere wijze gerelateerd aan elkaar. 64 00:03:24,461 --> 00:03:26,339 Ze hebben geen enkele loyaliteit naar elkaar toe. 65 00:03:26,339 --> 00:03:29,813 We zullen zien dat ze rationeel nadenken over hun keuze, 66 00:03:29,813 --> 00:03:33,491 of misschien rationeel kiezen voor een niet zo optimaal scenario. 67 00:03:33,491 --> 00:03:35,443 en om het goed begrijpen, ga ik het uittekenen 68 00:03:35,443 --> 00:03:39,279 genaamd de "pay-off matrix" ofwel pay-off matrix. 69 00:03:39,279 --> 00:03:42,106 en laat ik hier de keuzes zien voor Bill. 70 00:03:42,106 --> 00:03:49,642 Bill heeft twee opties, hij kan de gewapende overval bekennen 71 00:03:49,642 --> 00:03:52,450 of hij kan ontkennen dat hij iets, 72 00:03:52,450 --> 00:03:55,163 weet over de gewapende overval. 73 00:03:55,163 --> 00:03:57,469 en Al heeft dezelfde twee opties 74 00:03:57,469 --> 00:04:03,820 Al kan bekennen en Al kan ontkennen 75 00:04:03,820 --> 00:04:06,121 en aangezien het een pay-off matrix wordt genoemd, 76 00:04:06,121 --> 00:04:10,559 laat me hier wat rasters tekenen 77 00:04:10,559 --> 00:04:12,979 en laten we nadenken over de verschillende scenario's 78 00:04:12,979 --> 00:04:14,603 en wat de pay-offs / gevolgen zouden zijn. 79 00:04:14,603 --> 00:04:18,860 Als Al bekent en Bill bekent, dan krijgen ze beide scenario 4, 80 00:04:18,860 --> 00:04:25,567 ze krijgen beide 3 jaar gevangenisstraf, ze krijgen dus beide 81 00:04:25,567 --> 00:04:29,591 3 jaar voor Al en 3 jaar voor Bill. 82 00:04:29,591 --> 00:04:35,505 Maar nu, als Al bekent en Bill ontkent... 83 00:04:35,505 --> 00:04:38,847 dan krijgen we scenario 2, gezien van Al's standpunt, 84 00:04:38,847 --> 00:04:43,115 Al krijgt nu maar 1 jaar, 85 00:04:43,115 --> 00:04:47,800 en Bill krijgt dus 10 jaar. 86 00:04:47,800 --> 00:04:49,435 Maar als het omgekeerde gebeurt, 87 00:04:49,435 --> 00:04:51,189 dat Bill bekent en Al ontkent, 88 00:04:51,189 --> 00:04:52,857 dan gebeurt het tegenovergestelde. 89 00:04:52,857 --> 00:04:55,438 Al krijgt dan 10 jaar omdat hij niet wil meewerken en 90 00:04:55,438 --> 00:04:59,484 Bill krijgt een verminderde straf van 1 jaar voor het meewerken. 91 00:04:59,484 --> 00:05:05,987 En als ze allebei ontkennen, dan is scenario 1 van toepassing, waar 92 00:05:05,987 --> 00:05:09,139 ze beide gewoon hun straf moeten uitzitten voor het dealen van drug. 93 00:05:09,139 --> 00:05:15,719 Al krijgt 2 jaar en Bill krijgt dan ook 2 jaar. 94 00:05:15,719 --> 00:05:18,211 Ik zinspeelde hier al eerder op in de video: 95 00:05:18,211 --> 00:05:21,673 wat is het meest optimale scenario voor hun beide? 96 00:05:21,673 --> 00:05:23,043 Nou, het is het scenario, waar 97 00:05:23,043 --> 00:05:25,718 ze beide ontkennen dat ze iets te maken hebben met de gewapende overval, 98 00:05:25,718 --> 00:05:28,544 en ze krijgen beide 2 jaar. 99 00:05:28,544 --> 00:05:31,317 Maar we zullen zien, dat ze eigenlijk rationeel een keuze gaan maken, 100 00:05:31,317 --> 00:05:34,481 ervan uitgaande dat ze geen loyaliteit naar elkaar toe hebben, 101 00:05:34,481 --> 00:05:36,327 of een sterke mate van vertrouwen hebben in de andere partij, 102 00:05:36,327 --> 00:05:39,744 waardoor het eigenlijk het beste is voor beide om te bekennen. 103 00:05:39,744 --> 00:05:43,185 Een bekentenis is eigenlijk een "Nash equilibrium" ofwel "Nash evenwicht" 104 00:05:43,185 --> 00:05:44,815 En we gaan het hier meer over hebben. 105 00:05:44,815 --> 00:05:49,175 Een "Nash evenwicht" is waar iedere partij een keuze maakt of strategie bepaalt 106 00:05:49,175 --> 00:05:52,347 gezien de keuzes van de andere partij 107 00:05:52,347 --> 00:05:55,764 Als we dan denken aan, de optimale keuze voor de andere partij 108 00:05:55,764 --> 00:06:00,580 gezien de keuzes die er zijn of wat de beste keuze is voor de andere partij. 109 00:06:00,580 --> 00:06:02,963 Als we het van Al's standpunt bekijken, zal hij zeggen 110 00:06:02,963 --> 00:06:06,799 Ik weet niet of Bill zal bekennen of ontkennen, 111 00:06:06,799 --> 00:06:10,020 maar laten we zeggen dat hij bekent, wat is dan beter voor mij om te doen? 112 00:06:10,020 --> 00:06:13,169 Als hij bekent en beken, dan krijg ik 3 jaar. 113 00:06:13,169 --> 00:06:16,045 Als hij bekent en ik ontken, dan krijg ik 10 jaar. 114 00:06:16,045 --> 00:06:19,175 Dus als hij bekent, dan kan ik ook maar beter bekennen. 115 00:06:19,175 --> 00:06:23,178 Dus dit scenario krijgt de voorkeur, dan deze hier beneden. 116 00:06:23,178 --> 00:06:25,723 Nu weet ik niet of Bill bekent, hij ontkent wellicht. 117 00:06:25,723 --> 00:06:29,781 Maar ik ga ervan uit dat als Bill ontkent, het beter voor mij is om te bekennen. 118 00:06:29,781 --> 00:06:32,710 en dan krijg ik 1 jaar en als ik ontken, dan krijg ik 2 jaar? 119 00:06:32,710 --> 00:06:35,563 Nogmaals, het is beter voor mij om te bekennen. 120 00:06:35,563 --> 00:06:38,963 En dus, ongeacht of Bill bekent of ontkent, 121 00:06:38,963 --> 00:06:42,538 dit is dus eens te meer de meest optimale keuze voor Al, 122 00:06:42,538 --> 00:06:46,419 rekening houdend met Bill zijn keuzes, om te bekennen. 123 00:06:46,419 --> 00:06:48,699 Als Bill bekent, dan is Al beter af om te bekennen, 124 00:06:48,699 --> 00:06:51,125 als Bill ontkent, dan is Al ook beter af om te bekennen. 125 00:06:51,125 --> 00:06:52,861 Nu gaan we het bekijken van Bills standpunten, 126 00:06:52,861 --> 00:06:54,414 en het is volledig symmetrisch. 127 00:06:54,414 --> 00:06:58,959 Als Bill, Bill zegt, nou ik weet niet of Al gaat bekennen of ontkennen... 128 00:06:58,959 --> 00:07:01,990 als Al bekent, dan kan bekennen en krijg ik 3 jaar, 129 00:07:01,990 --> 00:07:04,176 of ik kan ontkennen en ik krijg 10 jaar. 130 00:07:04,176 --> 00:07:06,071 Nou, 3 jaar in de gevangenis is beter dan 10 jaar, 131 00:07:06,071 --> 00:07:09,013 dus zou ik gaan voor die 3 jaar. 132 00:07:09,013 --> 00:07:10,761 Als ik weet dat Al bekent. 133 00:07:10,761 --> 00:07:14,240 Maar ik weet niet definitief of Al bekent, hij kan ook ontkennen. 134 00:07:14,240 --> 00:07:17,773 Als Al ontkent, dan krijg ik als ik beken maar 1 jaar. 135 00:07:17,773 --> 00:07:19,836 of ik kan ontkennen en ik krijg 2 jaar. 136 00:07:19,836 --> 00:07:24,219 Nou, nogmaals, ik kan ook bekennen en ik krijg maar 1 jaar. 137 00:07:24,219 --> 00:07:28,099 Dus Bill, rekening houden met zijn scenarios waar Al waarschijnlijk voor gaat, 138 00:07:28,099 --> 00:07:33,085 dan is het altijd beter voor hem om te bekennen. 139 00:07:33,085 --> 00:07:35,072 En dit is dus interessant. 140 00:07:35,072 --> 00:07:38,605 Ze hebben rationeel bepaald, dat ze beide moeten gaan voor dit scenario. 141 00:07:38,605 --> 00:07:40,741 Deze Nash evenwichtstoestand, 142 00:07:40,741 --> 00:07:43,640 in tegenstelling tot de meest optimale toestand. 143 00:07:43,640 --> 00:07:46,531 Ze krijgen beide 3 jaar, als ze beide bekennen 144 00:07:46,531 --> 00:07:49,417 in tegenstelling dat ze 2 jaar krijgen als ze beide ontkennen. 145 00:07:49,417 --> 00:07:54,329 Het probleem met deze is de onzekere toestand. 146 00:07:54,329 --> 00:07:57,641 Als een van beide ervan uitgaat dat de ander ontkent, 147 00:07:57,641 --> 00:07:58,729 of de ander ervan uitgaat dat 148 00:07:58,729 --> 00:08:00,796 ze op de een of ander manier in die tijdelijke toestand. 149 00:08:00,796 --> 00:08:04,529 Ze kunnen zeggen "nou, ik kan mijn scenario altijd verbeteren 150 00:08:04,529 --> 00:08:07,707 door het wijzigen van, het wijzigen van wat ik wil doen". 151 00:08:07,707 --> 00:08:10,425 Als Al er zeker van was dat Bill ontkent 152 00:08:10,425 --> 00:08:13,551 Dan kan Al zijn omstandigheden verbeteren door zich te verplaatsen uit die toestand 153 00:08:13,551 --> 00:08:16,037 en bekennen en maar 1 jaar te krijgen. 154 00:08:16,037 --> 00:08:20,121 Evenzo, als Bill had gedacht dat Al misschien zou ontkennen 155 00:08:20,121 --> 00:08:23,965 beseft hij dat hij zijn eigen omstandigheden kan verbeteren door dit scenario te kiezen. 156 00:08:23,965 --> 00:08:25,679 In plaats van ontkennen en 2 jaar krijgen 157 00:08:25,679 --> 00:08:28,413 kan hij zich richten in de richting dat hij wil. 158 00:08:28,413 --> 00:08:31,317 Dit is dus een onzekere optimaal scenario, 159 00:08:31,317 --> 00:08:34,292 maar dit is het Nash evenwicht, de tegenovergestelde toestand 160 00:08:34,292 --> 00:08:36,762 is eigenlijk, heel, heel, heel erg zeker. 161 00:08:36,762 --> 00:08:40,811 Als ze ervan uitgaan... dat dit, beter is voor beide om te bekennen 162 00:08:40,811 --> 00:08:43,489 ongeacht wat de ander doet, 163 00:08:43,489 --> 00:08:47,375 en de veronderstelling hebben dat alle andere acteurs kiezen voor hun strategie, 164 00:08:47,375 --> 00:08:50,187 is er geen stimulans voor Bill. 165 00:08:50,187 --> 00:08:53,327 Dus... als hij veronderstelt dat iedereen zijn strategie veranderd 166 00:08:53,327 --> 00:08:57,654 je kan je alleen verplaatsen in die richting, als je Bill bent, kun je ervoor kiezen... 167 00:08:57,654 --> 00:09:01,380 je kan uitgaan van het Nash evenwicht van bekennen naar ontkennen 168 00:09:01,380 --> 00:09:03,615 maar je bent dan slechter af, dus dat wil je niet doen. 169 00:09:03,615 --> 00:09:05,567 Of je kan je verplaatsen in deze richting, 170 00:09:05,567 --> 00:09:07,692 waar het Al zou zijn, die zijn besluit zou wijzigen. 171 00:09:07,692 --> 00:09:10,794 Maar nogmaals, dan is Al slechter af met het resultaat 172 00:09:10,794 --> 00:09:12,916 jij gaat van 3 jaar naar 10 jaar toe. 173 00:09:12,916 --> 00:09:15,788 Dus dit is het evenwichtstoestand, de stabiele toestand. 174 00:09:15,788 --> 00:09:17,569 dat beide mensen iets zouden kiezen 175 00:09:17,569 --> 00:09:20,437 dat totaal niet optimaal is.