WEBVTT 00:00:00.860 --> 00:00:05.975 Op dezelfde dag, arresteert de politie twee mannen die elkaar niet kennen. 00:00:05.975 --> 00:00:08.896 Ze arresteren een man, genaamd Alan 00:00:08.896 --> 00:00:11.407 Ze hebben hem op heterdaad opgepakt omdat hij drug verkocht. 00:00:11.407 --> 00:00:13.079 Dus het is een uitgemaakte zaak. 00:00:13.079 --> 00:00:17.011 Op dezelfde dag, wordt er nog een man opgepakt, genaamd Bill, 00:00:17.011 --> 00:00:20.323 en hij is ook op heterdaad opgepakt voor het dealen van drugs. 00:00:20.323 --> 00:00:22.925 De mannen worden afzonderlijk vervoerd naar het politiebureau 00:00:22.925 --> 00:00:25.669 en ze vertellen hen, "Kijk, dit is een uitgemaakte zaak 00:00:25.669 --> 00:00:28.017 je wordt veroordeeld voor het dealen van drugs 00:00:28.017 --> 00:00:29.396 en je krijgt hiervoor twee jaar." 00:00:29.396 --> 00:00:31.123 En ze vertellen dit aan elk van hen afzonderlijk. 00:00:31.123 --> 00:00:33.506 Toevallig, dealde ze beide dezelfde type drugs. 00:00:33.506 --> 00:00:35.387 Maar deden ze dit volledig onafhankelijk. 00:00:35.387 --> 00:00:39.651 Hetgeen gaat gebeuren, is de twee jaar vastzitten voor het dealen van drug, 00:00:39.651 --> 00:00:41.597 ervan uitgaande dat er geen andere delicten zijn gepleegd. 00:00:41.597 --> 00:00:43.720 Vervolgens heeft de Officier van Justitie de kans 00:00:43.720 --> 00:00:46.376 om met beide heren afzonderlijk te praten 00:00:46.376 --> 00:00:49.047 en terwijl hij in gesprek is met hen, is het idee versterkt dat 00:00:49.047 --> 00:00:51.061 dit een uitgemaakte zaak is voor het dealen van drugs 00:00:51.061 --> 00:00:54.048 Ze krijgen hiervoor 2 jaar, als er geen andere delicten zijn gepleegd. 00:00:54.048 --> 00:00:56.079 Maar dan begint de Officier van Justitie te beseffen dat 00:00:56.079 --> 00:00:58.551 deze 2 personages ergens op lijken. 00:00:58.551 --> 00:01:00.854 Hij heeft opeens het vermoeden, voor welke reden dan ook... 00:01:00.854 --> 00:01:03.194 dat dit de 2 personages zijn, 00:01:03.194 --> 00:01:05.560 die een veel ernstiger overtreding hebben gepleegd 00:01:05.560 --> 00:01:09.150 een paar weken geleden, namelijk een grote gewapende overval, 00:01:09.150 --> 00:01:13.344 en de Officier van Justitie heeft de kans 00:01:13.344 --> 00:01:17.617 om zijn voorgevoel, zijn verdenking voor te leggen. Ook al zijn er geen harde bewijzen. 00:01:17.617 --> 00:01:20.129 Dus probeert hij om een deal te krijgen 00:01:20.129 --> 00:01:22.720 met elk van deze mannen, zodat ze gestimuleerd worden 00:01:22.720 --> 00:01:25.068 zodat, ze in wezen, elkaar verlinken. 00:01:25.068 --> 00:01:27.390 Dus vertelt hij elk van hen 00:01:27.390 --> 00:01:29.323 "Kijk, je krijgt twee jaar voor drugshandel, 00:01:29.323 --> 00:01:32.989 dat is gegarandeerd" Maar, zegt hij verder, 00:01:32.989 --> 00:01:44.610 "Kijk, als jij bekent, en de ander niet, 00:01:44.610 --> 00:01:50.235 dan krijg jij 1 jaar 00:01:50.235 --> 00:01:56.449 en die andere man, krijgt 10 jaars". 00:01:56.449 --> 00:02:00.963 Dus vertelt hij Al, "kijk, we hebben Bill toevallig ook opgepakt vandaag, 00:02:00.963 --> 00:02:04.565 als jij bekent dat je met Bill de gewapende overval hebt gepleegd, 00:02:04.565 --> 00:02:07.603 dan wordt jouw straf verlaagd, van 2 naar 1 jaar. 00:02:07.603 --> 00:02:11.014 Maar Bill gaat uiteraard veel meer tijd doorbrengen in de gevangenis, 00:02:11.014 --> 00:02:14.215 vooral omdat hij niet met ons samen meewerkt, 00:02:14.215 --> 00:02:15.808 hij ontkent alles". 00:02:15.808 --> 00:02:18.918 Maar dan de andere verklaring is ook waar: 00:02:18.918 --> 00:02:28.184 als jij alles ontkent, en de ander bekent 00:02:28.184 --> 00:02:29.879 dan is het andersom. 00:02:29.879 --> 00:02:33.255 Jij krijgt 10 jaar gevangenis omdat je niet wil meewerken, 00:02:33.255 --> 00:02:38.190 en de ander, jouw mede samenzweerder krijgt een verminderde straf 00:02:38.190 --> 00:02:40.808 en krijgt 1 jaar, dus dit wat is ik je vertel Al 00:02:40.808 --> 00:02:43.357 "kijk, als je ontkent dat jullie de gewapende overvallers waren 00:02:43.357 --> 00:02:45.388 en Bill verlinkt jou 00:02:45.388 --> 00:02:47.837 dan krijg jij straks 10 jaar gevangenisstraf 00:02:47.837 --> 00:02:50.394 en Bill krijgt alleen maar 1 jaar gevangenisstraf". 00:02:50.394 --> 00:02:57.738 en als jullie beide bekennen, 00:02:57.738 --> 00:03:02.521 dan krijgen jullie beide 3 jaar gevangenisstraf. 00:03:02.521 --> 00:03:06.418 Dit scenario is genoemd "The Prisoner's Dilemma" ofwel "het gevangenendilemma". 00:03:06.418 --> 00:03:07.867 Omdat we beide in een tel zien, 00:03:07.867 --> 00:03:10.466 dat er een optimaal scenario is voor ze 00:03:10.466 --> 00:03:15.100 als ze beide ontkennen, dan krijgen ze beide 2 jaar 00:03:15.100 --> 00:03:17.262 Maar wat we ook zien, gebaseerd op hun stimulans 00:03:17.262 --> 00:03:20.487 ervan uitgaande, dat er geen loyaliteit is naar elkaar toe 00:03:20.487 --> 00:03:22.379 en dit zijn, zoals je begrijpt, twee echte criminelen hier. 00:03:22.379 --> 00:03:24.461 Dit zijn geen broers van elkaar of op andere wijze gerelateerd aan elkaar. 00:03:24.461 --> 00:03:26.339 Ze hebben geen enkele loyaliteit naar elkaar toe. 00:03:26.339 --> 00:03:29.813 We zullen zien dat ze rationeel nadenken over hun keuze, 00:03:29.813 --> 00:03:33.491 of misschien rationeel kiezen voor een niet zo optimaal scenario. 00:03:33.491 --> 00:03:35.443 en om het goed begrijpen, ga ik het uittekenen 00:03:35.443 --> 00:03:39.279 genaamd de "pay-off matrix" ofwel pay-off matrix. 00:03:39.279 --> 00:03:42.106 en laat ik hier de keuzes zien voor Bill. 00:03:42.106 --> 00:03:49.642 Bill heeft twee opties, hij kan de gewapende overval bekennen 00:03:49.642 --> 00:03:52.450 of hij kan ontkennen dat hij iets, 00:03:52.450 --> 00:03:55.163 weet over de gewapende overval. 00:03:55.163 --> 00:03:57.469 en Al heeft dezelfde twee opties 00:03:57.469 --> 00:04:03.820 Al kan bekennen en Al kan ontkennen 00:04:03.820 --> 00:04:06.121 en aangezien het een pay-off matrix wordt genoemd, 00:04:06.121 --> 00:04:10.559 laat me hier wat rasters tekenen 00:04:10.559 --> 00:04:12.979 en laten we nadenken over de verschillende scenario's 00:04:12.979 --> 00:04:14.603 en wat de pay-offs / gevolgen zouden zijn. 00:04:14.603 --> 00:04:18.860 Als Al bekent en Bill bekent, dan krijgen ze beide scenario 4, 00:04:18.860 --> 00:04:25.567 ze krijgen beide 3 jaar gevangenisstraf, ze krijgen dus beide 00:04:25.567 --> 00:04:29.591 3 jaar voor Al en 3 jaar voor Bill. 00:04:29.591 --> 00:04:35.505 Maar nu, als Al bekent en Bill ontkent... 00:04:35.505 --> 00:04:38.847 dan krijgen we scenario 2, gezien van Al's standpunt, 00:04:38.847 --> 00:04:43.115 Al krijgt nu maar 1 jaar, 00:04:43.115 --> 00:04:47.800 en Bill krijgt dus 10 jaar. 00:04:47.800 --> 00:04:49.435 Maar als het omgekeerde gebeurt, 00:04:49.435 --> 00:04:51.189 dat Bill bekent en Al ontkent, 00:04:51.189 --> 00:04:52.857 dan gebeurt het tegenovergestelde. 00:04:52.857 --> 00:04:55.438 Al krijgt dan 10 jaar omdat hij niet wil meewerken en 00:04:55.438 --> 00:04:59.484 Bill krijgt een verminderde straf van 1 jaar voor het meewerken. 00:04:59.484 --> 00:05:05.987 En als ze allebei ontkennen, dan is scenario 1 van toepassing, waar 00:05:05.987 --> 00:05:09.139 ze beide gewoon hun straf moeten uitzitten voor het dealen van drug. 00:05:09.139 --> 00:05:15.719 Al krijgt 2 jaar en Bill krijgt dan ook 2 jaar. 00:05:15.719 --> 00:05:18.211 Ik zinspeelde hier al eerder op in de video: 00:05:18.211 --> 00:05:21.673 wat is het meest optimale scenario voor hun beide? 00:05:21.673 --> 00:05:23.043 Nou, het is het scenario, waar 00:05:23.043 --> 00:05:25.718 ze beide ontkennen dat ze iets te maken hebben met de gewapende overval, 00:05:25.718 --> 00:05:28.544 en ze krijgen beide 2 jaar. 00:05:28.544 --> 00:05:31.317 Maar we zullen zien, dat ze eigenlijk rationeel een keuze gaan maken, 00:05:31.317 --> 00:05:34.481 ervan uitgaande dat ze geen loyaliteit naar elkaar toe hebben, 00:05:34.481 --> 00:05:36.327 of een sterke mate van vertrouwen hebben in de andere partij, 00:05:36.327 --> 00:05:39.744 waardoor het eigenlijk het beste is voor beide om te bekennen. 00:05:39.744 --> 00:05:43.185 Een bekentenis is eigenlijk een "Nash equilibrium" ofwel "Nash evenwicht" 00:05:43.185 --> 00:05:44.815 En we gaan het hier meer over hebben. 00:05:44.815 --> 00:05:49.175 Een "Nash evenwicht" is waar iedere partij een keuze maakt of strategie bepaalt 00:05:49.175 --> 00:05:52.347 gezien de keuzes van de andere partij 00:05:52.347 --> 00:05:55.764 Als we dan denken aan, de optimale keuze voor de andere partij 00:05:55.764 --> 00:06:00.580 gezien de keuzes die er zijn of wat de beste keuze is voor de andere partij. 00:06:00.580 --> 00:06:02.963 Als we het van Al's standpunt bekijken, zal hij zeggen 00:06:02.963 --> 00:06:06.799 Ik weet niet of Bill zal bekennen of ontkennen, 00:06:06.799 --> 00:06:10.020 maar laten we zeggen dat hij bekent, wat is dan beter voor mij om te doen? 00:06:10.020 --> 00:06:13.169 Als hij bekent en beken, dan krijg ik 3 jaar. 00:06:13.169 --> 00:06:16.045 Als hij bekent en ik ontken, dan krijg ik 10 jaar. 00:06:16.045 --> 00:06:19.175 Dus als hij bekent, dan kan ik ook maar beter bekennen. 00:06:19.175 --> 00:06:23.178 Dus dit scenario krijgt de voorkeur, dan deze hier beneden. 00:06:23.178 --> 00:06:25.723 Nu weet ik niet of Bill bekent, hij ontkent wellicht. 00:06:25.723 --> 00:06:29.781 Maar ik ga ervan uit dat als Bill ontkent, het beter voor mij is om te bekennen. 00:06:29.781 --> 00:06:32.710 en dan krijg ik 1 jaar en als ik ontken, dan krijg ik 2 jaar? 00:06:32.710 --> 00:06:35.563 Nogmaals, het is beter voor mij om te bekennen. 00:06:35.563 --> 00:06:38.963 En dus, ongeacht of Bill bekent of ontkent, 00:06:38.963 --> 00:06:42.538 dit is dus eens te meer de meest optimale keuze voor Al, 00:06:42.538 --> 00:06:46.419 rekening houdend met Bill zijn keuzes, om te bekennen. 00:06:46.419 --> 00:06:48.699 Als Bill bekent, dan is Al beter af om te bekennen, 00:06:48.699 --> 00:06:51.125 als Bill ontkent, dan is Al ook beter af om te bekennen. 00:06:51.125 --> 00:06:52.861 Nu gaan we het bekijken van Bills standpunten, 00:06:52.861 --> 00:06:54.414 en het is volledig symmetrisch. 00:06:54.414 --> 00:06:58.959 Als Bill, Bill zegt, nou ik weet niet of Al gaat bekennen of ontkennen... 00:06:58.959 --> 00:07:01.990 als Al bekent, dan kan bekennen en krijg ik 3 jaar, 00:07:01.990 --> 00:07:04.176 of ik kan ontkennen en ik krijg 10 jaar. 00:07:04.176 --> 00:07:06.071 Nou, 3 jaar in de gevangenis is beter dan 10 jaar, 00:07:06.071 --> 00:07:09.013 dus zou ik gaan voor die 3 jaar. 00:07:09.013 --> 00:07:10.761 Als ik weet dat Al bekent. 00:07:10.761 --> 00:07:14.240 Maar ik weet niet definitief of Al bekent, hij kan ook ontkennen. 00:07:14.240 --> 00:07:17.773 Als Al ontkent, dan krijg ik als ik beken maar 1 jaar. 00:07:17.773 --> 00:07:19.836 of ik kan ontkennen en ik krijg 2 jaar. 00:07:19.836 --> 00:07:24.219 Nou, nogmaals, ik kan ook bekennen en ik krijg maar 1 jaar. 00:07:24.219 --> 00:07:28.099 Dus Bill, rekening houden met zijn scenarios waar Al waarschijnlijk voor gaat, 00:07:28.099 --> 00:07:33.085 dan is het altijd beter voor hem om te bekennen. 00:07:33.085 --> 00:07:35.072 En dit is dus interessant. 00:07:35.072 --> 00:07:38.605 Ze hebben rationeel bepaald, dat ze beide moeten gaan voor dit scenario. 00:07:38.605 --> 00:07:40.741 Deze Nash evenwichtstoestand, 00:07:40.741 --> 00:07:43.640 in tegenstelling tot de meest optimale toestand. 00:07:43.640 --> 00:07:46.531 Ze krijgen beide 3 jaar, als ze beide bekennen 00:07:46.531 --> 00:07:49.417 in tegenstelling dat ze 2 jaar krijgen als ze beide ontkennen. 00:07:49.417 --> 00:07:54.329 Het probleem met deze is de onzekere toestand. 00:07:54.329 --> 00:07:57.641 Als een van beide ervan uitgaat dat de ander ontkent, 00:07:57.641 --> 00:07:58.729 of de ander ervan uitgaat dat 00:07:58.729 --> 00:08:00.796 ze op de een of ander manier in die tijdelijke toestand. 00:08:00.796 --> 00:08:04.529 Ze kunnen zeggen "nou, ik kan mijn scenario altijd verbeteren 00:08:04.529 --> 00:08:07.707 door het wijzigen van, het wijzigen van wat ik wil doen". 00:08:07.707 --> 00:08:10.425 Als Al er zeker van was dat Bill ontkent 00:08:10.425 --> 00:08:13.551 Dan kan Al zijn omstandigheden verbeteren door zich te verplaatsen uit die toestand 00:08:13.551 --> 00:08:16.037 en bekennen en maar 1 jaar te krijgen. 00:08:16.037 --> 00:08:20.121 Evenzo, als Bill had gedacht dat Al misschien zou ontkennen 00:08:20.121 --> 00:08:23.965 beseft hij dat hij zijn eigen omstandigheden kan verbeteren door dit scenario te kiezen. 00:08:23.965 --> 00:08:25.679 In plaats van ontkennen en 2 jaar krijgen 00:08:25.679 --> 00:08:28.413 kan hij zich richten in de richting dat hij wil. 00:08:28.413 --> 00:08:31.317 Dit is dus een onzekere optimaal scenario, 00:08:31.317 --> 00:08:34.292 maar dit is het Nash evenwicht, de tegenovergestelde toestand 00:08:34.292 --> 00:08:36.762 is eigenlijk, heel, heel, heel erg zeker. 00:08:36.762 --> 00:08:40.811 Als ze ervan uitgaan... dat dit, beter is voor beide om te bekennen 00:08:40.811 --> 00:08:43.489 ongeacht wat de ander doet, 00:08:43.489 --> 00:08:47.375 en de veronderstelling hebben dat alle andere acteurs kiezen voor hun strategie, 00:08:47.375 --> 00:08:50.187 is er geen stimulans voor Bill. 00:08:50.187 --> 00:08:53.327 Dus... als hij veronderstelt dat iedereen zijn strategie veranderd 00:08:53.327 --> 00:08:57.654 je kan je alleen verplaatsen in die richting, als je Bill bent, kun je ervoor kiezen... 00:08:57.654 --> 00:09:01.380 je kan uitgaan van het Nash evenwicht van bekennen naar ontkennen 00:09:01.380 --> 00:09:03.615 maar je bent dan slechter af, dus dat wil je niet doen. 00:09:03.615 --> 00:09:05.567 Of je kan je verplaatsen in deze richting, 00:09:05.567 --> 00:09:07.692 waar het Al zou zijn, die zijn besluit zou wijzigen. 00:09:07.692 --> 00:09:10.794 Maar nogmaals, dan is Al slechter af met het resultaat 00:09:10.794 --> 00:09:12.916 jij gaat van 3 jaar naar 10 jaar toe. 00:09:12.916 --> 00:09:15.788 Dus dit is het evenwichtstoestand, de stabiele toestand. 00:09:15.788 --> 00:09:17.569 dat beide mensen iets zouden kiezen 00:09:17.569 --> 00:09:20.437 dat totaal niet optimaal is.