-
No mesmo dia, a polícia fez duas prisões em flagrante.
-
Eles prenderam um senhor chamado Alan.
-
Ele foi pego em flagrante vendendo drogas.
-
Então é um caso já solucionado.
-
E no mesmo dia eles prenderam um homem chamado Bill,
-
e ele também foi pego vendendo drogas em flagrante.
-
Eles foram levados separadamente à delegacia
-
e lhes foi dito: "olhe, este é um caso já resolvido,
-
você será condenado por venda de drogas
-
e você pegará dois anos de prisão."
-
Isto foi dito para cada um individualmente.
-
Eles estão vendendo o mesmo tipo de drogas.
-
Mas estavam fazendo isto completamente de forma independente.
-
Dois anos pelas drogas, isto é o que acontecerá,
-
assumindo nada mais.
-
Mas então o advogado do Distrito teve a chance
-
de conversar com cada um separadamente.
-
E durante a conversa, ele reforça a ideia de
-
que é um caso já solucionado pela venda de drogas.
-
Cada um pegará dois anos se nada mais acontecer.
-
Mas então ele começou a perceber que
-
os dois indivíduos eram familiares.
-
Ele começou a suspeitar, por alguma razão,
-
que eles eram os dois indivíduos que cometeram
-
uma infração muito mais grave, que eles tinham cometido
-
um grande assalto armado poucas semanas antes.
-
E então o advogado teve que continuar com
-
sua intuição, sua suspeita. Ele não tinha nenhuma evidência.
-
Então o que ele quer é tentar conseguir um acordo
-
com cada um deles, então eles terão um incentivo
-
para, essencialmente, delatar um ao outro.
-
Então o que ele disse para cada um deles foi:
-
"Olhe, você pegará dois anos de prisão pela venda de drogas,
-
isto é garantido". Mas ele disse:
-
"Se você confessar, e o outro não,
-
então você pegará um ano
-
e o outro pegará 10 anos".
-
Então eles diz para Alan: "nós pegamos o Bill aleatoriamente hoje,
-
se você confessar que eram vocês dois naquele assalto armado,
-
sua sentença cairá de dois anos para um.
-
Mas Bill terá que passar muito mais tempo na prisão,
-
especialmente porque ele não estará cooperando,
-
ele não está confessando".
-
Mas a outra afirmação também é verdade:
-
se você negar e o outro confessar
-
isto se inverte.
-
Você pegará 10 anos porque você não está cooperando,
-
e o outro, pegará uma sentença reduzida,
-
pegará um ano. Então, isto é como dizer a Alan:
-
"Se você negar que estava no assalto armado
-
e Bill te entregar,
-
você pegará 10 anos de prisão
-
e Bill pegará apenas um ano de prisão".
-
E se vocês dois confessarem,
-
ambos pegarão três ano de prisão.
-
Este cenário é chamado de "O Dilema do Prisioneiro".
-
Pois logo veremos
-
que existe um cenário ótimo global para eles
-
onde ambos negam, e ambos pegam dois anos.
-
Mas veremos, baseado em seus incentivos,
-
assumindo que eles não possuem uma lealdade um com o outro,
-
e eles são, vocês sabe, criminosos.
-
Eles não são irmãos nem são próximos de outra maneira.
-
Eles não tem nenhum tipo de lealdade.
-
Veremos que eles racionalmente escolherão,
-
ou eles deveriam racionalmente escolherão um cenário não-ótimo.
-
E para entender isto eu desenharei algo
-
chamado de "matriz de retornos".
-
Então farei aqui para o Bill.
-
Então Bill tem duas opções, ele pode confessar o assalto
-
ou ele pode negar que tenha feito algo,
-
que ele saiba algo sobre o assalto armado.
-
E Alan tem as mesmas duas opções.
-
Alan pode confessar, ou negar.
-
E já que é chamada de matriz de retornos,
-
deixe-me desenhar algumas grades aqui.
-
E vamos pensar em todos os cenários diferentes
-
e quais seriam os retornos de cada um.
-
Se Al confessar e Bill confessar,eles estarão no cenário quatro,
-
ambos pegam três anos de prisão, pegariam
-
três para Alan, e três para Bill.
-
Agora, se Alan confessar e Bill negar,
-
estaremos no cenário dois no ponto de vista de Alan,
-
Alan pegará apenas um ano,
-
mas Bill pegará 10 anos.
-
Se o oposto ocorrer,
-
se Bill confessar e Al negar,
-
então acontecerá o contrário.
-
Al pegará 10 anos por não cooperar e
-
Bill terá sua sentença reduzida para um ano devido a sua cooperação.
-
Se ambos negarem, eles estarão no cenário um, onde
-
ambos pegarão o tempo pela venda de drogas.
-
Então Al pegaria dois anos e Bill pegaria dois anos.
-
Agora, fiz referência a isto no início do vídeo:
-
qual o cenário ótimo global para eles?
-
Bem, este é o cenário, onde
-
ambos negam ter qualquer coisa a ver com o assalto,
-
e então ambos pegam dois anos.
-
Mas o que veremos é que é um tanto racional,
-
assumindo que eles não tem nenhuma lealdade um com o outro,
-
ou um grande nível de confiança com a outra parte,
-
é na verdade racional para ambos confessar.
-
E a confissão é na verdade o Equilíbrio de Nash.
-
E falaremos mais sobre isto.
-
O Equilíbrio de Nash é onde cada parte fez uma escolha
-
dada a escolha da outra parte.
-
Então se pensarmos nisto, ou cada parte escolherá a escola ótima
-
dadas as escolhas feitas, ou dadas quaisquer que sejam as escolhas de outra parte.
-
Do ponto de vista de Alan, eles diz: "bem,
-
eu não sei se Bill estão confessando ou negando..
-
então, digamos que ele confesse, o que é melhor para mim?
-
Se ele confessar e eu confessar, pegarei três anos.
-
Se ele confessar e eu negar, pegarei 10 anos.
-
Então se ele confessa, é melhor que eu confesse também.
-
Então este é um cenário preferível a este aqui.
-
Eu não sei se Bill confessou, ele pode negar.
-
Se eu assumir que Bill negou, é melhor eu confessar
-
e pegar um ano, ou negar e pegar dois anos?
-
Novamente, é melhor para mim confessar.
-
Então, independentemente se Bill confessa ou nega,
-
novamente, a escolha ótima para Alan,
-
levando em conta a escolha de Bill, é confessar.
-
Se Bill confessa, o melhor para Alan é confessar.
-
Se Bill nega, o melhor para Alan é confessar.
-
Agora olhamos do ponto de vista de Bill,
-
e é completamente simétrico.
-
Bill diz: "eu não sei se Alan está confessando ou negando.
-
Se Al confessa, eu posso confessar e pegar três anos,
-
ou eu posso negar e pegar 10 anos.
-
Bem, três anos na prisão é melhor do que 10,
-
então eu escolheria três.
-
Se eu soubesse que Alan está confessando.
-
Mas eu não sei se Alan está confessando, ele pode negar.
-
Se Al está negando, eu poderia confessar e pegar um ano
-
ou poderia negar e pegar dois anos.
-
Bem, novamente, eu confessaria e pegaria um ano.
-
Então para Bill, levando em conta cada cenário que Alan poderia escolher,
-
é sempre melhor confessar.
-
Isto é interessante.
-
Eles estão racionalmente deduzindo que deveriam escolher este cenário,
-
este estado de Equilíbrio de Nash,
-
se opondo ao estado de ótimo global.
-
Ambos estão pegando três anos por confessarem
-
opondo-se a pegar dois anos negando.
-
O problema é que este é um estado instável.
-
Se um deles assumir que o outro tem,
-
se um deles assumir que
-
eles estão de algum modo temporariamente naquele estado.
-
Eles dizem: "bem, eu posso sempre melhorar o meu cenário
-
mudando o que eu quero fazer".
-
Se Al tivesse certeza que Bill negaria,
-
Al poderia melhorar sua situação saindo daquele estado
-
e confessando e pegando um ano.
-
Do mesmo modo, se Bill achasse que Al tenderia a negar,
-
ele perceberia que poderia otimizar sua situação movendo nesta direção
-
ao invés de negar e pegar dois e dois.
-
Ele poderia se mover nesta direção bem aqui.
-
Então este é um cenário ótimo instável,
-
mas este Equilíbrio de Nash, este estado bem aqui
-
é na verdade muito, muito, muito estável.
-
Se eles assumirem...isto é, é melhor para cada um deles confessar,
-
não importa o que o outro faça,
-
e assumindo que todos os outros atores escolheram esta estratégia,
-
não há incentivo para Bill.
-
Então...assumindo que todos mudaram sua estratégia
-
você pode mudar apenas nesta direção, se você for o Bill você também pode...
-
você pode ir do Equilíbrio de Nash à negação,
-
mas você estará pior, então você não quer fazer isso.
-
Ou você poderia se mover nesta direção,
-
onde Alan mudaria sua decisão.
-
Mas novamente isto resulta em um pior resultado para Al
-
você vai de três para 10 anos.
-
Então este é o estado de equilíbrio, o estado estável,
-
onde ambos escolheriam algo
-
que não é um ótimo global.