Return to Video

O Dilema dos Prisioneiros e o Equilíbrio de Nash

  • 0:01 - 0:06
    Num mesmo dia, a polícia fez duas prisões
    a princípio não relacionadas.
  • 0:06 - 0:09
    Prenderam um senhor chamado Al.
  • 0:09 - 0:11
    Pegaram-no "com a boca na botija" vendendo drogas.
  • 0:11 - 0:13
    Então, é um caso simples de resolver.
  • 0:13 - 0:17
    No mesmo dia, pegaram também
    um senhor chamado Bill,
  • 0:17 - 0:20
    e também o pegaram "com a boca na botija" vendendo drogas.
  • 0:20 - 0:23
    E levam os dois separadamente para a delegacia
  • 0:23 - 0:26
    e dizem a eles, "olha, é um caso simples de resolver
  • 0:26 - 0:28
    você será condenado por vender drogas
  • 0:28 - 0:29
    e vai pegar dois anos de cadeia."
  • 0:29 - 0:31
    E dizem isso a eles separadamente.
  • 0:31 - 0:34
    Eles estavam vendendo o mesmo tipo de drogas, simplesmente era isso.
  • 0:34 - 0:35
    Mas eles estavam fazendo isso completamente independentes.
  • 0:35 - 0:40
    Dois anos por vender drogas é o que vai acontecer,
  • 0:40 - 0:42
    assumindo que não haja mais nada.
  • 0:42 - 0:44
    Mas então o Promotor tem a oportunidade
  • 0:44 - 0:46
    de conversar com cada um desses senhores separadamente.
  • 0:46 - 0:49
    E enquanto está conversando com eles, ele reforça a ideia
  • 0:49 - 0:51
    de que este é um caso simples de resolver por venda de drogas.
  • 0:51 - 0:54
    Cada um pegará 2 anos se mais nada acontecer.
  • 0:54 - 0:56
    Mas então ele começa a perceber que
  • 0:56 - 0:59
    esses dois personagens, ao que parece,
  • 0:59 - 1:01
    Ele começa a suspeitar por alguma razão
  • 1:01 - 1:03
    de que esses foram dois personagens de fato condenados
  • 1:03 - 1:06
    por um crime muito mais sério, que eles haviam cometido
  • 1:06 - 1:09
    um roubo a mão armada algumas semanas antes.
  • 1:09 - 1:13
    Tudo o que o Promotor tem a suportá-lo
  • 1:13 - 1:18
    é sua intuição, sua suspeita. Ele não tem qualquer prova concreta.
  • 1:18 - 1:20
    Então, o que ele quer é tentar um acordo
  • 1:20 - 1:23
    com cada um desses caras, para que eles tenham um incentivo
  • 1:23 - 1:25
    para, essencialmente, dedurar um ao outro.
  • 1:25 - 1:27
    Então o que ele diz a cada um deles é
  • 1:27 - 1:29
    "Olhe, você pegará dois anos por vender drogas.
  • 1:29 - 1:33
    isto está garantido." Mas ele diz
  • 1:33 - 1:45
    "Olhe, se você confessar e o outro cara, não,
  • 1:45 - 1:50
    então você pegará 1 ano
  • 1:50 - 1:56
    e o outro cara pegará 10 anos."
  • 1:56 - 2:01
    Então ele está dizendo para o Al: "Olhe, nós pegamos o Bill também hoje por acaso,
  • 2:01 - 2:05
    se você confessar que foram vocês dois que praticaram aquele roubo a mão armada,
  • 2:05 - 2:08
    sua sentença será de fato reduzida de 2 para 1 ano.
  • 2:08 - 2:11
    Mas Bill vai obviamente ter que passar muito mais tempo na cadeia,
  • 2:11 - 2:14
    especialmente porque ele não está cooperando conosco,
  • 2:14 - 2:16
    ele não está confessando."
  • 2:16 - 2:19
    Mas então, a outra afirmação também é verdadeira:
  • 2:19 - 2:28
    "Se você negar e o outro confessar
  • 2:28 - 2:30
    a coisa se inverte.
  • 2:30 - 2:33
    Você pegará 10 anos porque não está cooperando,
  • 2:33 - 2:38
    e o outro, o seu cúmplice, terá a sentença redizida,
  • 2:38 - 2:41
    pegará 1 ano." Então isto é como dizer ao Al
  • 2:41 - 2:43
    "Olhe, se você negar que você era o ladrão a mão armada
  • 2:43 - 2:45
    e Bill dedurar você,
  • 2:45 - 2:48
    então você vai passar 10 anos na cadeia
  • 2:48 - 2:50
    e Bill só vai pegar 1 ano.
  • 2:50 - 2:58
    E se ambos confessarem,
  • 2:58 - 3:03
    ambos pegarão 3 anos."
  • 3:03 - 3:06
    Então, este cenário é chamado "O dilema do prisioneiro".
  • 3:06 - 3:08
    Porque veremos em um instante
  • 3:08 - 3:10
    que há um cenário ideal para eles
  • 3:10 - 3:15
    em que ambos negam, e ambos pegam 2 anos.
  • 3:15 - 3:17
    Mas veremos que, baseado nos incentivos,
  • 3:17 - 3:20
    assumindo que eles não tenham alguma lealdade incomum entre eles,
  • 3:20 - 3:22
    e estes são criminosos barra pesada.
  • 3:22 - 3:24
    Eles não são irmãos ou tem qualquer outra relação.
  • 3:24 - 3:26
    Eles não tem qualquer tipo de pacto de lealdade.
  • 3:26 - 3:30
    Veremos que eles racionalmente escolherão
  • 3:30 - 3:33
    ou poderão racionalmente escolher um cenário que não é ideal.
  • 3:33 - 3:35
    Para entender isto, eu vou desenhar algo
  • 3:35 - 3:39
    chamado "matriz de retornos".
  • 3:39 - 3:42
    Então vou fazer aqui para Bill.
  • 3:42 - 3:50
    Bill tem duas opções, ele pode confessar o assalto a mão armada
  • 3:50 - 3:52
    ou ele pode negar que tenha algo,
  • 3:52 - 3:55
    que ele saiba algo sobre o assalto a mão armada.
  • 3:55 - 3:57
    E Al tem as mesmas duas opções.
  • 3:57 - 4:04
    Al pode confessar e Al pode negar.
  • 4:04 - 4:06
    E como isto é chamado "matriz de retornos"
  • 4:06 - 4:11
    vou desenhar uma grade aqui.
  • 4:11 - 4:13
    Vamos pensar sobre todos os diferentes cenários
  • 4:13 - 4:15
    e o quais seriam os retornos.
  • 4:15 - 4:19
    Se Al confessar e Bill confessar, então eles estão no cenário 4,
  • 4:19 - 4:26
    ambos pegam 3 anos de cadeia, então ambos
  • 4:26 - 4:30
    pegam: 3 para Al, 3 para Bill.
  • 4:30 - 4:36
    Agora, se Al confessar e Bill negar
  • 4:36 - 4:39
    então estamos no cenário 2, do ponto de vista de Al,
  • 4:39 - 4:43
    Al só pegará 1 ano,
  • 4:43 - 4:48
    mas Bill pegará 10 anos.
  • 4:48 - 4:49
    Agora, se o oposto acontecer,
  • 4:49 - 4:51
    Bill confessar e Al negar
  • 4:51 - 4:53
    então acontece o contrário.
  • 4:53 - 4:55
    Al pegará 10 anos por não cooperar e
  • 4:55 - 4:59
    Bill terá a sentença reduzida a 1 ano por cooperar.
  • 4:59 - 5:06
    E se ambos negarem, eles estão no cenário 1, onde
  • 5:06 - 5:09
    ambos só pegam o tempo pela venda de drogas.
  • 5:09 - 5:16
    Então Al pegaria 2 anos e Bill pegaria 2 anos.
  • 5:16 - 5:18
    Agora, eu disse isto antes no vídeo:
  • 5:18 - 5:22
    qual é o cenário ideal para eles?
  • 5:22 - 5:23
    Bem, este é o cenário, onde
  • 5:23 - 5:26
    ambos negamter algo a ver com o assalto a mão armada,
  • 5:26 - 5:29
    e pegam 2 anos.
  • 5:29 - 5:31
    Mas o que nós veremos é que é deveras racional,
  • 5:31 - 5:34
    assumindo que eles não tenham nenhuma forte lealdade mútua,
  • 5:34 - 5:36
    um forte nível de confiança no outro,
  • 5:36 - 5:40
    a não fazer isto, é de fato racional para ambos confessar.
  • 5:40 - 5:43
    E a confissão é de fato um "Equilíbrio de Nash".
  • 5:43 - 5:45
    Vamos falar mais sobre isto.
  • 5:45 - 5:49
    Mas um Equilíbrio de Nash é quando cada parte escolhe uma opção
  • 5:49 - 5:52
    de acordo com as opções da outra parte.
  • 5:52 - 5:56
    Ou cada parte escolheu sua melhor opção
  • 5:56 - 6:01
    qualquer que seja a escolha que a outra parte fizer.
  • 6:01 - 6:03
    Então, pelo ponto de vista do Al, ele diz, vejamos,
  • 6:03 - 6:07
    "Eu não seu se Bill vai confessar ou negar,
  • 6:07 - 6:10
    então, digamos que ele confesse, o que para mim é melhor fazer?
  • 6:10 - 6:13
    Se ele confessar e eu confessar, eu pego 3 anos.
  • 6:13 - 6:16
    Se ele confessar e eu negar, eu pego 10 anos.
  • 6:16 - 6:19
    Se ele confessar, é melhor para mim que eu confesse também."
  • 6:19 - 6:23
    Então este é o cenário preferível comparado com o de baixo.
  • 6:23 - 6:26
    "Agora, eu não sei se Bill confessou, ele pode negar.
  • 6:26 - 6:30
    Se eu assumir que Bill negou, é melhor que eu confesse
  • 6:30 - 6:33
    e pegue 1 ano, ou negue e pegue 2 anos?
  • 6:33 - 6:36
    Bem, de novo, é melhor para mim confessar.
  • 6:36 - 6:39
    Então, independente de Bill confessar ou negar,
  • 6:39 - 6:43
    a escolha ideal para Al,
  • 6:43 - 6:46
    considerando as opções de Bill, é confessar
  • 6:46 - 6:49
    Se Bill confessar, Al se sairá melhor confessando.
  • 6:49 - 6:51
    Se Bill negar, Al se sairá melhor confessando.
  • 6:51 - 6:53
    Agora, veremos pelo ponto de vista de Bill,
  • 6:53 - 6:54
    e ele é completamente simétrico.
  • 6:54 - 6:59
    Se Bill disser "Bem eu não sei se Al vai conefssar ou negar.
  • 6:59 - 7:02
    Se Al confessar, eu posso confessar e pegar 3 anos,
  • 7:02 - 7:04
    ou eu posso negar e pegar 10 anos.
  • 7:04 - 7:06
    Bem, 3 anos na prisão é melhor do que 10,
  • 7:06 - 7:09
    então eu escolheria os 3 anos.
  • 7:09 - 7:11
    Se eu sei que Al vai confessar.
  • 7:11 - 7:14
    Mas eu não sei se Al vai mesmo confessar, ele pode negar.
  • 7:14 - 7:18
    Se Al for negar, eu poderia confessar e pegar 1 ano,
  • 7:18 - 7:20
    ou eu poderia negar e pegar 2 anos.
  • 7:20 - 7:24
    Bem, de novo, eu confessaria para pegar 1 ano.
  • 7:24 - 7:28
    Então Bill, considerando cada um dos cenários que Al tem,
  • 7:28 - 7:33
    é sempre melhor para ele confessar.
  • 7:33 - 7:35
    E então isto é interessante.
  • 7:35 - 7:39
    Eles estão racionalmente deduzindo que eles deveriam chegar a este cenário,
  • 7:39 - 7:41
    o estado de Equilíbrio de Nash,
  • 7:41 - 7:44
    ao contrário deste estado ideal.
  • 7:44 - 7:47
    Ambos pegarão 3 anos por confessar
  • 7:47 - 7:49
    ao contrário dos dois pegarem 3 anos por negarem.
  • 7:49 - 7:54
    O problema com este é que é um estado instável.
  • 7:54 - 7:58
    Se um deles assumir o que o outro tem.
  • 7:58 - 7:59
    se um assume isto,
  • 7:59 - 8:01
    eles estão de alguma forma neste estado temporariamente.
  • 8:01 - 8:05
    Eles dizem "Bem, eu posso sempre melhorar o meu cenário
  • 8:05 - 8:08
    mudando o meu, mudando o que eu quero fazer."
  • 8:08 - 8:10
    Se Al pensou que Bill ia definitivamente negar
  • 8:10 - 8:14
    Al pode melhorar suas circunstâncias mudando para aquele estado
  • 8:14 - 8:16
    e confessar e pegar só 1 ano.
  • 8:16 - 8:20
    Da mesma forma, se Bill tivesse pensado que talvez o Al fosse negar
  • 8:20 - 8:24
    ele percebe que pode otimizar mudando nesta direção
  • 8:24 - 8:26
    em vez de negar e pegar 2 e 2
  • 8:26 - 8:28
    ele pode mudar nesta direção para ali.
  • 8:28 - 8:31
    Então este é um cenário ótimo instável,
  • 8:31 - 8:34
    mas este é o Equilíbrio de Nash, este estado aqui
  • 8:34 - 8:37
    é de fato muito, muito, muito estável.
  • 8:37 - 8:41
    É melhor para cada um deles confessar
  • 8:41 - 8:43
    independente do que o outro fizer,
  • 8:43 - 8:47
    e assumindo que todas as outras partes tenham escolhido sua estratégia,
  • 8:47 - 8:50
    não há incentivo para Bill.
  • 8:50 - 8:53
    Então, se assumindo que todos mudaram para esta estratégia
  • 8:53 - 8:58
    você só pode ir nesta direção, se você é Bill você pode...
  • 8:58 - 9:01
    você pode ir do Equilíbrio de Nash de confessar para negar,
  • 9:01 - 9:04
    mas você vai se dar pior, então você não vai querer fazer isto.
  • 9:04 - 9:06
    Ou você pode ir nesta direção,
  • 9:06 - 9:08
    onde Al mudaria sua decisão.
  • 9:08 - 9:11
    Mas de novo isto gera um resultado pior para Al
  • 9:11 - 9:13
    você vai de 3 para 10 anos.
  • 9:13 - 9:16
    Então este é o estado de quilíbrio, o estado estável,
  • 9:16 - 9:18
    em que ambas as pessoas escolheriam algo
  • 9:18 - 9:20
    que não é ideal.
Title:
O Dilema dos Prisioneiros e o Equilíbrio de Nash
Description:

A exposição clássica do Dilema dos Prisioneiros como maneira de introduzir o conceito do Equilíbrio de Nash.

Por que dois criminosos não tão leais quererão dedurar um ao outro.

more » « less
Video Language:
English
Duration:
09:21

Portuguese subtitles

Revisions