Return to Video

O Dilema do Prisioneiro e o Equilíbrio de Nash

  • 0:01 - 0:06
    No mesmo dia, a polícia fez duas prisões em flagrante.
  • 0:06 - 0:09
    Eles prenderam um senhor chamado Alan.
  • 0:09 - 0:11
    Ele foi pego em flagrante vendendo drogas.
  • 0:11 - 0:13
    Então é um caso já solucionado.
  • 0:13 - 0:17
    E no mesmo dia eles prenderam um homem chamado Bill,
  • 0:17 - 0:20
    e ele também foi pego vendendo drogas em flagrante.
  • 0:20 - 0:23
    Eles foram levados separadamente à delegacia
  • 0:23 - 0:26
    e lhes foi dito: "olhe, este é um caso já resolvido,
  • 0:26 - 0:28
    você será condenado por venda de drogas
  • 0:28 - 0:29
    e você pegará dois anos de prisão."
  • 0:29 - 0:31
    Isto foi dito para cada um individualmente.
  • 0:31 - 0:34
    Eles estão vendendo o mesmo tipo de drogas.
  • 0:34 - 0:35
    Mas estavam fazendo isto completamente de forma independente.
  • 0:35 - 0:40
    Dois anos pelas drogas, isto é o que acontecerá,
  • 0:40 - 0:42
    assumindo nada mais.
  • 0:42 - 0:44
    Mas então o advogado do Distrito teve a chance
  • 0:44 - 0:46
    de conversar com cada um separadamente.
  • 0:46 - 0:49
    E durante a conversa, ele reforça a ideia de
  • 0:49 - 0:51
    que é um caso já solucionado pela venda de drogas.
  • 0:51 - 0:54
    Cada um pegará dois anos se nada mais acontecer.
  • 0:54 - 0:56
    Mas então ele começou a perceber que
  • 0:56 - 0:59
    os dois indivíduos eram familiares.
  • 0:59 - 1:01
    Ele começou a suspeitar, por alguma razão,
  • 1:01 - 1:03
    que eles eram os dois indivíduos que cometeram
  • 1:03 - 1:06
    uma infração muito mais grave, que eles tinham cometido
  • 1:06 - 1:09
    um grande assalto armado poucas semanas antes.
  • 1:09 - 1:13
    E então o advogado teve que continuar com
  • 1:13 - 1:18
    sua intuição, sua suspeita. Ele não tinha nenhuma evidência.
  • 1:18 - 1:20
    Então o que ele quer é tentar conseguir um acordo
  • 1:20 - 1:23
    com cada um deles, então eles terão um incentivo
  • 1:23 - 1:25
    para, essencialmente, delatar um ao outro.
  • 1:25 - 1:27
    Então o que ele disse para cada um deles foi:
  • 1:27 - 1:29
    "Olhe, você pegará dois anos de prisão pela venda de drogas,
  • 1:29 - 1:33
    isto é garantido". Mas ele disse:
  • 1:33 - 1:45
    "Se você confessar, e o outro não,
  • 1:45 - 1:50
    então você pegará um ano
  • 1:50 - 1:56
    e o outro pegará 10 anos".
  • 1:56 - 2:01
    Então eles diz para Alan: "nós pegamos o Bill aleatoriamente hoje,
  • 2:01 - 2:05
    se você confessar que eram vocês dois naquele assalto armado,
  • 2:05 - 2:08
    sua sentença cairá de dois anos para um.
  • 2:08 - 2:11
    Mas Bill terá que passar muito mais tempo na prisão,
  • 2:11 - 2:14
    especialmente porque ele não estará cooperando,
  • 2:14 - 2:16
    ele não está confessando".
  • 2:16 - 2:19
    Mas a outra afirmação também é verdade:
  • 2:19 - 2:28
    se você negar e o outro confessar
  • 2:28 - 2:30
    isto se inverte.
  • 2:30 - 2:33
    Você pegará 10 anos porque você não está cooperando,
  • 2:33 - 2:38
    e o outro, pegará uma sentença reduzida,
  • 2:38 - 2:41
    pegará um ano. Então, isto é como dizer a Alan:
  • 2:41 - 2:43
    "Se você negar que estava no assalto armado
  • 2:43 - 2:45
    e Bill te entregar,
  • 2:45 - 2:48
    você pegará 10 anos de prisão
  • 2:48 - 2:50
    e Bill pegará apenas um ano de prisão".
  • 2:50 - 2:58
    E se vocês dois confessarem,
  • 2:58 - 3:03
    ambos pegarão três ano de prisão.
  • 3:03 - 3:06
    Este cenário é chamado de "O Dilema do Prisioneiro".
  • 3:06 - 3:08
    Pois logo veremos
  • 3:08 - 3:10
    que existe um cenário ótimo global para eles
  • 3:10 - 3:15
    onde ambos negam, e ambos pegam dois anos.
  • 3:15 - 3:17
    Mas veremos, baseado em seus incentivos,
  • 3:17 - 3:20
    assumindo que eles não possuem uma lealdade um com o outro,
  • 3:20 - 3:22
    e eles são, vocês sabe, criminosos.
  • 3:22 - 3:24
    Eles não são irmãos nem são próximos de outra maneira.
  • 3:24 - 3:26
    Eles não tem nenhum tipo de lealdade.
  • 3:26 - 3:30
    Veremos que eles racionalmente escolherão,
  • 3:30 - 3:33
    ou eles deveriam racionalmente escolherão um cenário não-ótimo.
  • 3:33 - 3:35
    E para entender isto eu desenharei algo
  • 3:35 - 3:39
    chamado de "matriz de retornos".
  • 3:39 - 3:42
    Então farei aqui para o Bill.
  • 3:42 - 3:50
    Então Bill tem duas opções, ele pode confessar o assalto
  • 3:50 - 3:52
    ou ele pode negar que tenha feito algo,
  • 3:52 - 3:55
    que ele saiba algo sobre o assalto armado.
  • 3:55 - 3:57
    E Alan tem as mesmas duas opções.
  • 3:57 - 4:04
    Alan pode confessar, ou negar.
  • 4:04 - 4:06
    E já que é chamada de matriz de retornos,
  • 4:06 - 4:11
    deixe-me desenhar algumas grades aqui.
  • 4:11 - 4:13
    E vamos pensar em todos os cenários diferentes
  • 4:13 - 4:15
    e quais seriam os retornos de cada um.
  • 4:15 - 4:19
    Se Al confessar e Bill confessar,eles estarão no cenário quatro,
  • 4:19 - 4:26
    ambos pegam três anos de prisão, pegariam
  • 4:26 - 4:30
    três para Alan, e três para Bill.
  • 4:30 - 4:36
    Agora, se Alan confessar e Bill negar,
  • 4:36 - 4:39
    estaremos no cenário dois no ponto de vista de Alan,
  • 4:39 - 4:43
    Alan pegará apenas um ano,
  • 4:43 - 4:48
    mas Bill pegará 10 anos.
  • 4:48 - 4:49
    Se o oposto ocorrer,
  • 4:49 - 4:51
    se Bill confessar e Al negar,
  • 4:51 - 4:53
    então acontecerá o contrário.
  • 4:53 - 4:55
    Al pegará 10 anos por não cooperar e
  • 4:55 - 4:59
    Bill terá sua sentença reduzida para um ano devido a sua cooperação.
  • 4:59 - 5:06
    Se ambos negarem, eles estarão no cenário um, onde
  • 5:06 - 5:09
    ambos pegarão o tempo pela venda de drogas.
  • 5:09 - 5:16
    Então Al pegaria dois anos e Bill pegaria dois anos.
  • 5:16 - 5:18
    Agora, fiz referência a isto no início do vídeo:
  • 5:18 - 5:22
    qual o cenário ótimo global para eles?
  • 5:22 - 5:23
    Bem, este é o cenário, onde
  • 5:23 - 5:26
    ambos negam ter qualquer coisa a ver com o assalto,
  • 5:26 - 5:29
    e então ambos pegam dois anos.
  • 5:29 - 5:31
    Mas o que veremos é que é um tanto racional,
  • 5:31 - 5:34
    assumindo que eles não tem nenhuma lealdade um com o outro,
  • 5:34 - 5:36
    ou um grande nível de confiança com a outra parte,
  • 5:36 - 5:40
    é na verdade racional para ambos confessar.
  • 5:40 - 5:43
    E a confissão é na verdade o Equilíbrio de Nash.
  • 5:43 - 5:45
    E falaremos mais sobre isto.
  • 5:45 - 5:49
    O Equilíbrio de Nash é onde cada parte fez uma escolha
  • 5:49 - 5:52
    dada a escolha da outra parte.
  • 5:52 - 5:56
    Então se pensarmos nisto, ou cada parte escolherá a escola ótima
  • 5:56 - 6:01
    dadas as escolhas feitas, ou dadas quaisquer que sejam as escolhas de outra parte.
  • 6:01 - 6:03
    Do ponto de vista de Alan, eles diz: "bem,
  • 6:03 - 6:07
    eu não sei se Bill estão confessando ou negando..
  • 6:07 - 6:10
    então, digamos que ele confesse, o que é melhor para mim?
  • 6:10 - 6:13
    Se ele confessar e eu confessar, pegarei três anos.
  • 6:13 - 6:16
    Se ele confessar e eu negar, pegarei 10 anos.
  • 6:16 - 6:19
    Então se ele confessa, é melhor que eu confesse também.
  • 6:19 - 6:23
    Então este é um cenário preferível a este aqui.
  • 6:23 - 6:26
    Eu não sei se Bill confessou, ele pode negar.
  • 6:26 - 6:30
    Se eu assumir que Bill negou, é melhor eu confessar
  • 6:30 - 6:33
    e pegar um ano, ou negar e pegar dois anos?
  • 6:33 - 6:36
    Novamente, é melhor para mim confessar.
  • 6:36 - 6:39
    Então, independentemente se Bill confessa ou nega,
  • 6:39 - 6:43
    novamente, a escolha ótima para Alan,
  • 6:43 - 6:46
    levando em conta a escolha de Bill, é confessar.
  • 6:46 - 6:49
    Se Bill confessa, o melhor para Alan é confessar.
  • 6:49 - 6:51
    Se Bill nega, o melhor para Alan é confessar.
  • 6:51 - 6:53
    Agora olhamos do ponto de vista de Bill,
  • 6:53 - 6:54
    e é completamente simétrico.
  • 6:54 - 6:59
    Bill diz: "eu não sei se Alan está confessando ou negando.
  • 6:59 - 7:02
    Se Al confessa, eu posso confessar e pegar três anos,
  • 7:02 - 7:04
    ou eu posso negar e pegar 10 anos.
  • 7:04 - 7:06
    Bem, três anos na prisão é melhor do que 10,
  • 7:06 - 7:09
    então eu escolheria três.
  • 7:09 - 7:11
    Se eu soubesse que Alan está confessando.
  • 7:11 - 7:14
    Mas eu não sei se Alan está confessando, ele pode negar.
  • 7:14 - 7:18
    Se Al está negando, eu poderia confessar e pegar um ano
  • 7:18 - 7:20
    ou poderia negar e pegar dois anos.
  • 7:20 - 7:24
    Bem, novamente, eu confessaria e pegaria um ano.
  • 7:24 - 7:28
    Então para Bill, levando em conta cada cenário que Alan poderia escolher,
  • 7:28 - 7:33
    é sempre melhor confessar.
  • 7:33 - 7:35
    Isto é interessante.
  • 7:35 - 7:39
    Eles estão racionalmente deduzindo que deveriam escolher este cenário,
  • 7:39 - 7:41
    este estado de Equilíbrio de Nash,
  • 7:41 - 7:44
    se opondo ao estado de ótimo global.
  • 7:44 - 7:47
    Ambos estão pegando três anos por confessarem
  • 7:47 - 7:49
    opondo-se a pegar dois anos negando.
  • 7:49 - 7:54
    O problema é que este é um estado instável.
  • 7:54 - 7:58
    Se um deles assumir que o outro tem,
  • 7:58 - 7:59
    se um deles assumir que
  • 7:59 - 8:01
    eles estão de algum modo temporariamente naquele estado.
  • 8:01 - 8:05
    Eles dizem: "bem, eu posso sempre melhorar o meu cenário
  • 8:05 - 8:08
    mudando o que eu quero fazer".
  • 8:08 - 8:10
    Se Al tivesse certeza que Bill negaria,
  • 8:10 - 8:14
    Al poderia melhorar sua situação saindo daquele estado
  • 8:14 - 8:16
    e confessando e pegando um ano.
  • 8:16 - 8:20
    Do mesmo modo, se Bill achasse que Al tenderia a negar,
  • 8:20 - 8:24
    ele perceberia que poderia otimizar sua situação movendo nesta direção
  • 8:24 - 8:26
    ao invés de negar e pegar dois e dois.
  • 8:26 - 8:28
    Ele poderia se mover nesta direção bem aqui.
  • 8:28 - 8:31
    Então este é um cenário ótimo instável,
  • 8:31 - 8:34
    mas este Equilíbrio de Nash, este estado bem aqui
  • 8:34 - 8:37
    é na verdade muito, muito, muito estável.
  • 8:37 - 8:41
    Se eles assumirem...isto é, é melhor para cada um deles confessar,
  • 8:41 - 8:43
    não importa o que o outro faça,
  • 8:43 - 8:47
    e assumindo que todos os outros atores escolheram esta estratégia,
  • 8:47 - 8:50
    não há incentivo para Bill.
  • 8:50 - 8:53
    Então...assumindo que todos mudaram sua estratégia
  • 8:53 - 8:58
    você pode mudar apenas nesta direção, se você for o Bill você também pode...
  • 8:58 - 9:01
    você pode ir do Equilíbrio de Nash à negação,
  • 9:01 - 9:04
    mas você estará pior, então você não quer fazer isso.
  • 9:04 - 9:06
    Ou você poderia se mover nesta direção,
  • 9:06 - 9:08
    onde Alan mudaria sua decisão.
  • 9:08 - 9:11
    Mas novamente isto resulta em um pior resultado para Al
  • 9:11 - 9:13
    você vai de três para 10 anos.
  • 9:13 - 9:16
    Então este é o estado de equilíbrio, o estado estável,
  • 9:16 - 9:18
    onde ambos escolheriam algo
  • 9:18 - 9:20
    que não é um ótimo global.
Title:
O Dilema do Prisioneiro e o Equilíbrio de Nash
Description:

A clássica exposição do Dilema do Prisioneiro, introduzindo o conceito do Equilíbrio de Nash.

Legendagem (Portuguese, Brazilian): Eloá Davanzo.

more » « less
Video Language:
English
Duration:
09:21

Portuguese, Brazilian subtitles

Revisions