Return to Video

囚犯兩難和奈許均衡 Prisoners' Dilemma and Nash Equilibrium

  • 0:01 - 0:06
    在同一天,警察逮捕兩個起初沒有關聯的犯人
  • 0:06 - 0:09
    他們逮捕了一個叫艾倫的先生
  • 0:09 - 0:11
    他們當場抓到他在販毒
  • 0:11 - 0:13
    所以,這是個簡單明瞭的案子
  • 0:13 - 0:17
    還有,在同一天,他們抓到另個叫比爾的先生
  • 0:17 - 0:20
    他也是當場被抓到販毒
  • 0:20 - 0:23
    後來他們被分開帶到警察局
  • 0:23 - 0:26
    然後警方告訴他們:"看吧,這是簡單明瞭的案子
  • 0:26 - 0:28
    你犯了買賣毒品的罪
  • 0:28 - 0:29
    而且你將會因此被關兩年"
  • 0:29 - 0:31
    警方將這段話個別告訴兩人
  • 0:31 - 0:34
    他們正好販賣的是同類型的毒品
  • 0:34 - 0:35
    但是他們完全獨立地的做這件事
  • 0:35 - 0:40
    他們將會因為毒品被關兩年
  • 0:40 - 0:42
    假設沒有其他因素
  • 0:42 - 0:44
    但這時檢察官有個機會
  • 0:44 - 0:46
    和兩位先生各別獨立談話
  • 0:46 - 0:49
    當他和他們談話時,他強化了想法:
  • 0:49 - 0:51
    這是個簡單明瞭的販毒案
  • 0:51 - 0:54
    如果沒有意外的話,他們將被關兩年
  • 0:54 - 0:56
    但此時他開始看清了
  • 0:56 - 0:59
    這兩個人的樣子
  • 0:59 - 1:01
    無論出於何種原因,他開始懷疑
  • 1:01 - 1:03
    這兩個人是否犯下
  • 1:03 - 1:06
    一個更嚴重的罪行,
  • 1:06 - 1:09
    就是幾周前的重大武裝搶劫案
  • 1:09 - 1:13
    所有的檢察官繼續跟著
  • 1:13 - 1:18
    他的直覺和他的懷疑. 但是他並沒有明確的證據
  • 1:18 - 1:20
    所以他想做的事是試圖和那些傢伙做個交易
  • 1:20 - 1:23
    使得他們有動機
  • 1:23 - 1:25
    確確實實地對彼此打小報告
  • 1:25 - 1:27
    所以他對各別兩人說:
  • 1:27 - 1:29
    "看吧,你將因為販毒被關兩年
  • 1:29 - 1:33
    這某方面已成定局", 但是他說:
  • 1:33 - 1:45
    "看看,如果你招供,但另一個人若沒這麼做的話
  • 1:45 - 1:50
    那麼你將只被關一年
  • 1:50 - 1:56
    而另外一個傢伙將會被關十年"
  • 1:56 - 2:01
    所以他告訴艾倫:"你看,我們今天剛好隨機抓到比爾
  • 2:01 - 2:05
    如果你招供是你和比爾犯下那件武裝搶案的話
  • 2:05 - 2:08
    你的刑期可以確實地從兩年減為一年
  • 2:08 - 2:11
    但是比爾顯然必須花更多的時間待在監獄裡
  • 2:11 - 2:14
    尤其是因為他不和我們合作
  • 2:14 - 2:16
    他不供出事實"
  • 2:16 - 2:19
    但同時另個敘述也是如此:
  • 2:19 - 2:28
    如果你否認而另個人招認的話
  • 2:28 - 2:30
    那現在情況就轉換過來
  • 2:30 - 2:33
    你將會被關十年,因為你不合作
  • 2:33 - 2:38
    而另個人,你的共犯將會得到減刑
  • 2:38 - 2:41
    只要被關一年, 所以這像是在告訴艾倫
  • 2:41 - 2:43
    "看吧,如果你否認你是武裝搶匪
  • 2:43 - 2:45
    而比爾又打你的小報告
  • 2:45 - 2:48
    那時你將會被關在牢裡十年
  • 2:48 - 2:50
    而比爾只被關在牢裡一年"
  • 2:50 - 2:58
    還有如果你們兩人都據實以告,都招供的話
  • 2:58 - 3:03
    你們兩個都將被關三年
  • 3:03 - 3:06
    所以這樣的情形就是所謂的"囚犯兩難"
  • 3:06 - 3:08
    因為我們將可看到
  • 3:08 - 3:10
    對他們來說有一個全體最適的情形
  • 3:10 - 3:15
    當他們兩者都否認,那麼兩人都關兩年
  • 3:15 - 3:17
    但我們可以瞭解到,根據他們的動機
  • 3:17 - 3:20
    假設他們對彼此並沒有特別的忠誠
  • 3:20 - 3:22
    而且如你所知道的,這些傢伙是慣犯
  • 3:22 - 3:24
    他們並非親兄弟或以任何方式彼此有關聯
  • 3:24 - 3:26
    他們沒有任何的忠誠心可言
  • 3:26 - 3:30
    我們將可以看到他們會理性地選擇一個並非
  • 3:30 - 3:33
    或他們可能會選擇一個非最適的情況
  • 3:33 - 3:35
    還有瞭解到我現在將畫些東西
  • 3:35 - 3:39
    這叫做"報酬(償付)矩陣", 一個報酬矩陣
  • 3:39 - 3:42
    所以讓我在這填上比爾的情況
  • 3:42 - 3:50
    所以比爾有兩個選擇, 他可以招認武裝搶案
  • 3:50 - 3:52
    或者否認他做過的任何事
  • 3:52 - 3:55
    他知道武裝搶案的一切
  • 3:55 - 3:57
    而艾倫也有相同的兩個選項
  • 3:57 - 4:04
    艾倫可以坦白招供也可以否認
  • 4:04 - 4:06
    因為它是所為的報酬矩陣
  • 4:06 - 4:11
    讓我在這裡畫些格子
  • 4:11 - 4:13
    然後讓我們一起考慮所有不同可能的情形
  • 4:13 - 4:15
    還有這些報酬該是如何
  • 4:15 - 4:19
    如果艾倫招供且比爾也招供,那麼他們會是第四種情形
  • 4:19 - 4:26
    他們兩人都會被關三年,
  • 4:26 - 4:30
    艾倫三年,比爾也是三年
  • 4:30 - 4:36
    現在,如果艾倫招供而比爾否認
  • 4:36 - 4:39
    那們我們會在第二種情形, 從艾倫的觀點
  • 4:39 - 4:43
    艾倫將只會被關一年
  • 4:43 - 4:48
    但是比爾卻面臨十年的牢獄之災
  • 4:48 - 4:49
    現在如果相反的情形發生
  • 4:49 - 4:51
    也就是比爾招供而艾倫否認
  • 4:51 - 4:53
    那麼結果將會是另種情況
  • 4:53 - 4:55
    艾倫將會因為他的不合作而被關十年
  • 4:55 - 4:59
    而比爾將會因為他的合作而被減刑至一年
  • 4:59 - 5:06
    而如果他們兩人都否認,他們會是第一種情形
  • 5:06 - 5:09
    他們將只會和他們只有販毒時一樣
  • 5:09 - 5:16
    所以艾倫將會被關兩年且比爾也是兩年
  • 5:16 - 5:18
    現在,我在影片一開始提到的
  • 5:18 - 5:22
    對他們而言什麼是全體(全面)最適的情況?
  • 5:22 - 5:23
    很好, 就是這種情形
  • 5:23 - 5:26
    他們都否認做過任何和武裝搶劫有關的事
  • 5:26 - 5:29
    然後他們都被關兩年
  • 5:29 - 5:31
    但我們將看到那裏實際上是有幾分理性的
  • 5:31 - 5:34
    假設他們對彼此並沒有強烈的忠誠
  • 5:34 - 5:36
    或是對他們另一方高程度的信任
  • 5:36 - 5:40
    為了不走到那一步, 確實理性的情形是他們都招供
  • 5:40 - 5:43
    而招供就是所謂的"奈許(Nash)均衡"
  • 5:43 - 5:45
    關於這個我們將談論論更多
  • 5:45 - 5:49
    而奈許均衡是雙方在給定對方的做出的選擇下
  • 5:49 - 5:52
    而做出的選擇
  • 5:52 - 5:56
    所以我們想的是,雙方做的最適選擇是
  • 5:56 - 6:01
    在給定所有選擇或給定對方所做的任何選擇
  • 6:01 - 6:03
    所以從艾倫的觀點,他說到:"好吧,
  • 6:03 - 6:07
    我不知道比爾招供還是否認
  • 6:07 - 6:10
    所以讓我,讓我們說他招供好了,那怎麼做對我才比較好?
  • 6:10 - 6:13
    如果他招供而我招供的話,那我被關三年
  • 6:13 - 6:16
    而如果他招供我否認的話,我將會被關十年
  • 6:16 - 6:19
    所以如果他招供的話,對我而言我最好也是招供
  • 6:19 - 6:23
    所以這是到這裡最好的情況
  • 6:23 - 6:26
    現在我並不知道比爾招供了沒.他可能否認
  • 6:26 - 6:30
    如果我假設比爾否認,那對我而言最好是招供
  • 6:30 - 6:33
    這樣是被關一年,不然我要否認而被關兩年嗎?
  • 6:33 - 6:36
    再一次,對我而言最好還是招供
  • 6:36 - 6:39
    所以不管比爾招供或否認與否
  • 6:39 - 6:43
    這裡再次顯示對艾倫來說他在考慮到比爾的選擇下
  • 6:43 - 6:46
    他的最適選擇是招認一切
  • 6:46 - 6:49
    如果比爾招供,艾倫最好是招供
  • 6:49 - 6:51
    如果比爾否認,艾倫最好也是招供
  • 6:51 - 6:53
    現在我們來看看比爾的觀點
  • 6:53 - 6:54
    而這是完全對稱的情況
  • 6:54 - 6:59
    如果比爾說:"呃,我不清楚艾倫是招供還是否認
  • 6:59 - 7:02
    如果艾倫招供的話,我可以招供這樣是被關三年
  • 7:02 - 7:04
    或者是我可以否認但被關十年
  • 7:04 - 7:06
    嗯,被關三年比被關十年好
  • 7:06 - 7:09
    所以我會選擇關三年
  • 7:09 - 7:11
    如果我知道艾倫招供的話
  • 7:11 - 7:14
    但我不知道艾倫是否的確招供,他有可能否認
  • 7:14 - 7:18
    如果艾倫否認的話,我可以招供,這樣只被關一年
  • 7:18 - 7:20
    或者我可以否認,這樣是被關兩年
  • 7:20 - 7:24
    再一次,我想要招出一切這樣只要被關一年
  • 7:24 - 7:28
    所以比爾考慮到艾倫可能採取的所有可能情形
  • 7:28 - 7:33
    對他來說,招供都是最好的選擇
  • 7:33 - 7:35
    所以這挺有趣的
  • 7:35 - 7:39
    他們理性的推斷他們應該在這種情況
  • 7:39 - 7:41
    也就是奈許均衡的狀態
  • 7:41 - 7:44
    但卻和全體最適的情況有違
  • 7:44 - 7:47
    他們都被關三年因為兩者都招供
  • 7:47 - 7:49
    和兩人都否認的時候只要被關兩年的情況相違背
  • 7:49 - 7:54
    這裡的問題是,這是一個不穩定的狀態
  • 7:54 - 7:58
    如果當中的一人假設另外一人
  • 7:58 - 7:59
    如果當中的一人假設
  • 7:59 - 8:01
    他們不知怎麼地暫時在那樣的狀態
  • 8:01 - 8:05
    他們說:"嗯,我可以改善我的處境
  • 8:05 - 8:08
    透過改變我的,改變我想做的事
  • 8:08 - 8:10
    如果艾倫認為比爾確實否認一切
  • 8:10 - 8:14
    艾倫可以改善他的狀態,藉由移出那情況
  • 8:14 - 8:16
    且坦白招供,只要被關一年
  • 8:16 - 8:20
    同樣地,如果比爾認為艾倫很有可能否認
  • 8:20 - 8:24
    他會了解到他可以藉由移到這方向來最適化
  • 8:24 - 8:26
    而不是否認因而被關兩年
  • 8:26 - 8:28
    他可以馬上移動到那方向
  • 8:28 - 8:31
    所以這是一個不穩定的情況
  • 8:31 - 8:34
    但這是奈許均衡,這情形在這裡
  • 8:34 - 8:37
    是真的,非常,非常,非常穩定的
  • 8:37 - 8:41
    如果他們假設...對他們來說最好還是招供比較好
  • 8:41 - 8:43
    不管另個人怎麼做
  • 8:43 - 8:47
    還有假設所有其他行動者已經選擇好他們的策略
  • 8:47 - 8:50
    這裡對比爾來說沒有任何動機
  • 8:50 - 8:53
    所以如果我們假設其他所有人已經改變他們的策略
  • 8:53 - 8:58
    你只可以移到那個方向,如果你是比爾也一樣
  • 8:58 - 9:01
    你可以從奈許均衡的招供移到否認的情況
  • 9:01 - 9:04
    但逆會變得更糟,所以你並不會想那樣做
  • 9:04 - 9:06
    或者你可以移動到這方向
  • 9:06 - 9:08
    這裡艾倫將會改變他的決定
  • 9:08 - 9:11
    但是這對艾倫來說,又再一次是更糟的結果
  • 9:11 - 9:13
    你會從被關三年變成被關十年
  • 9:13 - 9:16
    所以這是均衡狀態,穩定的狀態
  • 9:16 - 9:18
    兩人將會採取某個
  • 9:18 - 9:20
    並非全體最適的選擇
Title:
囚犯兩難和奈許均衡 Prisoners' Dilemma and Nash Equilibrium
Description:

對囚犯兩難經典的解釋,同時介紹奈許均衡的概念
The classical exposition of the Prisoner's Dilemma, as a way to introduce the concept of Nash equilibrium

more » « less
Video Language:
English
Duration:
09:21

Chinese, Traditional subtitles

Revisions