囚犯兩難和奈許均衡 Prisoners' Dilemma and Nash Equilibrium
-
0:01 - 0:06在同一天,警察逮捕兩個起初沒有關聯的犯人
-
0:06 - 0:09他們逮捕了一個叫艾倫的先生
-
0:09 - 0:11他們當場抓到他在販毒
-
0:11 - 0:13所以,這是個簡單明瞭的案子
-
0:13 - 0:17還有,在同一天,他們抓到另個叫比爾的先生
-
0:17 - 0:20他也是當場被抓到販毒
-
0:20 - 0:23後來他們被分開帶到警察局
-
0:23 - 0:26然後警方告訴他們:"看吧,這是簡單明瞭的案子
-
0:26 - 0:28你犯了買賣毒品的罪
-
0:28 - 0:29而且你將會因此被關兩年"
-
0:29 - 0:31警方將這段話個別告訴兩人
-
0:31 - 0:34他們正好販賣的是同類型的毒品
-
0:34 - 0:35但是他們完全獨立地的做這件事
-
0:35 - 0:40他們將會因為毒品被關兩年
-
0:40 - 0:42假設沒有其他因素
-
0:42 - 0:44但這時檢察官有個機會
-
0:44 - 0:46和兩位先生各別獨立談話
-
0:46 - 0:49當他和他們談話時,他強化了想法:
-
0:49 - 0:51這是個簡單明瞭的販毒案
-
0:51 - 0:54如果沒有意外的話,他們將被關兩年
-
0:54 - 0:56但此時他開始看清了
-
0:56 - 0:59這兩個人的樣子
-
0:59 - 1:01無論出於何種原因,他開始懷疑
-
1:01 - 1:03這兩個人是否犯下
-
1:03 - 1:06一個更嚴重的罪行,
-
1:06 - 1:09就是幾周前的重大武裝搶劫案
-
1:09 - 1:13所有的檢察官繼續跟著
-
1:13 - 1:18他的直覺和他的懷疑. 但是他並沒有明確的證據
-
1:18 - 1:20所以他想做的事是試圖和那些傢伙做個交易
-
1:20 - 1:23使得他們有動機
-
1:23 - 1:25確確實實地對彼此打小報告
-
1:25 - 1:27所以他對各別兩人說:
-
1:27 - 1:29"看吧,你將因為販毒被關兩年
-
1:29 - 1:33這某方面已成定局", 但是他說:
-
1:33 - 1:45"看看,如果你招供,但另一個人若沒這麼做的話
-
1:45 - 1:50那麼你將只被關一年
-
1:50 - 1:56而另外一個傢伙將會被關十年"
-
1:56 - 2:01所以他告訴艾倫:"你看,我們今天剛好隨機抓到比爾
-
2:01 - 2:05如果你招供是你和比爾犯下那件武裝搶案的話
-
2:05 - 2:08你的刑期可以確實地從兩年減為一年
-
2:08 - 2:11但是比爾顯然必須花更多的時間待在監獄裡
-
2:11 - 2:14尤其是因為他不和我們合作
-
2:14 - 2:16他不供出事實"
-
2:16 - 2:19但同時另個敘述也是如此:
-
2:19 - 2:28如果你否認而另個人招認的話
-
2:28 - 2:30那現在情況就轉換過來
-
2:30 - 2:33你將會被關十年,因為你不合作
-
2:33 - 2:38而另個人,你的共犯將會得到減刑
-
2:38 - 2:41只要被關一年, 所以這像是在告訴艾倫
-
2:41 - 2:43"看吧,如果你否認你是武裝搶匪
-
2:43 - 2:45而比爾又打你的小報告
-
2:45 - 2:48那時你將會被關在牢裡十年
-
2:48 - 2:50而比爾只被關在牢裡一年"
-
2:50 - 2:58還有如果你們兩人都據實以告,都招供的話
-
2:58 - 3:03你們兩個都將被關三年
-
3:03 - 3:06所以這樣的情形就是所謂的"囚犯兩難"
-
3:06 - 3:08因為我們將可看到
-
3:08 - 3:10對他們來說有一個全體最適的情形
-
3:10 - 3:15當他們兩者都否認,那麼兩人都關兩年
-
3:15 - 3:17但我們可以瞭解到,根據他們的動機
-
3:17 - 3:20假設他們對彼此並沒有特別的忠誠
-
3:20 - 3:22而且如你所知道的,這些傢伙是慣犯
-
3:22 - 3:24他們並非親兄弟或以任何方式彼此有關聯
-
3:24 - 3:26他們沒有任何的忠誠心可言
-
3:26 - 3:30我們將可以看到他們會理性地選擇一個並非
-
3:30 - 3:33或他們可能會選擇一個非最適的情況
-
3:33 - 3:35還有瞭解到我現在將畫些東西
-
3:35 - 3:39這叫做"報酬(償付)矩陣", 一個報酬矩陣
-
3:39 - 3:42所以讓我在這填上比爾的情況
-
3:42 - 3:50所以比爾有兩個選擇, 他可以招認武裝搶案
-
3:50 - 3:52或者否認他做過的任何事
-
3:52 - 3:55他知道武裝搶案的一切
-
3:55 - 3:57而艾倫也有相同的兩個選項
-
3:57 - 4:04艾倫可以坦白招供也可以否認
-
4:04 - 4:06因為它是所為的報酬矩陣
-
4:06 - 4:11讓我在這裡畫些格子
-
4:11 - 4:13然後讓我們一起考慮所有不同可能的情形
-
4:13 - 4:15還有這些報酬該是如何
-
4:15 - 4:19如果艾倫招供且比爾也招供,那麼他們會是第四種情形
-
4:19 - 4:26他們兩人都會被關三年,
-
4:26 - 4:30艾倫三年,比爾也是三年
-
4:30 - 4:36現在,如果艾倫招供而比爾否認
-
4:36 - 4:39那們我們會在第二種情形, 從艾倫的觀點
-
4:39 - 4:43艾倫將只會被關一年
-
4:43 - 4:48但是比爾卻面臨十年的牢獄之災
-
4:48 - 4:49現在如果相反的情形發生
-
4:49 - 4:51也就是比爾招供而艾倫否認
-
4:51 - 4:53那麼結果將會是另種情況
-
4:53 - 4:55艾倫將會因為他的不合作而被關十年
-
4:55 - 4:59而比爾將會因為他的合作而被減刑至一年
-
4:59 - 5:06而如果他們兩人都否認,他們會是第一種情形
-
5:06 - 5:09他們將只會和他們只有販毒時一樣
-
5:09 - 5:16所以艾倫將會被關兩年且比爾也是兩年
-
5:16 - 5:18現在,我在影片一開始提到的
-
5:18 - 5:22對他們而言什麼是全體(全面)最適的情況?
-
5:22 - 5:23很好, 就是這種情形
-
5:23 - 5:26他們都否認做過任何和武裝搶劫有關的事
-
5:26 - 5:29然後他們都被關兩年
-
5:29 - 5:31但我們將看到那裏實際上是有幾分理性的
-
5:31 - 5:34假設他們對彼此並沒有強烈的忠誠
-
5:34 - 5:36或是對他們另一方高程度的信任
-
5:36 - 5:40為了不走到那一步, 確實理性的情形是他們都招供
-
5:40 - 5:43而招供就是所謂的"奈許(Nash)均衡"
-
5:43 - 5:45關於這個我們將談論論更多
-
5:45 - 5:49而奈許均衡是雙方在給定對方的做出的選擇下
-
5:49 - 5:52而做出的選擇
-
5:52 - 5:56所以我們想的是,雙方做的最適選擇是
-
5:56 - 6:01在給定所有選擇或給定對方所做的任何選擇
-
6:01 - 6:03所以從艾倫的觀點,他說到:"好吧,
-
6:03 - 6:07我不知道比爾招供還是否認
-
6:07 - 6:10所以讓我,讓我們說他招供好了,那怎麼做對我才比較好?
-
6:10 - 6:13如果他招供而我招供的話,那我被關三年
-
6:13 - 6:16而如果他招供我否認的話,我將會被關十年
-
6:16 - 6:19所以如果他招供的話,對我而言我最好也是招供
-
6:19 - 6:23所以這是到這裡最好的情況
-
6:23 - 6:26現在我並不知道比爾招供了沒.他可能否認
-
6:26 - 6:30如果我假設比爾否認,那對我而言最好是招供
-
6:30 - 6:33這樣是被關一年,不然我要否認而被關兩年嗎?
-
6:33 - 6:36再一次,對我而言最好還是招供
-
6:36 - 6:39所以不管比爾招供或否認與否
-
6:39 - 6:43這裡再次顯示對艾倫來說他在考慮到比爾的選擇下
-
6:43 - 6:46他的最適選擇是招認一切
-
6:46 - 6:49如果比爾招供,艾倫最好是招供
-
6:49 - 6:51如果比爾否認,艾倫最好也是招供
-
6:51 - 6:53現在我們來看看比爾的觀點
-
6:53 - 6:54而這是完全對稱的情況
-
6:54 - 6:59如果比爾說:"呃,我不清楚艾倫是招供還是否認
-
6:59 - 7:02如果艾倫招供的話,我可以招供這樣是被關三年
-
7:02 - 7:04或者是我可以否認但被關十年
-
7:04 - 7:06嗯,被關三年比被關十年好
-
7:06 - 7:09所以我會選擇關三年
-
7:09 - 7:11如果我知道艾倫招供的話
-
7:11 - 7:14但我不知道艾倫是否的確招供,他有可能否認
-
7:14 - 7:18如果艾倫否認的話,我可以招供,這樣只被關一年
-
7:18 - 7:20或者我可以否認,這樣是被關兩年
-
7:20 - 7:24再一次,我想要招出一切這樣只要被關一年
-
7:24 - 7:28所以比爾考慮到艾倫可能採取的所有可能情形
-
7:28 - 7:33對他來說,招供都是最好的選擇
-
7:33 - 7:35所以這挺有趣的
-
7:35 - 7:39他們理性的推斷他們應該在這種情況
-
7:39 - 7:41也就是奈許均衡的狀態
-
7:41 - 7:44但卻和全體最適的情況有違
-
7:44 - 7:47他們都被關三年因為兩者都招供
-
7:47 - 7:49和兩人都否認的時候只要被關兩年的情況相違背
-
7:49 - 7:54這裡的問題是,這是一個不穩定的狀態
-
7:54 - 7:58如果當中的一人假設另外一人
-
7:58 - 7:59如果當中的一人假設
-
7:59 - 8:01他們不知怎麼地暫時在那樣的狀態
-
8:01 - 8:05他們說:"嗯,我可以改善我的處境
-
8:05 - 8:08透過改變我的,改變我想做的事
-
8:08 - 8:10如果艾倫認為比爾確實否認一切
-
8:10 - 8:14艾倫可以改善他的狀態,藉由移出那情況
-
8:14 - 8:16且坦白招供,只要被關一年
-
8:16 - 8:20同樣地,如果比爾認為艾倫很有可能否認
-
8:20 - 8:24他會了解到他可以藉由移到這方向來最適化
-
8:24 - 8:26而不是否認因而被關兩年
-
8:26 - 8:28他可以馬上移動到那方向
-
8:28 - 8:31所以這是一個不穩定的情況
-
8:31 - 8:34但這是奈許均衡,這情形在這裡
-
8:34 - 8:37是真的,非常,非常,非常穩定的
-
8:37 - 8:41如果他們假設...對他們來說最好還是招供比較好
-
8:41 - 8:43不管另個人怎麼做
-
8:43 - 8:47還有假設所有其他行動者已經選擇好他們的策略
-
8:47 - 8:50這裡對比爾來說沒有任何動機
-
8:50 - 8:53所以如果我們假設其他所有人已經改變他們的策略
-
8:53 - 8:58你只可以移到那個方向,如果你是比爾也一樣
-
8:58 - 9:01你可以從奈許均衡的招供移到否認的情況
-
9:01 - 9:04但逆會變得更糟,所以你並不會想那樣做
-
9:04 - 9:06或者你可以移動到這方向
-
9:06 - 9:08這裡艾倫將會改變他的決定
-
9:08 - 9:11但是這對艾倫來說,又再一次是更糟的結果
-
9:11 - 9:13你會從被關三年變成被關十年
-
9:13 - 9:16所以這是均衡狀態,穩定的狀態
-
9:16 - 9:18兩人將會採取某個
-
9:18 - 9:20並非全體最適的選擇
Adam Kuo edited Chinese, Traditional subtitles for Prisoners' Dilemma and Nash Equilibrium | ||
Adam Kuo edited Chinese, Traditional subtitles for Prisoners' Dilemma and Nash Equilibrium | ||
Adam Kuo edited Chinese, Traditional subtitles for Prisoners' Dilemma and Nash Equilibrium | ||
Adam Kuo edited Chinese, Traditional subtitles for Prisoners' Dilemma and Nash Equilibrium | ||
Adam Kuo edited Chinese, Traditional subtitles for Prisoners' Dilemma and Nash Equilibrium | ||
Adam Kuo added a translation |