一件嚴重的縱火案發生後,警察在現場抓到兩個犯罪嫌疑人。事實上,正是他們一起放火燒了這座倉庫。但是,警方沒有掌握足夠的證據,只得把他們隔離囚禁起來,要求他們坦白交代。
在這種情形下,兩個囚犯都可以做出自己的選擇:或者供出他的同夥——即與警察合作,從而背叛他的同夥;或者保持沉默——也就是與他的同夥合作,而不是與警察合作。這兩個囚犯都知道,如果他倆都能保持沉默的話,就都會被釋放,因為只要他們拒不承認,警方無法給他們定罪。
但警方也很明白這一點,所以就決定對兩個囚犯來點刺激:如果他們都承認縱火,每人將被判入獄3年;如果他們都不承認,每人將因為缺乏證據而都被釋放:如果一個抵賴而另一個坦白並且願意出來作證,那麼抵賴的將被判入獄5年,還要對他施以罰款,而坦白者將被寬大處理——釋放,同時還可以得到一筆獎金。
那麼,這兩個囚犯該怎麼辦呢?是選擇互相合作還是互相背叛?
從表面上看,他們應該互相合作,保持沉默,因為這樣他們倆都能得到最好的結果:自由。但他們不得不仔細考慮對方可能採取什麼選擇。
A犯不是個傻子,他根本無法相信同夥不會向警方提供對他不利的證據,然後帶著一筆豐厚的獎賞出獄而去,讓他獨自坐牢。這種想法的誘惑力實在太大了。但他也意識到,他的同夥也不是傻子,也會同樣來這樣設想他。
所以A犯的結論是,唯一理性的選擇就是背叛同夥,把一切都告訴警方,因為如果他的同夥笨得只會保持沉默,那麼他就會是那個帶獎出獄的幸運者了。而如果他的同夥也根據這個邏輯向警方交代了,那麼,A犯反正也得服審,起碼他不必服最重的刑。
一番博弈的結果就是。這兩個囚犯按照自己的邏輯做出行動,雙雙坐牢。
上面的故事反應了人們的一種博弈心理,它在心理學上被稱作“囚徒困境”,最早是由美國普林斯頓大學的數學家增克於1950年提出來的。他當時創造出這樣一個故事是為了向美國斯坦福大學的一群心理學家們解釋什麼是博弈論。後來,“囚徒困境”演繹出許多版本,成為博弈論中最著名的案例。
“囚徒困境”告訴我們,在一個存在著相互作用的博弈中,最好的策略直接取決於對方採用的策略,特別是取決於這個策略為發展雙方合作留出多大的餘地。
在大家都非常熟悉的國內的家電大戰中,雖然不是兩個對手之間的博弈,但由於在眾多對手當中,每一方的市場份額都很大,每一個主體人的行為後果受對手行為的影響都很大,因此,其情景大概也是如此。
因而,如果清楚這種前景,雙方勾結或合作起來,都實行比較高的價格,那麼雙方都可以因為避免價格大戰而獲得較高的利潤。有人把這樣一種合作的做法,叫做“雙贏對局”。而這樣的結果,往往雙方將都是“雙贏對局”的贏家。
可惜這些聯盟也往往處於利益驅動的“囚徒困境”。而雙贏也就成為泡影。五花八門的價格聯盟總是非常短命,道理就在這裡。
在囚徒困境中,雙方不約而同地選擇背叛而坐牢,一方面的原因是與同夥合作的懲罰遠遠高於所得到的報酬,另一方面也由於這是在資訊不透明的情況下進行的一次性決策,不存在更多的後果或者後續的博弈。
舉例來說,在公共汽車上,兩個陌生人會為一個座位爭吵,如果他們認識,可能就會相互謙讓。在夜市地攤、車站和旅遊景點等人群流動性大的地方,不但商品和服務質量最差,而且假冒偽劣橫行,因為在商家和顧客之間沒有後續的博弈,顧客不大可能因為飯菜可口而再次光臨。既然是一錘子買賣,不賺白不賺。
也正是這種心理所驅使,如果一廂情願地選擇合作就要受到懲罰。約翰遜總統在向一群商業界頭面人物說明需要大量資金同前蘇聯進行導彈競賽時,曾經透過下面這個故事來說明這個道理:
1861年,一位得克薩斯州人離家前去參加南軍士兵陣營。他告訴他的鄰居他很快就會回來,這場戰爭不會費力:“因為我們能用掃帚柄揍這些北方佬。”兩年後,他才重返故里,少了一條腿。
他的鄰居向這位神情悲慘、衣衫襤褸的傷兵詢問到底發生了什麼事:“你不是說過戰爭不費力,你們能用掃帚柄揍這些北方佬嗎?”
這位士兵回答:“我們當然能,但是麻煩在於北方佬不用掃帚打仗。”
可是在生活中的大部分情境中,人與人之間都會存在一些後續的接觸和博弈。那麼在這種情況下,我們又應該如何決策呢?
顯然,一味地以德報怨不可取,因為這樣只是將別人的人生成本轉嫁到自己頭上;而一味地以怨報德也不可取,因為這樣將慢慢失去大多數的博弈夥伴和機會。
所以,最好的決策方法還是囚徒困境教給我們的:以德報德、以怨報怨的反射決策。
事實上,這也是日常生活中多數人的理性選擇,也是一個很具適應性的規則。它的有效是由於其他規則預料到它的存在,並且被設計得與它很好相處。因為要和“反射決策”很好相處,就必須採取合作態度,即使那些伺機佔便宜而不被懲罰的規則,也很快改變,因為任何想佔“反射決策”便宜的規則最終將傷害自己。
要使這一決策方式發生作用,必須滿足以下條件:
特徵是顯著而且容易識別的;
一旦被識別出來,就必須使對方明白會對一切背叛進行報復,並且使對方很難解脫。
數學家約翰·馮諾依曼曾說過:“在一個存在著相互作用的博弈中,最好的策略直接取決於對方採用的策略,特別是取決於這個策略為發展雙方合作留出多大的餘地。”
總之,反射決策能夠贏得競賽不是靠打擊對方,而是靠從對方引出使雙方都有好處的行為。
一件嚴重的縱火案發生後,警察在現場抓到兩個犯罪嫌疑人。事實上,正是他們一起放火燒了這座倉庫。但是,警方沒有掌握足夠的證據,只得把他們隔離囚禁起來,要求他們坦白交代。
在這種情形下,兩個囚犯都可以做出自己的選擇:或者供出他的同夥——即與警察合作,從而背叛他的同夥;或者保持沉默——也就是與他的同夥合作,而不是與警察合作。這兩個囚犯都知道,如果他倆都能保持沉默的話,就都會被釋放,因為只要他們拒不承認,警方無法給他們定罪。
但警方也很明白這一點,所以就決定對兩個囚犯來點刺激:如果他們都承認縱火,每人將被判入獄3年;如果他們都不承認,每人將因為缺乏證據而都被釋放:如果一個抵賴而另一個坦白並且願意出來作證,那麼抵賴的將被判入獄5年,還要對他施以罰款,而坦白者將被寬大處理——釋放,同時還可以得到一筆獎金。
那麼,這兩個囚犯該怎麼辦呢?是選擇互相合作還是互相背叛?
從表面上看,他們應該互相合作,保持沉默,因為這樣他們倆都能得到最好的結果:自由。但他們不得不仔細考慮對方可能採取什麼選擇。
A犯不是個傻子,他根本無法相信同夥不會向警方提供對他不利的證據,然後帶著一筆豐厚的獎賞出獄而去,讓他獨自坐牢。這種想法的誘惑力實在太大了。但他也意識到,他的同夥也不是傻子,也會同樣來這樣設想他。
所以A犯的結論是,唯一理性的選擇就是背叛同夥,把一切都告訴警方,因為如果他的同夥笨得只會保持沉默,那麼他就會是那個帶獎出獄的幸運者了。而如果他的同夥也根據這個邏輯向警方交代了,那麼,A犯反正也得服審,起碼他不必服最重的刑。
一番博弈的結果就是。這兩個囚犯按照自己的邏輯做出行動,雙雙坐牢。
上面的故事反應了人們的一種博弈心理,它在心理學上被稱作“囚徒困境”,最早是由美國普林斯頓大學的數學家增克於1950年提出來的。他當時創造出這樣一個故事是為了向美國斯坦福大學的一群心理學家們解釋什麼是博弈論。後來,“囚徒困境”演繹出許多版本,成為博弈論中最著名的案例。
“囚徒困境”告訴我們,在一個存在著相互作用的博弈中,最好的策略直接取決於對方採用的策略,特別是取決於這個策略為發展雙方合作留出多大的餘地。
在大家都非常熟悉的國內的家電大戰中,雖然不是兩個對手之間的博弈,但由於在眾多對手當中,每一方的市場份額都很大,每一個主體人的行為後果受對手行為的影響都很大,因此,其情景大概也是如此。
因而,如果清楚這種前景,雙方勾結或合作起來,都實行比較高的價格,那麼雙方都可以因為避免價格大戰而獲得較高的利潤。有人把這樣一種合作的做法,叫做“雙贏對局”。而這樣的結果,往往雙方將都是“雙贏對局”的贏家。
可惜這些聯盟也往往處於利益驅動的“囚徒困境”。而雙贏也就成為泡影。五花八門的價格聯盟總是非常短命,道理就在這裡。
在囚徒困境中,雙方不約而同地選擇背叛而坐牢,一方面的原因是與同夥合作的懲罰遠遠高於所得到的報酬,另一方面也由於這是在資訊不透明的情況下進行的一次性決策,不存在更多的後果或者後續的博弈。
舉例來說,在公共汽車上,兩個陌生人會為一個座位爭吵,如果他們認識,可能就會相互謙讓。在夜市地攤、車站和旅遊景點等人群流動性大的地方,不但商品和服務質量最差,而且假冒偽劣橫行,因為在商家和顧客之間沒有後續的博弈,顧客不大可能因為飯菜可口而再次光臨。既然是一錘子買賣,不賺白不賺。
也正是這種心理所驅使,如果一廂情願地選擇合作就要受到懲罰。約翰遜總統在向一群商業界頭面人物說明需要大量資金同前蘇聯進行導彈競賽時,曾經透過下面這個故事來說明這個道理:
1861年,一位得克薩斯州人離家前去參加南軍士兵陣營。他告訴他的鄰居他很快就會回來,這場戰爭不會費力:“因為我們能用掃帚柄揍這些北方佬。”兩年後,他才重返故里,少了一條腿。
他的鄰居向這位神情悲慘、衣衫襤褸的傷兵詢問到底發生了什麼事:“你不是說過戰爭不費力,你們能用掃帚柄揍這些北方佬嗎?”
這位士兵回答:“我們當然能,但是麻煩在於北方佬不用掃帚打仗。”
可是在生活中的大部分情境中,人與人之間都會存在一些後續的接觸和博弈。那麼在這種情況下,我們又應該如何決策呢?
顯然,一味地以德報怨不可取,因為這樣只是將別人的人生成本轉嫁到自己頭上;而一味地以怨報德也不可取,因為這樣將慢慢失去大多數的博弈夥伴和機會。
所以,最好的決策方法還是囚徒困境教給我們的:以德報德、以怨報怨的反射決策。
事實上,這也是日常生活中多數人的理性選擇,也是一個很具適應性的規則。它的有效是由於其他規則預料到它的存在,並且被設計得與它很好相處。因為要和“反射決策”很好相處,就必須採取合作態度,即使那些伺機佔便宜而不被懲罰的規則,也很快改變,因為任何想佔“反射決策”便宜的規則最終將傷害自己。
要使這一決策方式發生作用,必須滿足以下條件:
特徵是顯著而且容易識別的;
一旦被識別出來,就必須使對方明白會對一切背叛進行報復,並且使對方很難解脫。
數學家約翰·馮諾依曼曾說過:“在一個存在著相互作用的博弈中,最好的策略直接取決於對方採用的策略,特別是取決於這個策略為發展雙方合作留出多大的餘地。”
總之,反射決策能夠贏得競賽不是靠打擊對方,而是靠從對方引出使雙方都有好處的行為。