博弈論的基本概念 博弈要素:
(1)決策人:在博弈中率先作出決策的一方,這一方往往依據(jù)自身的感受、經(jīng)驗(yàn)和表面狀態(tài)優(yōu)先采取一種有方向性的行動(dòng)。
(2) 對(duì)抗者:在博弈二人對(duì)局中行動(dòng)滯后的那個(gè)人,與決策人要作出基本反面的決定,并且他的動(dòng)作是滯后的、默認(rèn)的、被動(dòng)的,但最終占優(yōu)。他的策略可能依賴于決策人劣勢(shì)的策略選擇,占去空間特性,因此對(duì)抗是唯一占優(yōu)的方式,實(shí)為領(lǐng)導(dǎo)人的階段性終結(jié)行為。
(3)
局中人(players):在一場(chǎng)競(jìng)賽或博弈中,每一個(gè)有決策權(quán)的參與者成為一個(gè)局中人。只有兩個(gè)局中人的博弈現(xiàn)象稱為“兩人博弈”,而多于兩個(gè)局中人的博弈稱為 “多人博弈”。
(4)策略(strategies):一局博弈中,每個(gè)局中人都有選擇實(shí)際可行的完整的行動(dòng)方案,即方案不是某階段的行動(dòng)方案,而是指導(dǎo)整個(gè)行動(dòng)的一個(gè)方案,一個(gè)局中人的一個(gè)可行的自始至終全局籌劃的一個(gè)行動(dòng)方案,稱為這個(gè)局中人的一個(gè)策略。如果在一個(gè)博弈中局中人都總共有有限個(gè)策略,則稱為“有限博弈”,否則稱為“無限博弈”。
(5)得失(payoffs):一局博弈結(jié)局時(shí)的結(jié)果稱為得失。每個(gè)局中人在一局博弈結(jié)束時(shí)的得失,不僅與該局中人自身所選擇的策略有關(guān),而且與全局中人所取定的一組策略有關(guān)。所以,一局博弈結(jié)束時(shí)每個(gè)局中人的“得失”是全體局中人所取定的一組策略的函數(shù),通常稱為支付(payoff)函數(shù)。
(6)次序(orders):各博弈方的決策有先后之分,且一個(gè)博弈方要作不止一次的決策選擇,就出現(xiàn)了次序問題;其他要素相同次序不同,博弈就不同。
(7)博弈涉及到均衡:均衡是平衡的意思,在經(jīng)濟(jì)學(xué)中,均衡意即相關(guān)量處于穩(wěn)定值。在供求關(guān)系中,某一
商品市場(chǎng)如果在某一價(jià)格下,想以此價(jià)格買此商品的人均能買到,而想賣的人均能賣出,此時(shí)我們就說,該商品的供求達(dá)到了均衡。所謂納什均衡,它是一穩(wěn)定的博弈結(jié)果。
納什均衡(Nash Equilibrium):在一策略組合中,所有的參與者面臨這樣一種情況,當(dāng)其他人不改變策略時(shí),他此時(shí)的策略是最好的。也就是說,此時(shí)如果他改變策略他的支付將會(huì)降低。在
納什均衡點(diǎn)上,每一個(gè)理性的參與者都不會(huì)有單獨(dú)改變策略的沖動(dòng)。納什均衡點(diǎn)存在性證明的前提是“博弈均衡偶”概念的提出。所謂“均衡偶”是在二人
零和博弈中,當(dāng)局中人A采取其最優(yōu)策略a*,局中人B也采取其最優(yōu)策略b*,如果局中人B仍采取b*,而局中人A卻采取另一種策略a,那么局中人A的支付不會(huì)超過他采取原來的策略a*的支付。這一結(jié)果對(duì)局中人B亦是如此。
這樣,“均衡偶”的明確定義為:一對(duì)策略a*(屬于策略集A)和策略b*(屬于策略集B)稱之為均衡偶,對(duì)任一策略a(屬于策略集A)和策略b(屬于策略集B),總有:偶對(duì)(a, b*)≤偶對(duì)(a*,b*)≥偶對(duì)(a*,b)。
對(duì)于
非零和博弈也有如下定義:一對(duì)策略a*(屬于策略集A)和策略b*(屬于策略集B)稱為非零和博弈的均衡偶,對(duì)任一策略a(屬于策略集A)和策略 b(屬于策略集B),總有:對(duì)局中人A的偶對(duì)(a, b*) ≤偶對(duì)(a*,b*);對(duì)局中人B的偶對(duì)(a*,b)≤偶對(duì)(a*,b*)。
有了上述定義,就立即得到
納什定理:
任何具有有限純策略的二人博弈至少有一個(gè)均衡偶。這一均衡偶就稱為納什均衡點(diǎn)。
納什定理的嚴(yán)格證明要用到不動(dòng)點(diǎn)理論,不動(dòng)點(diǎn)理論是
經(jīng)濟(jì)均衡研究的主要工具。通俗地說,尋找均衡點(diǎn)的存在性等價(jià)于找到博弈的不動(dòng)點(diǎn)。
納什均衡點(diǎn)概念提供了一種非常重要的分析手段,使博弈論研究可以在一個(gè)博弈結(jié)構(gòu)里尋找比較有意義的結(jié)果。
但納什均衡點(diǎn)定義只局限于任何局中人不想單方面變換策略,而忽視了其他局中人改變策略的可能性,因此,在很多情況下,納什均衡點(diǎn)的結(jié)論缺乏說服力,研究者們形象地稱之為“天真可愛的納什均衡點(diǎn)”。
塞爾頓(R·Selten)在多個(gè)均衡中剔除一些按照一定規(guī)則不合理的均衡點(diǎn),從而形成了兩個(gè)均衡的精煉概念:子博弈完全均衡和顫抖的手完美均衡。
夏普里值
考慮這樣一個(gè)合作博弈:a、b、c、投票決定如何分配100萬,他們分別擁有50%、40%、10%的權(quán)力,規(guī)則規(guī)定,當(dāng)超過50%的票認(rèn)可了某種方案時(shí)才能通過。那么如何分配才是合理的呢?按票力分配,a50萬、b40萬、c10萬c向a提出:a70萬、b0、c30萬b向a提出:a80萬、b20萬、c0……
權(quán)力指數(shù):每個(gè)決策者在決策時(shí)的權(quán)力體現(xiàn)在他在形成的獲勝聯(lián)盟中的“關(guān)鍵加入者”的個(gè)數(shù),這個(gè)“關(guān)鍵加入者”的個(gè)數(shù)就被稱為權(quán)利指數(shù)。
夏普里值(
Shapley value):在各種可能的聯(lián)盟次序下,參與者對(duì)聯(lián)盟的邊際貢獻(xiàn)之和除以各種可能的聯(lián)盟組合。
次序 abc acb bac bca cab cba
關(guān)鍵加入者 b c a a a a
由此計(jì)算出a,b,c的夏普里值分別為4/6,1/6,1/6
所以a,b,c應(yīng)分別獲得100萬的2/3,1/6,1/6
智豬博弈
智豬博弈(
Pigs’payoffs)講的是:豬圈里有兩頭豬,一頭大豬,一頭小豬。豬圈的一邊有個(gè)踏板,每踩一下踏板,在遠(yuǎn)離踏板的豬圈的另一邊的投食口就會(huì)落下少量的食物。如果有一只豬去踩踏板,另一只豬就有機(jī)會(huì)搶先吃到另一邊落下的食物。當(dāng)小豬踩動(dòng)踏板時(shí),大豬會(huì)在小豬跑到食槽之前剛好吃光所有的食物;若是大豬踩動(dòng)了踏板,則還有機(jī)會(huì)在小豬吃完落下的食物之前跑到食槽,爭(zhēng)吃到另一半殘羹。
那么,兩只豬各會(huì)采取什么策略?答案是:小豬將選擇“搭便車”策略,也就是舒舒服服地等在食槽邊;而大豬則為一點(diǎn)殘羹不知疲倦地奔忙于踏板和食槽之間。
原因何在?因?yàn)?,小豬踩踏板將一無所獲,不踩踏板反而能吃上食物。對(duì)小豬而言,無論大豬是否踩動(dòng)踏板,不踩踏板總是好的選擇。反觀大豬,已明知小豬是不會(huì)去踩動(dòng)踏板的,自己親自去踩踏板總比不踩強(qiáng)吧,所以只好親力親為了。
“小豬躺著大豬跑”的現(xiàn)象是由于故事中的游戲規(guī)則所導(dǎo)致的。規(guī)則的核心指標(biāo)是:每次落下的食物數(shù)量和踏板與投食口之間的距離。
如果改變一下核心指標(biāo),豬圈里還會(huì)出現(xiàn)同樣的“小豬躺著大豬跑”的景象嗎?試試看。
改變方案一:減量方案。投食僅原來的一半分量。結(jié)果是小豬大豬都不去踩踏板了。小豬去踩,大豬將會(huì)把食物吃完;大豬去踩,小豬將也會(huì)把食物吃完。誰去踩踏板,就意味著為對(duì)方貢獻(xiàn)食物,所以誰也不會(huì)有踩踏板的動(dòng)力了。
如果目的是想讓豬們?nèi)ザ嗖忍ぐ澹@個(gè)游戲規(guī)則的設(shè)計(jì)顯然是失敗的。
改變方案二:增量方案。投食為原來的一倍分量。結(jié)果是小豬、大豬都會(huì)去踩踏板。誰想吃,誰就會(huì)去踩踏板。反正對(duì)方不會(huì)一次把食物吃完。小豬和大豬相當(dāng)于生活在物質(zhì)相對(duì)豐富的“共產(chǎn)主義”社會(huì),所以競(jìng)爭(zhēng)意識(shí)卻不會(huì)很強(qiáng)。
對(duì)于游戲規(guī)則的設(shè)計(jì)者來說,這個(gè)規(guī)則的成本相當(dāng)高(每次提供雙份的食物);而且因?yàn)楦?jìng)爭(zhēng)不強(qiáng)烈,想讓豬們?nèi)ザ嗖忍ぐ宓男Ч⒉缓谩?div id="c9ozetgccsir" class="spctrl">
改變方案三:減量加移位方案。投食僅原來的一半分量,但同時(shí)將投食口移到踏板附近。結(jié)果呢,小豬和大豬都在拼命地?fù)屩忍ぐ?。等待者不得食,而多勞者多得。每次的收獲剛好消費(fèi)完。
對(duì)于游戲設(shè)計(jì)者,這是一個(gè)最好的方案。成本不高,但收獲最大。
原版的“智豬博弈”故事給了競(jìng)爭(zhēng)中的弱者(小豬)以等待為最佳策略的啟發(fā)。但是對(duì)于社會(huì)而言,因?yàn)樾∝i未能參與競(jìng)爭(zhēng),小豬搭便車時(shí)的社會(huì)資源配置的并不是最佳狀態(tài)。為使資源最有效配置,規(guī)則的設(shè)計(jì)者是不愿看見有人搭便車的,政府如此,公司的老板也是如此。而能否完全杜絕“搭便車”現(xiàn)象,就要看游戲規(guī)則的核心指標(biāo)設(shè)置是否合適了。
比如,公司的激勵(lì)制度設(shè)計(jì),獎(jiǎng)勵(lì)力度太大,又是持股,又是期權(quán),公司職員個(gè)個(gè)都成了百萬富翁,成本高不說,員工的積極性并不一定很高。這相當(dāng)于“智豬博弈”增量方案所描述的情形。但是如果獎(jiǎng)勵(lì)力度不大,而且見者有份(不勞動(dòng)的“小豬”也有),一度十分努力的大豬也不會(huì)有動(dòng)力了----就象“智豬博弈”減量方案一所描述的情形。最好的激勵(lì)
機(jī)制設(shè)計(jì)就象改變方案三----減量加移位的辦法,獎(jiǎng)勵(lì)并非人人有份,而是直接針對(duì)個(gè)人(如業(yè)務(wù)按比例提成),既節(jié)約了成本(對(duì)公司而言),又消除了“搭便車”現(xiàn)象,能實(shí)現(xiàn)有效的激勵(lì)。
許多人并未讀過“智豬博弈”的故事,但是卻在自覺地使用小豬的策略。股市上等待莊家抬轎的散戶;等待產(chǎn)業(yè)市場(chǎng)中出現(xiàn)具有贏利能力新產(chǎn)品、繼而大舉仿制牟取暴利的游資;公司里不創(chuàng)造效益但分享成果的人,等等。因此,對(duì)于制訂各種經(jīng)濟(jì)管理的游戲規(guī)則的人,必須深諳“智豬博弈”指標(biāo)改變的個(gè)中道理。
博弈的分類根據(jù)不同的基準(zhǔn)也有不同的分類。一般認(rèn)為,博弈主要可以分為
合作博弈和非合作博弈?!『献鞑┺暮头呛献鞑┺牡膮^(qū)別在于相互發(fā)生作用的當(dāng)事人之間有沒有一個(gè)具有約束力的協(xié)議,如果有,就是合作博弈,如果沒有,就是非合作博弈。
從行為的時(shí)間序列性,博弈論進(jìn)一步分為靜態(tài)博弈、
動(dòng)態(tài)博弈兩類: 靜態(tài)博弈是指在博弈中,參與人同時(shí)選擇或雖非同時(shí)選擇但后行動(dòng)者并不知道先行動(dòng)者采取了什么具體行動(dòng);
動(dòng)態(tài)博弈是指在博弈中,參與人的行動(dòng)有先后順序,且后行動(dòng)者能夠觀察到先行動(dòng)者所選擇的行動(dòng)。通俗的理解:"囚徒困境"就是同時(shí)決策的,屬于靜態(tài)博弈;而棋牌類游戲等決策或行動(dòng)有先后次序的,屬于動(dòng)態(tài)博弈
按照參與人對(duì)其他參與人的了解程度分為
完全信息博弈和
不完全信息博弈?!⊥耆┺氖侵冈诓┺倪^程中,每一位參與人對(duì)其他參與人的特征、
策略空間及收益函數(shù)有準(zhǔn)確的信息。
不完全信息博弈是指如果參與人對(duì)其他參與人的特征、策略空間及收益函數(shù)信息了解的不夠準(zhǔn)確、或者不是對(duì)所有參與人的特征、策略空間及收益函數(shù)都有準(zhǔn)確的信息,在這種情況下進(jìn)行的博弈就是不完全信息博弈。
目前經(jīng)濟(jì)學(xué)家們現(xiàn)在所談的博弈論一般是指非合作博弈,由于
合作博弈論比非合作博弈論復(fù)雜,在理論上的成熟度遠(yuǎn)遠(yuǎn)不如非合作博弈論。非合作博弈又分為:完全信息靜態(tài)博弈,完全信息動(dòng)態(tài)博弈,不完全信息靜態(tài)博弈,不完全信息動(dòng)態(tài)博弈。與上述四種博弈相對(duì)應(yīng)的均衡概念為:納什均衡(Nash equilibrium),
子博弈精煉納什均衡(subgame perfect Nash equilibrium),
貝葉斯納什均衡(Bayesian Nash equilibrium),精煉貝葉斯納什均衡(perfect Bayesian Nash equilibrium)。
博弈論還有很多分類,比如:以博弈進(jìn)行的次數(shù)或者持續(xù)長(zhǎng)短可以分為有限博弈和無限博弈;以表現(xiàn)形式也可以分為一般型(戰(zhàn)略型)或者展開型,等等。
博弈論的研究方法和其他許多利用數(shù)學(xué)工具研究社會(huì)經(jīng)濟(jì)現(xiàn)象的學(xué)科一樣,都是從復(fù)雜的現(xiàn)象中抽象出基本的元素,對(duì)這些元素構(gòu)成的數(shù)學(xué)模型進(jìn)行分析,而后逐步引入對(duì)其形勢(shì)產(chǎn)影響的其他因素,從而分析其結(jié)果。
基于不同抽象水平,形成三種博弈表述方式,標(biāo)準(zhǔn)型、擴(kuò)展型和特征函數(shù)型利用這三種表述形式,可以研究形形色色的問題。因此,它被稱為“社會(huì)科學(xué)的數(shù)學(xué)”從理論上講,博弈論是研究理性的行動(dòng)者相互作用的形式理論,而實(shí)際上正深入到經(jīng)濟(jì)學(xué)、政治學(xué)、社會(huì)學(xué)等等,被各門社會(huì)科學(xué)所應(yīng)用。
博弈論是指某個(gè)個(gè)人或是組織,面對(duì)一定的環(huán)境條件,在一定的規(guī)則約束下,依靠所掌握的信息,從各自選擇的行為或是策略進(jìn)行選擇并加以實(shí)施,并從各自取得相應(yīng)結(jié)果或收益的過程,在經(jīng)濟(jì)學(xué)上博弈論是個(gè)非常重要的理論概念。
什么是博弈論?古語有云,世事如棋。生活中每個(gè)人如同棋手,其每一個(gè)行為如同在一張看不見的棋盤上布一個(gè)子,精明慎重的棋手們相互揣摩、相互牽制,人人爭(zhēng)贏,下出諸多精彩紛呈、變化多端的棋局。博弈論是研究棋手們 “出棋” 著數(shù)中理性化、
邏輯化的部分,并將其系統(tǒng)化為一門科學(xué)。換句話說,就是研究個(gè)體如何在錯(cuò)綜復(fù)雜的相互影響中得出最合理的策略。事實(shí)上,博弈論正是衍生于古老的游戲或曰博弈如象棋、撲克等。數(shù)學(xué)家們將具體的問題抽象化,通過建立自完備的邏輯框架、體系研究其規(guī)律及變化。這可不是件容易的事情,以最簡(jiǎn)單的二人對(duì)弈為例,稍想一下便知此中大有玄妙:若假設(shè)雙方都精確地記得自己和對(duì)手的每一步棋且都是最“理性” 的棋手,甲出子的時(shí)候,為了贏棋,得仔細(xì)考慮乙的想法,而乙出子時(shí)也得考慮甲的想法,所以甲還得想到乙在想他的想法,乙當(dāng)然也知道甲想到了他在想甲的想法…
面對(duì)如許重重迷霧,博弈論怎樣著手分析解決問題,怎樣對(duì)作為現(xiàn)實(shí)歸納的抽象數(shù)學(xué)問題求出最優(yōu)解、從而為在理論上指導(dǎo)實(shí)踐提供可能性呢?現(xiàn)代博弈理論由匈牙利大數(shù)學(xué)家馮·
諾伊曼于20世紀(jì)20年代開始創(chuàng)立,1944年他與經(jīng)濟(jì)學(xué)家奧斯卡·摩根斯特恩合作出版的巨著《博弈論與經(jīng)濟(jì)行為》,標(biāo)志著現(xiàn)代系統(tǒng)博弈理論的初步形成。對(duì)于非合作、純競(jìng)爭(zhēng)型博弈,諾伊曼所解決的只有二人零和博弈--好比兩個(gè)人下棋、或是打乒乓球,一個(gè)人贏一著則另一個(gè)人必輸一著,凈獲利為零。在這里抽象化后的博弈問題是,已知參與者集合(兩方),策略集合(所有棋著),和盈利集合(贏子輸子),能否且如何找到一個(gè)理論上的“解” 或“平衡” ,也就是對(duì)參與雙方來說都最“合理” 、最優(yōu)的具體策略?怎樣才是“合理” ?應(yīng)用傳統(tǒng)決定論中的“最小最大” 準(zhǔn)則,即博弈的每一方都假設(shè)對(duì)方的所有功略的根本目的是使自己最大程度地失利,并據(jù)此最優(yōu)化自己的對(duì)策,諾伊曼從數(shù)學(xué)上證明,通過一定的線性運(yùn)算,對(duì)于每一個(gè)二人零和博弈,都能夠找到一個(gè)“最小最大解” 。通過一定的線性運(yùn)算,競(jìng)爭(zhēng)雙方以概率分布的形式隨機(jī)使用某套最優(yōu)策略中的各個(gè)步驟,就可以最終達(dá)到彼此盈利最大且相當(dāng)。當(dāng)然,其隱含的意義在于,這套最優(yōu)策略并不依賴于對(duì)手在博弈中的操作。用通俗的話說,這個(gè)著名的最小最大定理所體現(xiàn)的基本“理性” 思想是“抱最好的希望,做最壞的打算” 。
博弈論不僅僅存在于數(shù)學(xué)的運(yùn)籌學(xué)中,也正在經(jīng)濟(jì)學(xué)中占據(jù)越來越重要的地位,但如果你認(rèn)為博弈論的應(yīng)用領(lǐng)域僅限于此的話,那你就大錯(cuò)了。實(shí)際上,博弈論甚至在我們的工作和生活中無處不在!在工作中,你在和上司博弈,也在和下屬博弈,你也同樣會(huì)跟其他相關(guān)部門人員博弈;而要開展業(yè)務(wù),你更是在和你的客戶以及競(jìng)爭(zhēng)對(duì)手博弈。在生活中,博弈仍然無處不在。博弈論代表著一種全新的分析
方法和全新的思想。
諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者包羅·薩繆爾遜如是說:
要想在現(xiàn)代社會(huì)做個(gè)有價(jià)值的人,你就必須對(duì)博弈論有個(gè)大致的了解。
也可以這樣說,要想贏得生意,不可不學(xué)博弈論;要想贏得生活,同樣不可不學(xué)博弈論。
編輯本段應(yīng)用舉例
納什均衡
1950年和1951年納什的兩篇關(guān)于非合作博弈論的重要論文,徹底改變了人們對(duì)競(jìng)爭(zhēng)和市場(chǎng)的看法。他證明了非合作博弈及其均衡解,并證明了均衡解的存在性,即著名的納什均衡。從而揭示了博弈均衡與經(jīng)濟(jì)均衡的內(nèi)在聯(lián)系。納什的研究奠定了現(xiàn)代非合作博弈論的基石,后來的博弈論研究基本上都沿著這條主線展開的。
1944年馮·諾依曼與奧斯卡·摩根斯特恩合著的巨作《博弈論與經(jīng)濟(jì)行為》出版,標(biāo)志著現(xiàn)代系統(tǒng)博弈理論的的初步形成。盡管對(duì)具有博弈性質(zhì)的問題的研究可以追溯到19世紀(jì)甚至更早。例如,1838年古諾(
Cournot)簡(jiǎn)單雙寡頭壟斷博弈;1883年伯特蘭和1925年艾奇沃奇思研究了兩個(gè)寡頭的產(chǎn)量與價(jià)格壟斷;2000多年前中國著名軍事家孫武的后代孫臏利用博弈論方法幫助田忌賽馬取勝等等都屬于早期博弈論的萌芽,其特點(diǎn)是零星的,片斷的研究,帶有很大的偶然性,很不系統(tǒng)。馮·諾依曼和摩根斯特恩的《博弈論與經(jīng)濟(jì)行為》一書中提出的標(biāo)準(zhǔn)型、擴(kuò)展型和合作型博弈模型解的概念和分析方法,奠定了這門學(xué)科的理論基礎(chǔ)。合作型博弈在20世紀(jì)50年代達(dá)到了巔峰期。然而,諾依曼的博弈論的局限性也日益暴露出來,由于它過于抽象,使應(yīng)用范圍受到很大限制,在很長(zhǎng)時(shí)間里,人們對(duì)博弈論的研究知之甚少,只是少數(shù)數(shù)學(xué)家的專利,所以,影響力很有限。正是在這個(gè)時(shí)候,非合作博弈———“納什均衡”應(yīng)運(yùn)而生了,它標(biāo)志著博弈論的新時(shí)代的開始!納什不是一個(gè)按部就班的學(xué)生,他經(jīng)常曠課。據(jù)他的同學(xué)們回憶,他們根本想不起來曾經(jīng)什么時(shí)候和納什一起完完整整地上過一門必修課,但納什爭(zhēng)辯說,至少上過斯蒂恩羅德的代數(shù)拓?fù)鋵W(xué)。斯蒂恩羅德恰恰是這門學(xué)科的創(chuàng)立者,可是,沒上幾次課,納什就認(rèn)定這門課不符合他的口味。于是,又走人了。然而,納什畢竟是一位英才天縱的非凡人物,他廣泛涉獵數(shù)學(xué)王國的每一個(gè)分支,如拓?fù)鋵W(xué)、代數(shù)幾何學(xué)、邏輯學(xué)、博弈論等等,深深地為之著迷。納什經(jīng)常顯示出他與眾不同的自信和自負(fù),充滿咄咄逼人的學(xué)術(shù)野心。1950年整個(gè)夏天納什都忙于應(yīng)付緊張的考試,他的博弈論研究工作被迫中斷,他感到這是莫大的浪費(fèi)。殊不知這種暫時(shí)的“放棄”,使原來模糊、雜亂和無緒的若干念頭,在潛意識(shí)的持續(xù)思考下,逐步形成一條清晰的脈絡(luò),突然來了靈感!這一年的10月,他驟感才思潮涌,妙筆生花。其中一個(gè)最耀眼的亮點(diǎn)就是日后被稱之為“納什均衡”的非合作博弈均衡的概念。納什的主要學(xué)術(shù)貢獻(xiàn)體現(xiàn)在1950年和1951年的兩篇論文之中(包括一篇博士論文)。1950年他才把自己的研究成果寫成題為“非合作博弈”的長(zhǎng)篇博士論文,1950年11月刊登在美國全國科學(xué)院每月公報(bào)上,立即引起轟動(dòng)。說起來這全靠師兄戴維·蓋爾之功,就在遭到馮·諾依曼貶低幾天之后,他遇到蓋爾,告訴他自己已經(jīng)將馮·諾依曼的“最小最大原理”(
minimax solution)推到非合作博弈領(lǐng)域,找到了普遍化的方法和均衡點(diǎn)。蓋爾聽得很認(rèn)真,他終于意識(shí)到納什的思路比馮·諾伊曼的合作博弈的理論更能反映現(xiàn)實(shí)的情況,而對(duì)其嚴(yán)密優(yōu)美的數(shù)學(xué)證明極為贊嘆。蓋爾建議他馬上整理出來發(fā)表,以免被別人捷足先登。納什這個(gè)初出茅廬的小子,根本不知道競(jìng)爭(zhēng)的險(xiǎn)惡,從未想過要這么做。結(jié)果還是蓋爾充當(dāng)了他的“經(jīng)紀(jì)人”,代為起草致科學(xué)院的短信,系主任列夫謝茨則親自將文稿遞交給科學(xué)院。納什寫的文章不多,就那么幾篇,但已經(jīng)足夠了,因?yàn)槎际蔷分械木贰_@一點(diǎn)也是值得我們深思的。國內(nèi)提一個(gè)教授,要求在“核心的刊物”上發(fā)表多少篇文章。按照這個(gè)標(biāo)準(zhǔn)可能納什還不一定夠資格。
1996年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主莫爾里斯當(dāng)牛津大學(xué)艾奇沃思經(jīng)濟(jì)學(xué)講座教授時(shí)也沒有發(fā)表過什么文章,特殊的人才,必須有特殊的選拔辦法。
納什在上大學(xué)時(shí)就開始從事純數(shù)學(xué)的博弈論研究,1948年進(jìn)入普林斯頓大學(xué)后更是如魚得水。20歲出頭已成為聞名世界的數(shù)學(xué)家。特別是在經(jīng)濟(jì)博弈論領(lǐng)域,他做出了劃時(shí)代的貢獻(xiàn),是繼馮·諾依曼之后最偉大的博弈論大師之一。他提出的著名的納什均衡的概念在非合作博弈理論中起著核心的作用。后續(xù)的研究者對(duì)博弈論的貢獻(xiàn),都是建立在這一概念之上的。由于納什均衡的提出和不斷完善為博弈論廣泛應(yīng)用于經(jīng)濟(jì)學(xué)、
管理學(xué)、社會(huì)學(xué)、政治學(xué)、軍事科學(xué)等領(lǐng)域奠定了堅(jiān)實(shí)的理論基礎(chǔ)。
囚徒困境
在博弈論中,含有占優(yōu)戰(zhàn)略均衡的一個(gè)著名例子是由塔克給出的“囚徒困境”(
prisoners’ dilemma)博弈模型。該模型用一種特別的方式為我們講述了一個(gè)警察與小偷的故事。假設(shè)有兩個(gè)小偷A(chǔ)和B聯(lián)合犯事、私入民宅被警察抓住。警方將兩人分別置于不同的兩個(gè)房間內(nèi)進(jìn)行審訊,對(duì)每一個(gè)犯罪嫌疑人,警方給出的政策是:如果兩個(gè)犯罪嫌疑人都坦白了罪行,交出了贓物,于是證據(jù)確鑿,兩人都被判有罪,各被判刑8年;如果只有一個(gè)犯罪嫌疑人坦白,另一個(gè)人沒有坦白而是抵賴,則以妨礙公務(wù)罪(因已有證據(jù)表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。如果兩人都抵賴,則警方因證據(jù)不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。表2.2給出了這個(gè)博弈的
支付矩陣。
表2.2 囚徒困境博弈 [Prisoner's dilemma]
A╲B | 坦白 | 抵賴 |
坦白 | -8,-8 | 0,-10 |
抵賴 | -10,0 | -1,-1 |
我們來看看這個(gè)博弈可預(yù)測(cè)的均衡是什么。對(duì)A來說,盡管他不知道B作何選擇,但他知道無論B選擇什么,他選擇“坦白”總是最優(yōu)的。顯然,根據(jù)對(duì)稱性,B也會(huì)選擇“坦白”,結(jié)果是兩人都被判刑8年。但是,倘若他們都選擇“抵賴”,每人只被判刑1年。在表2.2中的四種行動(dòng)選擇組合中,(抵賴、抵賴)是
帕累托最優(yōu)的,因?yàn)槠x這個(gè)行動(dòng)選擇組合的任何其他行動(dòng)選擇組合都至少會(huì)使一個(gè)人的境況變差。不難看出,“坦白”是任一犯罪嫌疑人的占優(yōu)戰(zhàn)略,而(坦白,坦白)是一個(gè)占優(yōu)戰(zhàn)略均衡。
要了解納什的貢獻(xiàn),首先要知道什么是非合作博弈問題?,F(xiàn)在幾乎所有的博弈論教科書上都會(huì)講“囚犯的兩難處境”的例子,每本書上的例子都大同小異。
博弈論畢竟是數(shù)學(xué),更確切地說是運(yùn)籌學(xué)的一個(gè)分支,談經(jīng)論道自然少不了數(shù)學(xué)語言,外行人看來只是一大堆數(shù)學(xué)公式。好在博弈論關(guān)心的是日常經(jīng)濟(jì)生活問題,所以不能不食人間煙火。其實(shí)這一理論是從棋弈、撲克和戰(zhàn)爭(zhēng)等帶有競(jìng)賽、對(duì)抗和決策性質(zhì)的問題中借用的術(shù)語,聽上去有點(diǎn)玄奧,實(shí)際上卻具有重要現(xiàn)實(shí)意義。博弈論大師看經(jīng)濟(jì)社會(huì)問題猶如棋局,常常寓深刻道理于游戲之中。所以,多從我們的日常生活中的凡人小事入手,以我們身邊的故事做例子,娓娓道來,并不乏味。話說有一天,一位富翁在家中被殺,財(cái)物被盜。警方在此案的偵破過程中,抓到兩個(gè)犯罪嫌疑人,斯卡爾菲絲和那庫爾斯,并從他們的住處搜出被害人家中丟失的財(cái)物。但是,他們矢口否認(rèn)曾殺過人,辯稱是先發(fā)現(xiàn)富翁被殺,然后只是順手牽羊偷了點(diǎn)兒東西。于是警方將兩人隔離,分別關(guān)在不同的房間進(jìn)行審訊。由地方檢察官分別和每個(gè)人單獨(dú)談話。檢察官說,“由于你們的偷盜罪已有確鑿的證據(jù),所以可以判你們一年刑期。但是,我可以和你做個(gè)交易。如果你單獨(dú)坦白殺人的罪行,我只判你三個(gè)月的監(jiān)禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙檢舉,那么你就將被判十年刑,他只判三個(gè)月的監(jiān)禁。但是,如果你們兩人都坦白交代,那么,你們都要被判5年刑。”斯卡爾菲絲和那庫爾斯該怎么辦呢?他們面臨著兩難的選擇——坦白或抵賴。顯然最好的策略是雙方都抵賴,結(jié)果是大家都只被判一年。但是由于兩人處于隔離的情況下無法串供。所以,按照亞當(dāng)·斯密的理論,每一個(gè)人都是從利己的目的出發(fā),他們選擇坦白交代是最佳策略。因?yàn)樘拱捉淮梢云谕玫胶芏痰谋O(jiān)禁———3個(gè)月,但前提是同伙抵賴,顯然要比自己抵賴要坐10年牢好。這種策略是損人利己的策略。不僅如此,坦白還有更多的好處。如果對(duì)方坦白了而自己抵賴了,那自己就得坐10年牢。太不劃算了!因此,在這種情況下還是應(yīng)該選擇坦白交代,即使兩人同時(shí)坦白,至多也只判5年,總比被判10年好吧。所以,兩人合理的選擇是坦白,原本對(duì)雙方都有利的策略(抵賴)和結(jié)局(被判1年刑)就不會(huì)出現(xiàn)。這樣兩人都選擇坦白的策略以及因此被判5年的結(jié)局被稱為“納什均衡”,也叫非合作均衡。因?yàn)?,每一方在選擇策略時(shí)都沒有“共謀”(串供),他們只是選擇對(duì)自己最有利的策略,而不考慮社會(huì)福利或任何其他對(duì)手的利益。也就是說,這種策略組合由所有局中人(也稱當(dāng)事人、參與者)的最佳策略組合構(gòu)成。沒有人會(huì)主動(dòng)改變自己的策略以便使自己獲得更大利益。“囚徒的兩難選擇”有著廣泛而深刻的意義。個(gè)人理性與集體理性的沖突,各人追求利己行為而導(dǎo)致的最終結(jié)局是一個(gè)“納什均衡”,也是對(duì)所有人都不利的結(jié)局。他們兩人都是在坦白與抵賴策略上首先想到自己,這樣他們必然要服長(zhǎng)的刑期。只有當(dāng)他們都首先替對(duì)方著想時(shí),或者相互合謀(串供)時(shí),才可以得到最短時(shí)間的監(jiān)禁的結(jié)果。“納什均衡”首先對(duì)亞當(dāng)·斯密的“看不見的手”的原理提出挑戰(zhàn)。按照斯密的理論,在市場(chǎng)經(jīng)濟(jì)中,每一個(gè)人都從利己的目的出發(fā),而最終全社會(huì)達(dá)到利他的效果。不妨讓我們重溫一下這位經(jīng)濟(jì)學(xué)圣人在《國富論》中的名言:“通過追求(個(gè)人的)自身利益,他常常會(huì)比其實(shí)際上想做的那樣更有效地促進(jìn)社會(huì)利益。”從“納什均衡”我們引出了“看不見的手”的原理的一個(gè)
悖論:從利己目的出發(fā),結(jié)果損人不利己,既不利己也不利他。兩個(gè)囚徒的命運(yùn)就是如此。從這個(gè)意義上說,“納什均衡”提出的悖論實(shí)際上動(dòng)搖了
西方經(jīng)濟(jì)學(xué)的基石。因此,從“納什均衡”中我們還可以悟出一條真理:合作是有利的“利己策略”。但它必須符合以下黃金律:按照你愿意別人對(duì)你的方式來對(duì)別人,但只有他們也按同樣方式行事才行。也就是中國人說的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,“納什均衡”是一種非合作博弈均衡,在現(xiàn)實(shí)中非合作的情況要比合作情況普遍。所以“納什均衡”是對(duì)馮·諾依曼和摩根斯特恩的合作博弈理論的重大發(fā)展,甚至可以說是一場(chǎng)革命。
從“納什均衡”的普遍意義中我們可以深刻領(lǐng)悟司空見慣的經(jīng)濟(jì)、社會(huì)、政治、國防、管理和日常
生活中的博弈現(xiàn)象。我們將例舉出許多類似于“囚徒的兩難處境”這樣的例子。如價(jià)格戰(zhàn)、軍備競(jìng)賽、污染等等。一般的博弈問題由三個(gè)要素所構(gòu)成:即局中人(players)又稱當(dāng)事人、參與者、策略等等的集合,策略(strategies)集合以及每一對(duì)局中人所做的選擇和贏得(payoffs)集合。其中所謂贏得是指如果一個(gè)特定的策略關(guān)系被選擇,每一局中人所得到的效用。所有的博弈問題都會(huì)遇到這三個(gè)要素。
價(jià)格戰(zhàn)博弈
現(xiàn)在我們經(jīng)常會(huì)遇到各種各樣的家電價(jià)格大戰(zhàn),彩電大戰(zhàn)、冰箱大戰(zhàn)、空調(diào)大戰(zhàn)、微波爐大戰(zhàn)……這些大戰(zhàn)的受益者首先是消費(fèi)者。每當(dāng)看到一種家電產(chǎn)品的價(jià)格大戰(zhàn),百姓都會(huì)“沒事兒偷著樂”。在這里,我們可以解釋廠家價(jià)格大戰(zhàn)的結(jié)局也是一個(gè)“納什均衡”,而且價(jià)格戰(zhàn)的結(jié)果是誰都沒錢賺。因?yàn)椴┺碾p方的利潤(rùn)正好是零。競(jìng)爭(zhēng)的結(jié)果是穩(wěn)定的,即是一個(gè)“納什均衡”。這個(gè)結(jié)果可能對(duì)消費(fèi)者是有利的,但對(duì)廠商而言是災(zāi)難性的。所以,價(jià)格戰(zhàn)對(duì)廠商而言意味著自殺。從這個(gè)案例中我們可以引伸出兩個(gè)問題,一是競(jìng)爭(zhēng)削價(jià)的結(jié)果或“納什均衡”可能導(dǎo)致一個(gè)有效率的零利潤(rùn)結(jié)局。二是如果不采取價(jià)格戰(zhàn),作為一種敵對(duì)博弈論(rivalry game)其結(jié)果會(huì)如何呢?每一個(gè)企業(yè),都會(huì)考慮采取正常價(jià)格策略,還是采取高價(jià)格策略形成壟斷價(jià)格,并盡力獲取壟斷利潤(rùn)。如果壟斷可以形成,則博弈雙方的共同利潤(rùn)最大。這種情況就是壟斷經(jīng)營(yíng)所做的,通常會(huì)抬高價(jià)格。另一個(gè)極端的情況是廠商用正常的價(jià)格,雙方都可以獲得利潤(rùn)。從這一點(diǎn),我們又引出一條基本準(zhǔn)則:“把你自己的戰(zhàn)略建立在假定對(duì)手會(huì)按其最佳利益行動(dòng)的基礎(chǔ)上”。事實(shí)上,完全競(jìng)爭(zhēng)的均衡就是“納什均衡”或“非合作博弈均衡”。在這種狀態(tài)下,每一個(gè)廠商或消費(fèi)者都是按照所有的別人已定的價(jià)格來進(jìn)行決策。在這種均衡中,每一企業(yè)要使利潤(rùn)最大化,消費(fèi)者要使效用最大化,結(jié)果導(dǎo)致了零利潤(rùn),也就是說價(jià)格等于邊際成本。在完全競(jìng)爭(zhēng)的情況下,非合作行為導(dǎo)致了社會(huì)所期望的經(jīng)濟(jì)效率狀態(tài)。如果廠商采取合作行動(dòng)并決定轉(zhuǎn)向壟斷價(jià)格,那么社會(huì)的經(jīng)濟(jì)效率就會(huì)遭到破壞。這就是為什么WTO和各國政府要加強(qiáng)反壟斷的意義所在。
污染博弈
假如市場(chǎng)經(jīng)濟(jì)中存在著污染,但政府并沒有管制的環(huán)境,企業(yè)為了追求利潤(rùn)的最大化,寧愿以犧牲環(huán)境為代價(jià),也絕不會(huì)主動(dòng)增加環(huán)保設(shè)備投資。按照看不見的手的原理,所有企業(yè)都會(huì)從利己的目的出發(fā),采取不顧環(huán)境的策略,從而進(jìn)入“納什均衡”狀態(tài)。如果一個(gè)企業(yè)從利他的目的出發(fā),投資治理污染,而其他企業(yè)仍然不顧環(huán)境污染,那么這個(gè)企業(yè)的生產(chǎn)成本就會(huì)增加,價(jià)格就要提高,它的產(chǎn)品就沒有競(jìng)爭(zhēng)力,甚至企業(yè)還要破產(chǎn)。這是一個(gè)“看不見的手的有效的完全競(jìng)爭(zhēng)機(jī)制”失敗的例證。直到20世紀(jì)90年代中期,中國鄉(xiāng)鎮(zhèn)企業(yè)的盲目發(fā)展造成嚴(yán)重污染的情況就是如此。只有在政府加強(qiáng)污染管制時(shí),企業(yè)才會(huì)采取低污染的策略組合。企業(yè)在這種情況下,獲得與高污染同樣的利潤(rùn),但環(huán)境將更好。
貿(mào)易戰(zhàn)博弈
貿(mào)易戰(zhàn)對(duì)于剛剛加入WTO的中國而言尤為重要。任何一個(gè)國家在國際貿(mào)易中都面臨著保持貿(mào)易自由與實(shí)行貿(mào)易保護(hù)主義的兩難選擇。貿(mào)易自由與壁壘問題,也是一個(gè)“納什均衡”,這個(gè)均衡是貿(mào)易雙方采取不合作博弈的策略,結(jié)果使雙方因貿(mào)易戰(zhàn)受到損害。X國試圖對(duì)Y國進(jìn)行進(jìn)口貿(mào)易限制,比如提高關(guān)稅,則Y國必然會(huì)進(jìn)行反擊,也提高關(guān)稅,結(jié)果誰也沒有撈到好處。反之,如X和Y能達(dá)成
合作性均衡,即從互惠互利的原則出發(fā),雙方都減少關(guān)稅限制,結(jié)果大家都從貿(mào)易自由中獲得了最大利益,而且全球貿(mào)易的總收益也增加了。
博弈論--這是一個(gè)熱得燙手的概念。它不僅僅存在于數(shù)學(xué)的運(yùn)籌學(xué)中,也正在經(jīng)濟(jì)學(xué)中占據(jù)越來越重要的地位(近幾年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)就頻頻授予博弈論研究者),但如果你認(rèn)為博弈論的應(yīng)用領(lǐng)域僅限于此的話,那你就大錯(cuò)了。實(shí)際上,博弈論甚至在我們的工作和生活中無處不在!在工作中,你在和上司博弈,也在和下屬博弈,你也同樣會(huì)跟其他相關(guān)部門人員博弈;而要開展業(yè)務(wù),你更是在和你的客戶以及競(jìng)爭(zhēng)對(duì)手博弈。在生活中,博弈仍然無處不在。博弈論代表著一種全新的分析方法和全新的思想。
諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者包羅·薩繆爾遜如是說:
要想在現(xiàn)代社會(huì)做個(gè)有價(jià)值的人,你就必須對(duì)博弈論有個(gè)大致的了解。
也可以這樣說,要想贏得生意,不可不學(xué)博弈論;要想贏得生活,同樣不可不學(xué)博弈論。
企業(yè)博弈
博弈論是分析寡頭壟斷企業(yè)市場(chǎng)行為的有力工具。博弈論研究機(jī)智而又理性的經(jīng)濟(jì)活動(dòng)主體,在其行為相互影響時(shí)的決策以及這種決策的均衡問題。
重復(fù)博弈
囚徒困境,砸了傳統(tǒng)經(jīng)濟(jì)學(xué)的場(chǎng)子。因?yàn)閭€(gè)人的自利行為,并不一定導(dǎo)致集體利益的最大化,“看不見的手”拉不住,人類向墮落之城下滑的趨勢(shì),難道這真是一個(gè)悲哀?索性并非如此,撇去博弈論的理性假設(shè)不說。博弈論者很快發(fā)現(xiàn)囚徒困境只在單次博弈情形下明顯,一旦博弈的開始陷入重復(fù),合作將到來。因?yàn)?,未來的收益將左右目前的決策。
以牙還牙
重復(fù)的博弈理論上導(dǎo)致了合作的產(chǎn)生,但是誰也不能保證合作的繼續(xù),因?yàn)橹耙呀?jīng)說過,合作的代價(jià)是建立在損害個(gè)人利益基礎(chǔ)之上的。如果個(gè)人放棄未來收益或當(dāng)前背叛收益大于未來收益,背叛的風(fēng)險(xiǎn)仍然存在。那么在重復(fù)博弈中怎樣的策略才是最優(yōu)。若干睿智而復(fù)雜在經(jīng)過計(jì)算機(jī)中PK之后,極其原始的“以牙換牙”策略脫穎而出,固然這個(gè)策略簡(jiǎn)單至極,其威力卻無窮,以至于人們?cè)诙虝旱男老仓?,發(fā)現(xiàn)這把太阿指之劍倒持的可怕,一旦重復(fù)鏈條中出現(xiàn)一次(也許不經(jīng)意的)背叛,那據(jù)此原則行事的博弈將永無止境的背叛下去,個(gè)人利益極度膨脹的同時(shí),集體利益無限衰微。幸好,這個(gè)世界不是模型,也不是如此簡(jiǎn)單。很多時(shí)候,我們不必以牙還牙,第三方的規(guī)范:道德與法律就是我們的假牙,他們更加有利、有理、有節(jié)。
人質(zhì)困境
一場(chǎng)憋屈的博弈。搶打出頭鳥,人質(zhì)聯(lián)合固然可以制服歹徒,但是誰愿出頭。這一點(diǎn)給了無數(shù)處于劫持者地位的一方以機(jī)會(huì),類似于秦的遠(yuǎn)交近攻、各個(gè)擊破的策略,將最終全盤贏下。人質(zhì)可有反制的策略,當(dāng)然有,不過艱難至極。人質(zhì)可以選擇沉默,這樣他有一定時(shí)間茍延殘喘;或者聯(lián)合劫持者對(duì)付人質(zhì),結(jié)局還是取決于劫持者,萬一他過河拆橋怎么辦;同時(shí)反抗,集體將獲得左右策略,但是這需要壯士斷腕的勇氣,部分人可能因此受傷。這里是實(shí)力與勇氣的較量,而且實(shí)力暫居上風(fēng)。
酒吧博弈
如果人人理性,那么每一天到達(dá)酒吧的人數(shù)將是差不多正好的,但是人非圣賢,往往是有限理性的。第一次到酒吧的人多,那么大多人人認(rèn)為酒吧人太多,太擠。第二次決定的時(shí)候,參考前次而不去酒吧。少數(shù)去的人發(fā)現(xiàn)酒吧的人第二天很少,感覺很爽,第三次將繼續(xù)回來,并重新帶回許多人……循環(huán)就此開始。酒吧博弈一方面顯示,現(xiàn)實(shí)的博弈參與者,是極其有限理性的,其理性只前延后伸一小段。歷史數(shù)據(jù)只對(duì)計(jì)算機(jī)有用,對(duì)人,則不一定。
另一個(gè)方面,酒吧博弈指出,勝利者永遠(yuǎn)只是少數(shù)。盡管酒吧存在調(diào)諧的可能,譬如發(fā)短信時(shí)時(shí)提醒,但成本恐怕太高。而在其他場(chǎng)合,少數(shù)派可能更加會(huì)設(shè)置種種障礙阻止后進(jìn)者的上升。也就是說,我們的世界仍然是操弄在少數(shù)派的手中。不過,總算這個(gè)世界不是模型,少數(shù)派的道路到底還是有跡可循的。老練的將軍仍舊會(huì)在八卦迷陣中找到唯一的生門。若你想要,必須做一個(gè)更加老練的將軍。
槍手博弈
王者的悲哀。三人對(duì)槍自決,甲乙丙槍法優(yōu)劣遞減。最后無奈而神奇的結(jié)局,將不取決于同時(shí)開槍還是先后開槍,最優(yōu)良的槍手,倒下的概率將最高;而最蹩腳的槍手,存活的希望卻最大。因?yàn)闆]有人會(huì)把威脅最小的槍手列為一號(hào)清楚目標(biāo)。在這里,后發(fā)制人的弱勢(shì)者將勝出。以弱勝強(qiáng),絕不是神話。
難道王者的命運(yùn)就真如此不堪,呵,道別忘了每個(gè)理論模型都是有其前提的,擊破之中任何一個(gè),王者仍將歸來。這就是先發(fā)優(yōu)勢(shì)。假設(shè)這是一場(chǎng)類似CS的競(jìng)技,優(yōu)秀的槍手擊倒二號(hào)槍手,立刻獲得獎(jiǎng)勵(lì):盾牌。那么三號(hào)槍手將陷入絕境。不過,不管怎樣,這個(gè)博弈模型,到底給了弱勢(shì)者一份希望。機(jī)會(huì)永遠(yuǎn)存在。
獵鹿博弈
兩個(gè)獵人合作獵鹿獲得的收益將遠(yuǎn)大于分別獵兔的收益,戰(zhàn)略聯(lián)盟將開始。這或許是件好事,不過有取決于最后獵獲的鹿——這一公共資源的分配,如果分配得當(dāng),整體的效率將增加。如果一方主導(dǎo),另一方受損,那么帕累托改善無法進(jìn)行,合作可能終將破裂。
另外一個(gè)問題,更加大局的問題。合作的示范性將使得更多的獵人加入,獵獲的鹿將大大增加,人類的利益短期內(nèi)將呈幾何級(jí)數(shù)增長(zhǎng)。但是最后,確是生態(tài)失衡,鹿群滅群。短暫的繁華之后,獵人將再一次回歸于原始獵兔生活。盡管為了避免這一悲劇,人類還有最后的希望:制度經(jīng)濟(jì)學(xué)的法寶——科斯定理以產(chǎn)權(quán)歸屬來解決外部經(jīng)濟(jì)問題。但由于談判成本以及可行性,人類社會(huì)的公共悲劇仍將不斷上演。
智豬博弈
混沌之前最后的博弈。小豬和大豬住在豬圈的一邊(食槽在這里),開啟食物的開關(guān)在另一頭,誰去踩,誰喪失先機(jī)。結(jié)果怎樣?是小豬選擇“搭便車”,大豬勤跑。因?yàn)樾∝i無論跑還是停,大豬的最優(yōu)策略都是策略都是去踩機(jī)關(guān)。不過在實(shí)際生活中。這里依舊存在兩種策略。
小豬的“搭便車”。大豬有的時(shí)候,自覺或不自覺地自封“俠之大者,為國為民”,并因此承受一些不能承受之重?!恫┺恼摰脑幱?jì)》指出美國戰(zhàn)后的行為極似大豬,戰(zhàn)后的美國竭力宣傳自己的普世價(jià)值觀,并深入到海外事務(wù),甚至不惜重金協(xié)助小國防務(wù)。這樣小國不自覺地對(duì)大國進(jìn)行了“剝削”。
大豬在擊破模型的一個(gè)假設(shè)之后,仍然有一個(gè)后發(fā)制人的機(jī)會(huì)。因?yàn)榇筘i和小豬的耐餓能力不一樣,大豬完全有能力撐得更久,小豬如果不想餓死,那只有一條豪賭的路子:龜兔賽跑式的豪賭,但愿大豬打了個(gè)盹兒,他回來的時(shí)候,還能吃上一兩口,要不然真是賠了夫人又折兵了。據(jù)此,再也不難解釋為什么很多人切齒的騰訊,毫無顧忌地跟風(fēng),做QQ旋風(fēng),做拍拍,做滔滔。因?yàn)椴桓市牡男∝i早早把新技術(shù)研發(fā)的前期搞定了,大豬們只需要悄悄跟隨,適當(dāng)?shù)臅r(shí)候踢開擋路的,就可以了。
大豬在這里的后發(fā)制人和槍手博弈的后發(fā)并不一致,槍手后發(fā)是建立在他人惡斗的基礎(chǔ)上,大豬后發(fā)完全是以自身實(shí)力為基礎(chǔ)。而且大豬完全不必采取任何激進(jìn)措施,只要跟隨就好。因?yàn)樾∝i獲勝的條件不是接近,還是距離。
警察與小偷
令人沮喪的博弈結(jié)局。警察和小偷各只有一個(gè)機(jī)會(huì)去巡查或者偷盜A地或B地。A地的價(jià)值大于B地,那么警察應(yīng)該為了保護(hù)價(jià)值大而一直保護(hù)A地嗎。博弈論認(rèn)為當(dāng)然不是,警察的合理策略應(yīng)當(dāng)是有傾向于A以一定概率的隨機(jī)巡查。這個(gè)概率就是:p=A地價(jià)值/AB地總價(jià)值。這種情況下才能使小偷最大得手幾率降至最低。但是很不幸的是,此時(shí)的小偷謀求的是,最小得手幾率的最大化。也就是說,警察的最優(yōu)策略將把小偷的最差策略改良!這個(gè)便是馮·諾伊曼提出的“最小最大定律”。
我們必須再一次感謝這個(gè)不完美的世界,因?yàn)楝F(xiàn)實(shí)之中,類似的現(xiàn)象,對(duì)于一方仍然可以設(shè)法找到對(duì)手致命的規(guī)律性行動(dòng)(當(dāng)然必須考慮到對(duì)方是不是一個(gè)更加老練的獵手,故意放出的誘餌)。而保持自己的行動(dòng)的無序性,則有可能成為欺騙策略的武器,這倒似張三豐所言道的:無招勝有招。
斗雞博弈
兩只斗雞在決斗的時(shí)候,無論選擇進(jìn)或退都是一個(gè)難題,因?yàn)榧{什均衡已經(jīng)給出了一勝一敗的最優(yōu)策略。在很多較量下,死拼將是得不償失的,因?yàn)楹芸赡芙o第三者機(jī)會(huì)。因此,兩個(gè)已經(jīng)在戰(zhàn)場(chǎng)的強(qiáng)勢(shì)力很可能自覺的遵循納什均衡,當(dāng)一方攻擊時(shí),另一方暫退。雖然可能某方暫時(shí)受損,但較之于兩敗俱傷是好得多的。不過,要維持這一狀況,必須保證下一次先期受損的一方發(fā)動(dòng)攻勢(shì)的時(shí)候,另一方同樣的后退。于是這樣的攻擊性行為開始變得“儀式化”,沒有人真正流血。這只不過是兩個(gè)巨頭玩弄的游戲,目的是警告后來者,想進(jìn)來,那么也得陪我們一起玩,可是你玩的起么?這正是百事的廣告,即使暗含挑釁也最多只到“敢為中國紅”這樣的地步的原因。
協(xié)和謬誤
歐洲政府在大量投資協(xié)和飛機(jī)后,終于不能自拔。即使前景黯淡,也撐著面子投下去,非要走投無路才放棄。而這時(shí)投入的成本已經(jīng)全打水漂了。如果,發(fā)現(xiàn)不能繼續(xù)的時(shí)候,就果敢放手,損失會(huì)小得多??墒撬麄儠?huì)、能這么做么?壯士斷腕,是何等的壯烈,卻也是何等的艱難!
沉沒成本很可能會(huì)延續(xù)人們無畏的堅(jiān)持。已經(jīng)沉沒的本該放棄,可惜大部分有賭徒式的心理,相信阿基米德的杠桿終將啟動(dòng)??上麄?cè)谂赖阶銐蚯藙?dòng)杠桿的支點(diǎn)之前,已經(jīng)窒息了。
協(xié)和謬誤,倒是給了人們半途而廢的理由,會(huì)不會(huì)有人擔(dān)心它的濫觴會(huì)左右一些本該堅(jiān)持的目標(biāo)?的確有這個(gè)可能,但是應(yīng)該相信人們足夠理智,完全可以比較沉沒成本、機(jī)會(huì)成本與未來收益的關(guān)系。看清了的,必定會(huì)坦然地走出協(xié)和謬誤。
蜈蚣博弈
一場(chǎng)顛前倒后的博弈。蜈蚣博弈的機(jī)理是以最終的結(jié)果倒退至開始。這是一個(gè)睿智的策略,因果相報(bào),把握好因緣,自有好結(jié)果。它的另一個(gè)好處,就是使得未來的計(jì)劃明晰化,是你不再徘徊。只可惜,很多時(shí)候,碌碌無為的我們并沒有看透迷局的眼睛。我們黑色的眼睛只習(xí)慣于黑夜。
蜈蚣博弈也有一個(gè)致命的悖論,仍舊是個(gè)人利益和集體利益的沖突,因?yàn)樽詈笠淮蔚谋撑咽找媸冀K優(yōu)于合作??杀氖牵@一次背叛將由于人性的理智,穿越時(shí)光隧道,回到原始的地點(diǎn):人們將從開始就拒絕合作。還是感謝我們這個(gè)不完美的世界吧,事實(shí)上人們很少這樣做。當(dāng)然合作到最后的也很少,這意味著,倒推法只在中間階段突然發(fā)生了作用,只不過誰也不能預(yù)測(cè),中間一步在哪里。在那里,我們只有冀望信任、道德、良知等等。
分蛋糕博弈
兩個(gè)小孩怎么分蛋糕?經(jīng)典的故事,經(jīng)典的解答:一個(gè)分,一個(gè)選?,F(xiàn)實(shí)多如此,權(quán)利的合理分配將有效促進(jìn)公平與效率。經(jīng)營(yíng)權(quán)與所有權(quán)的分置的確使得經(jīng)濟(jì)更加活力。不過分蛋糕的進(jìn)階模型卻強(qiáng)調(diào)了討價(jià)還價(jià)的策略,分蛋糕不是一次性的,而是多回合的,而且出現(xiàn)成本:蛋糕在融化。
時(shí)間稱本的加入,將使得分配變得復(fù)雜化。雙方如果不能及時(shí)達(dá)成交易,不僅集體的收益將減量,而且個(gè)體的收益也將減少。在此情況下,利用時(shí)間稱本以及威脅、承諾將對(duì)其中一方極其有利。顧客可能迫于情勢(shì),必須盡快結(jié)束談判,這時(shí)賣方卻不慌不忙,故意拖延,顧客一方將不得不在價(jià)格上作出妥協(xié)。
顧客一方當(dāng)然也有策略,它的策略就是貨比三家,要求承諾或威脅。這個(gè)前提是買方市場(chǎng)的存在。顧客還應(yīng)當(dāng)保護(hù)自己討價(jià)還價(jià)的能力,這就是顧客有權(quán)投訴商家。
鷹鴿博弈
這個(gè)博弈很多人等同于斗雞博弈。不過,斗雞是兩個(gè)兼具侵略性的個(gè)體,鷹鴿卻是兩個(gè)不同群體的博弈,一個(gè)和平,一個(gè)侵略。在只有鴿子一個(gè)苞谷場(chǎng)里,突然加入的鷹將大大獲益,并吸引同伴加入。但結(jié)果不是鷹將鴿逐出苞谷場(chǎng),而是一定比例共存,因?yàn)辁椚涸黾右恢机椀倪呺H收益趨零時(shí)(鷹群發(fā)生內(nèi)斗),均衡將到來。
由此產(chǎn)生了ESS進(jìn)化上的穩(wěn)定策略,也就是說一旦均衡形成,偏離的運(yùn)動(dòng)會(huì)受到自然選擇的打擊。也就是鷹群飽滿后,再試圖加入的鷹將會(huì)被鷹群排擠。
進(jìn)化上的穩(wěn)定均衡最大的好處莫過于保持穩(wěn)定。但問題在于形成強(qiáng)勢(shì)的路徑依賴,也就是勝出的不一定是最好的。因?yàn)樽詈玫臅?huì)被當(dāng)作出頭鳥干掉,這是個(gè)體的失敗,集團(tuán)的勝利以及集體的止步不前。
臟臉博弈
恍然大悟的博弈。三個(gè)人在屋子里,不許說話。美女進(jìn)來說:你們當(dāng)中至少一個(gè)人臉是臟的。三人環(huán)看,沒有反應(yīng)。美女又說:你們知道嗎?三人再看,頓悟,臉都紅了。為什么?因?yàn)槊琅笠痪鋸U話點(diǎn)破天機(jī),三個(gè)人都知道臟臉的存在,而且推測(cè)知道對(duì)方也知道了臟臉的存在(因?yàn)榱韮扇四槢]紅,說明他們看到臟臉了),而且知道對(duì)方知道自己已經(jīng)想到上一步……循環(huán)開始,知識(shí)開始共同化,真相大白:三個(gè)人都是臟臉,所有人都臉紅了。
這就是共同知識(shí)的作用,它的作用顯得有點(diǎn)可怕的強(qiáng)大。幾乎是一招無影腿,殺人不見血。在臺(tái)面上的博弈之前,私下的算計(jì)已經(jīng)置對(duì)手于死地。不過,很可能對(duì)方也預(yù)料到這一點(diǎn),早也想到這一點(diǎn),同時(shí)殺來。終于,形成雙死局面。
當(dāng)然,現(xiàn)實(shí)雖然存在類似現(xiàn)象,不過共同知識(shí)更大的作用在于減少交易成本。因?yàn)槟承┮?guī)則人盡皆知,雙方只要各自依之行事就可以了。
信息均衡
很顯然,信息的作用在博弈之中非常重要。將博弈論還原到現(xiàn)實(shí),人們不再完全理性,信息存在不對(duì)稱,博弈就需要在搶占信息高地上作出努力。
信息不對(duì)稱,是一個(gè)很大的障礙。信息的不對(duì)稱會(huì)造成“逆向選擇”和“道德風(fēng)險(xiǎn)”,前者事前,后者事后。信息不對(duì)稱短期內(nèi)對(duì)某一方會(huì)有利,但最終會(huì)破壞整個(gè)市場(chǎng)。于是有兩個(gè)解決策略。
信息傳遞
傳達(dá)你的正面的信息的策略,也就是說吸引顧客走到你的柜臺(tái)面前。它的要點(diǎn)是保持有效、減低成本。
信息甄別
誘導(dǎo)對(duì)手暴露其私下?lián)碛械恼鎸?shí)信息。就是給顧客一個(gè)放大鏡,保證顧客不會(huì)走到其他柜臺(tái)去。這種策略顯然更加有效,不過風(fēng)險(xiǎn)也更大:萬一顧客用放大鏡看出了了自己的瑕疵怎么辦