作者: 谷小娜
申明:本網(wǎng)站內(nèi)容僅用于學(xué)術(shù)交流,如有侵犯您的權(quán)益,請及時告知我們,本站將立即刪除有關(guān)內(nèi)容。
摘要:文章通過對多人多次重復(fù)博弈的分析,解決了“囚徒困境”提出的個體理性與集體理性的矛盾,提出了新的“理性人”的人性假設(shè)。
關(guān)鍵詞:人性假設(shè),多人多次重復(fù)博弈
建立在亞當(dāng)?斯密的“看不見的手”理論以及“理性人”的人性假設(shè)基礎(chǔ)之上的西方經(jīng)濟學(xué),近年來受到了
來自博弈論的嚴峻挑戰(zhàn),被證實其存在嚴重的假設(shè)漏洞,艾克斯羅德對多人多次重復(fù)博弈的對策研究以及從他的研究得出的新的人性假設(shè)從某種程度上彌補了這個漏洞,下面本文將詳細論述這個新的理論突破。
一、傳統(tǒng)經(jīng)濟學(xué)的人性假設(shè)
早在200多年以前,西方經(jīng)濟學(xué)的鼻祖亞當(dāng)?斯密,提出了“看不見的手”原理。斯密寫了一段被廣為引用的著名的話:“每人都在力圖應(yīng)用他的資本,來使其生產(chǎn)品能得到最大的價值。一般地說:他并不企圖增進公共之福利,也不知道他所增進的公共福利為多少。他所追求的僅僅是他個人的安樂,僅僅是他個人的利益。在這樣做時,有只看不見的手引導(dǎo)他去促進一種目標,而這種目標決不是他追求的東西。由于追逐他自己的利益,他經(jīng)常促進了社會利益,其效果要比他真正想促進社會利益時所得到的效果為大。”這段頌揚資本主義的文字被稱為是斯密的“看不見的手”原理。可以毫不夸張地說:整個現(xiàn)代主流西方經(jīng)濟學(xué)都是建立在“看不見的手”的原理之上的。
亞當(dāng)?斯密的“看不見的手”原理,既是經(jīng)濟學(xué)的一個最重要的假設(shè),同時也是一個非常重要的哲學(xué)假設(shè)。這個假定首先是指經(jīng)濟學(xué)考慮問題的時候,把基本的分析單位放在“個體”之上,即“個人”。其他所有問題,所有層次上的問題,被假定都可以還原到這個個體和個體之間的關(guān)系來解釋。其次,個體又被假定是一個理性的,理性思考的個體。經(jīng)濟學(xué)為了能夠更準確地、精確地思考,對理性的定義就要比傳統(tǒng)哲學(xué)狹窄一點。從而把理性定義為“為自己的、為個人的利益充分,要把它這個人利益最大化”的一種思考方式,這種思考方式又有一個一貫的或者一致的特點。而個人就是一個符合邏輯思考的,在符合邏輯思考的情況下,處處想著要把自己的利益最大化的個體,即“理性人”。
亞當(dāng)?斯密認為,每個人雖然都是只為自己考慮,但是假如有一個基本上能夠保持社會秩序的一個制度,或者說有這么一個市場,那么盡管每個都為自己,最后的結(jié)果卻是一個社會的一個共同利益的發(fā)展。從亞當(dāng)?斯密開始至今的大部分經(jīng)濟學(xué)家認為,只要人是完全理性的,在經(jīng)濟活動中始終遵循個人的“理性原則”,那么,整個經(jīng)濟社會,從產(chǎn)品市場到要素市場都會達到一種均衡的狀態(tài),整個社會的福利也會達到最大的狀態(tài)――“帕累托最優(yōu)”狀態(tài),這樣的社會就是一個完美的社會。此后的經(jīng)濟學(xué)家,盡管在不同方面上對這個理論進行了修正,但他們始終是承認在“看不見的手”引導(dǎo)下“理性人”是能夠達到社會福利最大化的。
二、博弈論對傳統(tǒng)人性假設(shè)的挑戰(zhàn)
博弈論研究人們的策略互動行為。其認為:人是理性的,即人人都會在約束條件下最大化自身的利益;人們在交往合作中有沖突,行為互相影響,而且信息不對稱。博弈論研究人們的行為,在直接相互作用時的決策,以及決策的均衡問題。換句話說,博弈論研究如何使得人們在市場經(jīng)濟中,自愿做出大家都遵守和實施的有效制度安排,以增進社會的福利的機制。
博弈論在經(jīng)濟學(xué)領(lǐng)域應(yīng)用的一個經(jīng)典的案例就是“囚徒的困境”。即警察抓住了兩個合伙犯罪的罪犯,但缺乏足夠的證據(jù)。如果其中至少有一人供認犯罪,就能確認罪名成立。警察將其分別關(guān)在兩個獨立的不能互通信息的牢房里審訊。在這種情形下,兩個囚犯都可以做出自己的選擇:供出同伙或者保持沉默。
這兩個囚犯都知道,若他倆都保持沉默的話,就都會被釋放,但警察規(guī)定:如果他們中的一個人告發(fā)他的同伙,那么他就可以被無罪釋放。而他的同伙會被按照最重的罪來判決。當(dāng)然,若這兩個囚犯互相背叛,兩個人都會被按照最重的罪來判決。
那么,這兩個囚犯該怎么辦?是互相合作還是互相背叛?從表面上看,他們應(yīng)該互相合作,這樣他們倆都能得到最好的結(jié)果:自由。但他們要考慮對方可能采取的選擇。A犯和B犯都根本不相信他的同伙不會向警方提供對他不利的證據(jù)。這種想法的誘惑力實在太大了。
所以兩個囚犯唯一理性的選擇就是背叛同伙,所以結(jié)果就是,兩個囚犯按照不顧一切的邏輯得到了最糟糕的報應(yīng):坐牢。
從“囚徒的困境”可以看到與亞當(dāng)?斯密的“看不見的手”原理完全相反的結(jié)論,每個囚犯根據(jù)自己的“理性”判斷,做出了對自身來講是“最優(yōu)的”行為,但是他們兩個人構(gòu)成的整體的福利卻不是最大的。
“囚徒的困境”既揭示了個體理性與團體理性之間的矛盾――從個體利益出發(fā)的行為往往不能實現(xiàn)團體的最大利益,同時也揭示了個體理性自身的內(nèi)在矛盾――從個體利益出發(fā)的行為最終也不一定能實現(xiàn)個體的最大利益,甚至?xí)玫较喈?dāng)差的結(jié)果。
這樣,“囚徒的困境”被認為是對亞當(dāng)?斯密體系的一個挑戰(zhàn),當(dāng)然它并沒有否定“看不見的手”,而只是揭示了“看不見的手”這個假設(shè)下的一些經(jīng)濟活動的漏洞。
三、多人多次重復(fù)博弈所展示的人性假設(shè)
美國學(xué)者艾克斯羅德在《合作的進化》一書中通過對多人多次重復(fù)博弈的對策研究,指出在博弈中產(chǎn)生合作的必要條件和獲勝策略的主要特征:當(dāng)策略群體是按各種策略的得分進行淘汰和進化時,群體以一種不可逆轉(zhuǎn)的方式向合作的方向進化,即群體的合作性隨進化過程越來越大。
艾克斯羅德研究合作的兩個前提假設(shè):每個人都是自私的;沒有權(quán)威干預(yù)個人決策。即個人可以完全按照自己利益最大化的企圖進行決策。在此基礎(chǔ)上,他設(shè)計了一個實驗,實驗要求每個參賽者把追求得分最多的策略寫成計算機程序,然后用單循環(huán)賽的方式將參賽程序兩兩博弈,以找出什么樣的策略得分最高,游戲什么時候結(jié)束是不確定的。得分規(guī)則可用如圖1得益矩陣表示:
第一輪游戲有14個程序參加,再加上艾克斯羅德自己的一個隨機程序(即以50%的概率選取合作或不合作),運轉(zhuǎn)了300次。結(jié)果得分最高的程序是加拿大學(xué)者羅伯布寫的“一報還一報”(tit for tat)。這個程序的特點是,第一次對局采用合作的策略,以后每一步都跟隨對方上一步的策略,對方上一次合作,我這一次就合作,對方上一次不合作,我這一次就不合作。艾克斯羅德還發(fā)現(xiàn),得分排在前面的程序有三個特點:從不首先背叛,即“善良的”;不能對方一次背叛,就沒完沒了的報復(fù),以后對方只要改為合作,我也要合作,即“寬容性”;對于對方的背叛行為一定要報復(fù),不能總是合作,即“強硬的”。
為了進一步驗證上述結(jié)論,艾克斯羅德邀請了更多人再做了一次游戲,并把第一次的結(jié)果公開發(fā)表。第二次征集到了62個程序,加上他自己的隨機程序,又進行了一次競賽。結(jié)果,第一名的仍是“一報還一報”。艾克斯羅德總結(jié)這次游戲的結(jié)論是:“一報還一報”仍是最優(yōu)策略。前面提到的三個特點仍然有效,因為63人中的前15名里,只有第8名的哈靈頓程序是“不善良的”,后15名中,只有1個總是合作的是“善良的”??杉づ院蛯捜菪砸驳玫搅俗C明。此外,好的策略還必須具有的一個特點是“清晰性”,即能讓對方在三、五步對局內(nèi)辨識出來。“一報還一報”就有很好的清晰性,讓對方很快發(fā)現(xiàn)規(guī)律,從而不得不采取合作的態(tài)度。
艾克斯羅德設(shè)計了一個實驗,假設(shè)63個對策者中,誰在第一輪中的得分高,他在第二輪的群體中所占比例就越高,而且是他的得分的正函數(shù)。這樣,群體的結(jié)構(gòu)就會在進化過程中改變,由此可以看出群體是向什么方向進化的。
聯(lián)系客服