九色国产,午夜在线视频,新黄色网址,九九色综合,天天做夜夜做久久做狠狠,天天躁夜夜躁狠狠躁2021a,久久不卡一区二区三区

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
從“囚徒困境”到多人多次重復(fù)博弈的人性假設(shè)

      作者: 谷小娜
      申明:本網(wǎng)站內(nèi)容僅用于學(xué)術(shù)交流,如有侵犯您的權(quán)益,請及時告知我們,本站將立即刪除有關(guān)內(nèi)容。

      摘要:文章通過對多人多次重復(fù)博弈的分析,解決了“囚徒困境”提出的個體理性與集體理性的矛盾,提出了新的“理性人”的人性假設(shè)。
  
      關(guān)鍵詞:人性假設(shè),多人多次重復(fù)博弈
      建立在亞當(dāng)?斯密的“看不見的手”理論以及“理性人”的人性假設(shè)基礎(chǔ)之上的西方經(jīng)濟學(xué),近年來受到了
      來自博弈論的嚴峻挑戰(zhàn),被證實其存在嚴重的假設(shè)漏洞,艾克斯羅德對多人多次重復(fù)博弈的對策研究以及從他的研究得出的新的人性假設(shè)從某種程度上彌補了這個漏洞,下面本文將詳細論述這個新的理論突破。
      一、傳統(tǒng)經(jīng)濟學(xué)的人性假設(shè)
      早在200多年以前,西方經(jīng)濟學(xué)的鼻祖亞當(dāng)?斯密,提出了“看不見的手”原理。斯密寫了一段被廣為引用的著名的話:“每人都在力圖應(yīng)用他的資本,來使其生產(chǎn)品能得到最大的價值。一般地說:他并不企圖增進公共之福利,也不知道他所增進的公共福利為多少。他所追求的僅僅是他個人的安樂,僅僅是他個人的利益。在這樣做時,有只看不見的手引導(dǎo)他去促進一種目標,而這種目標決不是他追求的東西。由于追逐他自己的利益,他經(jīng)常促進了社會利益,其效果要比他真正想促進社會利益時所得到的效果為大。”這段頌揚資本主義的文字被稱為是斯密的“看不見的手”原理。可以毫不夸張地說:整個現(xiàn)代主流西方經(jīng)濟學(xué)都是建立在“看不見的手”的原理之上的。
      亞當(dāng)?斯密的“看不見的手”原理,既是經(jīng)濟學(xué)的一個最重要的假設(shè),同時也是一個非常重要的哲學(xué)假設(shè)。這個假定首先是指經(jīng)濟學(xué)考慮問題的時候,把基本的分析單位放在“個體”之上,即“個人”。其他所有問題,所有層次上的問題,被假定都可以還原到這個個體和個體之間的關(guān)系來解釋。其次,個體又被假定是一個理性的,理性思考的個體。經(jīng)濟學(xué)為了能夠更準確地、精確地思考,對理性的定義就要比傳統(tǒng)哲學(xué)狹窄一點。從而把理性定義為“為自己的、為個人的利益充分,要把它這個人利益最大化”的一種思考方式,這種思考方式又有一個一貫的或者一致的特點。而個人就是一個符合邏輯思考的,在符合邏輯思考的情況下,處處想著要把自己的利益最大化的個體,即“理性人”。
      亞當(dāng)?斯密認為,每個人雖然都是只為自己考慮,但是假如有一個基本上能夠保持社會秩序的一個制度,或者說有這么一個市場,那么盡管每個都為自己,最后的結(jié)果卻是一個社會的一個共同利益的發(fā)展。從亞當(dāng)?斯密開始至今的大部分經(jīng)濟學(xué)家認為,只要人是完全理性的,在經(jīng)濟活動中始終遵循個人的“理性原則”,那么,整個經(jīng)濟社會,從產(chǎn)品市場到要素市場都會達到一種均衡的狀態(tài),整個社會的福利也會達到最大的狀態(tài)――“帕累托最優(yōu)”狀態(tài),這樣的社會就是一個完美的社會。此后的經(jīng)濟學(xué)家,盡管在不同方面上對這個理論進行了修正,但他們始終是承認在“看不見的手”引導(dǎo)下“理性人”是能夠達到社會福利最大化的。
      二、博弈論對傳統(tǒng)人性假設(shè)的挑戰(zhàn)
      博弈論研究人們的策略互動行為。其認為:人是理性的,即人人都會在約束條件下最大化自身的利益;人們在交往合作中有沖突,行為互相影響,而且信息不對稱。博弈論研究人們的行為,在直接相互作用時的決策,以及決策的均衡問題。換句話說,博弈論研究如何使得人們在市場經(jīng)濟中,自愿做出大家都遵守和實施的有效制度安排,以增進社會的福利的機制。
      博弈論在經(jīng)濟學(xué)領(lǐng)域應(yīng)用的一個經(jīng)典的案例就是“囚徒的困境”。即警察抓住了兩個合伙犯罪的罪犯,但缺乏足夠的證據(jù)。如果其中至少有一人供認犯罪,就能確認罪名成立。警察將其分別關(guān)在兩個獨立的不能互通信息的牢房里審訊。在這種情形下,兩個囚犯都可以做出自己的選擇:供出同伙或者保持沉默。
      這兩個囚犯都知道,若他倆都保持沉默的話,就都會被釋放,但警察規(guī)定:如果他們中的一個人告發(fā)他的同伙,那么他就可以被無罪釋放。而他的同伙會被按照最重的罪來判決。當(dāng)然,若這兩個囚犯互相背叛,兩個人都會被按照最重的罪來判決。
      那么,這兩個囚犯該怎么辦?是互相合作還是互相背叛?從表面上看,他們應(yīng)該互相合作,這樣他們倆都能得到最好的結(jié)果:自由。但他們要考慮對方可能采取的選擇。A犯和B犯都根本不相信他的同伙不會向警方提供對他不利的證據(jù)。這種想法的誘惑力實在太大了。
      所以兩個囚犯唯一理性的選擇就是背叛同伙,所以結(jié)果就是,兩個囚犯按照不顧一切的邏輯得到了最糟糕的報應(yīng):坐牢。
      從“囚徒的困境”可以看到與亞當(dāng)?斯密的“看不見的手”原理完全相反的結(jié)論,每個囚犯根據(jù)自己的“理性”判斷,做出了對自身來講是“最優(yōu)的”行為,但是他們兩個人構(gòu)成的整體的福利卻不是最大的。
      “囚徒的困境”既揭示了個體理性與團體理性之間的矛盾――從個體利益出發(fā)的行為往往不能實現(xiàn)團體的最大利益,同時也揭示了個體理性自身的內(nèi)在矛盾――從個體利益出發(fā)的行為最終也不一定能實現(xiàn)個體的最大利益,甚至?xí)玫较喈?dāng)差的結(jié)果。
      這樣,“囚徒的困境”被認為是對亞當(dāng)?斯密體系的一個挑戰(zhàn),當(dāng)然它并沒有否定“看不見的手”,而只是揭示了“看不見的手”這個假設(shè)下的一些經(jīng)濟活動的漏洞。
      三、多人多次重復(fù)博弈所展示的人性假設(shè)
      美國學(xué)者艾克斯羅德在《合作的進化》一書中通過對多人多次重復(fù)博弈的對策研究,指出在博弈中產(chǎn)生合作的必要條件和獲勝策略的主要特征:當(dāng)策略群體是按各種策略的得分進行淘汰和進化時,群體以一種不可逆轉(zhuǎn)的方式向合作的方向進化,即群體的合作性隨進化過程越來越大。
      艾克斯羅德研究合作的兩個前提假設(shè):每個人都是自私的;沒有權(quán)威干預(yù)個人決策。即個人可以完全按照自己利益最大化的企圖進行決策。在此基礎(chǔ)上,他設(shè)計了一個實驗,實驗要求每個參賽者把追求得分最多的策略寫成計算機程序,然后用單循環(huán)賽的方式將參賽程序兩兩博弈,以找出什么樣的策略得分最高,游戲什么時候結(jié)束是不確定的。得分規(guī)則可用如圖1得益矩陣表示:
      第一輪游戲有14個程序參加,再加上艾克斯羅德自己的一個隨機程序(即以50%的概率選取合作或不合作),運轉(zhuǎn)了300次。結(jié)果得分最高的程序是加拿大學(xué)者羅伯布寫的“一報還一報”(tit for tat)。這個程序的特點是,第一次對局采用合作的策略,以后每一步都跟隨對方上一步的策略,對方上一次合作,我這一次就合作,對方上一次不合作,我這一次就不合作。艾克斯羅德還發(fā)現(xiàn),得分排在前面的程序有三個特點:從不首先背叛,即“善良的”;不能對方一次背叛,就沒完沒了的報復(fù),以后對方只要改為合作,我也要合作,即“寬容性”;對于對方的背叛行為一定要報復(fù),不能總是合作,即“強硬的”。
      為了進一步驗證上述結(jié)論,艾克斯羅德邀請了更多人再做了一次游戲,并把第一次的結(jié)果公開發(fā)表。第二次征集到了62個程序,加上他自己的隨機程序,又進行了一次競賽。結(jié)果,第一名的仍是“一報還一報”。艾克斯羅德總結(jié)這次游戲的結(jié)論是:“一報還一報”仍是最優(yōu)策略。前面提到的三個特點仍然有效,因為63人中的前15名里,只有第8名的哈靈頓程序是“不善良的”,后15名中,只有1個總是合作的是“善良的”??杉づ院蛯捜菪砸驳玫搅俗C明。此外,好的策略還必須具有的一個特點是“清晰性”,即能讓對方在三、五步對局內(nèi)辨識出來。“一報還一報”就有很好的清晰性,讓對方很快發(fā)現(xiàn)規(guī)律,從而不得不采取合作的態(tài)度。
      艾克斯羅德設(shè)計了一個實驗,假設(shè)63個對策者中,誰在第一輪中的得分高,他在第二輪的群體中所占比例就越高,而且是他的得分的正函數(shù)。這樣,群體的結(jié)構(gòu)就會在進化過程中改變,由此可以看出群體是向什么方向進化的。

      “一報還一報”原來在群體中占1/63,經(jīng)過1000代的進化,結(jié)構(gòu)穩(wěn)定下來時,它占了24%。另外,有一些程序在進化過程中消失了。其中有一個值得研究的程序,即原來前15名中唯一的那個“不善良的”哈靈頓程序,它的對策方案是,首先合作,當(dāng)發(fā)現(xiàn)對方一直在合作,它就突然來個不合作,如果對方立刻報復(fù)它,它就恢復(fù)合作,如果對方仍然合作,它就繼續(xù)背叛。這個程序一開始發(fā)展很快,但等到除了“一報還一報”之外的其它程序開始消失時,它就開始下降了。因此,以合作系數(shù)來測量,群體是越來越合作的。
      進化實驗揭示了一個哲理:一個策略的成功應(yīng)該以對方的成功為基礎(chǔ)?!耙粓筮€一報”在兩個人對策時,得分不可能超過對方,最多打個平手,但它的總分最高。它賴以生存的基礎(chǔ)是很牢固的,因為它讓對方得到了高分。哈靈頓程序就不是這樣,它得到高分時,對方必然得到低分。它的成功是建立在別人失敗的基礎(chǔ)上的,而失敗者總是要被淘汰的,當(dāng)失敗者被淘汰之后,這個好占別人便宜的成功者也要被淘汰。
      艾克斯羅德通過數(shù)學(xué)化和計算機化的方法研究如何突破囚徒困境,達成合作,將這項研究帶到了一個全新境界,他在數(shù)學(xué)上的證明無疑是十分雄辯和令人信服的,而且,他在計算機模擬中得出的一些結(jié)論是非常驚人的發(fā)現(xiàn),比如,總分最高的人在每次博弈中都沒有拿到最高分。
      四、結(jié)束語
      艾克斯羅德所發(fā)現(xiàn)的“一報還一報”策略,從社會學(xué)的角度可以看作是一種“互惠式利他”,這種行為的動機是個人私利,但它的結(jié)果是雙方獲利,并通過互惠式利他有可能覆蓋了范圍最廣的社會生活,人們通過送禮及回報,形成了一種社會生活的秩序,這種秩序即使在多年隔絕,語言不通的人群之間也是最易理解的東西。有些看似純粹的利他行為,比如無償損贈,也通過某些間接方式,比如社會聲譽的獲得,得到了回報。研究這種行為,將對我們理解社會生活有很重要的意義。
      艾克斯羅德在《合作的進化》一書結(jié)尾提出幾個結(jié)論:友誼不是合作的必要條件,即使是敵人,只要滿足了關(guān)系持續(xù),互相回報的條件,也有可能合作。預(yù)見性也不是合作的前提,但是,當(dāng)有預(yù)見性的人類了解了合作的規(guī)律之后,合作進化的過程就會加快。這時,預(yù)見性是有用的,學(xué)習(xí)也是有用的。
      在這里可以得出一個重要的結(jié)論:“一報還一報”應(yīng)當(dāng)是“理性人”的重要行為準則,具備了“善意的、寬容的、強硬的、清晰的”性質(zhì)的“理性人”,才是一個完美的“理性人”,這樣,“囚徒困境”所提出的挑戰(zhàn)就會得到圓滿的解決。
      囚徒困境擴展為多人博弈時,就體現(xiàn)了一個更廣泛的問題──“社會悖論”,或“資源悖論”。人類共有的資源是有限的,當(dāng)每個人都試圖從有限的資源中多拿一點兒時,就產(chǎn)生了局部利益與整體利益的沖突。人口問題、資源危機、交通阻塞,都可以在社會悖論中得以解釋,在這些問題中,關(guān)鍵是通過研究,制定游戲規(guī)則來控制每個人的行為。
      艾克斯羅德的一些結(jié)論在中國古典文化道德傳統(tǒng)中可以很容易地找到對應(yīng),“投桃報李”、“人不犯我,我不犯人”都體現(xiàn)了“tit for tat”的思想。但這些東西并不是最優(yōu)的,因為“一報還一報”在充滿了隨機性的現(xiàn)實社會生活里是有缺陷的。對此,孔子在幾千年前就說出了“以德報德,以直報怨”這樣精彩的修正策略,所謂“直”,就是公正,以公正來回報對方的背叛,是一種修正了的“一報還一報”,修正的是報復(fù)的程度,本來會讓你損失5分,現(xiàn)在只讓你損失3分,從而以一種公正審判來結(jié)束代代相續(xù)的報復(fù),形成文明。
      參考文獻:
      1、羅伯特?艾克斯羅德.對策中的致勝之道――合作的進化[M].上海人民出版社,1998.
      2、高鴻業(yè).西方經(jīng)濟學(xué)[M].中國人民大學(xué)出版社,2000.
      3、謝識予.經(jīng)濟博弈論[M].復(fù)旦大學(xué)出版社,2002.
      (作者單位:上海財經(jīng)大學(xué)人文學(xué)院)
      

本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
博弈論與納什平衡
博弈論
內(nèi)部審計中的博弈論(三)之審計定位
畫說博弈論:何為囚徒困境?
走出“不要輸在起跑線上”的囚徒困境
搜索:博弈論與納什平衡
更多類似文章 >>
生活服務(wù)
熱點新聞
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服