国产深夜福利,国产精品二区三区免费播放心,伊人男人天堂

作者：谷小娜
申明:本網(wǎng)站內(nèi)容僅用于學(xué)術(shù)交流，如有侵犯您的權(quán)益，請及時告知我們，本站將立即刪除有關(guān)內(nèi)容。

      摘要：文章通過對多人多次重復(fù)博弈的分析，解決了“囚徒困境”提出的個體理性與集體理性的矛盾，提出了新的“理性人”的人性假設(shè)。

      關(guān)鍵詞：人性假設(shè)，多人多次重復(fù)博弈
      建立在亞當(dāng)?斯密的“看不見的手”理論以及“理性人”的人性假設(shè)基礎(chǔ)之上的西方經(jīng)濟學(xué)，近年來受到了
      來自博弈論的嚴峻挑戰(zhàn)，被證實其存在嚴重的假設(shè)漏洞，艾克斯羅德對多人多次重復(fù)博弈的對策研究以及從他的研究得出的新的人性假設(shè)從某種程度上彌補了這個漏洞，下面本文將詳細論述這個新的理論突破。
      一、傳統(tǒng)經(jīng)濟學(xué)的人性假設(shè)
      早在200多年以前，西方經(jīng)濟學(xué)的鼻祖亞當(dāng)?斯密，提出了“看不見的手”原理。斯密寫了一段被廣為引用的著名的話：“每人都在力圖應(yīng)用他的資本，來使其生產(chǎn)品能得到最大的價值。一般地說：他并不企圖增進公共之福利，也不知道他所增進的公共福利為多少。他所追求的僅僅是他個人的安樂，僅僅是他個人的利益。在這樣做時，有只看不見的手引導(dǎo)他去促進一種目標，而這種目標決不是他追求的東西。由于追逐他自己的利益，他經(jīng)常促進了社會利益，其效果要比他真正想促進社會利益時所得到的效果為大。”這段頌揚資本主義的文字被稱為是斯密的“看不見的手”原理。可以毫不夸張地說：整個現(xiàn)代主流西方經(jīng)濟學(xué)都是建立在“看不見的手”的原理之上的。
      亞當(dāng)?斯密的“看不見的手”原理，既是經(jīng)濟學(xué)的一個最重要的假設(shè)，同時也是一個非常重要的哲學(xué)假設(shè)。這個假定首先是指經(jīng)濟學(xué)考慮問題的時候，把基本的分析單位放在“個體”之上，即“個人”。其他所有問題，所有層次上的問題，被假定都可以還原到這個個體和個體之間的關(guān)系來解釋。其次，個體又被假定是一個理性的，理性思考的個體。經(jīng)濟學(xué)為了能夠更準確地、精確地思考，對理性的定義就要比傳統(tǒng)哲學(xué)狹窄一點。從而把理性定義為“為自己的、為個人的利益充分，要把它這個人利益最大化”的一種思考方式，這種思考方式又有一個一貫的或者一致的特點。而個人就是一個符合邏輯思考的，在符合邏輯思考的情況下，處處想著要把自己的利益最大化的個體，即“理性人”。
      亞當(dāng)?斯密認為，每個人雖然都是只為自己考慮，但是假如有一個基本上能夠保持社會秩序的一個制度，或者說有這么一個市場，那么盡管每個都為自己，最后的結(jié)果卻是一個社會的一個共同利益的發(fā)展。從亞當(dāng)?斯密開始至今的大部分經(jīng)濟學(xué)家認為，只要人是完全理性的，在經(jīng)濟活動中始終遵循個人的“理性原則”，那么，整個經(jīng)濟社會，從產(chǎn)品市場到要素市場都會達到一種均衡的狀態(tài)，整個社會的福利也會達到最大的狀態(tài)――“帕累托最優(yōu)”狀態(tài)，這樣的社會就是一個完美的社會。此后的經(jīng)濟學(xué)家，盡管在不同方面上對這個理論進行了修正，但他們始終是承認在“看不見的手”引導(dǎo)下“理性人”是能夠達到社會福利最大化的。
      二、博弈論對傳統(tǒng)人性假設(shè)的挑戰(zhàn)
      博弈論研究人們的策略互動行為。其認為：人是理性的，即人人都會在約束條件下最大化自身的利益；人們在交往合作中有沖突，行為互相影響，而且信息不對稱。博弈論研究人們的行為，在直接相互作用時的決策，以及決策的均衡問題。換句話說，博弈論研究如何使得人們在市場經(jīng)濟中，自愿做出大家都遵守和實施的有效制度安排，以增進社會的福利的機制。
      博弈論在經(jīng)濟學(xué)領(lǐng)域應(yīng)用的一個經(jīng)典的案例就是“囚徒的困境”。即警察抓住了兩個合伙犯罪的罪犯，但缺乏足夠的證據(jù)。如果其中至少有一人供認犯罪，就能確認罪名成立。警察將其分別關(guān)在兩個獨立的不能互通信息的牢房里審訊。在這種情形下，兩個囚犯都可以做出自己的選擇：供出同伙或者保持沉默。
      這兩個囚犯都知道，若他倆都保持沉默的話，就都會被釋放，但警察規(guī)定：如果他們中的一個人告發(fā)他的同伙，那么他就可以被無罪釋放。而他的同伙會被按照最重的罪來判決。當(dāng)然，若這兩個囚犯互相背叛，兩個人都會被按照最重的罪來判決。
      那么，這兩個囚犯該怎么辦？是互相合作還是互相背叛？從表面上看，他們應(yīng)該互相合作，這樣他們倆都能得到最好的結(jié)果：自由。但他們要考慮對方可能采取的選擇。A犯和B犯都根本不相信他的同伙不會向警方提供對他不利的證據(jù)。這種想法的誘惑力實在太大了。
      所以兩個囚犯唯一理性的選擇就是背叛同伙，所以結(jié)果就是，兩個囚犯按照不顧一切的邏輯得到了最糟糕的報應(yīng)：坐牢。
      從“囚徒的困境”可以看到與亞當(dāng)?斯密的“看不見的手”原理完全相反的結(jié)論，每個囚犯根據(jù)自己的“理性”判斷，做出了對自身來講是“最優(yōu)的”行為，但是他們兩個人構(gòu)成的整體的福利卻不是最大的。
      “囚徒的困境”既揭示了個體理性與團體理性之間的矛盾――從個體利益出發(fā)的行為往往不能實現(xiàn)團體的最大利益，同時也揭示了個體理性自身的內(nèi)在矛盾――從個體利益出發(fā)的行為最終也不一定能實現(xiàn)個體的最大利益，甚至?xí)玫较喈?dāng)差的結(jié)果。
      這樣，“囚徒的困境”被認為是對亞當(dāng)?斯密體系的一個挑戰(zhàn)，當(dāng)然它并沒有否定“看不見的手”，而只是揭示了“看不見的手”這個假設(shè)下的一些經(jīng)濟活動的漏洞。
      三、多人多次重復(fù)博弈所展示的人性假設(shè)
      美國學(xué)者艾克斯羅德在《合作的進化》一書中通過對多人多次重復(fù)博弈的對策研究，指出在博弈中產(chǎn)生合作的必要條件和獲勝策略的主要特征：當(dāng)策略群體是按各種策略的得分進行淘汰和進化時，群體以一種不可逆轉(zhuǎn)的方式向合作的方向進化，即群體的合作性隨進化過程越來越大。
      艾克斯羅德研究合作的兩個前提假設(shè)：每個人都是自私的；沒有權(quán)威干預(yù)個人決策。即個人可以完全按照自己利益最大化的企圖進行決策。在此基礎(chǔ)上，他設(shè)計了一個實驗，實驗要求每個參賽者把追求得分最多的策略寫成計算機程序，然后用單循環(huán)賽的方式將參賽程序兩兩博弈，以找出什么樣的策略得分最高，游戲什么時候結(jié)束是不確定的。得分規(guī)則可用如圖1得益矩陣表示：
      第一輪游戲有14個程序參加，再加上艾克斯羅德自己的一個隨機程序（即以50%的概率選取合作或不合作），運轉(zhuǎn)了300次。結(jié)果得分最高的程序是加拿大學(xué)者羅伯布寫的“一報還一報”（tit for tat）。這個程序的特點是，第一次對局采用合作的策略，以后每一步都跟隨對方上一步的策略，對方上一次合作，我這一次就合作，對方上一次不合作，我這一次就不合作。艾克斯羅德還發(fā)現(xiàn)，得分排在前面的程序有三個特點：從不首先背叛，即“善良的”；不能對方一次背叛，就沒完沒了的報復(fù)，以后對方只要改為合作，我也要合作，即“寬容性”；對于對方的背叛行為一定要報復(fù)，不能總是合作，即“強硬的”。
      為了進一步驗證上述結(jié)論，艾克斯羅德邀請了更多人再做了一次游戲，并把第一次的結(jié)果公開發(fā)表。第二次征集到了62個程序，加上他自己的隨機程序，又進行了一次競賽。結(jié)果，第一名的仍是“一報還一報”。艾克斯羅德總結(jié)這次游戲的結(jié)論是：“一報還一報”仍是最優(yōu)策略。前面提到的三個特點仍然有效，因為63人中的前15名里，只有第8名的哈靈頓程序是“不善良的”，后15名中，只有1個總是合作的是“善良的”?？杉づ院蛯捜菪砸驳玫搅俗C明。此外，好的策略還必須具有的一個特點是“清晰性”，即能讓對方在三、五步對局內(nèi)辨識出來。“一報還一報”就有很好的清晰性，讓對方很快發(fā)現(xiàn)規(guī)律，從而不得不采取合作的態(tài)度。
      艾克斯羅德設(shè)計了一個實驗，假設(shè)63個對策者中，誰在第一輪中的得分高，他在第二輪的群體中所占比例就越高，而且是他的得分的正函數(shù)。這樣，群體的結(jié)構(gòu)就會在進化過程中改變，由此可以看出群體是向什么方向進化的。

      “一報還一報”原來在群體中占1/63，經(jīng)過1000代的進化，結(jié)構(gòu)穩(wěn)定下來時，它占了24%。另外，有一些程序在進化過程中消失了。其中有一個值得研究的程序，即原來前15名中唯一的那個“不善良的”哈靈頓程序，它的對策方案是，首先合作，當(dāng)發(fā)現(xiàn)對方一直在合作，它就突然來個不合作，如果對方立刻報復(fù)它，它就恢復(fù)合作，如果對方仍然合作，它就繼續(xù)背叛。這個程序一開始發(fā)展很快，但等到除了“一報還一報”之外的其它程序開始消失時，它就開始下降了。因此，以合作系數(shù)來測量，群體是越來越合作的。
      進化實驗揭示了一個哲理：一個策略的成功應(yīng)該以對方的成功為基礎(chǔ)?！耙粓筮€一報”在兩個人對策時，得分不可能超過對方，最多打個平手，但它的總分最高。它賴以生存的基礎(chǔ)是很牢固的，因為它讓對方得到了高分。哈靈頓程序就不是這樣，它得到高分時，對方必然得到低分。它的成功是建立在別人失敗的基礎(chǔ)上的，而失敗者總是要被淘汰的，當(dāng)失敗者被淘汰之后，這個好占別人便宜的成功者也要被淘汰。
      艾克斯羅德通過數(shù)學(xué)化和計算機化的方法研究如何突破囚徒困境，達成合作，將這項研究帶到了一個全新境界，他在數(shù)學(xué)上的證明無疑是十分雄辯和令人信服的，而且，他在計算機模擬中得出的一些結(jié)論是非常驚人的發(fā)現(xiàn)，比如，總分最高的人在每次博弈中都沒有拿到最高分。
      四、結(jié)束語
      艾克斯羅德所發(fā)現(xiàn)的“一報還一報”策略，從社會學(xué)的角度可以看作是一種“互惠式利他”，這種行為的動機是個人私利，但它的結(jié)果是雙方獲利，并通過互惠式利他有可能覆蓋了范圍最廣的社會生活，人們通過送禮及回報，形成了一種社會生活的秩序，這種秩序即使在多年隔絕，語言不通的人群之間也是最易理解的東西。有些看似純粹的利他行為，比如無償損贈，也通過某些間接方式，比如社會聲譽的獲得，得到了回報。研究這種行為，將對我們理解社會生活有很重要的意義。
      艾克斯羅德在《合作的進化》一書結(jié)尾提出幾個結(jié)論：友誼不是合作的必要條件，即使是敵人，只要滿足了關(guān)系持續(xù)，互相回報的條件，也有可能合作。預(yù)見性也不是合作的前提，但是，當(dāng)有預(yù)見性的人類了解了合作的規(guī)律之后，合作進化的過程就會加快。這時，預(yù)見性是有用的，學(xué)習(xí)也是有用的。
      在這里可以得出一個重要的結(jié)論：“一報還一報”應(yīng)當(dāng)是“理性人”的重要行為準則，具備了“善意的、寬容的、強硬的、清晰的”性質(zhì)的“理性人”，才是一個完美的“理性人”，這樣，“囚徒困境”所提出的挑戰(zhàn)就會得到圓滿的解決。
      囚徒困境擴展為多人博弈時，就體現(xiàn)了一個更廣泛的問題──“社會悖論”，或“資源悖論”。人類共有的資源是有限的，當(dāng)每個人都試圖從有限的資源中多拿一點兒時，就產(chǎn)生了局部利益與整體利益的沖突。人口問題、資源危機、交通阻塞，都可以在社會悖論中得以解釋，在這些問題中，關(guān)鍵是通過研究，制定游戲規(guī)則來控制每個人的行為。
      艾克斯羅德的一些結(jié)論在中國古典文化道德傳統(tǒng)中可以很容易地找到對應(yīng)，“投桃報李”、“人不犯我，我不犯人”都體現(xiàn)了“tit for tat”的思想。但這些東西并不是最優(yōu)的，因為“一報還一報”在充滿了隨機性的現(xiàn)實社會生活里是有缺陷的。對此，孔子在幾千年前就說出了“以德報德，以直報怨”這樣精彩的修正策略，所謂“直”，就是公正，以公正來回報對方的背叛，是一種修正了的“一報還一報”，修正的是報復(fù)的程度，本來會讓你損失5分，現(xiàn)在只讓你損失3分，從而以一種公正審判來結(jié)束代代相續(xù)的報復(fù)，形成文明。
      參考文獻：
      1、羅伯特?艾克斯羅德.對策中的致勝之道――合作的進化[M].上海人民出版社,1998.
      2、高鴻業(yè).西方經(jīng)濟學(xué)[M].中國人民大學(xué)出版社,2000.
      3、謝識予.經(jīng)濟博弈論[M].復(fù)旦大學(xué)出版社,2002.
      （作者單位：上海財經(jīng)大學(xué)人文學(xué)院）

本站僅提供存儲服務(wù)，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點擊舉報。

九色国产,午夜在线视频,新黄色网址,九九色综合,天天做夜夜做久久做狠狠,天天躁夜夜躁狠狠躁2021a,久久不卡一区二区三区