互惠的博弈分析 互惠的博弈分析

互惠的博弈分析

  • 期刊名字:制度經(jīng)濟學(xué)研究
  • 文件大?。?79kb
  • 論文作者:羅伯特·薩金,皮建才
  • 作者單位:東英格蘭大學(xué)經(jīng)濟學(xué),南京大學(xué)經(jīng)濟學(xué)院
  • 更新時(shí)間:2020-09-25
  • 下載次數:次
論文簡(jiǎn)介

互惠的博弈分析'0羅伯特.薩金”皮建才律”.[摘要]本文從博弈論的角度分析了互惠的形成以及形成互惠的穩定均衡策略。[關(guān)鍵詞]互惠囚徒困境擴展博弈針?shù)h相對勇敢互惠謹慎互惠中圖分類(lèi)號: F063.1 文 獻標識碼: A-、囚徒困境假設你是一個(gè)美國的學(xué)者,我是一個(gè)英國的學(xué)者。我們互訪(fǎng)彼此的大學(xué),并且我們互換住處。因為遇到了一群很愛(ài)熱鬧的美國人,所以我打算在我返回英國之前舉行-個(gè)晚會(huì )。我知道這將會(huì )把你的房子搞得亂七八糟一煙頭燒壞椅子,啤酒弄臟地毯,但是這在很大程度上與我無(wú)關(guān),因為我以后再也用不著(zhù)忍受這些亂七八糟的東西。與此同時(shí),你遇到了-群不緊不忙的英國人,所以你也打算在離開(kāi)之前為他們舉行-一個(gè)晚會(huì ).......假設不管每個(gè)聚會(huì )造成什么樣的破壞,求助法律都是不可能的。你不會(huì )因為毀壞地毯而被引渡。假設- -旦我們的互訪(fǎng)結束,不管是我們還是我們的●本文譯自羅伯特.薩金( Robert Sugden) 的著(zhù)作《權利、合作與福利的經(jīng)濟學(xué)》 (The Eco-nomics of Rights, Cooperation and Welfare) 第6章,翻譯時(shí)把標題“互惠”改成了“互惠的博弈分析",摘要和關(guān)鍵詞為澤者所加。本文在翻譯時(shí)得到了韋森教授的指導。作者羅伯特.薩金( Robert Sugden),東英格蘭大學(xué)經(jīng)濟學(xué)教授( Profesor of Economics, Uni-versity of East Anglia)。中國煤化工...譯者:皮建才,博士后,南京大學(xué)經(jīng)濟學(xué)院教師;IYHCNMHG:學(xué)商學(xué)院安中大樓281信箱(210093); E-mail: jiancaipi@ hotnail om?!?12●互惠的博弈分析機構都不會(huì )有任何彼此之間的交往。這樣的話(huà),我們正在進(jìn)行的就是-一次性的博弈:交訪(fǎng)博弈( the exchange -visit game)。我們每個(gè)人都可以從兩個(gè)策略中選擇- -個(gè):或者進(jìn)行聚會(huì ),或者不進(jìn)行聚會(huì )。從我的觀(guān)點(diǎn)來(lái)看,我將把我們都進(jìn)行聚會(huì )的事態(tài)當做已知數,并且賦予這個(gè)結果零效用。這樣- -來(lái),“不進(jìn)行聚會(huì )”將會(huì )給采取這種行動(dòng)的人帶來(lái)成本,卻給另-方帶來(lái)了好處。用c代表當我不進(jìn)行聚會(huì )時(shí)損失的效用,用b代表當你不進(jìn)行聚會(huì )時(shí)我得到的效用。對我來(lái)說(shuō)最壞的結果就是我沒(méi)有進(jìn)行聚會(huì )但你卻進(jìn)行了聚會(huì ),這個(gè)結果對我的效用是-c。對我來(lái)說(shuō)最好的結果就是我進(jìn)行了聚會(huì )而你卻沒(méi)有進(jìn)行聚會(huì ),這個(gè)結果對我的效用是b。如果我們都不進(jìn)行聚會(huì ),我得到的效用是b-c。不用多說(shuō),b和c都是正的。我將設定b>c:相對于我們都進(jìn)行聚會(huì )我更加喜歡我們都不進(jìn)行聚會(huì )的結果?,F在假設博弈從你的觀(guān)點(diǎn)來(lái)看和從我的觀(guān)點(diǎn)來(lái)看是一樣的,那么(暫時(shí)不考慮標識性非對稱(chēng))我們得到的對稱(chēng)博弈如圖1所示。對手的策略合作不合作(不進(jìn)行聚會(huì )) (進(jìn)行聚會(huì ))(不進(jìn)行聚會(huì ))b-e參與人的策略(進(jìn)行聚會(huì ))b0注意: b>c>0且π>c/b。圖1交訪(fǎng)博弈 .當然,這個(gè)博弈就是著(zhù)名的囚徒困境博弈的一個(gè)版本。在囚徒困境博弈中,每個(gè)參與人都可以選擇兩個(gè)策略(合作和不合作)中的一個(gè)。對每個(gè)參與人而言,最壞的結果是他合作而他的對手不合作。第二壞的結果是他們都不合作。比這更好的結果是他們都合作。但是對每個(gè)參與人而言,所有結果中最好的結果是他不合作然而他的對手合作。在交訪(fǎng)博弈中進(jìn)行聚會(huì )是不合作策略,而不進(jìn)行聚會(huì )則是合作策略。我賦予了交訪(fǎng)博弈結果的效用值,用以保證我的博弈結構和囚徒困境的博弈結構一樣?,F在想象- -一個(gè)學(xué)術(shù)社區的世界,其中每個(gè)人和其他人進(jìn)行重復但不匿名的交訪(fǎng)博弈。因此,總體上每個(gè)人積累了博弈的經(jīng)驗,但是并不是關(guān)于特定對手的行為的經(jīng)驗。這樣,博弈的分析非常簡(jiǎn)單。這里僅僅有一個(gè)均衡策略,即純策略“不合作”(進(jìn)行聚會(huì ))。并且,這個(gè)均衡是穩定的。注意到“不合作”是唯-一的最好回應( best reply), 不僅對這個(gè)策略自身而言而且對所有的策略而言,不管是純的策略還是混合的策略.都是這樣。用常識性的話(huà)說(shuō),我做的任何事情都不能中國煤化工進(jìn)行聚會(huì ),由于直到你回家時(shí)你才會(huì )知道我做了什么MHCNMHG最好也。 213.制度經(jīng)濟學(xué)研究進(jìn)行聚會(huì )。而且,如果你不進(jìn)行聚會(huì ),那么無(wú)論如何我仍然最好利用你的好品性進(jìn)行聚會(huì )。因為“不合作”是一個(gè)占優(yōu)策略,所以不管參與人認識到博弈是對稱(chēng)的還是非對稱(chēng)的都無(wú)關(guān)緊要。不管我的角色是什么也不管我期望你做什么,對我來(lái)說(shuō)不合作總是最好。描述這個(gè)結果的一種方式是考慮-一個(gè)互利交易的機會(huì )一我們都想要達成不進(jìn)行聚會(huì )的協(xié)議一-但 是我們不可能利用這個(gè)機會(huì ),因為盡管我們能夠達成協(xié)議,但我們卻不能實(shí)施這些協(xié)議。(我們每個(gè)人可能許諾照看對方的房子,但是我們每個(gè)人都有違背諾言的激勵)我們還有類(lèi)似問(wèn)題的另一個(gè)例子。我把它叫做交易博弈(thetradinggame)。假設你從一個(gè)遠方集郵的親戚那里繼承了一些稀有的郵票。你對這些郵票不感興趣,從務(wù)實(shí)的角度出發(fā)打算賣(mài)掉它們。你在雜志上做了廣告,并且接到了一個(gè)集郵者的電話(huà),他給你開(kāi)價(jià)50英鎊。你接受了?,F在你必須決定如何安排郵票和金錢(qián)的交換。集郵者住的地方遠在300英里,因此碰面是不實(shí)際的。你建議他郵寄給你50英鎊現金,你-收到這些錢(qián)就馬上把郵票郵寄過(guò)去。這樣的話(huà)你就可以防止他騙走你的郵票。他回應了一個(gè)相反的建議:你把郵票郵寄給他,他-收到郵票就馬上把錢(qián)郵寄給你。這樣的話(huà)他就可以安全了。很明顯,你的位置和他的位置是彼此對稱(chēng)的,你們不可能都是安全的。因此最后你同意一個(gè)對稱(chēng)的解決方案。 你許諾直接寄郵票,他許諾直接寄錢(qián)。他會(huì )遵守諾言嗎?你會(huì )嗎?這個(gè)博弈和交訪(fǎng)博弈有相同的結構:遵守諾言是合作的策略,而違背諾言則是不合作的策略。我們將再一次(假設進(jìn)行重復的匿名博弈)得到唯一-的穩定均衡,在這個(gè)均衡中所有的人總是不合作,盡管每個(gè)人都可以從交易中獲利,但是沒(méi)有人交易。下面是最后-一個(gè)例子,是由休謨( Hume)給出的:你的莊稼今天熟,我的莊稼明天熟。我今天和你-起勞動(dòng)并且你明天幫助我,對我們來(lái)說(shuō)是有利的。我不會(huì )對你仁慈,也知道你不會(huì )對我仁慈。因此,我不會(huì )不辭辛苦地幫你收割你的莊稼;并且如果我和你--起勞動(dòng)來(lái)收割你的莊稼,我知道在期望回報方面我會(huì )失望,我只能徒然依靠你的感激。結果自然就是我不幫你,你也不幫我。季節輪回,我們每個(gè)人都失去自己的收獲,因為我們缺乏相互間的信任和保證。這個(gè)博弈和前面兩個(gè)博弈稍微有些不同,在休謨的博弈中參與人輪流選擇(而不是同時(shí)選擇)合作還是不合作。但是這個(gè)區別并不顯著(zhù);充分分析休謨的博弈我們就可以發(fā)現唯一的穩定均衡( 假設為重復匿名博弈)是誰(shuí)都不幫誰(shuí)。實(shí)際上,那正是休謨自中國煤化芏俗地表口日址山達出來(lái)。YHCNMHG●214.互惠的博弈分析二、擴展囚徒困境博弈中的互惠我在第- -部分考慮的博弈都是匿名的。在匿名情形下,守諾是不可能獲得益處的。在-一次博弈中如果你違背諾言,被你欺騙的人并沒(méi)有辦法采取報復行動(dòng),因為我們假設他下一次不會(huì )遇到你一或 者即使他遇到你也不會(huì )認出你。并且,因為我們另外假設你的對手從來(lái)就不知道你在以前的博弈中表現如何,所以也就沒(méi)有辦法為你遵守諾言建立聲譽(yù)?,F在我將要考慮的是,如果參與人有機會(huì )下次見(jiàn)面,那么交訪(fǎng)博弈或囚徒困境博弈將會(huì )發(fā)生什么情況。我將通過(guò)分析囚徒困境博弈的擴展彤式來(lái)做到這-一點(diǎn)。擴展博弈由同樣兩個(gè)個(gè)體的一- 系列回合構成,每一個(gè)回合從它自身的角度來(lái)看都是-一個(gè)簡(jiǎn)單的博弈,其中每個(gè)個(gè)體從他可以選擇的策略或行動(dòng)中進(jìn)行選擇。我將分析這樣的擴展博弈,每個(gè)回合采取如圖1所示的形式,也就是說(shuō),博弈由交訪(fǎng)博弈的重復行動(dòng)構成(交訪(fǎng)博弈無(wú)疑是囚徒困境博弈的-一個(gè)例子)。擴展博弈的每一回合之后都有π的可能性結束博弈,否則,就進(jìn)行另一個(gè)回合。因此博弈不會(huì )永遠持續下去,但是不存在這樣-一個(gè)階段,該階段的參與人知道他們正在進(jìn)行最后一次見(jiàn)面。我認為,這就是人類(lèi)交互作用的方式?,F在我們可以運用通常的均衡和穩定性概念來(lái)分析擴展博弈。這種分析的主要困難是存在大量的可能策略。--個(gè)策略就是進(jìn)行整個(gè)擴展博弈的一個(gè)計劃。由于一一個(gè)策略會(huì )使得參與人在-一個(gè)回合中采取的行動(dòng)依賴(lài)于他的對手在以前的回合中采取的行動(dòng),所以可能的策略的數量會(huì )隨著(zhù)可能進(jìn)行的回合的數量而爆炸性地增長(cháng)。如果囚徒困境博弈僅進(jìn)行- -回合,那么每個(gè)參與人只有兩個(gè)可能的策略。如果進(jìn)行兩個(gè)回合,就有8個(gè)可能的策略;如果進(jìn)行三個(gè)回合,就有128個(gè)策略;如果進(jìn)行四個(gè)回合,就有2"或32 768個(gè)策略;如果進(jìn)行五個(gè)回合,就有2"或大約2150 000 000個(gè)策略!當然,我分析的擴展博弈并沒(méi)有對可能進(jìn)行的回合數設限。啟動(dòng)分析非常復雜的博弈的一種方式就是僅考慮-些相當簡(jiǎn)單的策略。然而,在做這件事情之前,我將對π的值作出重要的假設。貫穿本章我都將假設π>c/b。為了弄清楚這意味著(zhù)什么,我們可以想象兩個(gè)參與人達成了一個(gè)協(xié)議,即他們在每- -回合中相互合作。如果協(xié)議被遵守,每個(gè)參與人都可以獲得(b-c)(1 +π+π? +..或者(b-c)/(1-π)的期望效用?,F在假設參與人知道一旦他違背協(xié)議。他的對手就再也不會(huì )同他合作(注意這是他的對手所能做的最嚴厲H中國煤化工人在第- -回合違背了協(xié)議,而他的對手卻遵守了協(xié)議CNMHG得到的i.215.制魔經(jīng)濟學(xué)研究效用為b。之后他將從每個(gè)回合中得到的效用為0,因為沒(méi)有人會(huì )和他合作。遵守協(xié)議值不值,依賴(lài)于(b-c)/(1-π) 比b大還是比b小,或者用等價(jià)的說(shuō)法,依賴(lài)于π比b大還是比b小。假設π >c/b意味著(zhù)存在相互合作的協(xié)議的可能性。當πc/b并不意味著(zhù)典型的博弈進(jìn)行的回合很長(cháng)。舉個(gè)例子,如果b=2且c=1,那么當π>1/2時(shí)-也就是博弈的平均回合數大于2. 0時(shí)一-假 設就得到滿(mǎn)足?,F在我將考察擴展囚徒困境博弈的一-些簡(jiǎn)單策略。我主要關(guān)心使參與人的合作依賴(lài)于他的對手的合作的那些策略,即互惠策略。但是我將首先分析其中兩個(gè)最簡(jiǎn)單的策略。這就是無(wú)條件的合作一在每一回合都進(jìn)行合作而不管你的對手的行為一以 及無(wú)條件的不合作一在每一 回合都不進(jìn)行合作。我將用S (代表容易受騙的人)和N (代表品質(zhì)惡劣的人)表示這些策略。一即刻明 顯的是,S不可能是-一個(gè)均衡策略。如果你知道你的對手不管你做什么都將和你進(jìn)行合作的話(huà),你的合作就沒(méi)有任何意義。對S最好回應的唯一策略就是像N這樣的回應策略一在每一 -回合中都不合作; S對它自身來(lái)說(shuō)并不是最好的回應。同樣明顯的是,N是-一個(gè)均衡策略。如果你知道不管你怎么做你的對手都會(huì )不合作,那么你曾經(jīng)的合作就沒(méi)有任何意義。因此對N最好回應的唯一策略就是在每一回合中都不合作的回應策略。因為N是這樣-一個(gè)策略,所以它是對自身的最好回應。換句話(huà)說(shuō),在一個(gè)大家都不合作的世界里,你最好的策略就是自己也不合作。N是穩定均衡策略嗎?對N的唯一最好回應是這些策略一一和 N博弈時(shí)每- -回合都不合作。但是N并不是具有這種性質(zhì)的唯一策略。我認為,參與人會(huì )遵循謹慎的策略,除非他的對手先前合作過(guò)至少- -次,否則他永遠不會(huì )合作。N是謹慎的策略,但是它并不是唯- -的這種策略。很容易明白的是,所有的謹慎策略(而不是別的策略)都是對N的最好回應。我們也要注意,如果遵循謹慎策略的參與人相互碰面,他們永遠不會(huì )合作。因此,只要所有的人都遵循這樣或那樣的謹慎策略,所有的謹慎策略就會(huì )產(chǎn)生相同的結果:沒(méi)有人會(huì )合作。這樣的結局就是沒(méi)有力量陽(yáng)止N刑參與人被某些別的謹慎策略侵占,但是沒(méi)有任何力量能夠培育中國煤化工是漂走(drift)中的一種。YCNMHG,216●互惠的博弈分析如果我們想對N的穩定性或不穩定性進(jìn)行更多的討論,我們就必須考慮到參與人時(shí)而不時(shí)犯錯誤的可能性。我將通過(guò)如下的假設來(lái)模型化錯誤,即,在每一回合中總是存在著(zhù)很小的可能性一那些本來(lái)打算不合作的參 與人實(shí)際上卻合作了,反過(guò)來(lái)也是這樣。我將假設,犯錯誤的參與人會(huì )立即意識到他做了什么;他的對手知道實(shí)際上被采用的行動(dòng),但是他不知道這些行動(dòng)是有意的還是無(wú)意的??紤]這些假設,假定你的對手采用N策略,也就是說(shuō),他打算在每一回合都不合作。他要是合作了,這只是一個(gè)錯誤,而不是一個(gè)他打算將來(lái)合作的信號。所以你的最好回應一你的唯 一的最好回應一- 就是審慎地從來(lái)不與他合作,不管你的對手做什么。換句話(huà)說(shuō),N是對它自身的唯- - 最好回應:它是-一個(gè)穩定均衡策略。然而,這并不是說(shuō)N是唯- -的穩定均衡策略?,F在我將考慮- -種簡(jiǎn)單的互惠策略一與 同你合作的人合作。這就是針?shù)h相對策略(簡(jiǎn)寫(xiě)為T(mén))。遵循T策略的參與人在第一回合中合作。在每一個(gè)后續回合中他將跟他的對手在先前的回合中采用的策略( 合作或不合作)相同。注意,如果兩個(gè)T型參與人相遇,他們會(huì )在每一回合中都合作。然而,如果-一個(gè)T型參與人遇到了一個(gè)N型參與人,T型參與人只會(huì )在第一回合中合作,之后他就會(huì )不合作。這樣一來(lái),T型參與人愿意同他們一樣的人合作,但是他們并不準備成為輕易上當受騙的人。T是穩定策略嗎?下面的討論基于阿克塞爾羅德( Axelrod, 1981) 的文獻。假定你知道你的對手采用T策略,并且假定你打算把博弈進(jìn)行到第i回合。這里有兩種可能性,依賴(lài)于這是不是第-回合,如果不是的話(huà),依賴(lài)于你在先前的回合采用的策略:或者你的對手將在第i回合合作,或者他在第i回合不合作。你知道情形會(huì )是哪- -種。給定上述知識,你就有可能為剩下的博弈找出對你的對手的行動(dòng)的最好回應(因為他在第i+1, i+2, .回合的行動(dòng)將完全由你有待采取的行動(dòng)決定)。另外,不難發(fā)現, i的價(jià)值與你的計算無(wú)關(guān)。你在第i+1, i+2, ..回合采取的行動(dòng)獨立于i。因此下面的兩個(gè)問(wèn)題將有獨立于i的確定的答案:1.如果你的對手在第i回合合作,那么你也在第i回合合作是最好回應的一部分嗎?2.如果你的對手在第i回合不合作,那么你在那- -回合合作是最好回應假定問(wèn)題1的答案是“是”。然后令i=1。你知道你的對手將會(huì )在第-回合合作,所以你也合作是-個(gè)最好回應。但是如果你在第- -回合合作, 你的對手在第二二回合將合作。那么你也合作將是一個(gè)最好向應_諸加此類(lèi)。因此,如果問(wèn)題1的答案是“是”,在每-回合中國煤化工應?,F在反過(guò)來(lái)假設問(wèn)題1的答案是“不是”MHCN MH可應都,.217.制度經(jīng)濟學(xué)研究是在第- -回合不合作。這保證你的對手在第二回合不合作?,F在有兩種可能性,它們依賴(lài)于問(wèn)題2的答案。如果那個(gè)問(wèn)題的答案是“不是”,任何對T的最好回應都是在第二回合也不合作。諸如此類(lèi)。在每一回合中不合作是對T的最好回應。如果反過(guò)來(lái)問(wèn)題2的答案是“是”,那么你在第二回合中合作將會(huì )是一個(gè)最好回應。這將會(huì )保證你的對手在第三回合合作。這重復了第一回合的位置,所以你將再次不合作。諸如此類(lèi)。在奇數回合中不合作而在偶數回合中合作是對T的最好回應?,F在考慮對T的三種可能的回應: T自身, N (例如在每- -回合都不合作)和一個(gè)新策略A。A (為了交替)是一種在奇數回合中合作、在偶數回合中不合作的策略。我們從上面段落的討論中知道,這三種策略中肯定有一種是對T的最好回應。我們現在可以估計出采取每種策略來(lái)回應T時(shí)獲得的期望效用。運用圖1中的效用指數:E(T, T)=(b-c)(1 +π+π2 +..)=(b-c)/(1-π)(1)E(N, T) =b(2)E(A, T)=b-mc+πb-π'e+π'b..=(b-πc)/(1-π')(3)不難算出,如果π>c/b (正如我已經(jīng)假設的),那么E(T, T)>E(N,T)且E(T, T) >E(A, T)。換句話(huà)說(shuō),作為對T的回應,T比N或A更好。但是由于它們中有一個(gè)是對T的最好回應,所以T必定是對它自身的最好回應,即針?shù)h相對策略是一個(gè)均衡策略。三、懲罰和補償針?shù)h相對是慣例嗎?我已經(jīng)指出針?shù)h相對策略是擴展囚徒困境博弈中的均衡策略。我也指出它并不是唯一的均衡。策略N (從來(lái)不合作)也是一個(gè)均衡,每個(gè)人都不合作使壞的均衡是穩定的。根據我的定義,慣例就是兩個(gè)或多個(gè)穩定均衡策略中的-一個(gè);因此為了說(shuō)明針?shù)h相對策略是一個(gè)慣例,我必須說(shuō)明針?shù)h相對策略是-一個(gè)穩定均衡策略。在第二部分中,針?shù)h相對策略T的唯- -最好回應是這樣的策略,和T博弈時(shí)每一回合 都合作。T有這樣的性質(zhì)一這 就是為什么T是- -個(gè)均衡策略一但是別的策略也這樣。其中最為明顯的例子就是S一容 易受騙的人的無(wú)條件合作策略。和S對招時(shí),S和T-樣成功。只要每個(gè)人遵循這兩種策略中的這種或那種,就從來(lái)不會(huì )有不合作出現。這意味著(zhù)并沒(méi)有力量阻止T型參與人的世界被S型參與人侵占;但是也沒(méi)有力丹平培美汶樣的侵占。中國煤化工我們再一次得到漂走( drift)的情形。因此我將像先前一樣假定,參與人有時(shí)MH.CNMH.沒(méi)定,我●218●互惠的博弈分析需要在定義針?shù)h相對策略時(shí)進(jìn)行--下小的改動(dòng)。假設你很有把握你的對手將采用針?shù)h相對策略。因此你在每- -回合都合作,并且你的對手也合作。接著(zhù)在一個(gè)回合中,比如說(shuō)回合i,你犯了一個(gè)錯誤,你想要合作但結果卻沒(méi)有合作。你現在應當怎么做呢?你會(huì )預期到你的對手為了回應你的偶然的不合作會(huì )在第i+1回合不合作。如果你遵循嚴格的針?shù)h相對原則,你將在第i+2回合以不合作回應,接著(zhù)你的對手將在第i+3回合也不合作,依次類(lèi)推。通過(guò)在第i+2回合合作來(lái)縮短報復和反報復的無(wú)休止的鏈條似乎更好。我將這種隱藏在變種的針?shù)h相對策略中的直覺(jué)稱(chēng)為T(mén)1。T1開(kāi)始于擁有好名聲的概念。其中的精髓思想是擁有好名聲的參與人有權利或資格來(lái)與他的對手合作。博弈開(kāi)始時(shí)每個(gè)參與人都被認為有好名聲。一個(gè)參與人可以保持好名聲,只要他經(jīng)常按照T1的限定來(lái)合作。如果●任-一個(gè)參與人在當T1限定他應當合作時(shí)沒(méi)有合作,他就會(huì )失去他的好名聲;在后續的博弈中合作后他就會(huì )重新得到他的好名聲(這就是為什么我把這個(gè)策略稱(chēng)為T(mén)1;如果需要兩個(gè)回合的合作才能重新得到好的名聲,這個(gè)策略就是T2,依次類(lèi)推)。給定所有這些,T1可以被系統地闡述如下:“當你的對手擁有好名聲時(shí),或者當你不擁有好名聲時(shí),合作;否則,不合作?!睂σ粋€(gè)從來(lái)不犯錯誤的參與人來(lái)說(shuō),T和T1是相互等價(jià)的(如果你遵循T1且不犯錯誤,你就會(huì )一直有好名聲,因此T1將限定你的對手在每一回合都合作。因此你的對手是否在任- -回合中都擁有好名聲完全依賴(lài)于他是否在先前的回合中與你合作。如果他在第i-1回合合作,T1就要求你在第i回合合作;如果他在第i-1回合不合作,T1就要求你在第i回合不合作)。T1和T的區別僅涉及參與人在犯了錯誤不合作后采取的行動(dòng)。假設將遵循T1并將博弈第i回合;你和你的對手都有好名聲。因此你應當在第i回合合作。然而,假設當你的對手合作時(shí)你犯錯誤沒(méi)有合作。接著(zhù)你失去了你的好名聲?,F在,根據T1,你應該在第i+1回合合作。由于你已經(jīng)失去了好名聲,你的對手在第i+1回合不合作也不會(huì )失去他的好名聲,因此不管他在第i+1回合怎么做, T1都會(huì )要求你在i+2回合合作。只要犯錯誤的概率充分小,T1就是-一個(gè)穩定均衡策略。為什么?假設你知道你的對手將遵循T1,并且你將進(jìn)行第i回合的博弈。假設不管過(guò)去發(fā)生了什么,你和你的對手都不會(huì )犯更深層次的錯誤。我將指明在這樣的假設下唯一的最好回應就是“當你的對手擁有好名聲時(shí),或者當你不擁有好名聲時(shí),合作;否則,不合作?!钡?,如果當沒(méi)有進(jìn)--步犯錯誤的可能性時(shí)這是唯一的最好回應一也就是說(shuō), 如果這個(gè)回應嚴格優(yōu)于其他回應一那么當有進(jìn)一步(犯)錯誤的可能性時(shí),只要犯錯誤的可能性足夠得小,它就必定保持為唯- -的最好回應。因此,我將中國煤化工的可能.性但可能性足夠小時(shí),“當你的對手擁有好名HCNMHG好名聲●219.制度經(jīng)濟學(xué)研究時(shí),合作;否則,不合作”是對T1的最好回應。但是這個(gè)回應是T1。所以我將證明T1是一個(gè)穩定均衡策略?,F在我們將進(jìn)行證明。當你進(jìn)入第i回合時(shí),只有三種可能性:1.或者你和你的對手都擁有好名聲,或者你們都不擁有好名聲。這樣你的對手將在第i回合合作并且之后采用針?shù)h相對策略(例如,重復你最后的行動(dòng))。2.你的對手擁有好名聲,但是你卻沒(méi)有好名聲。這樣他將在第i回合不合作并且之后采用針?shù)h相對策略。.3.你擁有好名聲,但是你的對手卻沒(méi)有好名聲。這樣他將在第i回合合作,在第i+1回合再次合作,并且之后采用針?shù)h相對策略。注意到在博弈的第- -回合,情形1必定適用。因此這就是我們在第二部分分析的情形,其中我證明如果不犯錯誤,對策略T的最好回應是在每一回合都合作(這個(gè)證明實(shí)際上是阿克賽爾羅德的)。所以我們知道在情形1你在第i回合的唯一的最優(yōu)行動(dòng)就是合作?,F在考慮情形2。注意到如果你在第i回合中合作,那么第i+1回合將會(huì )是情形1的步驟:你的對手在那一回合中合作,接著(zhù)采用針?shù)h相對策略。我們知道在情形1你的唯一的最優(yōu)回應是“合作,合作,...”.. 所以如果在第i回合合作是最優(yōu)行動(dòng),那么在第i+1回合合作也是最優(yōu)行動(dòng),依次類(lèi)推。反過(guò)來(lái)如果你在第i回合不合作,那么第i+1回合就是情形2的另一個(gè)步驟;因此如果第i回合不合作是一一個(gè)最優(yōu)行動(dòng),在第i+1回合不合作必定,是一個(gè)最優(yōu)行動(dòng),依次類(lèi)推。因此,回合i, i+1, .的兩種序列行動(dòng)中的一種必定是-個(gè)最好回應一或者 “合作,合作,...或者“不合作,不合作,....考慮到假設π>c/b,前一種序列產(chǎn)生更大的期望效用。因此,在情形2下,就像在情形1下一樣,你在第i回合的唯-最優(yōu)行動(dòng)是合作。最后考慮情形3。在這種情形下,在第i回合你可以不合作而不會(huì )喪失自己的好名聲;不管你在第i回合做什么,第i+1回合都將是情形1的一個(gè)步驟。所以你的最優(yōu)行動(dòng)必定是在第i回合不合作。這就完成了證明:當你的對手擁有好名聲時(shí),或者當你不擁有好名聲時(shí)(情形1和2),你在第i回合的最優(yōu)行動(dòng)是合作;否則,就不合作(情形3)。這樣一來(lái),T1策略就是一個(gè)穩定的均衡一一-但不是唯一穩定的均衡。.(回憶起無(wú)條件不合作也是一個(gè)穩定的均衡)換句話(huà)說(shuō),T1是-一個(gè)慣例??紤]一下這個(gè)慣例用日常的措詞怎么說(shuō)。它從開(kāi)始就很明顯是-一個(gè)互惠慣例:只要他的對手愿意合作,一個(gè)遵循T1策略的人就愿意合作。但是它也是一一個(gè)懲罰慣例。假設在某個(gè)i回合當你合作的時(shí)候你的對手錯誤地沒(méi)有合作,那中國煤化工你成了輕易受騙的人?,F在慣例規定在下一回合你MHCNMHG合作時(shí)●220.互惠的博弈分析他應當合作。這樣在第i+2回合你們都再次合作。發(fā)生在第i+1回合的事情可以看成是對你的對手的先前的違背慣例的懲罰:他在那一回合中得到了最壞的可能結果( 效用損失為c)。注意到這個(gè)結果比他像你一樣第i+1回合不合作的結果要差。在這個(gè)意義上,你的對手愿意接受懲罰(知道如果他不這樣,對他來(lái)說(shuō)長(cháng)期結果仍將會(huì )更加糟糕)。但是,說(shuō)你的對手已經(jīng)被懲罰了只不過(guò)講了故事的一半。在第i+1回合你得到最好的可能結果一效用收益為 b。對你來(lái)說(shuō)這比相互合作的回合的結果更好,更不要說(shuō)相互不合作的回合的結果了。所以第i+1回合的事件不僅對你的對手施加了傷害,而且使你獲益。換句話(huà)說(shuō),正在進(jìn)行的不僅是懲罰,而且是補償。我們可以這么說(shuō),慣例規定你的對手進(jìn)行補償行動(dòng)。你在第i+1回合的不合作以及他的合作都是這個(gè)行動(dòng)的一部分。策略T1規定補償的回合伴隨任何不合理的不合作(也就是說(shuō),任何不合作并不是由T1規定的)。這一回合過(guò)后,兩個(gè)參與人再次合作。為什么僅有一個(gè)補償回合呢?畢競,這種補償并沒(méi)有充分抵消受害方從另一個(gè)參與人的違背慣例中所遭到的損失。最初的違背一比 如說(shuō)在第i回合一對受害方施加了成本b:這是他本來(lái)應該從他的對手的合作行動(dòng)中得到的利益。第i+1回合的補償行動(dòng)允許受害方節省c,因為他從對手的合作行動(dòng)中獲得了利益而不會(huì )招致他自己合作的成本。但是我們知道b>c。另外,節省c的成本必須被貼現以考慮第i+1回合不會(huì )進(jìn)行的可能性。答案是補償的程度本身就是一一個(gè)慣例。受害方要求的補償跟他期望他的對手容許讓與的一-樣多,并且他的對手提供的和其預期第-個(gè)參與人堅持要求的一-樣多。我們想象策略T2 (規定對每個(gè)不合理的不合作有兩回合的補償),或者策略T3 ( 規定三回合的補償),等等。我們可以證明( 但是在這里我將不會(huì )給出)任何一個(gè)像Tr的策略都是一個(gè)穩定的均衡,只要π' >c/b。因此如果π充分地接近1,任何Tr策略都是一個(gè)穩定的均衡,但是r的值越大,π的值必須越接近1以保證穩定性。這是為什么呢?r的值越大,參與人犯錯誤后重新獲得好名聲就得付出更大的補償;我們可以說(shuō),遵循阿克塞爾羅德(1981), r值越小的策略越容易被寬容。-一個(gè)可以成為均衡的策略有多寬容有一個(gè)明顯的限制:補償必須足夠地難以負擔以阻止有目的的不合作。但是,即使對T1一所有策略中最寬容的策略來(lái)說(shuō),這也是真的。超過(guò)這一點(diǎn)不寬容就是一種危險。一旦犯了一次錯誤,參與人并不是被迫補償,他也許反過(guò)來(lái)屈從于他的好名聲的喪失,并且繼續不合作。他的對手越不寬容,后一種選擇的吸引力就越大。π的值越小它也會(huì )更具吸引力,因為博弈可能結束得越快,保持好名聲的收益就越小。中國煤化工YHCNMHG制度經(jīng)濟學(xué)研兗四、演化偏佑互惠嗎我一直考慮的針?shù)h相對策略是大族中的成員,我把這個(gè)大族稱(chēng)為勇敢互惠策略。這些策略有兩個(gè)定義性的特征。第一,對每- -回合都不合作的對手而言,這些策略是,除了在第一-回合以外每- -回合都不合作。第二,如果兩個(gè)勇敢互惠策略的參與人相遇,他們在每一回合都會(huì )合作(再次提醒,只要沒(méi)有犯錯誤)。注意兩個(gè)參與人不需要遵循同樣的策略。一個(gè)策略能夠只滿(mǎn)足第二個(gè)條件,如果它在第- -回合總是合作(直到進(jìn)行了第一回合,沒(méi)有參與人能夠知道關(guān)于他的對手的策略的任何事情)。這就是我為什么稱(chēng)這些策略為“勇敢”的原因。在有證據顯示你的對手將互惠以前就準備合作,就為你總是被不合作的對手利用敞開(kāi)了大門(mén)。如果你遵循勇敢互惠策略,這種利用將僅限為-回合,但這仍然是利用。如果你遵循任何“與它自身合作”的策略,這都是不得不付出的代價(jià)一也就 是說(shuō),任何一種策略一當 參與人雙方在博弈中都遵循它時(shí),他們將相互合作(如果除非別的參與人已經(jīng)合作過(guò),沒(méi)有參與人愿意合作,他們將永遠壓根兒不會(huì )合作;因此如果一個(gè)策略是和它自身合作,那么它就必須在有證據顯示對方有同樣的合作意愿之前就愿意合作)?,F在假設當人們進(jìn)行擴展囚徒困境博弈時(shí),他們僅考慮兩種類(lèi)型的策略一-勇敢互惠策略和無(wú)條件背叛不合作策略(N)。 當然,當實(shí)際可得的策略的數字無(wú)限大時(shí),這只是一一個(gè)大膽的簡(jiǎn)化。(回憶起即使是五個(gè)回合的擴展囚徒困境博弈也有超過(guò)20億個(gè)策略!)但是我們必須從某個(gè)地方開(kāi)始?,F在有三種可能性。第一,兩個(gè)N型參與人可能相遇。他們在每一回合都不合作,每個(gè)人只能從博弈中得到零效用。第二,一個(gè)N型參與人遇;到某個(gè)遵循勇敢互惠策略的人(我把他叫做B型參與人)。除了第一回合,他們將在所有回合都不合作;但是在第-回合N型參與人不合作,而B(niǎo)型參與人合作。因此從整個(gè)博弈中N型參與人得到的效用為b,而B(niǎo)型參與人得到的效用為-c。第三種可能性是兩個(gè)B型參與人相遇。他們在每- ~回合都合作,從而在每一回合中得到的效用為b-c;這一效用流的期望值是(b-c)/(1-π)。注意,B型參與人遵循同樣的策略與否無(wú)關(guān)緊要;重要的是每個(gè)B型參與人遵循某種勇敢互惠策略。這種情形可以用圖2所示的簡(jiǎn)單對稱(chēng)博蠻來(lái)描述?,F在這個(gè)博弈可以用中國煤化工通常的方式進(jìn)行分析。PYHCNMHG.222.互惠的博弈分析對手的策略B(合作)(無(wú)條件不合作)(b-c)/(1-π)-參與人的策略N (無(wú)條件不合作)注意: b>c>0 且π>c/b。圖2擴展囚徒困境博弈的-個(gè)簡(jiǎn)單版本注意,N是對N的最好回應,并且只要π>c/b, B就是對B的最好回應。因此參與人會(huì )選擇哪-一個(gè)更好的策略依賴(lài)于他的對手選擇-種策略而不是另一種策略的可能性。令p表示一個(gè)隨機的對手選擇策略B的可能性。那么將有p的某個(gè)臨界值,比如說(shuō)p", 根據p是否大于、等于或小于p°來(lái)使得B比N更加成功、一樣成功或更不成功。很容易計算出這個(gè)臨界值是:p° =cl一π/[π(b-c)](4)如果再--次遇到對手的概率相當高,那么這個(gè)p的臨界值可能非常接近于零。舉個(gè)例子,假設b=2且c=1 (這看起來(lái)和任何-一個(gè)假設- - 樣中立)。這樣當π=9時(shí),意味著(zhù)博弈的平均長(cháng)度為10回合,p的臨界值是0.11。當π=0.98時(shí),結果是博弈的平均長(cháng)度為50回合,臨界值是0.02。這反映的事實(shí)是采用B策略是一種有風(fēng)險的投資。冒著(zhù)在第一回合有可能被N型參與人利用的風(fēng)險,你就能夠跟B型參與人在每- -回合都合作。博弈可能進(jìn)行的時(shí)間越長(cháng),從成功的投資上獲得補償的時(shí)間就越多。這個(gè)結果似乎表明,在平均擁有多個(gè)回合的博弈中,勇敢互惠的慣例有很好的機會(huì )演化出來(lái)。即使開(kāi)始時(shí)大多數參與人都是品質(zhì)惡劣的人,這些品質(zhì)惡劣的人的也可能做得比少數遵循勇敢互惠策略的人差;這樣- -來(lái),少數群體就會(huì )有-一個(gè)增長(cháng)的自我加強的趨勢。注意,即使少數團體中的成員并不都遵循同樣的策略,這個(gè)觀(guān)點(diǎn)也是對的。換句話(huà)說(shuō),在任何關(guān)于補償的特定慣例之前,勇敢互惠的一-般慣例就會(huì )自己建立起來(lái)?,F在有另一個(gè)觀(guān)點(diǎn),希望演化偏佑勇敢互惠策略。這個(gè)觀(guān)點(diǎn)并不要求有臨界數量的勇敢互惠者:只要有任意一些勇敢互惠者,勇敢互惠慣例就能夠演化出來(lái)。然而,有必要假設所有的勇敢互惠者遵循同樣的關(guān)于補償的慣例。注意,可能有謹慎的互惠策略而不是勇敢的互惠策略(- 一個(gè)謹慎的策略就是從來(lái)不會(huì )先去合作,見(jiàn)第二部分)。遵循謹慎互惠策略的個(gè)體會(huì )等待他的對手采用第-一個(gè)合作的行動(dòng);那樣,并且只有那樣,他才會(huì )合作。這種類(lèi)型策略的很大的優(yōu)勢是它會(huì )導致跟勇敢互惠者會(huì )作而又不會(huì )引起被品質(zhì)惡劣的人利用的風(fēng)險。當然,它的主要YH中國煤化工自身合作:謹慎參與人不能夠從對手中區分出誰(shuí)是CNMHG的(參..223●制度經(jīng)濟學(xué)研究見(jiàn)第二部分)。如果謹慎的策略想要成功,它們就需要進(jìn)行調整以適應在勇敢對手中流行的補償慣例。舉個(gè)例子,假設所有勇敢參與人都遵循T1--針?shù)h 相對策略-一規定對每次不合 理的不合作只有一個(gè)補償回合(參見(jiàn)第二部分)。因此,一個(gè)在第一-回合沒(méi)有合作卻發(fā)現他的對手已經(jīng)合作的參與人實(shí)際上確定對手正在采用T1策略(并不是完全確定,因為對手可能有意不合作,但卻犯了一個(gè)錯誤)?,F在謹慎的參與人和T1型參與人處于同樣的位置, T1型參與人幾乎確定他面對的對手和他- -樣偶爾在第一回合不合作。所以謹慎的參與人的最好的計劃是跟T1型參與人正好做得一樣:在下兩回合合作,接著(zhù)采取針?shù)h相對。下面是這種類(lèi)型策略的一個(gè)簡(jiǎn)單表述:“ 在第一回合不合作。如果你的對手在第- -回合不合作,你就在所有的后續回合都不合作。如果你的對手在第一回合合作,你就在所有的后續回合中采取似乎是T1的策略,把你在第一回合的不合作看成似乎是一一個(gè)錯誤?!蔽野堰@個(gè)策略稱(chēng)為CI ( 很容易看出策略C2, C3, .,可以被設計成與勇敢策略T2, T3, ..吻合)?,F在考慮當我們假設唯- -的可得策略為N. T1和C1時(shí)博弈的結果。這個(gè)博弈表示在圖3中。為了解釋這個(gè)觀(guān)點(diǎn),我將用到數值b=2, c=1和π=0.9,這給出圖4所示的博弈。然而,并沒(méi)有什么會(huì )依靠這些數字;對驗證這個(gè)觀(guān)點(diǎn)來(lái)說(shuō)重要的是(正像我在通貫本章中假設的) π>c/b。對手的策略T1C1N(b-c)/(1-π)(b-c)/(1-π)-b+πc參與人的策略Cl(b-c)/(1 -π) -b+ πc0注意: b>c>0且π>c/b。圖3擴展囚徒困境博弈的另一 一個(gè)版本r1;1108.9-參與人的策略C19.2注意:這些指數是通過(guò)令b=2, c=1和u=0.9得到的。圖4圖3 中博弈的說(shuō)明性的效用指數現在考慮-一個(gè)社區,其中剛開(kāi)始有一些人遵循T1, - -些人遵循C1,一些人遵循N。令與這些策略相聯(lián)系的概率分別為pq. p(1-a)和1-p.換句話(huà)說(shuō),p是- -個(gè)隨機的對手采用互惠策略IYH中國煤化工定- -個(gè)對手正在采用互惠策略,q是他采用勇敢互CNMHG.224.互惠的博弈分析只要pq>0,最好的策略必定或者是T1或者是C1 (N被CI占優(yōu):在對付采用T1策略的對手方面它做得比C1更壞,并且在對付任何策略方面都至少和C1-樣好)。因此,只要一些人遵循T1,隨著(zhù)人們通過(guò)經(jīng)驗學(xué)習不去采用N, p的值- -定會(huì )穩定上升。但是要注意,T1是對T1和C1的最好回.應。因此,如果p的值足夠地高,T1一定會(huì )是最成功的策略。因此,即使T1剛開(kāi)始并不是最成功的策略,它最終也將變成最成功;并且它將保持最成功,不管多少人轉而采用它。轉變成更為常識意義上的話(huà),想象-一個(gè)社區,其中剛開(kāi)始幾乎所有的人都是品質(zhì)惡劣的人。在這個(gè)社區中,成為一個(gè)勇敢的互惠者并不會(huì )受益,因為合作的倡議人幾乎總是被擊敗。但是成為一個(gè)謹慎的互惠者并不會(huì )失去任何東西:這允許你與自己碰巧遇見(jiàn)的任何-一個(gè)勇敢互惠者合作,卻能夠保護你不被品質(zhì)惡劣的人利用。因此人們會(huì )慢慢弄明白,謹慎的互惠能夠獲得好處。但是謹慎的互惠者有可能因為太謹慎而不能相互合作:他們只能夠和勇敢互惠者合作。隨著(zhù)謹慎互惠者數量的增長(cháng),并且隨著(zhù)品質(zhì)惡劣的人的數量的下降,勇敢會(huì )獲得好處的時(shí)間將會(huì )來(lái)臨。在這個(gè)模型中,謹慎互惠的作用更像是某些類(lèi)型的生長(cháng)在被擾亂的土地上的植物一-這些植物拓殖別的物種發(fā)現不適于生存的生存地,但是它們的出現有助于產(chǎn)生這樣的條件,這些條件偏佑最終占領(lǐng)和接管的其他物種?,F在我已經(jīng)給出了兩個(gè)論據,認為社會(huì )演化的過(guò)程可能偏佑那些勇敢互惠策略。但是,我必須承認沒(méi)有任何一個(gè)論據是完全令人信服的。問(wèn)題是,很難看出任何一個(gè)旨在表明演化將偏佑某些特定類(lèi)型策略的論據不只是提示性的。在擴展的囚徒困境博弈中有數不清的數以?xún)|計的策略;看起來(lái)我們只有限制在一-些基本類(lèi)型的策略中才能分析這個(gè)博弈,這意味著(zhù)任何分析都是不完全的。我認為,這個(gè)問(wèn)題永遠不會(huì )被解決;但是阿克塞爾羅德(1981) 給出了一個(gè)具有吸引力的方法,這一方法有某種程度的進(jìn)步。阿克塞爾羅德的方法一他稱(chēng)之 為錦標賽方法一就是 具體指定- -種特定形式的擴展岡徒困境博弈并接下來(lái)讓來(lái)者遞交進(jìn)行博弈的策略。然后讓這些策略在某種類(lèi)型的錦標賽中彼此自由地對抗,在這種錦標賽中所有的策略對抗所有的策略(allplay against all), 看誰(shuí)將勝出。這種方法的動(dòng)人之處在于,盡管分析的策略是有限的一那當然是不可避免的,但并沒(méi)有強加任意的限制。沒(méi)有人會(huì )抱怨分析者通過(guò)排除可能做得更好的特定策略從而固定了他的分析結果,或者抱怨他因為太患鈍從而不能認識到特定策略的優(yōu)點(diǎn)進(jìn)而忽略了這些策略。如果你有一個(gè)自己做得好的得意策略,你所做的全部就是讓它進(jìn)入錦標賽。僅有的限制是由人類(lèi)創(chuàng )造力施加的一當然那種中國煤化工活的博弈中。YHCNMHG●225.制度經(jīng)濟學(xué)研究阿克塞爾歲德組織了一個(gè)這種類(lèi)型的錦標賽。他采用的擴展囚徒閑境博弈的版本與我一直分析的博究稍微不同。在我的版本的博究中,一個(gè)參與人(當對手不合作時(shí)不合作,當對手合作時(shí)合作,當對手合作時(shí)不合作,當對手不合作時(shí)合作)的四種可能的結果的效用指數是0,b-c, b和-c,且有b>c>0。而阿克塞爾羅德的博弈的效用指數是1, 3, 5和0。這兩種類(lèi)型的表述并不能?chē)栏竦丶嫒?,但是博弈的本質(zhì)結構卻是相同的。π的值被設定在0.99654,以便博弈的中間數長(cháng)度為200回合;期望長(cháng)度為289回合。錦標.賽根據回合知更鳥(niǎo)原則( round-robin principle) 組織,策略作為計算機程序被遞交。阿克塞爾羅德的錦標賽有62個(gè)進(jìn)人者。他報道說(shuō),進(jìn)人者包括“經(jīng)濟學(xué)、心理學(xué)、社會(huì )學(xué)、政治科學(xué)和數學(xué)的博弈理論家”和“演進(jìn)生物學(xué)、物理學(xué)和計算機科學(xué)的教授”(阿克塞爾羅德,1981)。 獲勝者是由博弈理論家拉波波特( Anatol Rapoport)遞交的簡(jiǎn)單的針?shù)h相對策略。在解釋這個(gè)結果時(shí),我們的腦海中必須想著(zhù)一些條件。 第一,π的值要相當高,相對于謹慎的或不合作策略而言,這會(huì )傾向于偏佑勇敢互惠策略。第二,回合知更鳥(niǎo)錦標賽并不跟演化過(guò)程- -樣。在回合知更鳥(niǎo)錦標賽中,通過(guò)對付拙劣的對手表現優(yōu)異而積累高分是可能的,然而演化過(guò)程卻傾向于在一一個(gè)早期的階段就淘汰那些最不成功的策略。第三,在慣例的演化中,凸顯性(prominence)起到了重要的作用;并且凸顯性有時(shí)事關(guān)想象地跳躍和思想的聯(lián)結,這些并不能夠輕易地簡(jiǎn)化成數學(xué)。通過(guò)進(jìn)行抽象的數學(xué)形式的實(shí)驗,并且通過(guò)要求把策略寫(xiě)成計算機程序,阿克塞爾羅德不經(jīng)意間形成了對凸顯性的數學(xué)概念的偏心(bias)。然而,所有這些都說(shuō)明,阿克塞爾羅德的錦標賽中針?shù)h相對策略的成功是顯著(zhù)的。它為我們提供了更深層次的基礎,使我們相信:如果擴展囚徒困境型的博弈在一個(gè)社區中重復地進(jìn)行,勇敢互惠的慣例將傾向于演化出來(lái)。參考文獻1. Axelrod, R.,1981, “The Emergence of Cooperation among Egoists" ,American Political Science Revierw, 75, pp. 306 -318.中國煤化工MYHCNMHG●226.互惠的博弈分析A Game Theory Approach to ReciprocityRobert Sugden( University of East Anglia)[ Abstract} This paper provides an analysis of the formation of reciprocity and thestable equilibrium strategies of reciprocity from the perspective of game theory.[ Key words ] reciprocity prisoner's dilemma extended game tit-for-tat bravereciprocity cautious reciprocityJEL Classifications: C700 D640中國煤化工MYHCNMHG227.

論文截圖
版權:如無(wú)特殊注明,文章轉載自網(wǎng)絡(luò ),侵權請聯(lián)系cnmhg168#163.com刪除!文件均為網(wǎng)友上傳,僅供研究和學(xué)習使用,務(wù)必24小時(shí)內刪除。
欧美AAAAAA级午夜福利_国产福利写真片视频在线_91香蕉国产观看免费人人_莉莉精品国产免费手机影院