必威电竞|足球世界杯竞猜平台

重復(fù)博弈
來源:互聯(lián)網(wǎng)

重復(fù)博弈是同樣結(jié)構(gòu)的博弈重復(fù)進行多次的過程。動態(tài)博弈的一種特殊形式。其中每次博弈都被稱為“階段博弈”。在重復(fù)博弈的情況下,企業(yè)在選擇策略的時候不僅需要考慮當(dāng)前的對局,而且還需考慮當(dāng)前選擇的策略對于以后的對局將產(chǎn)生怎樣的影響。

簡介

顧名思義,重復(fù)博弈(repeated game)是指同樣結(jié)構(gòu)的博弈重復(fù)許多次,其中的每次博弈稱為“階段博弈”(stage games)。重復(fù)博弈是動態(tài)博弈中的重要內(nèi)容,它可以是完全信息的重復(fù)博弈,也可以是不完全信息的重復(fù)博弈。重復(fù)博弈是指同樣結(jié)構(gòu)的博弈重復(fù)許多次。當(dāng)博弈只進行一次時,每個參與人都只關(guān)心一次性的支付;如果博弈是重復(fù)多次的,參與人可能會為了長遠利益而犧牲眼前的利益,從而選擇不同的均衡策略。因此,重復(fù)博弈的次數(shù)會影響到博弈均衡的結(jié)果。

在重復(fù)博弈中,每次博弈的條件、規(guī)則和內(nèi)容都是相同的,但由于有一個長期利益的存在,因此各博弈方在當(dāng)前階段的博弈中要考慮到不能引起其它博弈方在后面階段的對抗、報復(fù)或惡性競爭,即不能像在一次性靜態(tài)博弈中那樣毫不顧及其它博弈方的利益。有時,一方做出一種合作的姿態(tài),可能使其它博弈方在今后階段采取合作的態(tài)度,從而實現(xiàn)共同的長期利益。

下面給出兩個重要定義:

定義1:可信性是指動態(tài)博弈中先行動的博弈方是否該相信后行動的博弈方會采取對自己有利或不利的行為。

定義2:如果動態(tài)博弈中各博弈方的策略在動態(tài)博弈本身和所有子博弈中都構(gòu)成均衡,則稱該策略組合具有子博弈完美性。

在重復(fù)博弈中,可信性同樣是非常重要的,也即子博弈完美性仍是判斷均衡是否穩(wěn)定可靠的重要依據(jù),又由于長期利益對短期行為的制約作用,因此有一些在一次性博弈中不可行的威脅或諾言在重復(fù)博弈中會變?yōu)榭尚诺?,從而使博弈的均衡結(jié)果出現(xiàn)更多的可能性。

特征

重復(fù)博弈具有三個基本特征:

A、重復(fù)博弈的階段,博弈之間沒有“物質(zhì)”上的聯(lián)系,即前一個階段博弈并不改變后一個階段的博弈的結(jié)構(gòu);

B、在重復(fù)博弈的每一個階段,所有參與人都觀測到該博弈過去的歷史;

C、參與人的總收益是所有階段博弈的收益的貼現(xiàn)值之和或加權(quán)平均數(shù)

影響因素

影響重復(fù)博弈均衡結(jié)果的主要因素是博弈重復(fù)的次數(shù)和信息的完備性。在重復(fù)博弈中,參與人存在著短期利益和長遠利益的均衡,有可能為了長遠利益犧牲短期利益而選擇不同的均衡策略。重復(fù)博弈的這個結(jié)果,為現(xiàn)實中的許多合作行為和社會規(guī)范提供了解釋。信息的完備性之所以影響均衡結(jié)果,是因為如果每一個參與人的特征不為其他參與人所知時,該參與人就很有可能積極建立一個好聲譽,以換取長遠利益。根據(jù)重復(fù)博弈的重復(fù)次數(shù),可以將其分為有限次重復(fù)博弈和無限次重復(fù)博弈。

分類

無限次

下面用一個關(guān)于產(chǎn)品定價博弈的例子分析重復(fù)博弈。

產(chǎn)品定價博弈

廠商B

低價高價

廠商A低價

高價12,1220,4

4,2015,15

是兩個廠商A和B定價的支付矩陣,從中可以看出:在一次性博弈中中,廠商A和廠商B都存在上策,上策均衡是雙方都定低價。

從參與人行為看,由于博弈可以重復(fù)無數(shù)次,博弈雙方為了長期利益有時間進行試探性出價。在第一次博弈時出高價以尋求競爭對手的合作,一旦對局人為了短期利益采取不合作行為,那么就會建立該對局人是不可信任的信念,在下一次的博弈中都采取不合作的低價行為,使對局人的長期利益受損。

可見,廠商B在第一次博弈中由于不合作策略得到的高收益會在以后博弈中因A的報復(fù)性策略而抵消,甚至在重復(fù)博弈若干次后出現(xiàn)損失。

假如廠商A開始制定的高價策略,從支付矩陣得到廠商B若也定高價,其每次博弈的支付分別為(15,15,15...);若廠商B制定低價,則在第一次博弈中獲得高收益,但是隨后會由于廠商A的低價行為而使其受損,各次博弈的支付分別為(20,12,12...)。廠商A的這種策略被稱為“以牙還牙”策略,這種策略是A在初始選擇合作,如果B合作,那么A也會一直合作下去;若B在某一次博弈中選擇不合作,那么A在以后博弈中都采取不合作策略?!耙匝肋€牙”策略意味著任何一個參與人的一次性不合作將會引起永遠的不合作。所有參與人為了長期利益,使得無限次重復(fù)的非合作博弈產(chǎn)生合作解。

有限次

假定重復(fù)有限的N次,這意味著所有參與人都能預(yù)測到最后一次(第N次)的收益。在第N次博弈中,各參與人都知道對方的“以牙還牙”,但是他也知道如果在這次博弈中自己選擇低價的上策,將使自己受益而其他參與人受損,且也不會留給對方報復(fù)的機會(博弈到第N次結(jié)束)。所有參與人都明白這一點,因此在最后一次博弈中將都采取低價策略,這與一次博弈的上策均衡結(jié)果相同。

在現(xiàn)實中,市場競爭者很難弄清重復(fù)博弈的結(jié)構(gòu)。廠商很難預(yù)期自己在什么時候會結(jié)束經(jīng)營,也不清楚與對手的競爭何時是第N次博弈。因此,只要競爭時期足夠長,競爭的雙方都預(yù)期未來還要進行很多次博弈,那么,競爭的結(jié)構(gòu)就可能近似于無限次重復(fù)博弈,使得廠商在競爭中出現(xiàn)相互合作的局面。

序列博弈

在實踐中,博弈者在選擇行動時可能有先后順序或某些對局者可能率先采取行動,這種博弈被稱為序列博弈。

1.先行者優(yōu)勢:廠商生產(chǎn)甜味餅干的收益10要高于生產(chǎn)脆味餅干的收益8。假定兩個廠商同時獨立的做出生產(chǎn)決定,他們都愿意推出甜味餅干——結(jié)果是兩家收益都受損

廠商2

脆甜

廠商1脆

甜—3,—38,10

10,8—3,—3

可見,在序列博弈中,先行者可能占據(jù)一定的有利地位,這就是先行者優(yōu)勢。廠商1為獲得更大收益,會選擇推出甜味餅干,使得廠商2只能選擇收益較低卻是最優(yōu)的策略——推出脆味餅干。

2.博弈的擴展形式:常用博弈的擴展形式來分析序列博弈,它用決策樹的形式表示可能的行動,并在各枝的結(jié)束處給出各行動的支付。

脆-3,-3

脆廠商2

廠商1(2)甜8,10

(1)脆10,8

甜廠商2

(3)甜3,-3

博弈的擴展形式的解一般用逆推法推導(dǎo),由最后的收益逆向歸納,倒推到初始節(jié)點1處做出最后決策。

參考資料 >

重復(fù)博弈.智庫。百科.2017-07-31

重復(fù)博弈.ppt.智庫文檔.2017-07-31

生活家百科家居網(wǎng)