Scrittu da: CB Garcia è WI Zangwill

Prufissori di Scienze di Gestione in a Scuola di Imprese di Booth (i dui pensionati)

Revisatu August 18, 2018 da (Garcia è Zangwill [8, 9]).

SegniTheory teoria di u ghjocu, dilema di prigiuneru, bayesianu, probabbilità subjectiva

astrattu: Von Neumann è Morgenstern (VNM), usendu l'ipotesi utilità prevista, furnì a formulazione fundamentale di u prublema di a teoria di u ghjocu. Finu à questu puntu, però, sta formulazione era stata difficile di risolve senza impone supposizioni supplementari. Nash avia da suppone chì i ghjucatori sò stati disaccoppiati in modu chì a probabilità di u ghjucatore A per piglià una azione era indipendente da a probabilità di u ghjucatore B di piglià una azione. In stu documentu, eliminemu l'assunzioni di Nash, cumprese una supposizione chì e strategie di i ghjucatori sò cunuscenza cumuna, è propondemu un mudellu chì hè cumplettamente equivalente à u prublema generale di a VNM. A nostra formulazione facilmente soluzione elimina alcune di e difficoltà inerenti cù l'approcciu Nash, chì spessu produceva risultati contradictori è contraintuittivi, per esempiu, à u dilemma di u prigiuneru, à u ghjocu di a gallina, à u paradossu di Newcomb, à a caccia di stagni è à molti altri ghjochi. Per esempiu, abbandunendu l'assunzione mutuale di l'indipendenza di Nash in u dilema di i prigiuneri, u nostru mudellu dimustra chì i ghjucatori sò capaci di ottene rimborsi superiori, è per ottene ciò, ùn anu micca bisognu di ghjucà cooperativamente o di cumunicazione, ma solu applicanu u teorema di Bayes, in stile di (Harsanyi [10]; Kadane è Larkey [11]). U nostru avvicinamentu divide u spaziu di a probabilità in duie semi-spazii o regioni, chì e so dimensioni relative dipendenu da i saldi. Avà, ùn ci hè micca bisognu di stima precisamente a probabilità, ma solu di determinà in quale regione si trova. Questa furnisce vantaghji significativi postu chì, se una regione hè considerablemente più grande cà l'altra, questu rende immediatamente una idea sustanziale di cume u ghjocu. A nostra soluzione generale, chì ùn hè micca correlata, dì in u sensu di Aumann [1], cuntene l'equilibri Nash cum'è soluzioni particulari. In cuntrastu à e soluzioni descriptive Nash, a nostra suluzione hè una coppia prescrittiva di strategie puri-aspettative raziunali, rendendu un novu fundamentu per a teoria di u ghjocu. Estendemu a nostra dimarchja versu i ghjoculi in generale M-Person, cum'è l'illustravamu in u ghjocu di scogliu di scogliu di carta è u prublema di bar-crowding.

Sommariu di i Risultati.

Avà riassumemu qualchi risultati, basatu annantu à i dettagli è i pagamenti espliciti furniti quì sottu. Cridemu chì questi risultati dimostranu u valore di a nostra dimarchja per l'insignamentu è a ricerca postu chì i risultati presentanu spessu soluzioni novi.

Partita di cuurdinazione: L'assunzione di l'indipendenza Nash falla l'approcciu bayesianu superiore chì adopemu. Per i pagamenti forniti quì sottu, ghjucate a prima strategia se crede chì a probabilità di l'avversariu à ghjucà a so prima strategia hè almenu 1 / 3, altrimenti ghjucà a seconda strategia. Nash ùn furnisce nunda di quandu applicà quale strategia. Inoltre, se i pagamenti sò cambiati, u nostru approcciu furnisce probabilità rivisate. Battaglia di i sessi: Dui partiti sò diffirenti per induve andavanu, ma ùn sò micca permessi di cumunicà. Tramindui i partiti piglianu un bonu rimborsu sì tramindui si ne vanu à a listessa scelta, postu chì almenu e duie sò inseme. Un partitu datu hà da ottene un bonu si i dui andanu à a scelta di u partitu. Nemmenu vene un bon rimborsu si vanu in diversi lochi. Dati i pagamenti presentati quì sottu, u ghjucatore A deve ghjucà a so strategia desiderata se crede chì l'altru ghjucatore sceglie ancu A scelta desiderata di A cun una probabilità di almenu 33%. In cuntrastu, Nash furnisce trè equilibri senza alcuna intuizione di ghjucà quandu è senza analisi di e probabbilità. Sottu li corrisponde: Dui ghjucatori, Even è Odd, simultaneamente revelanu un centesimu. Sì i sordi si paragunanu, Ancu mantenenu e duie sordi; altrimenti Odd mantene e dui sordi. U unicu equilibriu Nash per stu ghjocu di summa zero hè per i dui ghjucatori à ghjucà aleatoriamente. Dati i pagamenti quì sottu, Ancu duverà ghjucà capi se crede chì Odd ghjucarà capi cù probabilità di almenu 50%. Invece, Odd duverà ghjucà capi se crede chì Even ghjucarà capi cù probabilità di massimu 50%. Partita di pollu: Duie vitture sò veloci versu l'altru è sò vicinu à avè un colpu di capu. Nash suggerisce chì una vittura duve virare è l'altra hè dritta, ma offre poca visione da quale deve gira. Dati i pagamenti di seguitu, u nostru approcciu suggerisce di girà si credi chì l'avversariu sferisce cù a probabilità di massimu 90%, altrimenti vai drittu. Osservate quì chì i dui ghjucadori chì giranu (o i dui vanu dritti) ùn hè micca un equilibriu di Nash, ma chì i dui ghjucadori chì giranu (o i dui vanu dritti) in l'aspettativa chì l'avversu anderà drittu (o infernatu) hè un scenariu di equilibriu. Inoltre, se i pagamenti sò cambiati, u nostru approcciu furnisce una probabilità aghjurnata. Razza di Armi: ogni paese inizialmente raccoglie arme per ùn esse attaccatu. Ma cumu dimustratu quì sottu, diminuisce i ritorni nantu à e braccia di stazzunamentu si materializanu, apre una opportunità per un trattatu di paci. Nash ùn identifica micca l'opportunità per u trattatu di paci. Caccia a fuga: caccia a stagione se credi chì l'avversariu caccia a staghjunalità cù probabilità almenu 50%, altrimenti caccia a lepre. (L'equilibri puri di Nash sò per i dui per caccia i stagni, o per i dui per caccia a liebre). U prublema di Newcomb: se u prublema di Newcomb hè prisentatu cum'è un dilema di un prigiuneru, a soluzione à u prublema di Newcomb si pò ghjunghje in dui modi: cume l'equilibriu Nash non cooperativu utilizendu u principiu di dominanza, o cum'è una soluzione cooperativa utilizendu l'ipotesi utilitaria prevista. U ghjocu di forbici Rock-paper: L'equilibriu Nash hè per voi di ghjucà un X-NUMX sided die aleatoriamente. Ciò chì pare una nova strategia per questu ghjocu anticu hè per voi di ghjucà à u rock se crede chì u vostru avversariu hà da ghjucà a carta cù probabilità di 33% massimu è tisore cù una probabilità di almenu 33%; per ghjucà à carta si crede chì u vostru avversariu hà da ghjucà forbici cun probabilità di massimu 33% è scoglià cù a probabilità di almenu 33%; altru per ghjucà a forbici. (U nostru approcciu vi pò aiutà si dite, avete datu nantu à u ghjocu di u to avversariu nanzu di u ghjocu.) U ghjocu di bar-crowding hà 3 amici A, B, è C: Quellu chì và à u bar solu ùn ottene nunda - stà in casa hè un megliu scelta. Sì dui amichi andanu à a barra, questu hè a megliu opzione. Sì tutti i trè vanu, a barra tira tutti i trè. L'equilibri Nash sò per tutti per stà in casa, o per tutti per ghjucà a so prima strategia cun probabilità uguale à 33%. Ma sè avete qualchì intesu nantu à i vostri amichi è ponu stima i probabbilità bayesiane di u so cumpurtamentu, a nostra strategia pò aiutà.

Allargemu ancu a nostra dimarchja à u ghjocu di a persona M è uttene scopi simili. Per esempiu, mostremu a suluzione cumpleta per ghjoculi di e persone generale 2 è e persone generale 3 x 2 strategie di ghjocu.

Ipotesi Utilità Espera.

In un ghjocu 2-Person, lasciate chì i ghjucatori A è B avianu strategie 2: A1 o A2 per u giocatore A, è B1 o B2 per u giocatore B.

U fundamentu per a teoria di l'utilità prevista hè u von Neumann - Teorema di l'utilità di Morgenstern (von Neumann è Morgenstern [20]): lasciate Aij è Bij pagare i giocatori A è B rispettivamente se u giocatore A juca Ai è u ghjucadore B ghjoca Bj, per i , j = 1 o 2. L'ipotesi utilitaria prevista stabilisce chì i ghjucatori A è B deve maximizà i so pagamenti previsti1:

induve pA (Ai è Bj) hè a probabilità di u ghjucatore A chì A ghjoca Ai è B ghjoca Bj, è simile per u ghjucatu B.

Probabilità Cundiziunali[1].

Per u nostru approcciu, noi lintà L'assunzione di Nash chì e probabilità di ghjucatori sò reciprocamente indipendenti. Questu permette à u nostru prublema (1) esse più generale è ottene più soluzioni chì satisfanu l'ipotesi utilitaria prevista.

Sia EP (A | Ai) è EP (B | Bj) sianu i riti previsti[2],[3] di A è B rispettivamente datu chì A ghjoca Ai è B ghjoca Bj, per i, j = 1, 2:

Cuminciamu per pruvà una Teorema di "Bayesian" elementariu di i ghjochi chì dimostra l'equivalenza di u nostru approcciu à a formulazione VNM:

Teorema 1[5]. I prublemi (3) sottu sò equivalenti à i prublemi (1)[6]:

Prova. By u teorema di Bayes,

Allora,

U massimu[7] di l'equazione di sopra hè pA (A1) = 1 (ie, strategia di ghjocu A1) se EP (A | A1) ≥ EP (A | A2), o pA (A1) = 0 (vale à dì strategia di ghjocu A2) se EP ( A | A1) EP (A | A2). Quì, (3) contene per u giocatore A. Un argumentu simile tenga per u ghjucatore BQED

Regioni VNM.

Definite e regioni VNM A1 è A2 per esse i polipi convex:

Comu si mostra in seguitu, A deve ghjucà a strategia A1 se aspetta chì B sia in a regione A1. Altrimenti, A devia ghjucà A2. A linea di equilibriu

separa u spaziu di probabilità in e duie regioni è furnisce un mezzu visuali d'aiutu per analizà a situazione[8].

Importanza di e Regioni: E duie regioni sò impurtanti praticamenti, postu chì avà ùn hè bisognu di stima cù precisione a probabilità, ma solu di determinà quale di e duie regioni si trova. Spessu, si vedrà chì a probabilità prima sia in una regione. , è l'identificazione di quella regione hè infurmazione suficiente per suggerisce u ghjocu adattatu di u ghjocu. Per esempiu, suppunimu chì a regione A1 hè considerablemente più grande cà l'altra, dunque a probabilità hè abbastanza in quella regione A1. Questu furnisce infurmazioni convincenti chì u ghjucatore A probabili ghjucà A1.

Analogamente per B:

I regioni VNM dipendenu di a distribuzione di probabilità prima di i ghjucatori, spessu chjamati simplici i prighi (Jaynes [13]; Harsanyi [10]; Kadane è Larkey [11]), che sono l'espressione di i jugatori di e credenze circa a distribuzione di probabilità di u so avversariu. [9]

Corollariu 2. Da (3), A ghjoca una strategia A1 se è solu s'ella aspetta chì u ghjucatore B sia in a regione VNM A1. Altro, A ghjoca una strategia A2. Grafia simile, B ghjoca a strategia B1 se è solu s'ella aspetta chì u ghjucatore A sia in a regione VNM B1. Altro, B ghjoca a strategia B2.

Prova. EP (A | A1) ≥ EP (A | A2) si è solu s'ellu A11 pA (B1 | A1) + A12 pA (B2 | A1) ≥ A21 pA (B1 | A2) + A22 pA (B2 | A2) si è solu se (A11 - A12) pA (B1 | A1) + (A21 - A22) pA (B2 | A2) + A12 - A21 ≥ 0.

In modu simili, EP (B | B1) ≥ EP (B | B2) se è solu s'ellu B11 pB (A1 | B1) + B21 pB (A2 | B1) ≥ B12 pB (A1 | B2)

+ B22 pB (A2 | B2) si è solu se (B11 - B21) pB (A1 | B1) + (B12 - B22) pB (A2 | B2) + B21 - B12 ≥ 0. QED

Da u Teorema 1 è u Corollariu 2, per i punti in e regioni (5) è (7), l'ipotesi utilità prevista tene, vale à dì, e regioni VNM definiscenu a soluzione generale per u ghjocu 2-Persona.[10].

Nash Equilibrium.

Se i probabilità di u ghjucatu sò reciprocamente indipendenti, e regioni VNM simplificheghjanu per:

Proposta 3. Supponemu un equilibriu Nash (p (A1), p (B1)) si trova in VNM regione Ai è VNM regione Bj rispettivamente, per alcuni i, j = 1, 2. Allora, u ghjucatore A ghjucarà a strategia Ai è u ghjucatore B ghjucarà strategia

Bj.

Prova. U prublema di equilibriu di Nash hè prublema (1), induve pA (Ai è Bj) = pB (Ai è Bj) = p (Ai) p (Bj), o prublema (3), induve pA (Bj | Ai) = p (Bj ) è pB (Ai | Bj) = p (Ai), per i, j = 1, 2. Cusì, Corollary 2 detene, induve e regioni VNM sò definite da (8), per pA (B1) = p (B1) è pB (A1) = p (A1). QED

Ricurdamu chì l'equazioni di equilibriu

separà e regioni VNM, rendendu cusì a suluzione generale à qualsiasi ghjocu. Queste stesse equazioni d'equilibriu, induve pB (A1) = p (A1) è pA (B1) = p (B1), rendenu l'equilibriu misto Nash11, cum'è noi mostriamo in a tabella sottu.

Proposta 4. Da ogni ghjocu A = [[A11, A12], [A21, A22]] è B = [[B11, B12], [B21, B22]], l'equilibri Nash per u ghjocu sò calculati da a fila applicabile di a Tabella 112.

Prova. Osservate chì (i, j) hè un equilibrio di Nash pura se è solu se sgn (2i - 1) * (A11 - A21)> 0 è sgn (2j - 1) * (B11 - B12)> 0, per i, j = 0, 1. Aduprendu questu fattu, per ogni fila in a Tabella 1, elencu tutte e coppie (i, j) chì sò puri d'equilibri Nash.

Finalmente, per a coppia (a, b) definita da (9) per esse un equilibriu mista Nash, ci vole solu mostrà chì 0 <a <1 è 0 <b <1. Ma nutate chì per e fila 6, 7, 10 è 11 di Tabella 1, numeratore è denominatore di a, 1 - a, b o 1 - b sò positivi o dui negativi; per quessa a, 1 - a, b, 1 - b sò tutte più grande di 0. QED

Esempiu di Dominanza Iterata[13].

Lasciate A = [[2, 2], [3, 1]] è B = [[0, 1], [0, 2]]. "Play A1 & B2" hè l'equilibriu Nash.

Proposta 5. Da A = [[2, 2], [3, 1]] è B = [[0, 1], [0, 2]], allora u giocatore A ghjucarà A1 è u giocatore B ghjucarà B2.

Prova. A regione VNM A1 hè: pA (B2 | A2) ≥ 1 / 2, e a regione VNM B2 è: pB (A2 | B2) ≥ -1. Quì, u ghjucadore B ghjucarà B2. U Jugatore A ancu sapi questu esse u casu, da quì pA (B2 | A2) = 1. Dapoi pA (B2 | A2) = 1 hè un puntu in a regione VNM A1, u ghjucatore A ghjoca A1. QED

Esempiu di cuurdinazione.

Let A = B = [[2, 0], [0, 1]]. Ci hè punti di equilibriu 3 Nash: "play A1 & B1", "play A2 & B2", è "play A1 (o B1) cù probabilità 1 / 3". A regione VNM A1 hè: 2pA (B1 | A1) ≥ pA (B2 | A2) è a regione VNM B1 è: 2pB (A1 | B1) ≥ pB (A2 | B2). Analizendu visuali questi VNM e regioni, A è B probabilmente sceglienu strategie A1 è B1 rispettivamente.

Proposta 6. Date A = B = [[2, 0], [0, 1]], se e probabilità di i ghjucatori sò reciprocamente indipendenti, allora ghjucate a prima strategia se crede chì a probabilità di l'avversariu di ghjucà a so prima strategia hè almenu 1 / 3, altru ghjoca a seconda strategia.

Prova. A regione VNM A1 hè: pA (B1) ≥ 1 / 3 è a regione VNM B1 hè: pB (A1) ≥ 1 / 3. QED

Esempiu di Battaglia di i Sessi

Lasciate A = [[3, 1], [1, 2]] è B = [[2, 1], [1, 3]]. Ci hè punti di equilibriu 3 Nash: "ghjucà A1 & B1", "ghjucà A2 & B2", è "ghjucà A1 cù probabilità 2 / 3, ghjucà B1 cù probabilità 1 / 3". A regione VNM A1 hè: 2pA (B1 | A1) ≥ pA (B2 | A2) e a regione VNM B1 è: pB (A1 | B1) ≥ 2pB (A2 | B2). Preferite sceglite A1 è B preferite sceglie B2.

Proposta 7. Da A = [[3, 1], [1, 2]] è B = [[2, 1], [1, 3]], se i probabilità di i ghjucatori sò reciprocamente indipendenti, allora: ghjucate A1 se pA (B1 ) ≥ 1 / 3, altru ghjucà A2; ghjucate B1 se pB (A1) ≥ 2 / 3, altrimente B2.

Prova. A regione VNM A1 hè: pA (B1) ≥ 1 / 3 è a regione VNM B1 hè: pB (A1) ≥ 2 / 3. QED

Esempiu di Pennies Corrispondente.

Lasciate A = [[1, -1], [-1, 1]] è B = [[-1, 1], [1, -1]]. Stu ghjocu di summa zero hà un equilibriu Nash mistu: "ghjucate A1 cù probabilità 1 / 2, ghjucate B1 cù probabilità 1 / 2".

Proposta 8. Date A = [[1, -1], [-1, 1]] è B = [[-1, 1], [1, -1]], se i probabilità di u giocatore sò reciprocamente indipendenti, allora: play A1 se pA (B1) ≥ 1 / 2, altrimente A2; ghjucà B1 se pB (A1) 1 / 2, altri ghjucate B2[14].

Prova. A regione VNM A1 hè: pA (B1) ≥ 1 / 2 è a regione VNM B1 hè: pB (A1) 1 / 2. QED

Esempiu di ghjocu di pollastru (Sugden [19]).

Lasciate A = [[0, -1], [1, -10]] è B = [[0, 1], [-1, -10]]. L'equilibri Nash sò "play A1 (swerve) & B2 (go straight)", "play A2 (go straight) & B1 (swerve)" è "play A1 (B1) with 0.9 probability".

Proposta 9. In u ghjocu di caccia, se i probabilità di u ghjucatu sò reciprocamente indipendenti, allora: indettate se crede chì l'avversariu s'infilmarà cù a probabilità di massimu 90%, altrimenti vai drittu.

Prova. A regione VNM A1 hè: pA (B1) + 11pA (B2) ≥ 2, o pA (B1) ≤ 9 / 10. In modu analogu, a regione VNM B1 hè: pB (A1) ≤ 9 / 10. QED

Osservate chì se u vostru avversariu mostra troppu entusiasmu (almenu 90%) per sfidassi, allura duvete andà à dritta.

Scenariu preferitu: I ghjucatori sò più probabili di girate di andà à andà in dritta.

Scenariu di pollo: Suppone pA (B1) = pB (A1) = 0. Tramindui ghjucatori aspetta chì l'altru ghjucatore sia drittu. Tramindui si giranu.

Scenariu di catastrofa: Supponemu pA (B1) = pB (A1) = 1. Tramindui ghjucatori aspettavanu chì l'altru ghjucatore si girà. Tramindui si ne và[15].

Scenariu di equilibrio Nash: Suppone pA (B1) = 1 - pB (A1), è pB (A1) = 0 o 1. U ghjucatore chì aspetta chì l'altru ghjucatore sia direttu si ndararà, è u ghjucatore chì aspetta chì l'altru ghjucatore si ne puderà girà seranu diritti.

Esempiu di razza d'Armi.

In a Proposizione 9, lasciate A = [[0, -x], [1, -10x]], B = [[0, 1], [-y, -10y]], per x, y ≥ 0. Chì A1 o B1 sia "cercate a pace" è A2 o B2 sia "attaccu nucleari". I valori x è y denotanu u materiale di armi di B è A rispettivamente.

U Paese A cerca a pace se a probabilità chì l'attacchi B di u paese sia più grande di 1 / (9x + 1); altrimenti A attacca. La curva di probabilità pA (B1) = 1 / (9x + 1) scende rapidamente, per esempio, pA (B1) = 1 / 2 a x = 1 / 9, ma presto si piatta drammaticamente: B deve rapidamente immagazzinare inizialmente, ma come la curva flattens, ci serà pocu benefiziu à B per purtà armi.

È listessu modu per u paese B.

In riassuntu, ogni paese accumene inizialmente armi per ùn esse attaccatu. Ma i ritorni in diminuzione rapida di e braccia di u materiale si materializanu, apre una opportunità per circà un trattatu di paci.

Comu illustrazione, cunzidiate u stockpile nucleare globale stimatu di 2018[16] di Tabella 2.

Basatu nantu à i pagamenti sopra è a Tabella 2, una Corea di u Nordu raziunale duveria cercà un trattatu di paci cù i Stati Uniti è a Russia.

Skyrms [16]).

Lasciate A = [[4, 1], [3, 2]] è B = [[4, 3], [1, 2]]. L'equilibri Nash sò "play A1 (Stag) & B1 (Stag)", "play A2 (Hare) & B2 (Hare)" è "play A1 (B1) con probabilità 0.5".

Proposta 10. In a caccia di stagni, se e probabilità di i ghjucatori sò reciprocamente indipendenti, allora: caccia a stagione se credi chì l'avversariu caccia a stagia cun una probabilità di almenu 50%, altrimenti caccia a lepre.

Prova. A regione VNM A1 hè: 3pA (B1) + pA (B2) ≥ 2, o pA (B1) ≥ 1 / 2. In modu simili, a regione VNM B1 hè: pB (A1) ≥ 1 / 2. QED

Dilema di u prigiuneru[17].

Lasciate A12 <A22 <A11 <A21, è lasciate uguali u traspusizione di A. Siccomu A11 <A21 è A12 <A22, l'usu di u principiu di dominanza rende l'equilibriu Nash, à dì a soluzione non cooperativa "play A2 (difettu) è B2 (difettu) ". Ma postu chì A22 <A11, A è B sò megliu s'elli ghjucanu a suluzione cooperativa "ghjucà A1 (silenziu) è B1 (silenziu)".

Proposta 11. In u dilema di u prigiuneru, se e probabilità di u ghjucatu sò reciprocamente indipendenti, allora i ghjucatori ghjucanu senza cooperazione[18].

Prova. Fighjemu u latu di a sinistra di a regione VNM A1:

(A11 - A12 - A21 + A22) pA(B1) + A12 - A22.

Se A11 - A12 - A21 + A22 ≤ 0, allora (A11 - A12 - A21 + A22) pA(B1) + A12 - A22 ≤ A12 - A22 <0. Per d 'altra banda, se A11 - A12 - A21 + A22> 0, allora (A11 - A12 - A21 + A22) pA(B1) + A12 - A22 ≤ (A11 - A12 - A21 + A22) + A12 - A22 = A11 - A21 <0. Cusì, per qualsiasi precedente per u giocatore A, a regione VNM A1 hè u set nulu, per quessa deve ghjucà strategia 2.

In modu analogu, u ghjucatore B deve ghjucà a strategia 2. QED

A proposizione 11 mostra chjaramente chì l'assunzione di l'indipendenza ci restringe à a suluzione micca cooperativa.

Esempiu di dilema di classi prigiuneri.

In u dilema classico di prigiuneri, A = [[-1, -3], [0, -2]] è B = [[-1, 0], [-3, -2]].

Proposta 12. In u dilema classico di prigiuneri, se i prighi di i ghjucatori sò: pA (B1 | A1) + pA (B2 | A2) ≥ 3 / 2, pB (A1 | B1) + pB (A2 | B2) ≥ 3 i ghjucatori sparghjeraranu a suluzione cooperativa2.

Prova. A regione VNM A1 hè: pA (B1 | A1) + pA (B2 | A2) ≥ 3 / 2, è a regione VNM B1 è: pB (A1 | B1) + pB (A2 | XXUMX Eccu, per i priori dati, i ghjucatori A è B anu da ghjucà a suluzione cooperativa. QED

In a Proposition 12, noteu a barra alta necessaria per ghjucà à a suluzione cooperativa. I ghjucadori preferiscenu sceglie di ghjucà a suluzione non-cooperativa.

Un Istanza induve l'approcciu Nash falla cunsiderà di ghjucà a Strategia Cooperativa.

Considera u dilema di u prigiuneru induve A11 - A12 = A21 - A22, A21 = A11 + m è A22 = A11 - M, induve m> 0 hè chjucu è M> 0 hè grande. Per esempiu, A = [[100, -3], [101, -2]]. Ricurdamu da a Proposition 11 chì, se e probabilità di ghjucatori sò reciprocamente indipendenti, allora i ghjucatori ghjucheranu micca cooperativamente.

Evidentemente, seria insensatu chì i ghjucatori ùn anu mancu à cunsiderà a ghjucazione di a strategia 1 postu chì se un ghjucatu ghjucà 2, a probabilità chì l'altru ghjucatu ghjucà 2 produzarà una perdita significativa, dunque perchè risicate cusì. Claramente, l'approcciu Nash falla cunsidereghja di ghjucà a suluzione cooperativa ancu quandu hè a soluzione evidente da ghjucà - un puntu assai impurtante per dì, discussioni di rottura di u mercatu in mudelli di equilibriu ecunomicu in generale.

Per d 'altra banda, cum'è a prossima pruposta mostra, abbandunendu l'assunzione di l'indipendenza, u nostru avvicinamentu hà da ghjucà a soluzione cooperativa piuttostu chè a suluzione non cooperativa.

A linea nera hè a linea indiferenza per u dilema classicu di i prigiuneri. Un jocatore hè più prubabile di ghjucà a strategia 2 per via di a improbabile prubabilità di esse in a regione per a strategia di ghjucà

1.

A linea verde hè a linea d'indifferenza per questa istanza di u dilema di u prigiuneru: pA (B1 | A1) + pA (B2 | A2) = 1 + m / (M + m). Quì, a dimensione di a regione di probabilità per a strategia 1 hè guasi quella per a strategia 2. U nostru approcciu hè cunsigliatu à i ghjucatori à cunsidereghja ghjucà a strategia 1.

Proposta 13. Da un dilema di un prigiuneru induve A11 - A12 = A21 - A22, A21 = A11 + m è A22 = A11 - M, induve m> 0 hè chjucu è M> 0 hè grande, i ghjucatori A è B ghjucanu a soluzione cooperativa20.

  • Dunque, i ghjucatori ùn ghjucanu micca a suluzione non-cooperativa.
  • Attualmente, per ghjunghje in a soluzione cooperativa, si assuncianu ipotesi, p.e., raziunalità delimitata, informazioni incomplete (Aumann and Maschler [2]; Acevedo and Krueger [4]; pA (A1 è B1) deve esse vicinu à 1.Què perchè A è B sò probabili di ghjucà a strategia 1, induve i so pagamenti sò abbastanza elevati è solu m unità menu di massimu.

Per quessa, pA (B1 | A1) = pA (A1 è B1) / pA (A1) deve ancu esse vicinu à 1.

A cuncludi ancu chì pA (A2 è B2) pA (A2 è B1) postu chì B hè più probabile di ghjucà a strategia 2 se A ghjucà a strategia 2. Dunque pA (B2 | A2) = pA (A2 e B2) / (pA (A2 e B1) + pA (A2 è B2)) 1 / 2. Concludi, aduprendu a Fig. 1, chì B hè abbastanza in a regione VNM A1. In modu simili, B giocarà a strategia 1. QED

U Paradossu di Newcomb cum'è una Versione di u Dilemma di u Prigiuneru.

In u famosu paradossu di Newcomb (Wolpert è Benford [21]), ci hè un predittore B, un ghjucatore A è una scatula X. U ghjucatore A hè datu a scelta di piglià a casella X o a scatula X plus $ 1,000. Prima chì A faci a so selezzione, B predice ciò chì A farà, è e previsioni di B sò quasi sicure. Se B predice chì A pigliarà solu a scatula X, allora B mette $ 1,000,000 in a casella X. In questu casu, cum'è a casella hà una $ 1,000,000 in ella, A riceve $ 1,000,000 o $ 1,001,000 sicondu se A sceglie a casella X o X plus $ 1,000. Per d 'altra banda, se B predice chì A pigliarà a scatula X plus $ 1,000, allora B ùn posa nunda in a casella X. In questu casu, secondu a so scelta, A sia riceve $ 1,000 o nunda.

U paradossu di Newcomb hè chì duie analisi perfettamente raziunali danu risposte cunflittu à u prublema d'ottimisazione di u ghjucatore A: in virtù di l'ipotesi utilitaria prevista, u ghjucadore A deve piglià solu a scatula X, postu chì u pagu previstu di piglià X hè assai più altu. Per d 'altra banda, sottu u principiu di dominanza, u jugatore A duverà piglià a scatula X plus $ 1,000.

U paradossu hè megliu capitu da un passaghju in (Wolpert è Benford [21]): "... Newcomb hà dichjaratu ch'ellu avia solu X; perchè cumbatte un esse cum'è Diu? Tuttavia, Nozick hà dettu, "A quasi tutti, hè perfettamente chjaru è evidenti ciò chì deve esse fattu. A difficultà hè chì queste persone pare divèrtenu quasi uniformi annantu à u prublema, cù un gran numaru pensendu chì a mità opposta hè solu stupida. "...".

Wolpert è Benford risolvenu u paradossu dimustrendu chì u prublema di Newcomb riprisenta in fattu dui ghjochi sferenti cù risultati probabilistichi differenti.

In questa sezione, risolvemu u paradossu pusendu u prublema di Newcomb cum'è un dilema di i prigiuneri. Fendu cusì, a soluzione à u prublema di Newcomb pò esse ghjunghje in dui modi: cum'è a soluzione non cooperativa (pigliate a casella X plus $ 1,000) aduprendu u principiu di dominanza, o cum'è a soluzione cooperativa (pigliate solu casella X) aduprendu l'aspettatu. ipotesi utilità.

Supponemu chì ci hè un ricco benefattore chì prumette di finanziare una matrice di rimborsu per u predictore B, rendendu u seguente ghjocu: A = [[$ 1,000,000, 0], [$ 1,001,000, $ 1,000]] è B = [[$ 1,000,000, $ 1,001,000 ], [0, $ 1,000]].

Se B predice bè, B ottene ciò chì u ghjucatore A uttene. Ma se B predice sbagliatu, B uttene 1,001,000 $ minus ciò chì A vene21.

Da a Proposition 13, i ghjucatori A è B ghjucaranu cooperativamente in stu ghjocu.

Se Nash, u ghjucatore risolve u prublema aduprendu u principiu di dominanza, cusì face u preditore. Tramindui predittore è u ghjucadore saranu à a suluzione non cooperativa: pigliate X più $ 1,000. Se u ghjucatore risolve u prublema aduprendu l'ipotesi utilitaria aspettata, cusì face u predictor, è u dui predictor è ghjucatore saranu à a soluzione cooperativa: pigliate solu X. In ogni casu, a predizione di u predittore hè

è Sadowski [6]) o novi metudi sò descritti, per esempiu, tit-per-tat, equilibri correlati (Axelrod [3]; Aumann [1]).

21 Nota chì, pusendu u prublema di Newcomb cum'è un prublema PD, u predictore hè datu un incantu persunale chì hè assente in u prublema di Newcomb.

certa. Siccomu da a Proposition 13, i ghjucatori ùn ghjucanu micca a suluzione non-cooperativa, accordu cun Newcomb chì a cooperazione hè a strategia evidenti da piglià.

Nota in a Fig. 1, in ogni modu, a regione per a cooperazione hè negligibilmente più chjuca cà quella per a non-cuuperazione. Ùn ci hè micca dunque surprisa chì e persone dividinu uniformemente nantu à quale strategia di piglià.

Una Generalizazione di u Dilemma di u Prigiuneru à e Persone M.

Per capisce megliu cumu a soluzione Nash puderà abbandunà in i mudelli generale di equilibriu ecunomicu, generalizemu u dilema di i prigiuneri à i Persone M, cù ogni ghjucatore chì hà strategie 2, per M 2.

Scriveremu u ghjocu M-Person via arbuli binari.

Fig. 2 hè u dilemma di prigiuneru rimborsu per u ghjucadore A. Tree (2, 1) hè l'arbre binariu cù u ghjucatore B (ghjucatore 2) in quantu parenti, è u ghjucatore A (ghjucatore 1) da zitellu. Per ottene u rimborsu per u ghjucatore B, basta cambià u rolu di u genitore è u zitellu à Tree (1, 2). Ricurdate chì per u dilema di u prigiuneru, A12 <A22 <A11 <A21.

In seguitu, supponimu chì Tree (M - 1, M - 2, ..., 2, 1) denota u pagamentu di u A per un ghjocu (M - 1) -Personale, per M 3. Custruisci l'Arburu di u giocatore A (M, M - 1, ..., 2, 1) per un ghjocu di Persona M lascendu l'arbulu di A player (M - 1, M - 2, ..., 2, 1) esse l'arbureti su entrambi rami di u ghjucadore genitore M.

I valori numerichi di a rimunerazione in l'arburu sub destra sò assuniti sferenti da quelli chì sò nantu à l'arburu sub left, sempre chì a relazione A12 <A22 <A11 <A21 si mantene in ogni locu in l'arbre.

Finalmente, datu Tree (M, M - 1, ..., 2, 1) per u giocatore A, crea Tree (1, M, M - 1, ..., 3, 2) per u giocatore B (player 2) facendu 1 u più altu genitore; Arbulu (1, 2, M, M - 1, ..., 4, 3) per u giocatore 3 facendu 2 u sicondu genitore più altu, ..., Arbore (1, 2, 3, ..., M - 2, M, M - 1 ) per u jugatore M - 1 facendo M - 2 u terzu zitellu più bassu, Arbre (1, 2, 3, ..., M - 1, M) per u jugatore M facendu M - 1 u sicondu zitellu più bassu.

Questa completa a descrizzione di i pagamenti di i ghjucatori per un ghjocu di dilema di un prigiuneru M-Person, cù ogni ghjucatore chì hà strategie 2.

Teorema 14. Per u dilema di u prigiuneru M-Person, M 2, aduprendu u principiu di dominanza, a suluzione Nash hè per i ghjucatori à ghjucà a strategia 2.

Prova. Sapemu digià chì u teorema tene per M = 2. Assumemu per induzione chì u teorema possa per M - 1, per M 3. Dimostremu chì u teorema tene per M.

Arbore datu (M, M - 1, ..., 2, 1) per u giocatore A, ricordate chì per custruzione, i sub arbuli di a filiera di manca è di diritta sò di forma Arbulu (M - 1, M - 2, ..., 2 , 1) per u giocatore 1, Tree (M, M - 1, ..., 2) per u player 2, Tree (2, M, M - 1, ..., 4, 3) per u giocatore 3, ..., Tree (2, ... , M - 2, M, M - 1) per u giocatore M - 1. Questi arburi sub sò identici per i ghjucatori 1, 2, ..., M - 1, eccettu per l'etichettatura in i nodi di i genitori. Innota chì a strategia di ogni ghjucatore 2 domina a so strategia 1 in ogni cundizione. Per induzione, aduprendu u principiu di dominanza, i ghjucatori 1 à M - 1 ghjucanu a strategia 2.

Dunque, datu Tree (1, 2, ..., M - 1, M) per u giocatore M, se M gioca 1, la paga per u giocatore M è b (u sicondu nodo più diritto di l'arbulu) mentre chì M gioca 2, il payoff per u jugatore M hè A22 (u node più dirittu di l'arburu). Per u principiu di dominanza, postu chì A12 <A22, u ghjucatu M ghjucarà ancu strategia 2. QED

Avà supponemu chì ogni pagamentu di u tipu A11 hè assai più grande ch'è qualsiasi payoff di u tipu A22; è chì A21 = A11 + m, induve i pagamenti A11 è A21 si trovanu in nodi adjacenti.

Claramente, l'approcciu Nash falla di cunsiderà ghjucà a suluzione cooperativa "strategia di ghjocu 1" ancu quandu hè a soluzione evidente per ghjucà.

In seguitu à l'argumentu inductive di u Teorema 14, pudemu ancu cuncludi chì, postu chì l'arbureti sottu à e branche di a manca è di a diritta sò di a forma Tree (M - 1, M - 2, ..., 2, 1) per u giocatore 1, Tree ( M - 1, M - 2, ..., 2) per u giocatore 2, Tree (2, M, M - 1, ..., 4, 3) per u giocatore 3, ..., Tree (2, ..., M - 2, M, M - 1) per u giocatore M - 1, per induzione, usendu l'ipotesi utilitaria prevista, i ghjucatori 1 à M - 1 ghjucanu a strategia 1 induve l'alloghju hè di u tippu A11.

Dunque, datu Tree (1, 2, ..., M - 1, M) per u giocatore M, se M gioca 1, il payoff per il giocatore M è un (u nodo più a sinistra dell'arbre) mentre chì si M si joca 2, il payoff per u jugatore M hè A21 = A11 + m (u sicondu nodo più à manca di l'arbulu). Siccomu A11 <A21, u jugatore M pò esse tentatu di ghjucà a strategia 2. Ma perchè u risicu di ghjucà a strategia 2 per m unità più di A11, quandu puderia purtà à un pagamentu di u tipu A22, un payoff significativamente menu di A11?

Per l'ipotesi utilitaria prevista, u ghjucatu M deve ancu ghjucà a strategia 1.

Ghjochi in generale M-persona.

Infine, generalizemu Teorema 1 per i ghjoculi in generale M-persona.

Sia ci sò M attori, induve ogni ghjucadore ha strategie possibili per ogni i = 1, 2, ..., M. Visto u vettore di strategia (j1, j2, ..., jM), lasciate che il rimborso al giocatore sia Aij1j2 ... jM. Sia xi sia una strategia mista per u giocatore i, vale à dì una strategia xi induve Σj xij = 1, xij 0, tutte j, è lasciate x = (xi, xi) denote e strategie di tutti i ghjucatori. U prublema di Nash hè:

induve EP (i | xi) hè u rimborsu previstu di u ghjucadore i datu xi è induve a summazione hè sopra tutte jk è tutte k.

Una strategia x * hè un equilibriu di Nash se xi * hè una soluzione à u prublema di i ghjucatori sopra, datu xi *.

Per u nostru approcciu, lascia pij1, j2, ..., jM Siate u ghjucatore Probabilità probabile chì u ghjucatu k ghjoca jk, per tutti i jk è tutti i k. A teoria di l'utilità prevista da Von Neumann – Morgenstern dice chì u scopu di u playeru hè di maximizà a so spiranza prevista:

induve a summazione hè sopra tutte e jk è tutte e k.

Defini

induve -I ghjoca j-i significa chì u ghjucatu k ghjoca jk è induve a summazione hè sopra à tuttu jk, per tutti k i.

Teorema 15. I prublemi (13) sottu sò equivalenti à i prublemi (11):

Prova.. Per definizione,

induve a summazione hè sopra à tuttu rk, per ogni k i.

U denominatore di (14) hè a probabilità pi (i ghjoca ji). Quì,

Dapoi Σ pi (i ghjoca ji) = 1 è pi (i ghjoca ji) 0 per tutti i ji, ghjè dopu à quellu ghjucadore chì ghjoca strategia [arg maxji EP (i | ghjoca ji)]. QED

Un metudu per truvà la migliore strategia per u giocatore i hè u seguente: Per ogni coppia di strategie per u giocatore i, dici a strategia r e la strategia s, calculate u locu di punti induve i pagamenti previsti stanu cundiziunati à u ghjucadore chì ghjuche o r o s uguali. . Questu definisce una superficie d'indifferenza chì divide u spaziu di probabilità cundizionale in regioni 2 VNM. Una regione VNM hè marcata r perchè a strategia di scelta hè r, è l'altra regione VNM hè marcata s perchè a strategia di scelta hè s.

Dopu i calculi supra, ogni regione VNM serà stata tichjata tante volte quant'è ci sò pariglii distinti di strategie. Per ogni regione VNM data, pigliate una di e duie etichette multiple è elimine una di elle basatu annantu à a superficie d'indifferenza creata da stu paru di etichette. U prucessu finisce quandu ogni regione VNM hà una sola etichetta.

Generale 2-persona Ghjochi.

Lasciate chì u ghjucatore A hà strategie Ai, i = 1, 2, ... n1 è u ghjucatore B anu strategie Bj, j = 1, 2, ... n2. Assumemu chì e probabilità di u ghjucatu sò reciprocamente indipendenti. U prublema (13) hè:

Quì, e regioni VNM sò definite da polytopes convex:

Cumu si pò osservà in (16), truvendu a suluzione stabilita in un ghjocu generale per a persona 2 hè semplice. Per esempiu, cunzidiate u ghjocu di più di duie anni Rock-Paper-forbici, induve l'equilibriu Nash: ghjucate ogni strategia cù 33% probabilità:

A strategia A1 o B1 (rock) perde à a strategia A2 o B2 (carta) perde a strategia A3 o B3 (forbici) perde à u rock.

Per u ghjucatore A, in generale avemu, induve 0 pA (Bj) 1,

chì si reduce à

E similariamente per u ghjucatu B.

Ciò chì pare una nova strategia per stu ghjocu anticu hè: play rock se crede chì u vostru avversariu hà da ghjucà a carta cù a probabilità di 33% massimu è forbici cù probabilità di almenu 33%; ghjucà a carta se crede chì u vostru avversariu hà da ghjucà forbici cù probabilità di massimu 33% è scoglià cù a probabilità di almenu 33%; altru ghjucà forbici22.

3-persona Giochi induve Ogni Persona Hà 2 Strategie.

Applicemu u Teorema 15 per truvà a soluzione stabilita in un ghjocu di persona 3, induve ogni giocatore A, B, è C hà 2 strategie Ai, Bi, Ci, per i = 1, 2 rispettivamente.

Assumemu chì e probabilità di u ghjucatu sò reciprocamente indipendenti. Per u ghjucatore A, l'equazione (13) hè

è simile per i ghjucatori B è C. Utilizendu Theorem 15, a suluzione hè definita da:

Emu aduprà quì sopra per u ghjocu Bar-crowding[21]:

Se u ghjucatore hè in casa, u so pagamentu hè 1; se u ghjucatore hè solu in a barra, u so pagamentu hè 0; se u ghjucatore hè in a barra cù una altra persona, u so pagamentu hè 2; altru, u so pagamentu hè -1.

Avemu: A111 - A211 = -2, A112 - A212 = A121 - A221 = 1, A122 - A222 = -1, quindi la regione VNM A1 è la regione -3pA (B1) (C1) - 2 ≥ 1, o equivalente a regione[22] pA (B1) ≥ (1 - 2pA (C1)) / (2 - 3pA (C1)). Simile, a regione VNM B1 hè a regione pB (A1) ≥ (1 - 2pB (C1)) / / 2 - 3pB (C1)) è a regione VNM C1 hè a regione pC (B1) ≥ (1) - 2 - 1 - 2) / (3 - 1pC (A1)). L'equilibri Nash sò p (A) = p (B) = p (C) = 1 è p (A) = p (B) = p (C) = 3 / XNUMX.

Ricunniscenza.

Vulemu ringraziari Al Roth è Todd Davies per i so preziosi cunsiglii è guida in a preparazione di stu documentu.

Footnotes

[1] Per a simplicità, facemu a supposizione cumuna chì l'utilità hè una funzione lineale di u payoff (Starmer [18]). Quì, a maximizazione di l'utilità prevista hè a stessa cosa chì a maximizazione di i pagamenti previsti.

[2] L'approcciu bayesianu per i ghjochi difiere di u travagliu bayesianu precedente (per esempiu, Acevedo è Krueger [4]; Aumann [1]; Daley è Sadowski [6]; McKelvey è Palfrey [12]; Quattrone è Tversky [15]) in quessa, a diferenza di l'altri approcci, u nostru approcciu tene à probabilità cundiziunali inutilmente à l'ipotesi utilitaria prevista, chì a nostra soluzione sempre satisfà.

[3] Un criticu dichjara chì "i ghjucatori raziunali ùn anu micca è ùn deve micca cunzidiate e probabilità condiziunali ... Imagine un agent chì sapi chì a probabilità di pioggia hè p. A vostra "suluzione" pare esse chì l'agente duverà piglià un ombrello cun ellu se piove è lascià l'ombrello se ùn piove micca ".
U teorema 1 mostra chì l'antica critica ùn hè micca giustificata. In quantu à l'ultima critica, lasciate EP (agentu | porta un ombrello) = p, è EP (agentu | ùn porta micca un ombrello) = 1 - p. A nostra suluzione seria allora: portà un ombrello si p ≥ 1 / 2; ùn portate micca ombrello si p ≤ 1 / 2.

[4] A probabilità condizionale di (2) ùn viola micca u principiu in Spohn [17]: "Ogni modello di decisione quantitativa adatta ùn deve cuntene esplicitamente o implicitamente alcuna probabilità soggettiva per atti ..." Le probabilità di un giocatore sò probabilità subjective per l'avversariu. strategie, micca per e so propie strategie.

[5] Stu teorema serà generalizatu à unu per i ghjoculi in persona M.

[6] Ùn ci hè micca signalazione trà i ghjucatori.

[7] Si suppone chì e variabili indipendenti pA (B1 | A1) è pA (B2 | A2) si datanu in u prublema di maximizzazione, una simplificazione chì evita u prublema di regressione infinita (simile à l'ipotesi di Nash che p (B1) è dato per il giocatore A in a formulazione di u so prublema di maximizazione).

[8] Inuguaglianza (5) hè a soluzione (scuperta) à u prublema (1) in u stessu modu chì a formula quadratica hè a soluzione à una equazione quadratica generale.

[9] L'avventura di u ghjucatu pò esse dipende da avvenimenti casuali parzialmente osservabili, cum'è u clima. Per l'usu di prioi in ghjoculi cun infurmazione incompleta ghjucata da i ghjucatori Bayesiani, fate riferimentu (Harsanyi [10]).

[10] Questa soluzione generale cuntene l'equilibri Nash cum'è soluzioni particulare. In cuntrastu à e soluzioni descriptive Nash, a nostra suluzione hè un paru di strategie puri-aspettative raziunali piene. D’altronde, se per errore, u ghjucatore A hè in a regione VNM A1 è ghjucà A2, u Corollary 2 dichjara chì u ghjucatore A hà da uttenerà un ingiru più bassu previstu.

[11] Hè interessante di nutà chì in un equilibriu mista Nash, a strategia di un ghjucatore dipende da cunnosce a funzione di pagamentu di l'altru ghjucatore.

[12] I segni zero sò ignurati in u tavulinu, postu chì questi casi degeneranu: un ghjucatore ùn hè micca incapace di sceglie trà e so dui strategie. Inoltre, hè interessante nutà chì ogni equilibriu di Nash appare in esattamente quattru file.

[13] I seguenti 3 esempi sò adattati da (Davies [7]) in una manera chì puderia serve cum'è una tecnica pedagogica per i studienti in teoria di u ghjocu. A Tabella 1 pò esse usata per truvà l'equilibri Nash per tutti l'esempi di ghjocu di a persona 2 descritti in questu.

[14] L'azzione di A ùn anu micca impattu nant'à a scelta di l'azzione di B. Ciò hè perchè e credenze di A sò non correlate a credenze di B. Invece, se e credenze sono correlazionate, allora e probabilità di entrambi i ghjucatori deve uguali à 50%, altrimenti, se diciamo chì e probabilità di i ghjucatori sò tramindui> 50%, A sa chì B ghjucerà a strategia 2 (codici), e dunque a strategia di gioco 1 (capi) ùn pò micca esse una prescription curretta per A. Se dì, a probabilità di A hè> 50% è a probabilità di B hè <50%, B sapi chì A ghjucarà i capi, dunque i capi di ghjocu ùn ponu esse una prescription curretta per A. Etc. a suluzione unica hè dunque l'equilibriu Nash: ghjucà à casu per i dui.

[15] Innota chì pA (B1) = pB (A1) = 0 o 1 hè un scenariu di equilibrio: i dui ghjucatori giranu (o i dui vanu drittu) se i dui ghjucatori aspettanu chì l'altru ghjucatore va drittu (o infernatu). In cuntrastu, p (A1) = p (B1) = 0 o 1 ùn pò micca esse un equilibriu di Nash: se B va drittu (o gira), A girà (o va dritta).

[16] Fonti: Associazione à u Control d'Arme, Federazione di Scienziati Americani, Panel Internaziunale nantu à Materiali Fissili, Dipartimentu di Difesa di i Stati Uniti, Dipartimentu di Statu di i Stati Uniti è Istitutu Internaziunale di Ricerca di Pace di Stoccolma

[17] Dapoi u scrittu originale di Flood è Dresher, migliaia d'articuli sò stati publicati riguardanti questu. Una ricerca di Google Scholar di "dilema di prigiuneri" dà risultati 104,000 da sta scrittura. Per piacè, conferite (Kuhn [14]).

[18] Dunque, i ghjucatori ùn ghjucanu micca a suluzione cooperativa.

[19] Se u vostru avversariu ghjoca in modu casuale, u vostru avutu pò esse influenzatu da i ghjoculi di u vostru avversariu precedente di stu ghjocu.

[20] A formula pò esse estesa à M-persone, per M> 3.

[21] Stu ghjocu hè basatu nantu à u prublema di a barra di El Farol (Arthur [5]).

[22] U locu di l'indifferenza hè una curva quadratica passante per i punti (pA (C1), pA (B1)) = (0.5, 0), (0.33, 0.33), (0, 0.5).

Vede ancu

[1] Aumann RJ (1974) Subjetività è Correlazione in Strategie Randomized. Journal of Economics Mathematical 1: 67-96

[2] Aumann RJ, Maschler M (1995) Ghjochi ripetuti cù informazioni incomplete. MIT Press, Cambridge Londra

[3] Axelrod R (1984) L'evoluzione di a cuuperazione. Libri basi

[4] Acevedo M, Krueger JI (2005) Ragionamentu evidenziali in u dilemma di u prigiuneru. U Revista Americana di Psicologia 118: 431-457

[5] Arthur WB (1994) Riunamentu Induttivu è Razionalità Legata. Revisione Economica Americana 84: 406-411

[6] Daley B, Sadowski P (2017) U Pensamentu Magicu: Un Risultatu di Rapprisentazione. Economie teoriche 12: 909-956 24 Stu ghjocu hè basatu nantu à u prublema di a barra El Farol (Arthur [5]). 25 Il locus di l'indifferenza hè una curva quadratica che passa per i punti (pA (C1), pA (B1)) = (0.5, 0), (0.33, 0.33), (0, 0.5).

[7] Davies T (2004) Teoria Utilità è Teoria di Ghjocu. Note di lezioni

[8] Garcia CB, Zangwill WI (2017) Un novu approcciu à a Guerra o à a Pace. Paper di travagliu

[9] Garcia CB, Zangwill WI (2018) Dominanza, Utilità Stritta è u Dilemma di u Prigiuneru. Paper di travagliu

[10] Harsanyi J (1967) Ghjochi Cù Informazioni Incomplete Played da "Bayesian" Players I - III. J. Management Science 14 (3): 159-182

[11] Kadane JB, Larkey PD (1982) Probabilità sughjettiva è a Teoria di i Ghjoculi. Scienza Management 28 (2): 113-120

[12] McKelvey RD, Palfrey TR (1995) Equilibrii di Risposte Quantale per i ghjochi di furmatu nurmali. Giochi è Comportamentu Econòmicu 10: 6-38

[13] Jaynes ET (1968) Probabilità precedente. Transazzioni IEEE nantu i Sistemi Scienza è Cibernètica 4 (3): 227-241

[14] Kuhn S (2017) Dilemma di u prigiuneru. Enciclopedia di Filosofia di Stanford

[15] Quattrone GA, Tversky A (1984) Causa Versus Contingenzi di diagnostica: On auto-ingannu è illusione di u votante. Journal of Personality and Psychology Social 46: 237-248

[16] Skyrms B (2004) U Stag Hunt è l'Evoluzione di a Struttura Soziale. Stampa di l'Università di Cambridge, Cambridge

[17] Spohn W (1977) Induve Luce è Krantz Generalizanu u Modelu di Decisione di Savage. Erkenntnis 11: 113-134

[18] Starmer C (2000) Sviluppi in a teoria di l'utilità non prevista: a caccia per una teoria discrittiva di scelta sottu u risicu. Journal of Letteratura Econòmica 38: 332-382

[19] Sugden R (2005) L'ecunumia di Diritti, Cooperazione è Benessere. Palgrave MacMillan, edizione 2: 132

[20] Von Neumann J, Morgenstern O (1953) Teoria di i Ghjoculi è u Comportamentu Econòmicu. Princeton University Press, New Jersey

[21] Wolpert DH, Benford G (2011) A Lezione di Paradossu di Newcomb. Sintesi 190: 1637-164