Inteoria dei giochi si definisceequilibrio di Nash un profilo di strategie (una per ciascun giocatore) rispetto al quale nessun giocatore ha interesse a essere l'unico a cambiare. Prende il nome dal matematico statunitenseJohn Nash.
«Un gioco può essere descritto in termini di strategie che i giocatori devono seguire nelle loro mosse: l'equilibrio c'è quando nessuno riesce a migliorare in maniera unilaterale il proprio comportamento.
Per cambiare occorre agire insieme.[1]»
(John Nash)
La prima formulazione di questo teorema, relativo alla nozione di equilibrio più famosa dellateoria dei giochi per quel che riguarda i "giochi non cooperativi", appare in un brevissimo articolo apparso nel 1950 doveJohn Nash, allora dottorando aPrinceton, spiega la sua idea di fondere intimamente due concetti apparentemente assai lontani[2]: quella di unpunto fisso in una trasformazione di coordinate, e quella della strategia più razionale che un giocatore può adottare, quando compete con un avversario anch'esso razionale, estendendo la teoria dei giochi a un numero arbitrario di partecipanti, o agenti. Nash dimostra che, sotto certe condizioni, esiste sempre una situazione di equilibrio, che si ottiene quando ciascun individuo che partecipa a un dato gioco sceglie la sua mossa strategica in modo da massimizzare il suopayoff, sotto la congettura che il comportamento dei rivali non varierà a motivo della sua scelta (vuol dire che anche conoscendo la mossa dell'avversario, il giocatore non farebbe una mossa diversa da quella che ha deciso).
Il risultato di Nash può essere visto come una estensione rilevante rispetto al caso dei "giochi a somma zero" studiati in precedenza daJohn von Neumann. L'idea di equilibrio rappresenta anche una variazione concettuale significativa rispetto all'approccio di von Neumann, che faceva ricorso all'idea diminimax.
Vediamo ora più nel dettaglio cosa si intende esattamente perequilibrio di Nash. A tal fine, può essere utile chiarire alcuni semplici aspetti matematici dellateoria dei giochi e definire alcuni concetti basilari.
Un gioco è caratterizzato da:

- di strategie che il giocatorei-esimo ha a disposizione, cioè l'insieme delle azioni che esso può compiere; per brevità indicheremo nel seguito con
la strategia scelta dal giocatore
- Per ogni agente, una funzione

- che associa al giocatore
il guadagno (detto anchepayoff) derivante da ogni combinazione di strategie (il guadagno di un giocatore in generale dipende infatti non solo dalla sua strategia ma anche dalle strategie scelte dagli avversari).
Un equilibrio di Nash per un dato gioco è una combinazione di strategie (che indicheremo con l'apicee)

tale che

per ogni
e per ogni strategia
scelta dal giocatore
-esimo.
Il significato di quest'ultima disuguaglianza è molto semplice: se un gioco ammette almeno un equilibrio di Nash, ogni agente ha a disposizione almeno una strategia
dalla quale non ha alcun interesse ad allontanarsi se tutti gli altri giocatori hanno giocato la propria strategia
. Infatti, come si può desumere direttamente dalla disuguaglianza, se il giocatore
gioca una qualunque strategia a sua disposizione diversa da
, mentre tutti gli altri hanno giocato la propria strategia
, può solo peggiorare il proprio guadagno o, al più, lasciarlo invariato. Se ne deduce quindi che se i giocatori raggiungono un equilibrio di Nash, nessuno può più migliorare il proprio risultato modificando solo la propria strategia, ed è quindi vincolato alle scelte degli altri. Poiché questo vale per tutti i giocatori, è evidente che se esiste un equilibrio di Nash ed è unico, esso rappresenta la soluzione del gioco, in quanto nessuno dei giocatori ha interesse a cambiare strategia.
Il contributo più importante dato daJohn Nash allateoria dei giochi è ladimostrazione matematica dell'esistenza di questo equilibrio. In particolare egli ha dimostrato che ogni gioco finito ha almeno un equilibrio di Nash, eventualmente in strategie miste. Per gioco finito si intende un gioco con un numero qualunque ma finito di giocatori e di strategie, e per strategia mista per un dato giocatore si intende una distribuzione diprobabilità sulle strategie a disposizione del suddetto giocatore.
Sia
un gioco non cooperativo a
giocatori. Si supponga che valgano le seguenti:
sono sottoinsiemiconvessi,compatti e non vuoti di
, per ogni
;
sonofunzioni continue, per ogni
;
, tale che
, dove
indica la stringa di lunghezza
in cui è stata eliminata la componente
-esima, sia quasi concava, per ogni
. In altre parole, la funzione utilità, ristretta a una strategia, una volta fissate le altre, sia quasi concava.
Allora il gioco ammette almeno un equilibrio di Nash.
Innanzitutto, consideriamo la funzione miglior risposta (best replay) del giocatore
-esimo
, definita come

Si noti che

Data la funzione miglior risposta del gioco
, definita come
, si ha che
è un equilibrio di Nash se e solo se
è un punto fisso della funzione miglior risposta del gioco, cioè
.
Quindi, se verifichiamo che la funzione miglior risposta del gioco,
, soddisfa le ipotesi delteorema di Kakutani, avremo la tesi.
- Banalmente si ha che
è non vuoto, convesso e compatto, in quantoprodotto cartesiano di sottoinsiemi non vuoti, convessi e compatti di
. - Essendo
compatto e
continua, per ogni
, allora esiste almeno un massimo in
, e inoltre,
.
è compatto, per ogni
. Infatti, essendo sottoinsiemi chiusi di un compatto, sono compatti. Consideriamo una successione
, in
, convergente a
, allora
. Per definizione, si ha che

- Dal fatto che le funzioni utilità sono continue e la successione converge a
, allora

- Dunque, per ilteorema della permanenza del segno, segue che

- Questo significa che
.

- Dal fatto che le funzioni utilità sono quasi concave, ossia il loro sottografico intersecato con iperpiani genera insiemi convessi, segue che l'insieme
è convesso
. Osserviamo che
,
- Essendo
convesso
, allora la loro intersezione è ancora un insieme convesso, quindi
è convesso.
- La funzione miglior risposta del giocatore
-esimo ha grafico chiuso. Consideriamo le successioni
, in
, convergenti rispettivamente a
, se, inoltre,
, allora
, ossia la funzione miglior risposta del giocatore
-esimo ha grafico chiuso. Si supponga per assurdo che
. Allora esisterà un certo
tale che
. Sia
. Equivalentemente si ha che

- Dal fatto che le successioni sono convergenti e le funzioni utilità sono continue, e inoltre,
, segue che

- Per
, si ha che
. Assurdo.
Per concludere, è opportuno fare una breve riflessione sul significato profondo del concetto di equilibrio di Nash. Si è visto infatti come esso rappresenti una situazione nella quale nessun agente razionale ha interesse a cambiare strategia e come sia il frutto della scelta, da parte di tutti i giocatori, della propria strategia dominante: l'equilibrio di Nash rappresenta quindi la situazione nella quale il gruppo si viene a trovare se ogni componente del gruppo fa ciò che è meglio per sé, cioè mira a massimizzare il proprio profitto a prescindere dalle scelte degli avversari. Tuttavia, non è detto che l'equilibrio di Nash sia la soluzione migliore per tutti. Infatti, se è vero che in un equilibrio di Nash il singolo giocatore non può aumentare il proprio guadagno modificando solo la propria strategia, non è affatto detto che un gruppo di giocatori, o, al limite, tutti, non possano aumentare il proprio guadagno allontanandosi congiuntamente dall'equilibrio. È noto infatti che l'equilibrio di Nash può non essere un ottimo diPareto (oottimo paretiano), e quindi possano esistere altre combinazioni di strategie che conducono a migliorare il guadagno di alcuni senza ridurre il guadagno di nessuno, o addirittura, come accade nel caso deldilemma del prigioniero, ad aumentare il guadagno di tutti. Analogamente, il risultato migliore per tutti può non essere un equilibrio. Supponiamo quindi che in un gioco esista un equilibrio di Nash ed esista anche una combinazione di strategie ottimale, che indicheremo con l'apice
tale che

per ogni
, ma che questa tale combinazione non sia un equilibrio, come accade neldilemma del prigioniero, o, in altre parole, che
non sia una strategia dominante. In tal caso, ogni singolo agente avrà a disposizione almeno una strategia
diversa da
che gli permette di migliorare ulteriormente il proprio profitto modificando la sua sola strategia, vale a dire che esiste per ogni agente una
tale che

Conseguentemente, per l'assioma dirazionalità, sarà portato a preferire una strategia diversa da
. Inoltre, l'incremento di guadagno rispetto all'equilibrio di Nash derivante dalla scelta della strategia
, dipende, come sempre, dal fatto che tutti abbiano scelto tale strategia, poiché in generale il guadagno di
dipende dalle scelte di tutti i giocatori; non essendo
una strategia dominante, è possibile che se anche uno solo degli agenti sceglie di non giocare
, gli altri subiscano una riduzione del proprio guadagno rispetto a quello che avrebbero ottenuto giocando una strategia ottimale. In conclusione, ogni giocatore troverà comunque preferibile non rischiare e giocare la propria strategia dominante, e la soluzione del gioco resterà comunque l'equilibrio di Nash, anche se esso non garantisce il massimo guadagno possibile.
Non si deve tuttavia pensare che non sia possibile raggiungere una situazione nella quale tutti ottengono il miglior risultato possibile se esso non è un equilibrio (in alcuni casi
coincide con
e quindi il problema non si pone): ciò è possibile ma a condizione che si instauri una cooperazione tra i giocatori, vale a dire che tutti agiscano non col fine di ottenere il miglior risultato per sé, ma di ottenere il miglior risultato per il gruppo, e quindi, indirettamente, ottenendo un risultato migliore anche per sé (anche questo concetto è ben esemplificato nel dilemma del prigioniero). Poiché tuttavia spesso la razionalità collettiva contrasta con quella individuale, è nella maggior parte dei casi necessario un accordo vincolante tra i giocatori (e quindi una istituzione che vigili su tale accordo) e una sanzione nei confronti di chi non lo rispetta, riducendo quindi il profitto del singolo se esso si allontana dalla combinazione di strategie che garantisce a tutti il miglior risultato, affinché nessuno trovi preferibile defezionare.
Ildilemma del prigioniero fornisce un valido spunto per confrontare i due concetti di equilibrio di Nash e ottimo di Pareto, e per comprenderne l'applicazione ineconomia. Riprendendo quanto illustrato nella definizione matematica dell'equilibrio di Nash, vediamo la loro applicazione al caso del dilemma del prigioniero. Le possibili scelte per due prigionieri in celle diverse non comunicanti sono parlare (accusando l'altro) o non parlare.
- Se entrambi non parlano avranno una pena leggera (1 anno).
- Se entrambi parlano, accusandosi a vicenda, avranno una pena pesante (6 anni).
- Se fanno scelte diverse, quello che parla avrà la libertà (0 anni) e l'altro avrà una pena leggermente più pesante (7 anni) che non se avessero confessato entrambi.
Se entrambi conoscono queste regole e non prendono accordi, la scelta che corrisponde all'equilibrio diNash è di parlare, per entrambi. Da questo esempio si vede che la teoria nei casi reali non è sempre la soluzione migliore (o talvolta non è sufficientemente realistica).
Entrambi i giocatori hanno a disposizione le stesse strategie (due) e gli stessipayoff (2x2) che sono (indicheremo per brevità confessa con
e non confessa con
e gli anni di carcere col segno meno poiché rappresentano perdite e quindi guadagni negativi):




Si deduce immediatamente che, per entrambi, la strategia dominante è confessa, infatti

e

Quindi qualunque sia la scelta dell'avversario, scegliere confessa garantisce sempre un guadagno maggiore rispetto a scegliere non confessa. È immediato riconoscere come la combinazione di strategie dominanti confessa-confessa soddisfi la disuguaglianza che definisce l'equilibrio di Nash, infatti per entrambi i giocatori

(per il secondo giocatore la disuguaglianza è soddisfatta invertendo l'ordine delle strategie). In sostanza, posto che il secondo giocatore confessi, il primo deve scegliere anch'esso confessa, e non può aumentare il proprio guadagno cambiando solo la sua strategia: il suopayoff nel caso non confessa-confessa è minore di quello che otterrebbe giocando l'equilibrio. confessa-confessa è inoltre l'unico equilibrio del gioco, infatti nessun'altra combinazione di strategie soddisfa la disuguaglianza.
La soluzione del gioco è quindi che entrambi confessino, ottenendo 6 anni di carcere ciascuno.
L'aspetto tuttavia più interessante deldilemma del prigioniero è il seguente: tutte le combinazioni di strategie, con l'eccezione dell'equilibrio di Nash, sono ottimi paretiani. Infatti, presa una qualunque di queste combinazioni, non è possibile trovarne un'altra che comporti per almeno uno dei due giocatori una riduzione degli anni di carcere senza che aumentino quelli dell'altro. Questo concetto non è invece applicabile all'equilibrio confessa-confessa: la combinazione non confessa-non confessa porta a una riduzione degli anni di carcere per entrambi i giocatori (un anno ciascuno invece di 6) e poiché

per ogni
non è una soluzione Pareto-ottimale.
L'ottimo paretiano è un concetto di grande importanza in economia: un ottimo di Pareto si definisce come una situazione nella quale, indipendentemente dalla specifica allocazione delle risorse, non sia possibile trovare un'altra che porti a un incremento della ricchezza di alcuni senza sottrarre ricchezza ad altri. La ragione dell'importanza dell'ottimo di Pareto è intuitiva: se esiste una soluzione che comporta un incremento del guadagno di qualcuno senza che nessuno subisca delle perdite, vuol dire che esistono delle risorse che non sono state allocate o che sono state allocate male; meglio quindi cambiare allocazione. Nel caso dell'ottimo paretiano, infatti, l'ulteriore arricchimento di qualcuno passa necessariamente per l'impoverimento di qualcun altro. Il dilemma del prigioniero mette in luce un concetto cardine dell'economia: l'ottimo di Pareto è razionale dal punto di vista collettivo, ma non lo è affatto dal punto di vista individuale; in sostanza, se gli
agenti di un gioco (e quindi, per estensione, di un mercato) agiscono secondo la razionalità individuale, cioè col solo fine di massimizzare il proprio profitto personale, non è detto che essi raggiungano un ottimo di Pareto. In alcuni casi lo raggiungono e in altri no; in quest'ultimo caso le loro azioni comportano una dispersione o cattiva allocazione di risorse.
Il confronto tra equilibrio di Nash e ottimo paretiano fa dubitare della generalità di quanto sostenuto daAdam Smith. Egli infatti riteneva che se ogni componente di un gruppo persegue il proprio interesse personale e vi sono condizioni diconcorrenza perfetta, l'equilibrio che ne esce è uno nel quale ogni azione individuale accresce la ricchezza complessiva del gruppo. Un ottimo di Pareto, insomma. Oggi invece sappiamo che se ogni componente del gruppo fa ciò che è meglio per sé, il risultato cui si giunge è, in generale, un equilibrio di Nash ma non necessariamente un ottimo di Pareto: è quindi possibile che, se ogni agente fa solo il proprio interesse personale, si giunga a un'allocazione inefficiente delle risorse. Nel caso del dilemma del prigioniero, ciò è evidente: il valore minimo possibile di anni di carcere è 0 per il singolo e 2 per il gruppo, ma se entrambi scelgono la propria strategia dominante, ne ottengono 6 a testa.
Tale nozione di equilibrio costituisce una generalizzazione dell'equilibrio diduopolio cheAntoine Augustin Cournot, matematico ed economista, descrisse già nel 1838.
- ^ Piergiorgio Odifreddi,John Nash genio e follia, suespresso.repubblica.it,la Repubblica.Espresso. Cultura., 11 marzo 2008.
- ^Si noti che questa connessione era comunque già presente qui: John von Neumann:Über ein ökonomisches Gleichungssystem und eine Verallgemeinerung der Brouwerschen Fixpunktsatzes, Ergebnisse eines Math. Kolloquiums (curatore:Karl Menger),8, 73-83, 1937. Traduzione inglese:A model of general economic equilibrium, Review of Economic Studies,13, 1-9, 1945-1946.
- Nash, John F. Jr. [1950]:Equilibrium Points in n-Person Games, Proc. Nat. Acad. Sci. U.S.A., 36, 48-49.
- Nash, John F. Jr. [1951]:Non-Cooperative Games, Ann. of Math., 54, 286-295.
- Roberto Lucchetti,Equilibrio di Nash, inEnciclopedia della scienza e della tecnica,Istituto dell'Enciclopedia Italiana, 2008.

- Nash, equilibrio di, inEnciclopedia della Matematica,Istituto dell'Enciclopedia Italiana, 2013.

- (EN)Opere riguardanti Nash equilibrium, suOpen Library,Internet Archive.

- (EN) Eric W. Weisstein,Nash Equilibrium, suMathWorld, Wolfram Research.

- Nash, Berge, Kakutani dimostrazione del teorema di esistenza dell'equilibrio di Nash e preliminari (file pdf, 18 pagg.)