Paradosso delle due buste

Il paradosso delle due buste deriva da un ragionamento logico-matematico, apparentemente ineccepibile, che dimostra che, tra due buste di valore diverso, ma dichiarate esternamente indistinguibili, una volta scelta una delle due conviene comunque cambiarla.

In realtà, come è intuitivo, il guadagno atteso da uno scambio delle buste all'ultimo momento dovrebbe essere mediamente nullo, ma, nella situazione prospettata, risulta piuttosto sottile individuare se sia fallace l'enunciato, il ragionamento logico o l'intuito.

L'analisi di questo paradosso richiama l'attenzione sulla valutazione non sempre banale della probabilità condizionata e sui limiti dell'ipotesi di equiprobabilità per eventi con cause sconosciute.

Situazione

In un ipotetico gioco a premi, al concorrente vengono presentate due buste chiuse, ciascuna contenente l'indicazione di un premio in denaro, che il concorrente riceverà, se la sceglie. È noto che il valore indicato in una busta è esattamente il doppio di quello dell'altra, ma non si sa quale delle due contenga il premio maggiore.

Il concorrente può ottenere il premio di una sola busta, ma gli viene data la possibilità di effettuare la scelta definitiva anche dopo aver aperto a suo piacere una busta ed averne visto il valore.

Paradosso

Sembra evidente che:
1. non c'è differenza nella scelta dell'una o dell'altra busta, prima dell'apertura.
2. la conoscenza del valore di una busta non aggiunge informazioni alla domanda se questo sia maggiore o minore dell'altro.

Quindi non c'è alcun motivo per preferire l'una o l'altra busta, prima di aver aperto l'una o l'altra.

Tuttavia, applicando la teoria delle decisioni, si giunge alla conclusione paradossale che sia sempre conveniente scegliere l'altra busta.
Infatti, se nella busta che si sceglie di aprire per prima è contenuto, diciamo, un premio di valore $A,$ nell'altra busta sarà contenuto un premio di valore $A/2,$ oppure un premio di valore $2A.$

In caso di cambio: se andasse male, si dimezzerebbe il premio (perdita = $A/2$ ) ma, se andasse bene, si raddoppierebbe (guadagno = $A$ ).

Sulla base delle informazioni a nostra disposizione nessuna delle due eventualità, che si perda $A/2$ o che si vinca $A$ , appare favorita rispetto all'altra, dunque la strategia più ragionevole sembrerebbe quella di considerare entrambe le opzioni equiprobabili, con probabilità 1/2 e 1/2.

Quindi conviene certamente tentare la sorte, e scegliere di cambiare la busta, vista la netta differenza tra possibile guadagno e possibile perdita.

In termini matematici, se calcoliamo il guadagno atteso che si ha cambiando busta (probabilità di guadagnare moltiplicata per il valore del guadagno, meno probabilità di perdere moltiplicata per il valore della perdita), otteniamo:

{\frac {1}{2}}A-{\frac {1}{2}}\left({\frac {A}{2}}\right)={\frac {1}{4}}A

una quantità che è positiva per qualsiasi valore di

A.

Concludiamo che conviene sempre cambiare busta, a prescindere dal valore che troviamo in quella scelta per prima (e quindi anche senza averci guardato dentro!). Ciò sembra palesemente assurdo.

Se è davvero assurda l'affermazione che conviene sempre cambiare, rimane il problema di individuare la fallacia dell'argomentazione appena presentata.

Soluzione

Il ragionamento si basa sulle due condizioni:

probabilità del 50% per il caso favorevole e altrettanto per quello contrario;
conoscenza del valore del premio contenuto in una busta.

Questi assunti sarebbero entrambi corretti di per sé, ma non lo sono contemporaneamente. Infatti si riferiscono a due casi ben distinti:

Caso 1: buste chiuse, nessun paradosso

Chiamiamo $X$ il premio minore e $Y$ il premio maggiore. I valori non sono noti, ma sappiamo che $Y$ vale il doppio di $X$ ( $Y=2X$ ) e che sono distribuiti in modo equiprobabile tra le due buste.

Se si apre prima la busta con $X,$ cambiando si troverebbe $Y$ ( $=2X$ ), con un guadagno uguale a $Y-X=X.$

Se si apre prima la busta con $Y,$ cambiando si troverebbe $X,$ stavolta con una perdita netta uguale a $Y-X=X.$

Si vede dunque il guadagno e la perdita sono uguali ed equiprobabili, come intuitivamente doveva essere.

Tornando al ragionamento iniziale del paradosso, bisogna tener presente che il valore

A,

trovato all'apertura della prima busta, vale una volta

X

e una volta

Y,

a seconda di quale busta si sia scelta per prima.

È sbagliato quindi dire che una perdita uguale ad

A/2

(quando si cambia dopo aver aperto prima la busta col valore maggiore, e

A=Y=2X

) sia diversa da un guadagno uguale ad

A

(quando si cambia dopo aver aperto prima la busta col valore minore, e

A=X

). In realtà la perdita in un caso è uguale al guadagno nel caso opposto.

Caso 2: una busta aperta

Chiamiamo $A$ il valore trovato nella busta aperta. Stavolta la vincita può essere solo $A$ e la perdita solo $A/2.$ Ma non possiamo più affermare con certezza che la probabilità tra i due casi sia la stessa. Essa dipende fortemente dal valore di $A,$ in relazione alla distribuzione di probabilità dei premi possibili. Intuitivamente potremmo dire che, se abbiamo trovato un premio alto, ci conviene accontentarci e, se abbiamo trovato un premio basso, ci conviene tentare l'altra busta.

In altre parole, tutto dipende dal criterio con cui sono stati scelti i premi da inserire nelle buste e da quale sia il premio massimo possibile.

Premio massimo definito

Supponiamo, ad esempio, che il premio maggiore nelle buste sia stato scelto a caso (con uguale probabilità) tra zero e 2 milioni, come valore massimo. Di conseguenza il premio minore sarà compreso tra zero e un milione, con la stessa distribuzione di probabilità.

In queste condizioni, se il valore $A$ trovato nella prima busta è inferiore ad un milione abbiamo una buona probabilità di guadagnare nel cambio (guadagno medio atteso uguale ad $A,$ con $A$ che vale mediamente mezzo milione)^[1].

Ma, ovviamente, avremmo la certezza di una perdita, se cambiassimo quando $A$ è maggiore di un milione (guadagno medio atteso uguale a $-A/2,$ con $A$ che in questo caso vale mediamente un milione e mezzo = 3/2 di milione).

Se decidessimo di cambiare in ogni caso, ci accorgeremmo che, a conti ben fatti, il valore atteso del guadagno sarebbe esattamente zero. Infatti, calcolando correttamente il valore della perdita per la probabilità di perdere, si trova un risultato uguale al valore del guadagno per la probabilità di vincere. (C'è infatti una probabilità 3/4^[2] di trovare un valore compreso tra zero e un milione, con guadagno medio di 1/4 di milione, e una probabilità 1/4^[2] di trovare un valore compreso tra un milione e due milioni, con perdita media di 3/4 di milione)

Anche in questo caso il paradosso scompare. Il ragionamento iniziale non è applicabile, in quanto non tiene conto del limite massimo dei premi né della conseguente diversa probabilità di aver scelto per prima la busta col premio maggiore o col premio minore.

Nessun limite al premio

Se non stabiliamo il valore massimo del premio, implicitamente ammettiamo che esso possa diventare teoricamente infinito. Conservando l'ipotesi che i premi siano stati scelti a caso, con distribuzione uniforme (l'unica che possiamo ipotizzare in mancanza di altre indicazioni), resta matematicamente valida la conclusione che conviene cambiare solo se il valore trovato nella prima busta è inferiore alla metà del massimo e che non conviene in caso contrario.

Ma questa volta, se il massimo è infinito, anche la metà del massimo è infinita e, siccome i confronti tra grandezze infinite non seguono esattamente le regole dei confronti tra grandezze finite, il paradosso rimane e può essere spiegato semplicemente ricordando che spesso l'infinito si comporta in modo paradossale^[3] o meglio, in modo contro-intuitivo. In questo caso, ad esempio, qualunque valore (finito) trovassimo nell'aprire la prima busta, esso sarebbe certo inferiore alla metà del massimo (infinito) e quindi avremmo (sempre) buone probabilità di guadagnare nel cambio. Nella pratica non possiamo mai immaginare di trovare una busta con dentro un valore infinito, né avrebbe senso stabilire se tale valore (infinito) sia minore o maggiore della metà del massimo (anch'esso infinito). Perciò trascuriamo completamente di conteggiare il peso di queste eventualità teoriche, e concludiamo che conviene sempre cambiare.

Invece anche in questo caso, a conti ben fatti, la scelta di cambiare sempre comporta un guadagno atteso nullo, se si mette debitamente in conto il peso di perdite (o guadagni) infiniti.

Storia

Una formulazione analoga a questo paradosso risale almeno al 1953, quando un matematico belga, Maurice Kraitchik, propose questo rompicapo:

Due persone, ugualmente ricche arrivano a confrontare il contenuto dei loro portafogli, di cui nessuno dei due conosce il contenuto esatto. Impostano il gioco in questi termini: chi ha meno denaro nel portafoglio riceverà tutto il denaro del portafoglio dell'altro (niente accade, se i due valori sono uguali).

Uno dei due può così ragionare:

Supponiamo che ho una quantità A nel mio portafoglio: questo è il massimo che potrei perdere. Se invece vinco (probabilità 0,5), alla fine avrò nel mio portafoglio un valore certamente maggiore di 2A. Quindi il gioco è favorevole a me.

L'altro può ragionare esattamente allo stesso modo.

In effetti, per simmetria, il gioco è pari. Dov'è dunque l'errore nel ragionamento di ciascun uomo?

Martin Gardner ha reso popolare il rompicapo nel suo libro del 1982 Aha! Gotcha, sempre nella forma di scommessa sul portafoglio. Nel 1989 Barry Nalebuff lo ha presentato nella forma delle due buste e, da allora, questa è la forma più comunemente usata.

Approfondimenti matematici

Caso 1

Prima di aprire le buste, è corretto assegnare ad una busta il 50% di probabilità di contenere il premio maggiore (o minore).

Si corre però il rischio di sbagliare, se si assegna al premio un valore $X,$ e se si ragiona una volta come se questo $X$ fosse il premio maggiore, ma subito dopo come se lo stesso $X$ fosse il premio minore.

Si può comunque evitare l'analisi della variabile stocastica $X,$ semplicemente assegnando alle due buste valori di premio pari a $X$ e a $2X.$ Questa assegnazione, valida qualunque sia la distribuzione di probabilità dei premi, permette di definire correttamente la differenza tra le due buste.

Tale differenza, nel caso di scambio, corrisponde alla perdita a cui si va incontro, se la prima busta contiene il valore maggiore, ma anche al guadagno che si ottiene, se la prima busta contiene il valore minore.

Caso 2

Supponendo di conoscere il valore del premio contenuto in una busta, e volendo tener conto di come questa informazione possa influire sulla decisione di cambiare, diventa indispensabile formulare un'ipotesi sulla distribuzione di probabilità con cui siano stati scelti i premi nelle buste.

Con qualche passaggio matematico si può dimostrare che, in ogni caso, qualunque sia questa distribuzione, il cambio comporta un guadagno atteso nullo.

Distribuzione uniforme

Sappiamo che ad ogni valore $Y,$ che possa essere inserito nella busta di valore maggiore, è associato un valore $X=Y/2$ che deve essere inserito nella busta di valore minore.
Chiamiamo $x$ il valore minore e $y$ il valore maggiore contenuti nella coppia di buste in gioco.

Possiamo supporre che $y$ sia stato scelto a caso da una distribuzione uniforme tra un minimo $m$ e un massimo $M.$

Chiamiamo $p(y)$ questa distribuzione di probabilità.

Di conseguenza $x$ risulta scelto a caso in un intervallo metà, da $m/2$ a $M/2,$ con una distribuzione uniforme di valore doppio

p(x)=2p(y).

Dunque il valore $A$ $A$ che troveremo nella prima busta avrà probabilità:
1. $p(x)(m-m/2)$ di appartenere alla classe delle $x,$ nell'intervallo da $m/2$ a $m.$ Nello scambio si guadagna $A.$
2. $p(x)(M/2-m)$ di appartenere alla classe delle $x,$ nell'intervallo da $m$ a $M/2.$ Nello scambio si guadagna $A.$
3. $p(y)(M/2-m)$ di appartenere alla classe delle $y,$ nell'intervallo da $m$ a $M/2.$ Nello scambio si perde $A/2.$
4. $p(y)(M-M/2)$ di appartenere alla classe delle $y,$ nell'intervallo da $M/2$ a $M.$ Nello scambio si perde $A/2.$

Per normalizzare, in modo che la probabilità complessiva sia uguale a 1, deve essere uguale a 1 la somma dei quattro casi:

p(x)m/2+p(x)(M/2-m)+p(y)(M/2-m)+p(y)M/2=1,

p(y)(m+2(M/2-m)+(M/2-m)+M/2)=1.

Cioè:

p(y)=1/2(M-m),

p(x)=1/(M-m).

Nei quattro casi si ottengono dunque i seguenti valori medi di guadagno, indicato con $G,$ $G,$ atteso dallo scambio (valore medio dell'intervallo, moltiplicato per la probabilità dell'intervallo stesso):
1. $A={\tfrac {1}{2}}(m+m/2),$ con probabilità $p(x)m/2,$ cioè $G={\frac {3m^{2}}{8(M-m)}};$
2. $A={\tfrac {1}{2}}(M/2+m),$ con probabilità $p(x)(M/2-m),$ cioè $G={\frac {{\frac {M^{2}}{4}}-m^{2}}{2(M-m)}};$
3. $-A/2=-{\tfrac {1}{4}}(M/2+m),$ con probabilità $p(y)(M/2-m),$ cioè $G=-{\frac {{\frac {M^{2}}{4}}-m^{2}}{8(M-m)}};$
4. $-A/2=-{\tfrac {1}{4}}(M+M/2),$ con probabilità $p(y)M/2,$ cioè $G=-{\frac {3M^{2}}{32(M-m)}}.$

Sommando i guadagni dei quattro casi, si osserva che il guadagno atteso complessivo è nullo. Più in dettaglio, esso è positivo per $A<m$ (caso 1) e per $A$ compreso tra $m$ e $M/2$ (caso 2 + caso 3), ma è negativo per $A>M/2.$

Questo risultato può essere esteso senza problemi al caso in cui il minimo $m$ diventi piccolo fino a zero, annullando il primo intervallo.

Ancora, il risultato di guadagno nullo rimane valido anche al caso in cui $M$ diventa grande a piacere, cioè se $M\to +\infty .$

In quest'ultimo caso però, si perde il significato dell'intervallo 4, da 1/2 infinito a infinito. Se non si passa prima dall'analisi di $M$ finito, facilmente si è indotti a trascurare l'influenza di questo intervallo e si perde la possibilità di spiegare l'origine del paradosso.

Una caratteristica fastidiosa della distribuzione uniforme è che, quando l'intervallo M diventa infinito, la probabilità di qualunque valore diventa evanescente. Ancora, quando l'intervallo M diventa infinito, il premio mediamente atteso dall'apertura di una busta diventa esso stesso infinito. È questo un altro aspetto importante, che spiega come mai possa sembrare vantaggioso cambiare sempre. Qualunque sia il valore (finito) che si trovi nella prima busta, esso apparirà sempre al di sotto della media attesa.

Altre distribuzioni

Per superare i problemi di probabilità evanescenti e di premi infiniti, sono state analizzate distribuzioni di probabilità decrescenti per premi elevati.

Se la distribuzione di probabilità $p(y)$ diminuisce, al crescere di $y,$ più rapidamente di $1/y,$ diventa possibile normalizzare a 1 la probabilità complessiva, dividendo per l'integrale da zero a infinito di $p(y)dy,$ che in questo caso non è infinito.

Rimarrebbe però ancora infinito il premio medio atteso, a meno che la distribuzione di probabilità non diminuisca, al crescere di $y,$ più rapidamente di $1/y^{2}$ . In quest'ultimo caso il confronto tra la probabilità che un valore $A,$ trovato nella prima busta, sia la metà di un valore, diciamo $y=2A,$ contenuto nella seconda busta (per cui converrebbe cambiare), e la probabilità contraria, che si tratti invece del doppio di un valore, diciamo $x=A/2,$ contenuto nella seconda busta (per cui non converrebbe cambiare), è così sfavorevole che non risulta mai conveniente cambiare.

In tutti i casi, compresi quello della distribuzione uniforme e quello delle distribuzioni a media infinita, il valore atteso del guadagno medio è sempre esattamente zero.

Per la dimostrazione analitica, conviene partire assegnando due simboli diversi alla probabilità $p(y)$ , che venga posto nelle buste un premio (di valore maggiore) compreso tra $y$ e $y+dy$ , e alla probabilità $p(x)$ , che venga posto nelle buste un premio (di valore minore) compreso tra $x$ e $x+dx$ . Siano:

p(y)=g(y)dy

p(x)=f(x)dx.

Ovviamente, quando $y=2x$ , deve essere $p(y)=p(x)$ . Cioè:

f(x)dx=g(y)dy=g(2x)2dx.

La probabilità di trovare un valore $z$ nella prima busta è data dalla somma della probabilità $f(z)dz$ , che $z$ sia il valore minore (e quindi si guadagna z nel cambio), più la probabilità $g(z)dz$ , che $z$ sia il valore maggiore (e quindi si perde z/2 nel cambio). Complessivamente il guadagno atteso nel cambio vale:

G=z\ f(z)dz-z/2\ g(z)dz=z\ g(2z)\ 2dz-z/2\ g(z)dz=(2g(2z)-1/2\ g(z))\ zdz.

Si vede dunque che il guadagno è positivo quando $g(2z)>1/4\ g(z)$ , cioè quando la probabilità a priori che venga scelto un certo valore di premio è più di quattro volte la probabilità che venga scelto un valore doppio.

Nei casi in cui questa condizione non è rispettata, per esempio, con una funzione del tipo $g(z)=1/z(1+z)$ o, in modo più netto, quando esiste un valore massimo $M$ del premio possibile, e $z$ è compreso tra $M/2$ e $M,$ non conviene cambiare e il paradosso non si pone.

Negli altri casi ci troviamo invece nella situazione paradossale, o meglio contro intuitiva, che il guadagno è positivo per ogni valore di $z$ , ma la somma integrale dei guadagni attesi, estesa da zero infinito, è nulla. Infatti:

G_{t}=\int _{0}^{\infty }(2g(2z)-1/2\ g(z))\ z\ dz=\int _{0}^{\infty }2g(2z)\ z\ dz-\int _{0}^{\infty }1/2\ g(z)\ z\ dz.

Ponendo $w=2z$ e $dw=2dz$ :

G_{t}=\int _{0}^{\infty }1/2\ g(w)\ w\ dw-\int _{0}^{\infty }1/2\ g(z)\ z\ dz,

che vale esattamente zero, qualunque sia la distribuzione di probabilità $g(x)$ .

Note

^ Riferendoci al caso ipotizzato, la probabilità che come premio maggiore sia stato scelto proprio il valore generico $A$ è uguale a 1 su due milioni. Analogamente, la probabilità che un valore generico A (minore di un milione) appartenga alla classe dei premi minori è uguale a 1 su un milione. In altre parole, un valore $A$ inferiore al milione ha probabilità doppia di essere un premio minore, rispetto alla probabilità di essere un premio maggiore (ovviamente un valore $A$ superiore al milione sarebbe certamente un premio maggiore). Se dunque $A$ è minore di un milione, decidendo di cambiare, si hanno 2 probabilità di raddoppiare (guadagnare un altro $A$ ), e 1 probabilità di dimezzare la vincita (perdere $A/2$ ). Cioè si ottiene mediamente un guadagno uguale a $(2/3A-1/3A/2)=A/2.$
^ ^a ^b Il calcolo è facilmente verificabile fissando l'attenzione solo su premi di valore intero. Così avremmo un milione di buste con i premi minori (da uno a un milione), collegate ad altrettante buste con i premi doppi (da due a due milioni). Di queste ultime buste, una metà conterrebbe ovviamente valori inferiori al milione e una metà valori superiori. In totale ci sarebbero un milione e mezzo di buste con valore inferiore al milione e mezzo milione di buste con valore superiore. Quindi, aprendo la prima busta a caso, avremo 3 possibilità su quattro di trovare un valore inferiore al milione e una probabilità su quattro di trovarne uno superiore.
^ Un semplice esempio di comportamento paradossale dell'infinito può essere derivato dal paradosso di Galileo. Quanti sono i numeri pari, rispetto al totale dei numeri naturali? Si potrebbe dire che sono la metà del totale, dato che nella sequenza naturale si alternano con i numeri dispari. Ma, pensandoci bene, la totalità dei numeri pari non può essere inferiore alla totalità dei numeri interi: infatti per ogni numero intero esiste il suo doppio, che è pari. Evidentemente per l'infinito non valgono le regole ordinarie.

Voci correlate

Calcolo di probabilità condizionata
Paradosso delle tre carte
Problema di Monty Hall - Può una capra far aumentare la probabilità di vincere un'automobile?
Paradossi dell'infinito - Non valgono le regole degli insiemi finiti
Paradosso di San Pietroburgo - Conviene scommettere su una vincita infinita, con probabilità infinitesima di vincere?
Paradosso di Bertrand - Quante sono le corde che tagliano un cerchio?
Paradosso del quiz

[Nota1-1] Riferendoci al caso ipotizzato, la probabilità che come premio maggiore sia stato scelto proprio il valore generico $A$ è uguale a 1 su due milioni. Analogamente, la probabilità che un valore generico A (minore di un milione) appartenga alla classe dei premi minori è uguale a 1 su un milione. In altre parole, un valore $A$ inferiore al milione ha probabilità doppia di essere un premio minore, rispetto alla probabilità di essere un premio maggiore (ovviamente un valore $A$ superiore al milione sarebbe certamente un premio maggiore). Se dunque $A$ è minore di un milione, decidendo di cambiare, si hanno 2 probabilità di raddoppiare (guadagnare un altro $A$ ), e 1 probabilità di dimezzare la vincita (perdere $A/2$ ). Cioè si ottiene mediamente un guadagno uguale a $(2/3A-1/3A/2)=A/2.$

[Nota2-2] Il calcolo è facilmente verificabile fissando l'attenzione solo su premi di valore intero. Così avremmo un milione di buste con i premi minori (da uno a un milione), collegate ad altrettante buste con i premi doppi (da due a due milioni). Di queste ultime buste, una metà conterrebbe ovviamente valori inferiori al milione e una metà valori superiori. In totale ci sarebbero un milione e mezzo di buste con valore inferiore al milione e mezzo milione di buste con valore superiore. Quindi, aprendo la prima busta a caso, avremo 3 possibilità su quattro di trovare un valore inferiore al milione e una probabilità su quattro di trovarne uno superiore.

[QuantiP-3] Un semplice esempio di comportamento paradossale dell'infinito può essere derivato dal paradosso di Galileo. Quanti sono i numeri pari, rispetto al totale dei numeri naturali? Si potrebbe dire che sono la metà del totale, dato che nella sequenza naturale si alternano con i numeri dispari. Ma, pensandoci bene, la totalità dei numeri pari non può essere inferiore alla totalità dei numeri interi: infatti per ogni numero intero esiste il suo doppio, che è pari. Evidentemente per l'infinito non valgono le regole ordinarie.

[1]

[2]

[3]