Decisioni in condizioni di rischio Roberto Cordone
Decisioni in condizioni di rischio Rispetto ai problemi in condizioni di ignoranza, oltre all’insieme Ω dei possibili scenari, `e nota una funzione di probabilit`a per i sottoinsiemi di scenari possibili (ovvero eventi). Come nel caso delle decisioni in condizioni di ignoranza, molti approcci consistono nel ricondurre il problema all’ottimizzazione di una funzione ausiliaria u (x). Le prime indagini, compiute nel Seicento, proponevano il criterio del valore atteso, cio`e di assumere come funzione ausiliaria da massimizzare il valore atteso dell’impatto: u (x) = E [f (x, ω)] Infatti, l’impatto associato ad ogni soluzione `e una variabile aleatoria, dato che dipende dallo scenario ω. Il suo valore atteso `e • nel caso discreto: X
u (x) = E [f (x, ω)] =
πω f (x, ω)
ω∈Ω
• nel caso continuo: u (x) = E [f (x, ω)] =
Z
π (ω) f (x, ω) dω
Ω
Esempio Si consideri il seguente problema di decisione in condizioni di rischio: sono possibili quattro alternative e quattro scenari; le tabelle seguenti riportano le utilit`a associate ad ogni coppia alternativa-scenario e la probabilit`a che ciascuno scenario si realizzi. f (x, ω) x1 x2 x3 x4
ω1 1 2 3 6
ω2 3 2 2 6
ω3 4 2 1 1
ω4 6 4 9 3
p (ω)
ω1 0.20
ω2 0.25
ω3 0.50
ω4 0.05
Se applichiamo il criterio del valore atteso, dobbiamo calcolare il valore atteso u (x) = E [f (x, ω)] per ciascun’alternativa x. u (x1 ) = 0.20 · 1 + 0.25 · 3 + 0.50 · 4 + 0.05 · 6 = 3.25 u (x2 ) = 0.20 · 2 + 0.25 · 2 + 0.50 · 2 + 0.05 · 4 = 2.10 u (x3 ) = 0.20 · 3 + 0.25 · 2 + 0.50 · 1 + 0.05 · 9 = 2.05 u (x4 ) = 0.20 · 6 + 0.25 · 6 + 0.50 · 1 + 0.05 · 3 = 3.35 1
che porta a scegliere l’alternativa x4 , pi` u precisamente ordinando le alternative come segue: x4 , x1 , x2 , x3 .
Studio di sensitivit` a Le probabilit`a dei singoli scenari sono spesso stimate a partire da modelli, e quindi ` spesso conveniente, quindi, valutare la non sono note con assoluta perfezione. E dipendenza della soluzione dalle probabilit`a degli scenari, per capire se un eventuale errore pu`o tradursi in unascelta di individuare nello Psbagliata, e di quanto. Si tratta spazio delle probabilit`a pω : ω∈Ω pω = 1, pω ≥ 0, ∀ω ∈ Ω le regioni nelle quali ciascuna alternativa risulta ottima. Se l’alternativa scelta in base alle probabilit`a stimate cade ben dentro la regione in cui rimane ottima, possiamo stare abbastanza tranquilli. Altrimenti, bisognerebbe prendere in considerazione per analisi ulteriori le altre soluzioni. 1 Non `e detto che si debba studiare l’intero spazio delle probabilit`a: `e anche possibile analizzare la sensitivit`a rispetto a una delle probabilit`a, tenendo le altre reciprocamente fisse (cio`e modificandone la somma, ma conservando i loro rapporti). Ad esempio, valutiamo la sensitivit`a dell’esempio precedente rispetto alla probabilit`a dello scenario ω3 . Se p (ω3 ) = α e le probabilit` a degli altri scenari conservano la loro dimensione reciproca, esse diventano p (ω2 ) 0.25 5 5 = = p (ω2 ) = p (ω1 ) 0.20 4 p (ω1 ) 4 1 p (ω4 ) 0.05 1 ⇒ ⇒ p (ω4 ) = p (ω1 ) = = 4 p (ω ) 0.20 4 1 p (ω ) + p (ω ) + p (ω ) = 1 − α 1 2 4 p (ω1 ) + p (ω2 ) + p (ω4 ) = 1 − α
5 1 4 ⇒ p (ω1 ) + p (ω1 ) + p (ω1 ) = 1 − α ⇒ p (ω1 ) = (1 − α) ⇒ 4 4 10 4 p (ω1 ) = (1 − α) 10 5 ⇒ p (ω2 ) = (1 − α) 10 1 p (ω4 ) = (1 − α) 10 Ora possiamo applicare il criterio del valore atteso in modo parametrico, e osservare le prestazioni delle tre alternative al variare di α: 4 5 1 25 15 uα (x1 ) = (1 − α) · 1 + (1 − α) · 3 + α · 4 + (1 − α) · 6 = + α 10 10 10 10 10 uα (x2 ) = 4 (1 − α) · 2 + 5 (1 − α) · 2 + α · 2 + 1 (1 − α) · 4 = 22 − 2 α 10 10 10 10 10 4 5 1 31 21 u (x ) = (1 − α) · 3 + (1 − α) · 2 + α · 1 + (1 − α) · 9 = − α α 3 10 10 10 10 10 uα (x4 ) = 4 (1 − α) · 6 + 5 (1 − α) · 6 + α · 1 + 1 (1 − α) · 3 = 57 − 47 α 10 10 10 10 10
A OCCHIO, SE LA GIOCANO x1 (per bassi valori di α) e x4 (per alti valori di α), mentre x2 `e dominata da x1 (non rigorosamente, ma solo al variare di α). Probabilmente, x3 non vince mai, ma questo `e da verificare.
1 L’ampiezza del supporto (probabilistico) di un’alternativa potrebbe essere un buon criterio di robustezza per una decisione in condizioni di ignoranza
2
Svantaggi del criterio del valore atteso Si confrontino le seguenti 4 soluzioni: 1. lanciare un dado e guadagnare con certezza 100 euro 2. lanciare un dado e guadagnare 200 euro se escono 4, 5 o 6, nulla altrimenti 3. lanciare un dado e guadagnare 600 euro se esce 6, nulla se escono gli altri numeri 4. lanciare un dado e guadagnare 200 euro se escono 2, 3, 4, 5 o 6, perdere 400 euro se esce 1 Secondo il criterio del valore atteso, le quattro soluzioni sono indifferenti. Eppure, quasi nessun decisore le considererebbe tali. Questo mostra che il valore atteso non modella correttamente la relazione di preferenza del decisore dal punto di vista descrittivo. Anche dal punto di vista normativo, non sembra molto desiderabile che le quattro situazioni siano considerate indifferenti. Esempio: la scommessa di Pascal Un famosissimo esempio di applicazione del criterio del valore atteso `e la scommessa di Pascal, che egli intendeva come argomento per “dimostrare” l’esistenza di Dio, o meglio per sostenere la razionalit`a della fede. L’argomento, notissimo, afferma quanto segue: ogni individuo deve scegliere se credere oppure no (possiamo modellare questa situazione con due alternative, x1 e x2 ). Inoltre, Dio esiste oppure non esiste (cio`e vi sono due scenari ω1 e ω2 ). Se l’individuo crede e Dio esiste, egli guadagna il paradiso, che possiamo vedere come un impatto a altissimo (al limite, infinito). I tre impatti associati al credere in un Dio che non esiste (e quindi perdere tempo, occasioni di godimento, ma anche vivere onestamente e serenamente, dice Pascal), al non credere in un Dio che esiste (e quindi essere forse punito) e non credere in un Dio che non esiste vengono indicati rispettivamente con b, c e d, e sono tutti valori piccoli in confronto ad a. f (x, ω) Credo Non credo
∃ Dio a = +∞ c
∄ Dio b d
Indichiamo con α la probabilit`a (incognita) che Dio esista. Il criterio del valore atteso indica come utilit`a del credere e del non credere: ( u (x1 ) = aα + b (1 − α) ≈ +∞ u (x2 ) = cα + d (1 − α) cα + (d − b) (1 − α) 1 = c + (d − b) − 1 , il criterio del valore atteso α α suggerisce l’utilit`a di credere. Anche con una probabilit`a α molto piccola, una ricompensa a infinita suggerisce la razionalit`a della fede. Obiezioni all’argomento furono avanzate immediatamente, oltre che sul piano della seriet`a etica, anche sul piano della validit`a matematica. Si attacc`o il fatto che le opzioni fossero due (vi sono molti modi di credere e non credere, e molte cose in cui credere e non credere), che il concetto di probabilit`a in questa situazione non avesse senso (non si possono fare esperimenti casuali e vedere se al termine Dio esiste o no), ecc. . . Uno dei punti deboli dell’argomento `e il criterio del valore atteso. Se a ≫
3
Il paradosso di San Pietroburgo Nel 1730, Daniel Bernouilli propose il seguente problema. Si supponga di dover decidere se sborsare o no una cifra P per partecipare al seguente gioco d’azzardo: si lancia una moneta finch´e non esce croce; se la prima croce esce dopo k teste (k ≥ 0), si vincono 2k euro. Per quali valori di P conviene partecipare al gioco e per quali non conviene? Il problema consente due alternative: giocare o non giocare. Il guadagno associato alla prima `e 2k − P , se k `e il numero di teste che precedono la prima croce. Vi sono infiniti scenari possibili, corrispondenti a tutti gli esiti del gioco, ovvero al numero di teste consecutive. Il valore atteso del guadagno `e quindi: E [v] = −P +
+∞ +∞ X X 1 k 2 = −P + 1 = +∞ 2k k=0
k=0
Il guadagno associato alla seconda alternativa `e sempre nullo. Quindi giocare `e conveniente qualunque sia la cifra P . ovvero si sarebbe disposti a pagare qualsiasi cifra per partecipare al gioco. Non `e chi non veda, per`o, che le due alternative non sono affatto equivalenti. Entra in gioco un potentissimo fattore che viene detto propensione al rischio e che dipende dall’entit`a delle somme in gioco, dal reddito del giocatore, dal suo umore corrente, ecc. . .
Teoria dell’utilit` a stocastica La teoria dell’utilit`a stocastica si propone di evitare le difficolt`a del criterio del valore atteso. L’idea `e assumere che il decisore sia in grado di stabilire una relazione di preferenza Π fra coppie di impatti in F , anche quando gli impatti sono variabili aleatorie. Lotteria `e una coppia di funzioni (f (ω) , π (ω)) dove f (ω) : Ω → F rappresenta l’impatto di una fissata alternativa x ed `e una variabile aleatoria, mentre π (ω) : Ω → [0; 1] `e la probabilit`a di ciascuno scenario in Ω (nel caso discreto), o la densit`a di probabilit`a (nel caso continuo). In particolare, indichiamo con (f1 , α, f2 ) una lotteria a due scenari, con impatto f1 nel primo scenario e f2 nel secondo, e probabilit`a pari ad α per il primo scenario, 1 − α per il secondo. ` possibile definire anche lotterie composte i cui esiti non siano impatti deterE ministici, ma altre lotterie. Il criterio del valore atteso suggerirebbe di scegliere fra due lotterie sempre quella con il massimo valore atteso dell’impatto: X uf,π (x) = E [f (x, ω)] = π (ω) f (x, ω) ω∈Ω
ma il paradosso di San Pietroburgo e parecchi studi psicologici mostrano che non si tratta di un criterio corretto dal punto di vista descrittivo, e suggeriscono che non lo sia da quello normativo. La teoria dell’utilit`a stocastica definisce gli assiomi che una relazione razionale di preferenza fra lotterie dovrebbe rispettare. Quindi, dimostra che solo una ben determinata famiglia di relazioni soddisfa tali assiomi. 1. la relazione di preferenza fra lotterie Π `e un ordine debole (riflessiva, transitiva e completa); 2. monotonia: lotterie che assegnano probabilit`a pi` u alte agli impatti migliori sono preferite; se f1 f2 (f1 , α, f2 ) (f1 , β, f2 ) ⇔ α ≥ β 4
3. continuit` a (propriet`a archimedea): variando in modo continuo le probabilit`a, variano in modo continuo le preferenze: f1 f2 f3 ⇒ ∃α ∈ [0; 1] : f2 ∼ (f1 , α, f3 ) 4. indipendenza (o sostituzione): se due lotterie coincidono in parte, la preferenza dipende solo dalle parti diverse: f1 f2 ⇔ (f1 , α, f3 ) (f2 , α, f3 )
∀α ∈ [0; 1]
5. riduzione: nelle lotterie composte, ai fini della scelta contano le probabilit`a totali degli impatti finali, e non il modo in cui le probabilit`a si formano. Utilit` a stocastica La relazione di preferenza Π `e di ordine debole in quanto `e possibile costruire una funzione uf,π (x) di utilit` a stocastica tale che una lotteria `e meglio di un’altra se e solo se ha utilit`a maggiore. Si tratta di costruire questa funzione a partire da f (x, ω) e π (ω), in modo tale da rispettare i cinque assiomi. Tale funzione non `e unica. Infatti, si pu`o dimostrare che due funzioni utilit`a u (x) e u′ (x) sono strategicamente equivalenti, cio`e danno luogo allo stesso ordinamento su ogni lotteria se e solo se sono legate da una trasformazione lineare u′ = au + b con a > 0. Quindi, tutte le funzioni strategicamente equivalenti danno luogo alla stessa funzione normalizzata. Von Neumann e Morgenstern propongono di procedere come segue. Anzi tutto, assegnano valori di utilit`a 1 e 0 all’impatto ottimo fmax e pessimo fmin . Quindi, costruiscono i valori di utilit`a dei singoli impatti sfruttando l’assioma di continuit`a: ogni impatto f intermedio equivale infatti a una lotteria (fmax , α, fmin ) fra i risultati estremi, per un opportuno valore di α. Tale valore `e unico per l’assioma di monotonia: a valori strettamente pi` u alti e pi` u bassi, infatti, corrispondono impatti strettamente migliori e peggiori. Ogni impatto si pu`o interpretare come una lotteria degenere (con un solo esito possibile) uf,1 . Ora si devono assegnare valori di utilit`a a lotterie generiche (fω , πω ). Per l’assioma di sostituzione, ogni impatto f pu`o essere sostituito da una lotteria fra gli impatti estremi, con probabilit`a pari alla sua utilit`a stocastica αf = uf,1 . Ci`o determina una lotteria composta a due fasi: la prima fase fornisce non l’impatto, ma un biglietto per partecipare alla seconda fase, nella quale sono possibili solo gli impatti estremi. L’assioma di riduzione consente di ignorare le fasi intermedie e concentrarsi sugli impatti finali con le relative probabilit`a. Queste vengono fornite dai teoremi della probabilit`a totale e di quella composta: basta sommare per ciascuno scenario il prodotto della sua probabilit`a πω per la sua utilit`a αf (ω) . A questo punto, l’intera lotteria `e sostituita da una lotteria fra gli impatti estremi: ! X fmax , π (ω) u (f (x, ω)) , fmin ω∈Ω
la cui utilit`a `e pari alla probabilit`a di fmax per l’utilit`a di fmax , e coincide col valore atteso dell’utilit`a dell’impatto: X uf,π (x) = E [u (f (x, ω))] = π (ω) u (f (x, ω)) ω∈Ω
Una volta costruita la funzione di utilit`a, se ne ricava una relazione di preferenza affermando che lotterie con utilit`a superiore sono preferibili. Questo garantisce che la preferenza fra lotterie sia un ordine debole e garantisce anche l’assioma di 5
monotonia, perch´e fra due lotterie con gli stessi impatti `e preferita quella che fornisce l’impatto migliore con probabilit` a pi` u alta. Concludendo, la teoria dell’utilit` a stocastica dimostra che definire come utilit` a di una lotteria il valore atteso dell’utilit` a del suo esito consente di rispettare tutti gli assiomi. Avversione e propensione al rischio L’ordinamento fra lotterie ottenuto con il criterio del valore atteso equivale a quello ottenuto normalizzando l’impatto fra fmin e fmax e in generale `e molto diverso da quello suggerito dall’utilit`a stocastica. Questo perch´e il valore atteso dell’impatto (anche se normalizzato) pu`o differire molto dal valore atteso dell’utilit` a dell’impatto. Riportando su un diagramma (vedi Figura ?? l’andamento dell’impatto normalizzato e dell’utilit`a stocastica al variare dell’impatto f , si ottengono due funzioni che crescono monotonicamente da 0 (in fmin ) a 1 (in fmax ). Si parla di: • decisore avverso al rischio quando l’utilit`a domina l’impatto normalizzato: disporre con certezza di f `e preferibile a giocare una lotteria fra fmin e fmax con valore atteso pari a f . Questo avviene quando la funzione di utilit`a `e concava: u (αfmax + (1 − α) fmin ) > αu (fmax ) + (1 − α) u (fmin ) • decisore propenso al rischio quando l’utilit`a `e inferiore all’impatto normalizzato: `e preferibile giocare una lotteria fra fmin e fmax con valore atteso pari a f piuttosto che avere f con certezza. Questo avviene quando la funzione di utilit`a `e convessa: u (πfmax + (1 − π) fmin ) < πu (fmax ) + (1 − π) u (fmin) Un decisore che non sia n´e avverso n´e propenso al rischio `e neutrale rispetto al rischio e la sua relazione di preferenza coincide con il criterio del valore atteso. FIGURA DA FARE Figura 1: Profili di rischio di tre decisori: avverso al rischio (a), propenso al rischio (b) e neutrale rispetto al rischio (c) In generale, possono esservi decisori avversi al rischio per alcuni valori di impatto e propensi per altri: ad esempio, un decisore pu`o considerare gratificante giocare piccole somme anche se il valore atteso della vincita `e negativo, ma non voler giocare grandi somme anche quando potrebbe aspettarsi di vincere qualcosa. Un modo equivalente di descrivere il profilo di rischio di un decisore `e `e fissare un valore di utilit`a stocastica α e determinare l’impatto corrispondente. Si dice equivalente certo di una lotteria l’impatto sicuro che le equivale esattamente. • per un decisore avverso al rischio ogni lotteria ha equivalente certo inferiore al valore atteso; • per un decisore propenso al rischio ogni lotteria ha equivalente certo superiore al valore atteso. Solo per decisori neutrali al rischio, l’equivalente certo coincide con il valore atteso. La teoria dell’utilit`a stocastica ordina le lotterie per valori crescenti di equivalente certo. Si dice premio di rischio di una lotteria la differenza fra equivalente certo e valore atteso. 6
Esempio Supponiamo che l’impatto di una decisione possa variare nell’intervallo r f . Si [0; 1000] e che la funzione di utilit`a stocastica del decisore sia α (f ) = 1000 debba scegliere fra una vincita sicura da 250 euro e una lotteria che fornisce 810 euro con probabilit`a pari al 10%, 360 euro con probabilit`a pari al 50% e 160 euro con probabilit`a pari al 40%. Quale alternativa r si sceglier`a? 250 L’utilit`a della vincita sicura `e u (f ) = = 0.5. Quella della lotteria `e 1000 X πω u (f (ω)) = 0.1·u (810)+0.5·u (360)+0.4·u (160) = 0.1·0.9+0.5·0.6+0.4·0.4 = 0.55 ω∈Ω
La seconda alternativa `e preferibile. L’equivalente certo della seconda lotteria `e il valore f che avrebbe la stessa utilit`a della lotteria: r f = 0.55 ⇒ f = 302.5 u (f ) = 1000 Il premio di rischio `e 250−302.5 = −52.5, negativo, e quindi il decisore `e avverso al rischio. Estensione al caso a molti attributi Quanto detto sopra si estende facilmente al caso in cui il problema ha molti attributi. Si tratta di ragionare definendo l’impatto f come la funzione di utilit`a a molti attributi. In condizioni di rischio, non si pu`o usare direttamente il suo valore, ma bisogna modularlo per tener conto dell’atteggiamento del decisore verso la probabilit`a di ciascun valore.
7