UNIVERSITA’ DI ROMA “LA SAPIENZA”
Dipartimento di Scienze Economiche Dottorato di Ricerca in Scienze Economiche Coordinatore: Prof. Claudio Sardoni (Università di Roma “La Sapienza”)
COMPORTAMENTO DEI MERCATI AZIONARI E SCELTE DI PORTAFOGLIO IN UNA PROSPETTIVA DI FINANZA COMPORTAMENTALE Tesi di Alessandro Magi Supervisore: Prof. Luigi Ventura (Università di Roma “La Sapienza”)
Docenti esaminatori (Commissione): Prof. Marcello Messori (Università di Roma “Tor Vergata”) Prof. Carlo Bianchi (Università di Pisa) Prof. Massimo Di Matteo (Università di Siena)
_________________________________________ Anno Accademico 2004/05
RINGRAZIAMENTI Desidero ringraziare Luigi Ventura, Giorgio Calcagnini e Attilio Gardini per i loro preziosi e puntuali suggerimenti, Sergio Bruno per alcune utili e costruttive critiche, Claudio Sardoni per la pazienza e l’interesse dimostrato verso noi dottorandi e il nostro lavoro. Un grazie speciale a Paolo Foschi per l’aiuto fornitomi con il software MatLab nella risoluzione numerica dei modelli. Un grazie alla mia famiglia per la pazienza dimostrata nei miei confronti in questi quattro anni di Dottorato e per tutto il resto. Grazie a tutti i miei compagni di Dottorato per la loro simpatia ed amicizia. Ringrazio Giorgio Rodano ed Enrico Saltari, miei professori ad Urbino ai tempi dei corsi di Laurea, per avermi fornito, con grande maestria, i primi rudimenti di teoria economica. Grazie al mio amato gatto, per avermi fatto spesso compagnia nelle mie fatiche al computer. Infine, un immenso grazie a una persona speciale che ho avuto la fortuna di conoscere: Claudia. Lei sa perché.
2
INDICE Comportamento dei mercati azionari e scelte di portafoglio in una prospettiva di Finanza Comportamentale INTRODUZIONE
5
1. Asset pricing e consumo : rassegna dei principali contributi in presenza di mercati completi 1. 2. 3. 4. 5. 6.
Alcuni dati C-CAPM e paradossi dei mercati finanziari Equity premium puzzle: il caso italiano Modelli con preferenze recursive Modelli con habit formation Considerazioni conclusive Appendice matematica A.1.1 Appendice matematica A.1.2
12 14 25 27 30 37 39 44
2. Asset pricing e modelli di finanza comportamentale 1. Introduzione 47 2. Il modello BHS 49 3. I risultati delle simulazioni: pregi del modello BHS e confronto con i modelli standard 60 4. Un’impostazione alternativa: la valutazione isolata dei rischi 63 5. Narrow framing e utilità recursiva 68
3. Valutazione dei rischi e premio azionario: applicazioni quantitative ai paesi del G7 1. Il paradosso del premio azionario 2. Implicazioni quantitative del modello 3. Conclusioni Tabelle
3
74 78 85 88
Appendice matematica A.3.1 Appendice matematica A.3.2 Appendice matematica A.3.3
94 98 103
4. Valutazione isolata, scelte di portafoglio e “home bias” azionario 1. Introduzione 106 2. Un modello di scelta internazionale di portafoglio con valutazione isolata dei rischi 112 2.1 Il modello 112 2.2 Derivazione delle condizioni di ottimo del problema consumo/portafoglio 115 2.3 Soluzione numerica del modello 119 3. I risultati del modello: alcune applicazioni 121 4. Considerazioni conclusive 128 Appendice matematica A.4.1 130 Appendice matematica A.4.2 132 CONCLUSIONI
138
BIBLIOGRAFIA
142
4
INTRODUZIONE Questo lavoro trae spunto dalla constatazione che i cosiddetti modelli macroeconomici standard, basati sulla “perfetta” razionalità degli agenti economici, non riescono a rendere conto validamente dell’andamento effettivo di certe variabili-chiave dei mercati finanziari. Ci riferiamo in particolare ai rendimenti (e ai prezzi) azionari, ai tassi di interesse privi di rischio e alla differenza tra queste due variabili: il cosiddetto premio per il rischio azionario. A partire dall’articolo di Mehra e Prescott (1985), vi è stata una grande esplosione di contributi volti a risolvere in qualche modo il “paradosso” del premio azionario (equity premium puzzle): usando parametri plausibili con la rappresentazione delle preferenze individuali, la teoria standard non riesce infatti a spiegare il notevole eccesso di rendimento che ritroviamo nei dati empirici delle principali economie mondiali. D’altra parte, nell’ambito dei modelli standard di asset pricing, se implementiamo i valori empirici del tasso di crescita e della varianza del consumo, e valori plausibili del tasso di preferenza intertemporale e del coefficiente di avversione relativa al rischio, troviamo che il risultante tasso privo di rischio è molto più elevato di quello effettivamente osservato (piuttosto basso): si tratta del cosiddetto risk-free rate puzzle (cfr. Weil, 1989). Gli studi di Finanza Comportamentale (Behavioral Finance) forniscono una prospettiva nuova e stimolante nel tentare di risolvere problemi che trovano soluzioni insoddisfacenti nella teoria prevalente. Si tratta di una recente linea di ricerca, in forte espansione, che tenta di rendere conto di alcune tematiche tipiche dell’economia finanziaria ricorrendo all’utilizzo di modelli popolati da agenti economici “non pienamente” razionali. Basandosi sui risultati di alcune indagini sperimentali, tramite varie argomentazioni teoriche viene infatti introdotto il concetto di “razionalità limitata” (Simon, 1982), dal quale discendono poi tutta una serie di interessanti implicazioni. I settori in cui trovano applicazione gli studi di finanza comportamentale sono numerosi: si va dalle tematiche di asset pricing a quelle di finanza aziendale, passando per l’analisi cross-section dei rendimenti azionari (si veda Barberis-Thaler, 2003). Per quanto ci riguarda, faremo riferimento a quel filone di letteratura che afferisce alle tematiche di asset pricing e scelta di portafoglio, nell’ambito dei “classici” modelli ad agente rappresentativo. Nel capitolo 1 presenteremo, in estrema sintesi, i principali contributi della letteratura mainstream (con mercati completi) in tema di asset pricing e consumo, al fine di comprendere quali sono i principali problemi irrisolti. Nel secondo capitolo introdurremo invece i modelli (macroeconomici)
5
comportamentali di asset pricing, analizzando in particolare un recente contributo, il “modello BHS”, ed un suo sviluppo che appare assai promettente, il cosiddetto “modello o approccio BH” (cfr. Barberis-HuangSantos, 2001 e Barberis-Huang, 2004a, b). In tale tipologia di modelli l’idea di fondo è che l’agente economico trae utilità non solo dal consumo, ma anche dalle fluttuazioni della propria ricchezza finanziaria. In particolare, sono proprio tali fluttuazioni a influenzare in maniera determinante l’avversione al rischio degli investitori, indipendentemente dalla loro correlazione con l’evoluzione del consumo. Inoltre, il consumatore/investitore ha una funzione di utilità caratterizzata da avversione alle perdite (loss aversion): ciò significa che l’agente è maggiormente sensibile a diminuzioni della propria ricchezza piuttosto che ad aumenti di uguali dimensioni. Tale idea ha le sue radici nel contributo di Kahneman-Tversky (1979), col quale fu introdotta la cosiddetta “teoria dei prospetti” (prospect theory): utilità che deriva all’agente economico non dal livello della ricchezza (o consumo), ma dalle sue fluttuazioni, misurate rispetto ad un livello di riferimento. Una possibile giustificazione di tale comportamento è la seguente. Il consumatore/investitore può rimanere fortemente “amareggiato” da un investimento azionario sbagliato: un brusco ribasso di borsa comporta una marcata diminuzione del suo stock di ricchezza azionaria, facendolo sentire un investitore di “quart’ordine” o comunque di scarso livello. In altri termini, insorge un rimpianto nei confronti della scelta d’investimento effettuata. Tale approccio ovviamente contrasta con i modelli di asset pricing tradizionali, nei quali viene supposto che, nel compiere le loro scelte di portafoglio, gli agenti economici tengano conto unicamente della loro utilità futura derivante dai livelli di consumo. Ma oramai esistono in letteratura numerosi contributi che dimostrano, tramite varie argomentazioni teoriche ed indagini sperimentali, che le spiegazioni standard comunemente accettate circa le attitudini degli individui nei confronti del rischio, sono ampiamente discutibili ed errate sotto vari aspetti (cfr. Rabin, 1998, 2002). Come sottolinea Rabin (2002), “….our attitudes towards risk are driven instead primarily by attitudes towards change in wealth levels”. Ma c’è un altro elemento che riveste un ruolo di fondamentale importanza e che viene evidenziato ed utilizzato soprattutto nei lavori di Barberis-Huang (2004a, b). Nei modelli tradizionali, l’agente economico adotta tipicamente il seguente comportamento: egli tende a “combinare” le nuove scelte che gli si prospettano con quelle già fronteggiate, dopodichè controlla se l’aggiunta della nuova scelta rischiosa migliora o peggiora la distribuzione futura del proprio consumo e/o della propria ricchezza. Ma una certa mole di lavoro sperimentale sulla teoria delle decisioni in condizioni di incertezza, cominciata con il lavoro di Tversky-Kahneman (1981), ha mostrato che gli individui spesso non si comportano in questo modo. In varie
6
occasioni, e vedremo quali, quando sono chiamati a compiere delle scelte rischiose (ad esempio un investimento azionario), nel valutare i rischi che essi fronteggiano, sono propensi a compiere valutazioni isolate, ossia a fare narrow framing. In altre parole, essi valutano i rischi isolatamente, ossia separatamente rispetto ad altri rischi che stanno già fronteggiando. Ciò che accade è che gli individui, invece di focalizzarsi sul risultato combinato di due decisioni (siano esse A e B), vale a dire sul risultato che determina la loro ricchezza finale, si focalizzano sul risultato di ogni singola decisione separatamente. Ed è per questo che in tale tipo di letteratura si usa dire che i soggetti in questione fanno “valutazioni isolate”. Come sottolineano BarberisHuang (2004a), “……narrow framing means that the agent derives utility directly from the outcome of a specific gamble he is offered, and not just indirectly via its contribution to his total wealth. Equivalently, he derives utility from the gamble’s outcome over and above what would be justified by a concern for his overall wealth risk”. Come si spiega tale comportamento? L’idea di fondo è molto semplice. Quando un individuo valuta un nuovo rischio, la sua distribuzione di probabilità, considerata separatamente, è molto più “accessibile” della distribuzione della ricchezza totale, comprensiva dei rischi già in essere più il nuovo rischio da valutare. Cosa significa più “accessibile”? Tale espressione fa riferimento al fatto che molte decisioni vengono prese tenendo soprattutto in considerazione le caratteristiche e le informazioni, su di esse disponibili, più evidenti e di più facile elaborazione/interpretazione: in altre parole, le caratteristiche e le informazioni più accessibili. A supporto di tale spiegazione possiamo anche richiamare il contributo fornito alle scienze sociali da Simon (1982). Nel proporre argomenti a sostegno della sua ipotesi di razionalità limitata degli agenti economici, Simon sottolinea che le risorse cognitive di questi ultimi sono limitate: ciò costringe gli individui a semplificare lo spazio del problema decisionale, che risulterebbe altrimenti ingestibile perché eccessivamente complesso. Date queste premesse, è abbastanza logico pensare ai mercati finanziari come campo di applicazione dell’approccio teorico in questione. È infatti evidente che pochi settori dell’attività umana sono caratterizzati da una quantità di informazioni così massiccia come quella presente nei mercati finanziari (Slovic, 1972). Tali informazioni sono a tutti altamente accessibili, tenuto conto che si possono avere, quotidianamente ed in dosi abbondanti, da giornali, telegiornali, internet, ecc. Ma il problema risiede nella loro corretta ed ottimale elaborazione. L’avvento delle nuove tecnologie, rendendo prontamente disponibili informazioni riguardanti l’andamento dei mercati di tutto il mondo, ha contribuito notevolmente ad aumentare le difficoltà degli individui nell’utilizzare in modo proficuo l’ampio numero di informazioni a loro disposizione. Infatti, se è vero che una maggiore disponibilità di informazioni è sinonimo di maggiore accuratezza nel valutare le alternative di scelta, è altrettanto vero che una mole eccessiva di informazioni, come
7
suggerito da Simon (1982), date le limitate risorse cognitive dell’individuo, rende lo spazio decisionale ingestibile. Ed è proprio nel tentativo di semplificare tale spazio che l’agente economico è portato a compiere valutazioni “isolate” a discapito di quelle “complessive”: tale comportamento ha come conseguenza quella di effettuare la scelta solo apparentemente migliore. La valutazione “complessiva” del problema condurrebbe ad una scelta migliore rispetto a quella effettivamente compiuta, ma la mancanza dell’”ottimale” capacità di elaborazione delle informazioni conduce invece alla scelta sub-ottimale. E la valutazione “complessiva” viene involontariamente accantonata, in favore di quella “isolata”, proprio a causa della mancanza di questa “ottimale” capacità di elaborazione. Nel terzo capitolo metteremo alla prova tale impostazione teorica (nella formulazione BH) tramite alcune applicazioni quantitative con riferimento ai paesi del G7, al fine di verificare la sua capacità di “replicare” l’evidenza empirica, che presenta un premio azionario piuttosto elevato, 6/7% per gli USA, e tassi risk-free relativamente bassi, 1.5/2% per lo stesso paese (per dati relativi ad altri paesi si veda Campbell, 2003 e il capitolo 3 del presente lavoro). Tale operazione, in questo tipo di letteratura, rappresenta una novità introdotta col presente lavoro, poiché l’approccio BH, per quanto riguarda l’equity premium e il risk-free rate puzzle, è stato utilizzato solo con riferimento a dati statunitensi. Barberis-Huang (2004a, b) risolvono infatti il loro modello solo con riferimento ai dati USA, senza tentare alcuna applicazione ad altri paesi: questo, oltre ad essere di per sé limitante, non fornisce l’opportunità di individuare la presenza di alcuni comportamenti piuttosto interessanti del modello, cosa che invece viene fatta e sottolineata in questa sede. Infatti, dopo aver visto i risultati da essi ottenuti, verificheremo ciò che accade con dati diversi da quelli statunitensi, analizzando in particolare i casi di Gran Bretagna, Italia, Germania, Francia, Giappone, Canada e Svezia. L’analisi dei risultati ci consente di affermare che, nel complesso, pur con alcune cautele, l’approccio BH appare “robusto” anche con riferimento a paesi diversi dagli Stati Uniti. Sono comunque due gli aspetti che meritano di essere sottolineati relativamente a ciò che emerge dall’analisi condotta nel terzo capitolo. La possibilità per l’agente economico di derivare utilità, oltre che dal consumo, anche dalle fluttuazioni della sua ricchezza azionaria, combinata con un certo grado di valutazione isolata del rischio derivante dal mercato azionario, più l’avversione alle perdite finanziarie, contribuisce notevolmente a migliorare le performances dei modelli con mercati completi e senza frizioni, nel replicare l’andamento effettivo del premio azionario e del tasso risk-free. Il meccanismo è semplice: l’investitore, nelle sue valutazioni d’investimento, dà più peso alla sua avversione verso le possibili perdite finanziarie che alla sua propensione a cogliere sui mercati favorevoli opportunità d’investimento (loss aversion). Si aggiunga a questo il fatto che l’eventuale acquisto di azioni viene valutato “a sè”, senza essere “combinato”
8
con i rischi già fronteggiati. Tutto ciò contribuisce a rendere l’investimento azionario particolarmente rischioso e spinge quindi l’investitore a chiedere, in equilibrio, un premio per il rischio maggiore rispetto ai modelli standard. Tale analisi vale per la maggior parte dei paesi in oggetto, con alcune riserve, in particolare, per i casi di Italia e Giappone. Del resto il caso italiano, per vari elementi strutturali, non è così facilmente paragonabile ad altri casi (ad esempio USA/Gran Bretagna). Si pensi ad esempio all’atteggiamento degli individui nei confronti dell’investimento azionario, alla struttura del mercato dei capitali, alla struttura dei portafogli famigliari, ecc. In Italia la cultura dell’investimento azionario è cosa piuttosto recente, al contrario dei paesi anglosassoni, dove già da molti anni esiste una maggiore cultura finanziaria e una maggiore dimestichezza nell’utilizzo di certi prodotti finanziari (si pensi ad esempio ai derivati). E’ quindi ragionevole supporre che l’approccio BH, date le sue caratteristiche distintive, si adatti alla realtà italiana in maniera piuttosto approssimativa. Ma recentemente, le massicce privatizzazioni che hanno caratterizzato il nostro paese, unitamente al mutamento del quadro macroeconomico internazionale (bassi tassi d’interesse), promettono, forse non in tempi brevi, di contribuire a cambiare le cose. Tra l’altro, in letteratura esistono oramai diversi lavori che enfatizzano l’importanza della diffusione di una certa cultura finanziaria al fine di promuovere ulteriormente lo sviluppo dei mercati finanziari di alcuni paesi e di ampliare le possibilità di diversificare con profitto i propri investimenti (si veda ad esempio HaliassosHassapis, 2001). Il secondo aspetto rilevante, ciò che non ritroviamo nei lavori di Barberis-Huang (2004a, b), è quello relativo al rapporto tra γ (l’avversione relativa al rischio) e b0 (il grado di valutazione isolata). Come emerge dall’analisi svolta nel terzo capitolo, l’aumento simultaneo di tali variabili ha sul tasso d’interesse risk-free un effetto di segno contrario. Il parametro di avversione relativa al rischio, essendo il reciproco dell’elasticità di sostituzione intertemporale (ESI), tende, aumentando, a spingerlo in alto, a causa della diminuita ESI (che spinge gli agenti ad indebitarsi per aumentare il loro consumo corrente), mentre l’aumento del grado di narrow framing (combinato col grado di avversione alla perdita) tende a spingerlo verso il basso. L’effetto legato all’aumento di b0 si spiega con l’aumento del rischio derivante dal mercato azionario, il quale comporta un dirottamento delle risorse finanziarie verso attività diverse, quali titoli privi di rischio e attività non finanziarie. L’acquisto di attività “certe” aumenta il loro prezzo, abbassandone il relativo tasso d’interesse. Notiamo che quest’ultimo effetto è lo stesso generato dal risparmio a fini precauzionali indotto dall’aumento di γ . Infatti, come argomentato nel primo capitolo (vedi prima parte del paragrafo 2), l’aumento dell’avversione al rischio non implica solo un aumento del tasso d’interesse (crescita del consumo corrente), ma anche un
9
sua diminuzione (risparmio precauzionale): ma per valori di γ non troppo elevati, ossia coerenti con la parametrizzazione delle preferenze individuali, l’effetto dominante è quello legato alla crescita del consumo, e quindi i tassi aumentano. L’effetto generato dal grado di valutazione isolata, aggiungendosi a quello del risparmio precauzionale, è invece in grado di controbilanciare l’effetto netto legato all’aumento dell’avversione al rischio, comportando una riduzione del tasso d’interesse. Ed è proprio questa capacità del modello di ribaltare gli effetti della “classica” avversione al rischio, a generare la possibilità di replicare, con moderati gradi di approssimazione, i valori empirici del premio azionario e del tasso risk-free. Nel quarto capitolo vedremo invece come il medesimo approccio, caratterizzato dalle cosiddette “preferenze BH”, possa essere fruttuoso anche per comprendere le scelte di portafoglio degli investitori. Dopo aver costruito un semplice modello di scelta internazionale di portafoglio contraddistinto da un agente rappresentativo con “preferenze di tipo narrow framing”, tramite la sua soluzione numerica analizzeremo il paradosso dell’equity home bias, ossia la tendenza ad investire soprattutto in attività azionarie nazionali, rifiutando profittevoli opportunità di diversificazione offerte dai mercati azionari esteri. La teoria di portafoglio standard è infatti concorde nell’affermare che per gli agenti economici sarebbe ottimale detenere una quota di azioni estere molto superiore a quella che viene effettivamente detenuta in portafoglio dagli investitori. Implementeremo tale modello con riferimento ad alcune coppie di economie, di cui la prima assunta come economia “nazionale” e la seconda come economia “estera”. Vedremo i casi Italia-USA, Gran Bretagna-USA e USA-Europa: i risultati ottenuti confermano le nostre proposizioni teoriche. Il meccanismo in azione, alla base dei risultati da noi ottenuti, fa leva sulle limitate capacità di elaborazione delle informazioni dell’individuo: l’attività estera è percepita come meno appetibile di quello che risulterebbe essere se l’investitore fosse in grado, tramite la “corretta” capacità di elaborazione, di operare una valutazione congiunta delle due attività finanziarie rischiose (l’azione nazionale e quella estera). Questo accade perché l’investitore, nelle sue valutazioni d’investimento, dà più peso alla sua avversione verso le possibili perdite finanziarie che alla sua voglia di cogliere, sui mercati nazionali ed esteri, favorevoli opportunità d’investimento. Tutto ciò contribuisce a rendere l’investimento azionario estero relativamente più rischioso e ciò che ne segue è una modestissima detenzione di attività estere, a prescindere dai profili di rischio/rendimento. Va inoltre evidenziato che i due parametri che caratterizzano il modello come un modello di finanza comportamentale, ossia il grado di valutazione isolata e quello di avversione alle perdite ( λ ), al fine di generare risultati coerenti con l’evidenza empirica, rimangono sempre coerenti con i valori utilizzati in altri studi e simulazioni (cfr. Barberis-Huang-Santos 2001, Barberis-Huang 2001, Barberis-Huang-Thaler, 2003, Barberis-Huang, 2004a,
10
b). In particolare, il grado di valutazione isolata non manifesta quasi mai la necessità di superare l’unità (in alcuni studi a volte la supera, ma di poco). L’analisi da noi svolta costituisce quindi un risultato importante e un ulteriore contributo nell’indagare quella sorta di “scatola nera” costituita dai parametri comportamentali ( b0 e λ ) che in qualche modo tentano di cogliere le preferenze dell’individuo più strettamente connesse alle sue emozioni. I risultati ottenuti nel capitolo 4 costituiscono il contributo originale più rilevante del presente lavoro. Infatti, nella letteratura di finanza comportamentale connessa ai modelli che utilizzano preferenze con narrow framing (letteratura, è bene sottolinearlo, molto recente), nell’ambito delle analisi di equilibrio parziale, non esiste un lavoro in tale direzione. E, parimenti, nell’ambito della vasta letteratura sull’equity home bias, non esistono lavori che tentano di fornire una spiegazione soddisfacente ricorrendo a preferenze di tipo behavioral. Stracca (2002b) accenna alla possibilità di indagare l’equity home bias puzzle tramite l’utilizzo della prospect theory e delle sue implicazioni, ma non costruisce esplicitamente nessun modello in tale direzione. D’altra parte, la risoluzione di questo tipo di modelli è notevolmente complicata dal fatto di dover ricorrere a soluzioni numeriche, data l’impossibilità di ottenere soluzioni analitiche in forma chiusa. Il fatto di dover utilizzare tecniche computazionali rende le cose sicuramente più complesse da un punto di vista operativo, ma allo stesso tempo consente di derivare implicazioni piuttosto interessanti da modelli altrimenti intrattabili e, quindi, inutilizzabili. Il presente lavoro costituisce quindi un primo e interessante contributo in un’area di ricerca che è solo ai suoi inizi e promette sviluppi futuri estremamente interessanti.
11
1 ASSET PRICING E CONSUMO: RASSEGNA DEI PRINCIPALI CONTRIBUTI IN PRESENZA DI MERCATI COMPLETI 1 Alcuni dati La letteratura economica relativa alla determinazione dei prezzi (e dei rendimenti) delle attività finanziarie e, più in generale, al comportamento macroeconomico dei mercati finanziari, è impegnata oramai da un ventennio nel tentativo di spiegare in maniera soddisfacente alcuni paradossi (puzzles) relativi all’andamento aggregato dei mercati finanziari e alla loro relazione con il consumo aggregato. In particolare, gli articoli di Hansen-Singleton (1983) e Mehra-Prescott (1985) hanno aperto un filone di letteratura che in vari modi ha tentato e tenta tuttora di rendere conto di una serie di incongruenze tra teoria ed evidenza empirica: 1) i modelli macroeconomici standard, ad agente rappresentativo, non rendono conto del cosiddetto premio azionario per il rischio, ossia dell’enorme differenza (in eccesso) fra il tasso di rendimento reale medio annuo delle azioni ed il tasso di interesse reale privo di rischio: si tratta del cosiddetto equity premium puzzle. 2) lo stesso problema lo si incontra con la volatilità dei rendimenti azionari (volatility puzzle o equity volatility puzzle): l’evidenza empirica dimostra che essa è molto più elevata di quella del rendimento privo di rischio, ed è anche sorprendentemente più elevata della volatilità dei sottostanti dividendi azionari. 3) la correlazione tra i rendimenti azionari e il tasso di crescita del consumo è molto bassa (evidenza empirica); i cosiddetti standard consumption-based asset pricing models o modelli C-CAPM (tra cui anche gli habit formation models) assumono invece una correlazione significativa, e tale correlazione risulta essere di cruciale importanza in tali modelli nello spiegare le variazioni nell’avversione al rischio degli agenti economici e i conseguenti movimenti dei mercati finanziari; in
12
altre parole, non si è in grado di rendere conto compiutamente della bassa correlazione fra consumo e rendimenti azionari riscontrata a livello empirico. 4) il tasso di interesse privo di rischio è, nei dati empirici, basso e stabile; la maggior parte dei modelli C-CAPM (anche gli habit formation models tranne Campbell-Cochrane, 1999), nel tentativo di clonare l’equity premium, generano invece un tasso risk-free particolarmente elevato (risk-free rate puzzle) e instabile. Tenendo conto del fatto che la maggior parte dei lavori esistenti sull’argomento sono stati fatti con riferimento a dati USA, proviamo ad entrare maggiormente nel dettaglio dei dati empirici elencando i principali fatti stilizzati riguardanti l’andamento dei mercati finanziari e, in particolare, la loro relazione con i tassi di interesse a breve termine e il consumo aggregato (cfr. Campbell, 2003). 1. Il rendimento reale medio (annuo) delle azioni è alto: l’8.1% negli USA per il periodo 1947-1998.1 2. Il tasso di interesse (a breve termine) reale medio privo di rischio è basso: i titoli del tesoro statunitensi a 3 mesi hanno reso lo 0.9% annuo nel periodo di cui sopra. 3. I rendimenti azionari (reali) sono piuttosto volatili: essi presentano una deviazione standard annua del 15.6%, sempre con riferimento ai dati americani. 4. Il tasso di interesse riskfree di cui al punto 2 è molto meno volatile dei rendimenti azionari: la deviazione standard annualizzata è dell’1.7%. 5. Il tasso di crescita del consumo reale (beni non durevoli e servizi) ha un andamento molto “regolare” (smooth): in altre parole, la volatilità del tasso di crescita del consumo è molto bassa, l’1.1% su base annua. 6. Il consumo e i dividendi (i loro tassi di crescita trimestrali) hanno una debolissima correlazione, 0.05 con dati USA, ma tale correlazione aumenta con l’orizzonte temporale. 7. Consumo e rendimenti azionari sono moderatamente correlati nei dati trimestrali e ad un anno, ma poi la loro correlazione diminuisce decisamente su orizzonti temporali più lunghi. Dai dati sopraelencati emergono in particolare due quesiti: 1) perché il rendimento azionario medio reale è così tanto elevato rispetto al tasso riskfree (equity premium puzzle)?
1
Il rendimento è da intendersi come rendimento logaritmico.
13
2) perché la volatilità dei rendimenti azionari è così elevata rispetto a quella dei rendimenti a breve termine (equity volatility puzzle)? Visti un po’ di dati, addentriamoci ora nelle spiegazioni teoriche che sono state proposte dalla letteratura nel corso di questi ultimi vent’anni. Come già preannunciato, ci muoviamo all’interno dei cosiddetti modelli ad agente rappresentativo, con comportamento ottimizzante ed aspettative razionali (modelli microfondati). Va inoltre sottolineato che, data la natura dei successivi capitoli di questo lavoro, passeremo in rassegna soltanto i contributi fondamentali con mercati completi e in assenza di qualunque tipo di frizione (costi di transazione, tasse, ecc.), nello spirito del lavoro pionieristico di Mehra-Prescott (1985). Per una rassegna di contributi con mercati incompleti e frizioni di varia natura si vedano, ad esempio, Kocherlakota (1996) e Campbell (2000b).
2 C-CAPM e paradossi dei mercati finanziari Premettiamo subito che nel contesto della nostra trattazione l’equity volatility puzzle assumerà un’importanza marginale. Tra l’altro, tale argomento meriterebbe, per la ricchezza dei contenuti e per alcune caratteristiche peculiari sue proprie, un discorso a parte. Ci occuperemo quindi soprattutto dell’equity premium puzzle e delle tematiche ad esso più strettamente connesse, cercando di capire da dove scaturisce e in quali termini. Il consumatore/investitore rappresentativo fronteggia il seguente problema di massimizzazione intertemporale in un’economia con orizzonte infinito: ∞ t E0 ∑ β u (Ct ) max t =0 {ct }t∞= 0
s.t.
Wt +1 = (1 + rt +1 )(Wt − Ct ) W0 dato
dove β è il fattore di sconto soggettivo intertemporale, W è la ricchezza finanziaria dell’individuo ed r è il tasso di rendimento reale relativo ad ogni attività finanziaria (tree nella terminologia di Lucas, 1978). La ricchezza
14
iniziale W0 è data. Abbiamo un certo numero di assets (ad esempio n ), e non esiste alcun tipo di reddito da lavoro: l’unica fonte di reddito (incerta) è di tipo finanziario, ed è costituita dai dividendi azionari (i frutti dell’albero), che vengono interamente consumati (siamo in un’economia di puro scambio alla Lucas, 1978). La funzione di utilità uniperiodale u (C ) è temporalmente separabile (additivamente); inoltre soddisfa alcuni requisiti tecnici standard: è concava, strettamente crescente e differenziabile due volte. Delle stesse proprietà godrà quindi anche la funzione di utilità multiperiodale U 0 = E0 ∑ β t u (Ct ) .
Sfruttando le tecniche di programmazione dinamica stocastica (oppure il Lagrangiano “dinamico”) otteniamo la condizione del primo ordine del problema, ossia la condizione fondamentale di equilibrio intertemporale, la cosiddetta equazione di Eulero:2
[
u ' (Ct ) = Et β (1 + rti+1 )u ' (Ct +1 )
]
(1)
Tale condizione intertemporale vale in ogni periodo t e per ogni generica attività finanziaria i (e quindi anche per l’attività riskfree, che fa parte insieme alle altre n − 1 attività rischiose delle n attivtà finanziarie complessive presenti nell’economia). Potenzialmente abbiamo quindi non una sola equazione, bensì un set di n equazioni di Eulero.3 La (1) può essere riscritta nel seguente modo,
[
u ' (Ct ) = βEt Rti +1u ' (Ct +1 ) i
]
(2)
i
dove Rt +1 = (1 + rt +1 ) rappresenta il fattore di interesse o rendimento lordo (reale) dell’i-esima attività finanziaria. Ancora, possiamo riscrivere la (2) come
u ' (Ct +1 ) 1 = βEt Rti+1 u ' (Ct )
2
(3)
Vedi l’Appendice Matematica A.1.1 per maggiori dettagli sul modello e sulla derivazione delle condizioni del primo ordine. 3 Notiamo fin da ora che in molti modelli di asset pricing, per semplificare la trattazione, si fa spesso uso dell’ipotesi di due sole attività finanziarie: una rischiosa e una dal rendimento certo (safe asset). Si suppone poi che l’attività rischiosa sia in realtà un’attività “composita”, ad esempio un fondo comune, comprendente un numero arbitrario di attività rischiose.
15
Tale equazione, come detto, vale per ogni attività; in particolare, per l’attività priva di rischio avremo: u ' (Ct +1 ) 1 = βR f Et u ' (Ct )
(4)
dove R f è il tasso di rendimento dell’attività riskfree, ed è stato portato fuori dall’operatore valore atteso e scritto con notazione meno pesante perchè all’inizio di ogni periodo è conosciuto dall’investitore con certezza. In altri termini abbiamo che Et + j Rt f+ j +1 = R f , ∀j . Specifichiamo ora la funzione di utilità come funzione “potenza”, o anche CRRA (constant relative risk aversion) o CIES (constant intertemporal elasticity of substitution o isoelastica), una forma funzionale ampiamente usata in letteratura in quanto caratterizzata da una serie di convenienti proprietà:4 u (C ) =
C1−γ − 1 1− γ
Tale forma funzionale ha soprattutto il pregio di essere scale-invariant: se le distribuzioni dei rendimenti sono costanti, al crescere della ricchezza aggregata e delle dimensioni dell’economia, i premi per il rischio non variano. E come evidenzia Campbell (2003), “this is important because over the two centuries wealth and consumption have increased manyfold, yet riskless interest rates and risk premia do not seem to have trended up or down”. E la forma power utility è una delle poche specificazioni della funzione di utilità coerenti con quanto appena detto. Altra qualità molto importante: se l’economia è popolata da individui diversi per quanto riguarda la loro ricchezza iniziale ma con la stessa funzione di utilità CRRA, allora essi possono essere aggregati in un unico agente rappresentativo con preferenze descritte dalla funzione di utilità dei singoli individui. Con la funzione di utilità sopradescritta avremo u '(C ) = C −γ e sostituendo tale espressione nella (3) e nella (4) otteniamo le due seguenti equazioni:
4
In particolare, oltre ad alcune “opportune” proprietà analitiche tipiche delle funzioni di utilità e già menzionate, tale funzione, come si evince dai due acronimi, ha un coefficiente di avversione relativa al rischio costante e un’elasticità di sostituzione intertemporale anch’essa costante. Ma la cosa ancor più importante da sottolineare è che, in funzioni di tale tipo, è possibile dimostrare che l’una è il reciproco dell’altra: l’elasticità di sostituzione è il reciproco dell’avversione relativa al rischio e viceversa. E vedremo che questa è una proprietà “scomoda” che può creare, in diversi casi, non pochi problemi.
16
−γ Ct +1 i 1 = βEt Rt +1 C t
(5)
C −γ 1 = βR f Et t +1 Ct
(6)
Utilizzando queste due espressioni e facendo delle ipotesi piuttosto restrittive sulle distribuzioni di probabilità di consumi e rendimenti, siamo in grado di discutere le implicazioni empiriche del modello C-CAPM, in particolare l’equity premium puzzle, che all’interno di un framework simile a quello che stiamo vedendo, fu per la prima volta rilevato da Mehra-Prescott (1985). Per la precisione, nel lavoro appena citato si procede calibrando un modello di equilibrio generale, rifacendosi fortemente alla struttura teorica di Lucas (1978). Anche il nostro punto di partenza è ispirato a Lucas (1978), ma ora procederemo seguendo l’approccio di Hansen-Singleton (1983), basato sullo studio delle equazioni di Eulero (ottenute sfruttando le summenzionate ipotesi restrittive sulle distribuzioni di consumo e rendimenti), e sul fatto che le condizioni di Eulero (5) e (6) valgono per tutti i consumatori. L’ipotesi restrittiva di cui sopra è la seguente: si suppone che rendimenti e consumo abbiano una distribuzione congiunta lognormale e omoschedastica. Sfruttando il fatto che per una variabile casuale X che ha tale distribuzione vale la seguente proprietà,
1 log Et ( X ) = Et (log X ) + VARt (log X − Et log X ) 2 possiamo riscrivere la (5) e la (6), dopo opportuni aggiustamenti, nel modo che segue:5 i t t +1
Er
=−
σ i2
+ ρ + γ Et ( ∆ct +1 ) −
γ 2σ c2
rf = ρ + γ Et ( ∆ct +1 ) −
γ 2σ c2
2
2
2
+ γ Cov(i, c)
(7)
(8)
dove rti+1 = log( Rti+1 ) , ct +1 = log(Ct +1 ) , ∆ct +1 = ct +1 − ct ,6 rf = log( R f ) , σ i2 è la varianza del rendimento azionario dell’i-esima attività rischiosa, σ c2 è la 5 6
Vedi l’Appendice Matematica A.1.2 per i dettagli analitici della derivazione delle equazioni (7) e (8). Quindi ∆c t +1 rappresenta il tasso di crescita del consumo.
17
varianza del tasso di crescita del consumo, Cov(i, c) è la covarianza tra il tasso di rendimento dell’i-esima attività rischiosa e il tasso di crescita del consumo e, per ultimo, ρ è la time preference che sta “dentro” il fattore di sconto intertemporale β = 1/(1 + ρ ) . La (7) ci dice in sostanza quali sono le determinanti del tasso di rendimento atteso rischioso, mentre la (8) ci dice la stessa cosa relativamente al rendimento certo. Sottraendo la (8) dalla (7) otteniamo un’espressione formale che ci definisce l’equity premium:
Et rti+1 − rf +
σ i2 2
= γ Cov(i, c)
(9)
Ciò che sta a sinistra di questa equazione è il premio azionario (logaritmico) per il rischio, “aggiustato” col termine relativo alla varianza del rendimento azionario, derivante dalla disuguaglianza di Jensen, per tenere conto del fatto che stiamo lavorando con aspettative di rendimenti logaritmici (vedi Appendice A.1.2). Sul lato destro abbiamo invece il coefficiente di avversione relativa al rischio e la covarianza tra rendimenti e crescita del consumo:7 il primo viene spesso interpretato come il prezzo del rischio, mentre la seconda come la quantità di rischio derivante dal mercato azionario. Prima di vedere alcuni utili esercizi numerici è immediato constatare che, dato lo spread tra rendimento azionario medio atteso e tasso privo di rischio (circa il 6% per gli USA nel periodo 1889-1978 e il 7% nel periodo 1891-1998), essendo empiricamente bassa la covarianza tra rendimenti e consumi, l’unico modo per giustificare l’elevato livello del premio azionario è avere un prezzo del rischio ( γ ) molto elevato. Con riferimento agli USA, per il periodo 1889-1978, Mehra-Prescott (1985) raccolgono i seguenti dati:
Tassi
Tabella 1 Varianze/Covarianze
Et rti+1 Et rti+1 0.070 0.0274 rf 0.010 0.00104
rf
∆ct+1
0.00104
0.00219
0.00308
-0.000193
∆ct +1 0.018 0.00219 -0.000193
0.00127
Tabella riadattata da Kocherlakota (1996, Tabella 1)
7
Richiamiamo l’attenzione sul fatto che in molti lavori teorici ed empirici sull’equity premium, spesso non si considera la covarianza tra rendimento e consumo, ma quella tra rendimento in eccesso ( E t rt +1 − r f ) e consumo.
18
Esplicitando la (9) per
γ, γ =
Et rti+1 − rf + σ i2 / 2 Cov(i, c)
,
e facendo le opportune sostituzioni utilizzando i dati della Tabella 1, è immediato verificare che otteniamo un valore di γ pari a 33.65: assolutamente implausibile con una ragionevole parametrizzazione delle preferenze individuali. Si ritiene infatti che valori accettabili del coefficiente di avversione relativa al rischio siano quelli inferiori a 10, ovviamente positivi (cfr. Mehra-Prescott, 1985). Molti economisti spostano tale soglia a valori non superiori a 5. Se ci si basa sulle argomentazioni di Pratt (1964), si dovrebbero considerare solo valori non superiori a 3.8 In ogni caso, visto il risultato ottenuto ( γ = 33.65 ), possiamo concludere affermando che la (9) è soddisfatta empiricamente solo per valori di γ così elevati da essere del tutto inadeguati a descrivere in maniera accettabile l’atteggiamento dei consumatori verso il rischio. Questo è il cosiddetto paradosso del premio azionario per il rischio (equity premium puzzle o equity risk premium puzzle). Vediamo ora, sempre con riferimento all’economia americana, se questo risultato è confermato anche con dati più recenti, relativi al periodo 1891-1998 (tratti da Campbell, 2003), che tengono quindi conto della notevole performance fatta registrare dai mercati finanziari durante gli anni ’90. I dati sono quelli riportati nella sottostante Tabella 2.
Tassi
Tabella 29 Varianze/Covarianze
Et rti+1
rf
Et rti+1 0.0717 0.0346 0.020 rf
∆ct+1
0.00776
∆ct +1 0.01789 0.0027
0.00103
Riadattata con dati tratti da Campbell (2003)
8
Il discorso sarebbe lungo è controverso (si vedano ad esempio Kocherlakota, 1996, LjungqvistSargent, 2000, Mehra-Prescott, 2003). In questa sede, per il momento, ci basta sapere che valori superiori a 10 sono fortemente implausibili. 9 Notiamo che in questa Tabella compaiono solo i dati rilevanti per i nostri calcoli: sono state tralasciate infatti alcune covarianze non disponibili, ma comunque non utili ai nostri fini.
19
Facendo le dovute sostituzioni, sempre nella (9) esplicitata per γ , otteniamo un valore dell’avversione relativa al rischio pari a 25.5: ancora troppo elevato. Notiamo comunque che l’equity premium puzzle non è un fenomeno solo americano. Anzi, esso si manifesta a livello internazionale ed è sostanzialmente presente in tutti i paesi del G7 (cfr. Campbell, 2003 e Kocherlakota, 1996). E’ importante osservare inoltre, come sottolinea Kocherlakota (1996), che la teoria non fallisce qualitativamente nel prevedere un premio per il rischio positivo, anzi, così è, quindi in questo senso la teoria è corretta; essa fallisce quantitativamente, ossia nel prevedere la dimensione del premio azionario. Notiamo a tal proposito che affinchè si abbia un premio azionario positivo ( Et rti+1 − rf >0), è necessario, come si evince dalla (9), che sia soddisfatta la seguente disuguaglianza:
γ >
1 σ i2 2 σ ic
dove σ ic = Cov (i, c) . Sostituendo i valori della varianza del rendimento azionario e della covarianza tra rendimento e consumo (tratti dalla Tabella 1), otteniamo la seguente condizione:
γ > 6.25 Quindi, affinché esista un premio azionario strettamente positivo, è necessario che l’avversione relativa al rischio sia superiore ad un valore che già di per se è abbastanza “azzardato” nel descrivere le preferenze dell’agente rappresentativo. Valori al di sotto di 6.25, i quali sarebbero ampiamente plausibili e desiderabili (ovviamente quelli positivi), generano un premio azionario negativo. Il paradosso risulta così confermato anche in questo modo. Ma possiamo affermare l’esistenza dell’equity premium puzzle in un altro modo ancora. Essendo la varianza dei rendimenti azionari positiva per definizione, dalla (9) abbiamo che Et rti+1 − rf ≤ γ Cov(i, c)
Se poi teniamo presente che, data la definizione statistica di correlazione, Corr (i, c) = Cov(i, c) / σ cσ i ≤ 1 , abbiamo che
Cov(i, c) = σ ic ≤ σ cσ i ,
20
(10)
combinando le due espressioni di cui sopra otteniamo
Et rti+1 − rf ≤ γσ iσ c
(11)
Possiamo interpretare il lato destro di quest’ultima espressione come un limite superiore (upper bound) per il premio azionario. Facendo le opportune sostituzioni con i dati della Tabella 1 e con γ = 5 abbiamo che Et rti+1 − rf ≤ 5(0.165)(0.0356) = 0.029 ⇒ EP ≤ 2.9%
dove EP = Et rti+1 − rf . Quindi, stando alla (11), l’equity premium non dovrebbe mai superare la soglia del 2.9%. Sappiamo invece, sempre con riferimento all’economia USA, che raggiunge il 6%. Notiamo che alzando il valore dell’avversione al rischio, le cose, come è lecito attendersi, migliorano: con γ = 8 ⇒ EP ≤ 4.7% , con γ = 10 ⇒ EP ≤ 5.8% , con γ = 20 ⇒ EP ≤ 11.7% . Ovviamente certi valori di γ , come già detto, hanno scarso significato. Osserviamo infine che la disuguaglianza (11) è violata anche per gli altri paesi del G7 (cfr. Jappelli-Pistaferri, 2000). Consideriamo ora la (8): anche qui emerge un’incongruenza tra teoria ed evidenza empirica. Infatti, se inseriamo nella (8) i valori empirici del tasso di crescita e della varianza del consumo, e valori plausibili della time preference e del coefficiente di avversione al rischio γ , troviamo che il risultante tasso riskfree è molto più elevato di quello effettivamente osservato: si tratta del cosiddetto riskfree rate puzzle (cfr. Weil, 1989). Utilizzando i dati della Tabella 1 e considerando una valore di ρ il più piccolo possibile tra i valori plausibili, ad esempio 0.01,10 otteniamo un tasso risk-free pari al 2.7% con γ = 1 , 4.3% con γ = 2 e 8.4% con γ = 5 . Ovviamente, con l’aumentare di γ , il termine quadratico sul lato destro della (8) tende a dominare il termine legato al tasso di crescita del consumo, facendo quindi diminuire rf . Questo significa che se inseriamo valori dell’avversione al rischio particolarmente elevati, ma assolutamente inadatti a descrivere le preferenze individuali, è possibile clonare il tasso d’interesse osservato empiricamente: un valore di γ pari a 28.3 fornisce esattamente rf = 1% . Del resto, se inseriamo valori ragionevoli di γ , solo con un‘implausibile time preference negativa è possibile riconciliare la (8) con l’evidenza empirica: il riskfree rate puzzle risulta così confermato anche in questo modo. Con i dati della Tabella 2 otteniamo sostanzialmente gli stessi risultati. In maniera tale che β sia uguale a 0.99, o comunque che non superi 1. Si tratta di un’ipotesi standard della letteratura macroeconomica circa il tasso di sconto intertemporale. Per le implicazioni che si hanno con β >1 (e quindi con ρ < 0 ) si veda Kocherlakota (1990). 10
21
Soffermiamoci ancora un poco sull’equazione (8). In tale equazione è insito un meccanismo, appena visto, che ritroveremo spesso nelle pagine successive di questo lavoro. Un aumento dell’avversione relativa al rischio, nell’ambito di valori “ragionevoli” e quindi non eccessivamente elevati, implica un aumento del tasso d’interesse. L’effetto del secondo termine del lato destro dell’equazione (che riflette la sostituzione intertemporale del consumo) prevale sul terzo termine (che riflette il risparmio a fini precauzionali). Non deve trarre in inganno il fatto che un aumento di γ , innalzando l’avversione al rischio dell’investitore, induce all’acquisto di attività finanziarie risk-free (risparmio precauzionale), con il conseguente aumento dei loro prezzi e la discesa dei relativi tassi. Per valori plausibili di γ , l’effetto legato alla crescita del consumo corrente è in grado di controbilanciare le cose, comportando, come effetto finale, un aumento del tasso risk-free.
FATTORE DI SCONTO STOCASTICO. Prima di vedere i rimedi proposti in letteratura al fine di ovviare ai problemi manifestati dai modelli C-CAPM, vediamo come è possibile analizzare quanto visto finora anche attraverso un altro approccio analitico. E sottolineiamo che si tratta di un modo di trattare i modelli di asset pricing che si è ampiamente diffuso ed affermato tra gli specialisti della materia. Introduciamo il concetto di fattore di sconto stocastico (stochastic discount factor). Si prenda in considerazione la (3) con β portato dentro l’operatore di aspettativa: u '(Ct +1 ) 1 = Et Rti+1 β u '(Ct )
Questa espressione possiamo riscriverla così,
1 = Et Rti+1 M t +1
(12)
dove
M t +1 = β
u '(Ct +1 ) u '(Ct )
rappresenta il cosiddetto stochastic discount factor (SDF): si tratta del saggio marginale di sostituzione intertemporale del consumatore/investitore. La cosa rilevante da tenere presente è che l’SDF è positivo e tale positività è garantita dal fatto che sul mercato non è possibile sfruttare opportunità di
22
arbitraggio, in quanto gli agenti possono scambiare liberamente, senza dover sostenere costi di transazione. Possono esistere molti e diversi SDF, uno per ogni investitore, a seconda dei processi stocastici seguiti dalle singole utilità marginali, ma in ogni caso tutti i possibili SDF devono soddisfare l’equazione (12). In presenza di mercati completi le cose però si semplificano drasticamente, ed abbiamo un unico SDF, in quanto gli investitori possono scambiare tra di loro al fine di eliminare ogni variazione idiosincratica nelle proprie utilità marginali (cfr. Kocherlakota, 1996 e Campbell, 2003). Partendo dall’equazione (12) possiamo ottenere una serie di espressioni che ci definiscono i paradossi del premio azionario e del tasso riskfree in maniera del tutto analoga a quella vista in precedenza, senza però esplicitare la funzione di utilità, ma lavorando con il concetto di fattore di sconto stocastico. Se assumiamo, come fatto in precedenza, una distribuzione congiunta lognormale e omoschedastica per rendimenti e SDF, passando ai logaritmi nella (12) abbiamo: i t t +1
Er
= − Et mt +1 −
σ i2 2
−
σ m2 2
− Cov(i, m)
(13)
E’ immediato notare che tale espressione è sostanzialmente analoga alla (7). Se consideriamo la (12), per il tasso riskfree abbiamo
Rf =
1 Et M t +1
Passando ai logaritmi otteniamo
rf = − Et mt +1 −
σ m2 2
(14)
Quest’ultima espressione è l’equivalente della (8). Sottraendo la (14) dalla (13) otteniamo un’espressione analoga alla (9) che ci definisce il premio azionario: i t t +1
Er
− rf +
σ i2 2
= −Cov(i, m)
(15)
Utilizziamo ora i dati della Tabella 1 nella (15): sostituendo i valori dei rendimenti e della varianza dell’attività rischiosa abbiamo che
σ im = −0.0737 < 0
23
Un valore dell’equity premium positivo si accorda con una covarianza tra rendimenti e SDF negativa: è quello che ci aspettavamo. Una relazione inversa tra SDF e rendimenti azionari è infatti coerente col “nostro” modello: quando i rendimenti azionari diminuiscono l’SDF aumenta, in quanto aumentano le sottostanti utilità marginali. E le utilità marginali aumentano perché i livelli di consumo diminuiscono: quindi la covarianza tra consumo e rendimenti deve essere positiva, ed è infatti quello che ritroviamo nei dati, tranne alcune eccezioni (con riferimento agli USA, 0.23 è la correlazione tra rendimenti e consumi, e questo dato è sinonimo di una Cov (i, c) non troppo elevata, ma comunque positiva). Inoltre, tenendo presente che
Corr (i, m) = ρim =
σ im ≥ −1 σ iσ m
avremo anche
− σ im ≤ σ iσ m
(16)
Combinando la (16) con la (12) otteniamo la seguente disuguaglianza:
σm ≥
Et rti+1 − rf + σ i2 / 2
σi
(17)
Questa espressione, derivata per la prima volta da Shiller (1982), ci è utile, nuovamente, per interpretare in un altro modo ancora il paradosso del premio per il rischio. Il lato destro può infatti essere visto come una sorta di Sharpe ratio logaritmico relativo all’attività i. E tale rapporto, anche il più alto possibile riscontrabile sui mercati finanziari, non deve mai superare la deviazione standard del fattore di sconto stocastico logaritmico. Ad esempio Campbell (2003) usa proprio la (17) per illustrare l’equity premium puzzle, stimando però il numeratore della suddetta espressione con il rendimento medio in eccesso (il premio azionario) più la metà della varianza del premio azionario, e il denominatore con la deviazione standard del premio azionario.11 Possiamo ricavare un’espressione analoga alla (17) anche con riferimento al consumo. Prendiamo in considerazione il modello con la funzione di utilità esplicitata come CRRA:
11
Detto in altre parole: Campbell (2003) utilizza nell’espressione (17) non la varianza del rendimento rischioso, ma quella dell’equity premium.
24
u (C ) =
C1−γ − 1 1− γ
Dalla (9), tenuto conto che Corr (i, c) = σ ic / σ iσ c ≤ 1, da cui segue che
σ ic ≤ σ iσ c , abbiamo
Et rti+1 − rf +
⇒
σc ≥
σ i2 2
≤ γσ iσ c ⇒
i 2 1 Et rt +1 − rf + σ i / 2
γ
σi
(18)
(19)
Anche nella (19) il lato destro può essere interpretato come un limite inferiore per la volatilità del consumo. Notiamo che in questo caso lo Sharpe ratio è ponderato con il reciproco del coefficiente di avversione relativa al rischio, ossia con l’elasticità di sostituzione intertemporale.12 Possiamo testare la disuguaglianza (19) con i dati relativi all’economia americana (ad esempio quelli della Tabella 1), ma essendo violata la (11) è evidente che risulterà violata pure la (19) (essendo σ i2 / 2 > 0 il termine di destra della (19) non può che aumentare). Con γ = 5 otteniamo infatti i 2 1 Et rt +1 − r f + σ i / 2
γ
σi
= 0.447
e sapendo che σ c = 0.0356 la disuguaglianza (19), come ci aspettavamo, risulta violata.
3 Equity premium puzzle: il caso italiano Vediamo ora brevemente i due paradossi con riferimento al caso italiano, con dati tratti da Campbell (2003). Per il periodo 1971-1998 abbiamo la successiva Tabella 3. Come fatto in precedenza, usiamo le equazioni (8) e (9) per testare la presenza dei due paradossi. Prima di passare a tale operazione, guardando ai dati, possiamo però notare immediatamente alcune 12
Notiamo anche che la disuguaglianza (19) è derivata dalla (18), la quale è praticamente analoga alla (11): la differenza sta nel termine relativo alla varianza dell’attività rischiosa, mancante nella (11) e presente nella (18).
25
marcate differenze con gli USA. In Italia il rendimento azionario medio è nettamente più basso, il tasso riskfree è simile (di un punto percentuale più alto con dati Mehra-Prescott, 1985), la covarianza tra rendimenti azionari e consumo è quasi nulla (anzi, impercettibilmente negativa); stessa cosa dicasi per la volatilità del consumo, prossima allo zero, mentre il tasso di crescita del consumo è di poco superiore a quello USA. E’ interessante notare invece come la volatilità dei rendimenti azionari sia in Italia non di poco superiore a quella americana.
Tabella 3 Varianze/Covarianze
Tassi
Et rti+1
rf
Et rti+1 0.032 0.0731 rf 0.024
∆ct+1
0.00081
∆ct +1 0.022 -0.000151
0.00029
Riadattata con dati tratti da Campbell (2003)
Sostituendo i dati della Tabella 3 nell’equazione (9) esplicitata per γ abbiamo:
γ=
(0.032 − 0.024) + 0.0731 / 2 0.04455 = −295 < 0 = − 0.000151 − 0.000151
Otteniamo un valore addirittura negativo. Questo succede ad esempio anche per Francia e Svizzera (cfr. Campbell, 2003). Notiamo che in Italia il premio per il rischio, senza tenere conto del termine di aggiustamento costituito dalla varianza azionaria, sarebbe esiguo: 0.8%. Ma opportunamente aggiustato con la metà della volatilità dei rendimenti azionari, arriva ad essere il 4.45%, contro il 6.9% - 7.3% degli USA. E’ poi evidente che all’ottenimento di un valore così elevato di γ contribuisce enormemente il valore prossimo allo zero della covarianza tra rendimenti e consumi. Vediamo ora il risk-free rate puzzle. Se prendiamo γ = 5 e ρ = 0.01 , dalla (8) otteniamo,
r f = 0.01 + 5(0.022) −
52 (0.00029) = 0.1164 ⇒ r f = 11.64% , 2
ovviamente troppo elevato per replicare il tasso a breve italiano nel periodo 1971-1998, pari al 2.4%.
26
4 Modelli con preferenze recursive Alcuni autori hanno tentato, come risposta ai problemi sollevati dal modello C-CAPM, di introdurre una tipologia di preferenze individuali che abbia la caratteristica di “rompere” la relazione di reciprocità tra avversione al rischio e elasticità di sostituzione intertemporale (ESI) tipica dei cosiddetti power utility models. Ci riferiamo ai lavori di Epstein-Zin (1989, 1991) e Weil (1989), i quali, inserendosi nella costruzione teorica elaborata da KrepsPorteus (1978), definiscono la funzione di utilità recursivamente, esplicitandola nel seguente modo (si parla anche di Generalized Expected Utility preferences o preferenze GEU): θ
1 1−γ 1−γ U t = (1 − β ) Ct θ + β Et U t1+−1γ θ
(
con
θ≡
)
(20)
(1 − γ ) , 1 − 1/ ψ
dove γ ha il solito significato (avversione relativa al rischio), mentre ψ rappresenta l’elasticità di sostituzione intertemporale. Nel caso di power utility abbiamo ovviamente γ = 1/ψ ; nel caso di utilità recursiva è immediato notare che se γ = 1/ψ ⇒ θ = 1 e rientriamo nel caso “classico” del modello standard con power utility.13 Ma vediamo più in dettaglio le implicazioni dell’impostazione EpsteinZin-Weil (EZW). Il vincolo di bilancio intertemporale fronteggiato dal consumatore/investitore rappresentativo ha le seguente forma:
Wt +1 = Rtw+1 (Wt − Ct ) dove Wt +1 è la ricchezza complessiva (capitale umano+ricchezza finanziaria14) dell’agente rappresentativo e Rtw+1 = 1 + rt w+1 è il tasso di rendimento lordo derivante da tale ricchezza.15 Dalle condizioni del primo ordine del problema recursivo otteniamo la seguente equazione di Eulero: 13
Per vedere questo formalmente è necessario risolvere “forward” l’espressione (20) modificata con
θ =1.
14
Sia quella rischiosa che quella certa: ossia, sia azioni che titoli privi di rischio. Solitamente ci si riferisce ad Rtw+1 come al tasso derivante dall’intero portafoglio di mercato, ossia da tutti gli assets dell’investitore rappresentativo: azioni, titoli privi di rischio, capitale umano (valore 15
27
1 θ 1−θ − Ct +1 ψ 1 1 = Et β Rti+1 16 w Ct Rt +1
Passando ai logaritmi (con le consuete ipotesi sulla distribuzione di rendimenti e consumi) otteniamo le due seguenti espressioni:
rf = ρ +
1
ψ
E r − rf + i t t +1
Et (∆ct +1 ) +
σ i2 2
=θ
θ −1 2
Cov(i, c)
ψ
σ w2 −
θ σ c2 2ψ 2
+ (1 − θ )Cov(i, w)
(21)
(22)
Tali equazioni sono le analoghe della (8) e della (9) con preferenze GEU. Quale commento possiamo fare? Questo approccio risolve i paradossi che stiamo analizzando? Purtroppo no: vediamo perché. Consideriamo prima la (22). Innanzitutto è possibile notare che con θ = 1 , come è logico attendersi, otteniamo la (9), mentre con θ = 0 “ricadiamo” nel CAPM statico. La generalità dell’approccio EZW sta quindi nel ricomprendere come casi particolari il C-CAPM e il CAPM. Dall’esame del lato destro dell’equazione notiamo che il premio azionario è interpretabile come una media ponderata di due differenti covarianze, con pesi θ e 1 − θ . Abbiamo la covarianza tra rendimento azionario e consumo (divisa per l’ESI) e la covarianza tra rendimento azionario e rendimento della ricchezza complessiva (chiamiamo quest’ultimo rendimento “di mercato”). Ciò che emerge da tale espressione è che, anche con un grado di avversione al rischio relativamente basso, sembrerebbe possibile avere un elevato premio azionario. L’idea e’ che se la volatilità del rendimento di mercato è maggiore della volatilità del tasso di crescita del consumo, allora Cov (i, w) può essere molto più grande di Cov (i, c) 17 e spiegare così l’equity premium anche con un basso valore di γ . E se approssimiamo il valore di Rtw+1 con il rendimento di un indice azionario (NYSE, S&P 500, ecc.), è ovviamente lecito avere un rendimento del “portafoglio di mercato” più volatile del consumo. Ma ci sono due validissime obiezioni da rilevare che inficiano pesantemente il ragionamento appena esposto. Primo, se il consumo è attuale dei redditi da lavoro futuri attesi), immobili. E notiamo fin da ora una cosa molto importante: tale tasso di rendimento, proprio perché particolarmente composito, non è empiricamente osservabile. 16 Ed è immediato notare che con θ = 1 otteniamo l’equazione (5), ossia quella del C-CAPM con power utility. 17 Questo ragionamento vale ovviamente data l’elevata volatilità dei rendimenti azionari riscontrata empiricamente.
28
“liscio” (smooth)18 e la ricchezza è volatile, allora gia’ questo e’ un puzzle da spiegare e non un fatto utile per spiegare un altro paradosso: tali variabili sono infatti collegate strettamente tramite il vincolo di bilancio intertemporale (cfr. Campbell, 2003). Secondo, l’implementazione empirica della (22), attraverso un esercizio di calibrazione, risulta di difficile realizzazione, in quanto essendo Rtw+1 empiricamente non osservabile, non è osservabile nemmeno la covarianza tra tale variabile e il rendimento dell’attività rischiosa. Epstein-Zin (1991) superano questo problema utilizzando come proxy di R w l’indice NYSE, ed in questo modo riescono ad ottenere una Cov(i, w) maggiore della Cov(i, c) , arrivando così a spiegare l’equity premium puzzle anche con valori bassi del coefficiente di avversione al rischio. Ma approssimare R w con un indice azionario è probabilmente fuorviante, in quanto non viene colto adeguatamente il vero livello di diversificazione dei propri investimenti attuato dall’agente rappresentativo (Kocherlakota, 1996). Consideriamo ora la (21). Da questa espressione è possibile evincere che anche con un valore di γ elevato (ma però non tale da raggiungere livelli implausibili) abbiamo la possibilità di replicare il tasso riskfree, in quanto con preferenze GEU un valore elevato dell’elasticità di sostituzione intertemporale ψ può perfettamente coesistere con un valore elevato del coefficiente di avversione al rischio γ . E nella (21) un valore alto di ψ tende ovviamente ad abbassare il tasso riskfree, anche con valori elevati di γ . In altre parole, un valore elevato di γ non implica necessariamente un rendimento certo alto: cosa che invece accade con power utility. Appare quindi possibile concludere che preferenze più generali come quelle EZW possono risolvere almeno il riskfree rate puzzle (vedi ad esempio Kocherlakota, 1996 e Mehra-Prescott, 2003). Ma in realtà c’è un problema rilevante: l’evidenza empirica ci dice che l’elasticità di sostituzione intertemporale relativa al consumo è bassa (Hall, 1988; Campbell, 2000a), mentre per risolvere il riskfree rate puzzle avremmo bisogno di un valore piuttosto elevato. L’approccio EZW è quindi sicuramente analiticamente degno di nota, ma portatore di pochi benefici rispetto al classico modello C-CAPM con preferenze standard. Il fatto di rompere il legame di reciprocità tra γ e ψ , tipico dei modelli con power utility, non aggiunge molto alla comprensione e alla spiegazione dei “nostri” paradossi.
18
E nei dati empirici questo è ciò che si riscontra.
29
5 Modelli con Habit Formation Un’altra possibile soluzione ai problemi posti dai modelli C-CAPM è stata proposta da quel filone di letteratura che, sempre rientrante nella categoria dei modelli basati sul consumo, adotta l’ipotesi di habit formation. Vediamo di cosa si tratta. Viene in primo luogo abbandonata l’ipotesi di separabilità temporale dell’utilità: l’utilità del periodo t non dipende più soltanto dal consumo del periodo t , ma dipende anche dal consumo del periodo t − 1 . In particolare, si suppone che ciò che arreca utilità al consumatore in ogni periodo non è il livello assoluto del suo consumo, ma il livello di consumo rispetto ad un’abitudine, una norma (habit), variabile nel tempo. Tale norma può dipendere dall’andamento passato del consumo dell’individuo (internal habit) oppure dall’evoluzione del consumo (pro-capite) aggregato della collettività (external habit). Ci sono poi due modi attraverso i quali viene modellato il livello del consumo rispetto alla norma: col rapporto, Ct / X t ,19 oppure con la differenza, Ct − X t .20 La cosa da sottolineare è che con la seconda forma abbiamo un coefficiente di avversione relativa al rischio non costante, bensì time-varying, mentre con la prima forma abbiamo la solita avversione al rischio costante e pari a γ . Vediamo le cose un po’ meglio. Nel caso del rapporto la funzione di utilità periodale è21 u (Ct , X t ) =
(Ct / X t )1−γ − 1 1− γ
dove X t rappresenta la norma di consumo dell’individuo e quindi l’influenza dei livelli di consumo passati sull’utilità corrente. Applicando la nota formula per il coefficiente di avversione relativa al rischio e tenendo X t fisso, otteniamo:
−
u ''(Ct ) −γ Ct−γ −1 / X t1−γ γ Ct−γ −1+γ +1 1−γ Ct = − C = ⋅ Xt = γ t u '(Ct ) Ct−γ / X t1−γ X t1−γ
Perveniamo quindi allo stesso risultato che abbiamo nel modello C-CAPM visto nella sezione 2: l’avversione al rischio coincide con il parametro che 19
Ad esempio Abel (1990, 1999). Si vedano in particolare Sundaresan (1989), Constantinides (1990), Campbell-Cochrane (1999). 21 Continuiamo ad utilizzare l’utilità nella forma potenza. 20
30
governa la curvatura della funzione di utilità. Ma per quanto riguarda questa versione del modello con habit formation ci fermiamo qui. Tale versione fornisce infatti risultati parzialmente interessanti sotto alcuni profili, ma piuttosto controversi sotto altri aspetti.22 Per tale motivo siamo interessati soprattutto a vedere meglio e ad approfondire in una qualche misura la versione del modello con utilità modellata “in differenza”. Questo anche perché tale versione, come vedremo, si accorda notevolmente con il discorso che faremo nei capitoli successivi. Nello spiegare le caratteristiche principali del modello faremo riferimento alla versione Campbell-Cochrane (1999). Abbiamo una funzione di utilità periodale del seguente tipo:
u (Ct , X t ) =
(Ct − X t )1−γ − 1 ( St Ct )1−γ − 1 ≡ 1−γ 1−γ St ≡
dove
Ct − X t Ct
rappresenta il surplus di consumo (surplus consumption ratio) rispetto alla norma di riferimento X t , con Ct > X t .23 St tende a zero quando il consumo tende al suo habit, mentre tende ad 1 al crescere del consumo. L’evoluzione nel tempo della norma X t è determinata dall’andamento del consumo procapite aggregato e non è quindi influenzata dalle decisioni di consumo del singolo agente (habit esterno). L’agente rappresentativo massimizza la seguente funzione di utilità multiperiodale: ∞ (C − X t )1−γ − 1 U 0 = E0 ∑ β t t 1− γ t =0
Calcoliamo il coefficiente di avversione relativa al rischio. Derivando rispetto a Ct , tenendo fisso X t , abbiamo
−
u ''(Ct ) −γ (Ct − X t ) −γ −1 γ Ct = − Ct = γ ( St Ct ) −γ −1+γ Ct = γ St−1Ct−1+1 = −γ u '(Ct ) St (Ct − X t )
Quindi, come già menzionato, formulando l’ipotesi di habit formation in questo modo, otteniamo un coefficiente di avversione relativa al rischio non 22
Per un resoconto dettagliato si veda Abel (1990, 1999), Kocherlakota (1996) e Campbell (2003). L’utilità è quindi definita solo per valori del consumo superiori alla norma, ossia solo per valori positivi del surplus consumption ratio. 23
31
più costante, ma che varia nel tempo con il variare del surplus consumption ratio, ossia con il variare della norma di consumo e del consumo stesso. Il grado di avversione al rischio è quindi anticiclico: aumenta quando St diminuisce, vale a dire, come anche l’intuizione suggerisce, quando il consumo si avvicina all’habit di riferimento.24 Questo risultato è di notevole importanza nello spiegare i puzzles di cui stiamo discutendo, perché ci consente di avere un grado di avversione relativa al rischio ( γ / St ) elevato senza però avere una parametrizzazione delle preferenze individuali ( γ ) implausibilmente alta. Capiremo ancora meglio questo punto tra breve. Per analizzare le implicazioni del modello in maggior dettaglio è necessario fare delle ipotesi circa l’evoluzione del consumo aggregato e circa l’evoluzione della norma di consumo. Per il consumo aggregato viene utilizzato un processo del seguente tipo:
∆ct +1 = g c + ε t +1
(23)
dove ct +1 = log(Ct +1 ) , g c è il tasso di crescita atteso del consumo (supposto costante) ed ε è un disturbo (un’innovazione) omoschedastico distribuito normalmente con media zero e varianza σ c2 . Per quanto riguarda l’evoluzione della norma di consumo in risposta alle innovazioni nel consumo aggregato, Campbell-Cochrane (1999) ipotizzano un processo AR(1):
st +1 = (1 − δ ) s + δ st + λ ( st )ε t +1
(24)
dove s = log( S ) , δ è un parametro che controlla la persistenza del surplus consumption ratio, λ ( st ) è una funzione di “sensibilità” che misura la risposta di st +1 ad innovazioni nella crescita del consumo aggregato e s è il livello del surplus consumptio ratio in stato stazionario. Possiamo derivare, dalle condizioni del primo ordine, un’espressione per il tasso privo di rischio.25 La condizione del primo ordine per il tasso riskfree è
24
E quando il consumo tende ad avvicinarsi alla propria norma, ossia quando il surplus consumption ratio è basso, ci troviamo nel cosiddetto “bad state” (o bad times) dell’economia, ossia in fase recessiva. Siamo in good times (o nel good state) quando il consumo si allontana (ovviamente in eccesso) dalla propria norma. 25 Notiamo che per il tasso rischioso, date le ipotesi fatte, non è possibile trovare una soluzione in forma chiusa. Quindi per il momento troveremo un’espressione analoga alla (8) ma non una analoga alla (9) (e alla 7).
32
S −γ C −γ 1 = β R f Et t +1 t +1 St Ct
Prendendo i logaritmi, con la procedura vista nel paragrafo 2, e utilizzando la (23) e la (24), dopo alcuni passaggi algebrici otteniamo26
rf = ρ + γ g c −
γ 2σ c2 2
[1 + λ ( st )]
2
− γ (1 − δ )( st − s )
(25)
I primi due termini del lato destro sono quelli usuali del modello C-CAPM standard (vedi equazione 8); le novità sono i restanti due termini. Il quarto termine descrive gli effetti su rf dovuti alla sostituzione intertemporale del consumo. Quando st è basso siamo in bad times, con utilità marginale elevata. Ciò che però il consumatore si aspetta è che in futuro st ritorni alla sua media, aumentando: ne seguirà una riduzione dell’utilità marginale attesa in futuro e conseguentemente un desiderio del consumatore di aumentare il suo consumo presente, che gli fornisce un’utilità marginale relativamente maggiore. A tal fine l’individuo cercherà di contrarre prestiti, innalzando così il tasso riskfree. Quanto detto è confermato dalla (25), dove ad una diminuzione di st corrisponde un aumento di rf . Ovviamente l’intensità di questo effetto dipende dal parametro γ e dal parametro δ . Notiamo in particolare, con riferimento a quest’ultimo, che tanto più si approssima ad 1, tanto più trascurabile sarà l’effetto di sostituzione intertemporale. Il terzo termine è simile a quello dell’equazione (8), eccetto che per la parte fra parentesi quadre. Come già sappiamo, questo termine è relativo alla motivazione precauzionale al risparmio dell’individuo, e dato che la volatilità del consumo è supposta costante nel tempo, a seconda delle variazioni in λ ( st ) , avremo corrispondenti variazioni nel tasso riskfree. Ma come varia la funzione di sensibilità in risposta a variazioni di st ? Campbell e Cochrane scelgono opportunamente tale funzione in maniera tale che ∂λ ( st ) <0 ∂st
26
Nel derivare il risultato che segue va tenuto anche presente che: 1) in equilibrio il consumo procapite aggregato coincide con quello individuale dell’agente rappresentativo; 2) come già postulato in precedenza, il tasso di crescita del consumo e i rendimenti delle attività hanno una distribuzione congiunta lognormale.
33
Quindi, se ad esempio ci troviamo in una fase recessiva, con il consumo che tende a diminuire approssimandosi all’habit ( st diminuisce), l’incertezza tende ad aumentare, ed il conseguente accumulo di attività finanziarie a fini precauzionali da parte dell’individuo comporta una riduzione del tasso riskfree. E questo è coerente con la risposta di λ ( st ) a variazioni in st , in quanto data la loro relazione inversa, ad una diminuzione del surplus consumption ratio (logaritmico) segue un aumento di λ ( st ) e, tramite la (25), una riduzione del tasso d’interesse. Altro aspetto di cruciale importanza: il termine legato al risparmio precauzionale va a controbilanciare, nella (25), l’effetto del termine di sostituzione intertemporale. Di più: lo deve controbilanciare “perfettamente”, al fine di rendere r f costante. Proprio a tale scopo, λ ( st ) viene scelto da Campbell e Cochrane non solo decrescente in st , ma anche tale da controbilanciare esattamente l’effetto del termine di sostituzione intertemporale. Gli autori sopra-citati calibrano il modello con riferimento all’economia USA, assegnando ad alcune variabili ( g c e σ c2 ) i loro rispettivi valori empirici e scegliendo per i parametri cruciali del modello determinati valori. In particolare scelgono γ = 2 , ρ = 0.11 e δ = 0.87 . Le performances del modello sono buone: i risultati ottenuti circa il premio azionario, il livello e la costanza del tasso riskfree, e la volatilità dei rendimenti azionari, sono fortemente coerenti con l’evidenza empirica. Ma senza entrare eccessivamente nella valutazione dei molteplici risultati del modello, quello che in questa sede ci interessa ancora osservare è la forma assunta dalla (25) quando viene valutata in steady state ( st = s ) e tenuto conto delle restrizioni imposte dallo stato stazionario sulla funzione λ ( st ) . Con le restrizioni del caso (vedi Campbell-Cochrane, 1999) tale funzione diventa
λ (s ) = λ (S ) =
1− S 1 = −1 S S
e dato che in steady state l’ultimo termine del lato destro della (25) sparisce, otteniamo infine 2
γ σ rf = ρ + γ g c − c S 2
2
(26)
Un confronto con la (8) mette subito in evidenza che in questo caso nell’ultimo termine, quello relativo al risparmio precauzionale (o alla volatilità del consumo), compare ancora il coefficiente di avversione relativa
34
al rischio (elevato al quadrato), ma tale coefficiente ora non è più pari a γ e non è più costante. Il parametro relativo alla curvatura della funzione di utilità ( γ ) rimane invece presente anche in questo caso nel termine relativo alla crescita del consumo. Il punto, come già evidenziato precedentemente, è che ora è possibile avere un tasso risk-free pari a quello osservato empiricamente, in quanto γ , tramite il tasso di crescita del consumo, ha sì un impatto positivo sul tasso d’interesse, ma a riportare tale variabile verso il basso, fino ad un livello prossimo all’1%, provvede l’elevata avversione al rischio associata al precautionary saving term. Infatti, il valore di steady state di S implicato dalla scelta dei parametri del modello è pari a 0.057 e, tenuto conto che γ = 2 , abbiamo che γ / S = 35 . La cosa da sottolineare è che con γ = 2 l’effetto di una variazione del tasso di crescita del consumo sul tasso risk-free non è così forte come nel caso della (8), dove per risolvere il puzzle avevamo bisogno di un valore di γ pari a 28.3. Inoltre, il fatto che anche una piccola variazione nella crescita del consumo abbia un così forte impatto sui tassi d’interesse, come quello implicato dalla (8) con γ = 28.3 , non è assolutamente riscontrabile nei dati empirici. La (26), con i valori suddetti dei parametri in questione, è in grado di evitare questo importante problema. Poi però anche in questo caso, come nei modelli C-CAPM senza habit formation, è necessaria un’avversione relativa al rischio ( γ / S ) elevata per replicare il risk-free rate, con la differenza però che tale avversione ora non coincide più con il parametro che modella le preferenze dell’individuo. Lo stesso discorso vale anche nel caso dell’equity premium. Quanto appena detto può forse essere compreso maggiormente in un altro modo. Semplificando notevolmente l’equazione che descrive la dinamica dell’habit è possibile ottenere un’espressione esplicita anche per il tasso di rendimento dell’attività rischiosa e, quindi, un’espressione per l’equity premium analoga alla (9). Le due semplificazioni che utilizziamo sono le seguenti:27
δ =1
λ ( st ) = φ In altre parole, supponiamo che la persistenza del surplus consumption ratio sia massima e che la funzione di sensibilità sia costante. La (24) diventa quindi
st +1 = st + φε t +1 ⇒ ∆st +1 = φε t +1
27
Vedi Bagliano-Bertola (1999).
35
(27)
Risolvendo il classico problema di massimizzazione intertemporale del consumatore rappresentativo e tenendo conto della (23) e della (27), perveniamo alle due seguenti equazioni:
rf = ρ + γ g c −
Et rti+1 − rf +
σ i2 2
γ 2 (1 + φ ) 2 σ c2 2
28
= γ (1 + φ )Cov(i, c)
(28)
(29)
Notiamo subito che se φ = 1/ S − 1 , come è logico attendersi, la (28) e la (26) coincidono, e la (29) diventa
Et rti+1 − rf +
σ i2 2
=
γ S
Cov(i, c)
(30)
Confrontando le espressioni (28) e (29) con quelle analoghe (8) e (9), si nota subito la novità rappresentata dal parametro φ , il quale, come già visto, misura la sensibilità della norma di consumo alle innovazioni ε nel consumo aggregato. Come influisce questo parametro sui rendimenti? Per la (28) vale ovviamente il discorso già fatto a proposito della (26). Dalla (29) notiamo che un aumento di φ amplifica l’effetto che la covarianza tra rendimento rischioso e tasso di crescita del consumo esercita sull’equity premium. Questo effetto, come nella sezione 2, rimane chiaramente tanto più intenso quanto più elevato è γ . Ma è importante notare che questo effetto sul premio azionario si manifesta tramite la riduzione del tasso riskfree. Infatti dalla (28) notiamo che un aumento di φ riduce il tasso sui titoli privi di rischio. Un aumento di φ va ad aumentare l’importanza della motivazione precauzionale al risparmio, incentivando così l’agente economico a risparmiare accumulando attività finanziarie risk-free per il futuro. Ne conseguirà un aumento dei prezzi delle attività e quindi una diminuzione dei tassi d’interesse. Con riferimento alla (30) notiamo infine che, al fine di replicare il premio azionario, attraverso l’amplificazione degli effetti della covarianza tra rendimenti e consumo, la misura dell’avversione al rischio necessaria è, anche in questo caso, come già evidenziato, molto elevata ( γ / S = 35). Ciò conferma la difficoltà della classe di modelli visti fino ad ora, compresi quindi anche i modelli con habit formation, di spiegare i paradossi dei mercati finanziari senza ricorrere a gradi di avversione al rischio particolarmente elevati. 28
E’ evidente che tale equazione poteva anche essere ottenuta facendo le modifiche di cui sopra direttamente nella (25).
36
6 Considerazioni conclusive Nei modelli visti, i movimenti dei rendimenti sono sostanzialmente spiegati da variazioni nell’avversione al rischio (e questo è logico e comprensibile), ma il punto cruciale è che la variazione nell’avversione al rischio degli investitori dipende da come il livello del consumo si muove in relazione ai rendimenti azionari. In altre parole, in tali modelli (C-CAPM puro o con habit formation) il rischio dell’investire in azioni è legato alla covarianza tra il rendimento di queste ultime e il tasso di crescita del consumo. Se ad esempio i mercati azionari registrano una caduta, i rendimenti diminuiranno, e come conseguenza della supposta correlazione positiva tra questi ultimi e il consumo, diminuiranno anche i livelli di Ct . La diminuzione del consumo comporterà un aumento dell’avversione al rischio da parte del consumatore/investitore, il quale, per detenere attività rischiose, pretenderà in equilibrio un premio per il rischio maggiore. Ma quanto appena detto ha come presupposto fondamentale l’assunto che la variazione del consumo sia fortemente correlata con l’andamento dei rendimenti: i dati ci dicono però il contrario, ossia che la correlazione fra consumo e rendimenti è molto debole; nulla quindi garantisce che ad una diminuzione dei rendimenti azionari debba necessariamente seguire anche una riduzione dei consumi e conseguentemente un aumento dell’avversione al rischio e dell’equity premium. Ciò che appare quindi necessario, nelle varie versioni del modello CCAPM, è una “forza” che sia in grado di generare variazioni del grado di avversione al rischio indipendenti, del tutto o in parte, dalle fluttuazioni del consumo. Compito assai arduo se si tiene conto del fatto che la funzione di utilità dell’agente rappresentativo dipende esclusivamente dai suoi livelli di consumo. Ma come visto nel precedente paragrafo, le cose sono già diverse nella versione del modello con habit formation: l’utilità non dipende dal livello del consumo, ma da come tale livello si muove rispetto ad una norma di riferimento, anch’essa variabile. Ciò che si ottiene è un’avversione al rischio variabile nel tempo, che spiega le fluttuazioni (la volatilità) dei mercati finanziari e il connesso premio azionario per il rischio. Un altro problema tipico dei modelli C-CAPM (anche con habit formation, ad esclusione di Campbell-Cochrane, 1999), di cui abbiamo già discusso, è poi costituito dalle problematiche legate al tasso d’interesse privo di rischio. Tali modelli, dovendo utilizzare un valore eccessivamente elevato del coefficiente di avversione (relativa) al rischio per spiegare l’equity premium, finiscono con il dover fare i conti col fatto che gli individui,
37
fortemente avversi al rischio,29 sono spinti ad equilibrare intertemporalmente le loro traiettorie di consumo, consumando più oggi e meno domani. Ciò che accade, in altre parole, è che gli individui si indebitano, contraendo prestiti al fine di aumentare il proprio consumo presente: conseguentemente il tasso d’interesse risk-free aumenta, sconfessando l’evidenza empirica che prevede invece un tasso d’interesse basso (e stabile). I modelli con habit formation forniscono una buona risposta sotto alcuni aspetti: in particolare hanno il pregio di introdurre il concetto di avversione al rischio variabile nel tempo e di utilità dipendente da una “norma” di consumo; non riescono però a rinunciare ad un livello di correlazione, tra consumo e rendimenti azionari, troppo elevato rispetto all’evidenza empirica. Esiste in letteratura, o è possibile trovare un modo alternativo per dare sostanza all’idea che l’investitore può trarre utilità anche da una “fonte” diversa da quella del consumo? In altri termini: nel tentativo di generare variazioni del grado di avversione al rischio indipendenti dalle fluttuazioni del consumo, è possibile trovare una forma della funzione di utilità che non dipenda esclusivamente da esso? Recenti modelli di Behavioral Finance (Finanza Comportamentale) tentano proprio di compiere tale operazione, allontanandosi però dall’ipotesi di perfetta razionalità degli agenti economici.
29
E con un’elasticità di sostituzione intertemporale molto bassa.
38
APPENDICE MATEMATICA A.1.1) Equazione di Bellman e Equazioni di Eulero. Seguendo il framework di Lucas (1978), il consumatore rappresentativo fronteggia il seguente problema di massimizzazione intertemporale: ∞ t E0 ∑ β u (Ct ) Max t =0 {ct }t∞= 0
s.t. (o anche
pt At +1 = ( pt + dt ) At − Ct n
∑
pit Ati+1
i =1
(A.1)
n
= ∑ ( pit + dit ) Ati − Ct ) i =1
dato
A0
dove At +1 è un vettore n × 1 contenente il numero di assets (trees) detenute dal consumatore all’inizio del periodo t + 1 (quindi detenute tra t e t + 1 ), pt è il vettore 1 × n dei prezzi delle attività, d è il vettore 1× n dei dividendi (i frutti degli alberi) e C è il livello di consumo dell’agente rappresentativo. Normalizzando ad 1 il numero delle attività finanziarie è però possibile ragionare come se A , p e d non fossero vettori, bensì semplici scalari. Vediamo ora come è possibile ottenere il vincolo di bilancio della sezione 2,
Wt +1 = Rt +1 (Wt − Ct ) , partendo dal vincolo (A.1). Notiamo che la ricchezza finanziaria individuale complessiva è data da
Wt = ( pt + d t ) At Al tempo t + 1 avremo quindi
39
(A.2)
Wt +1 = ( pt +1 + dt +1 ) At +1
(A.3)
Dalle (A.1)-(A.2) segue che
pt At +1 = Wt − Ct ⇒ At +1 =
Wt − Ct pt
(A.4)
Sostituendo questa espressione nella (A.3) abbiamo p +d Wt +1 = t +1 t +1 (Wt − Ct ) pt
(A.5)
Ed è semplice vedere che, per definizione,
pt +1 + dt +1 = (1 + rt +1 ) ≡ Rt +1 pt
(A.6)
Questo segue dal fatto che
rt +1 =
( pt +1 − pt ) + dt +1 pt +1 + dt +1 p +d = − 1 ⇒ 1 + rt +1 ≡ Rt +1 = t +1 t +1 pt pt pt
Combinando la (A.5) e la (A.6) otteniamo il vincolo di bilancio intertemporale in forma “standard”, come nella sezione 2:
Wt +1 = Rt +1 (Wt − Ct ) Possiamo quindi riformulare il “nostro” problema nel seguente modo: ∞ t E0 ∑ β u (Ct ) Max t =0 {ct }t∞= 0
s.t.
Wt +1 = Rt +1 (Wt − Ct ) W0 dato
40
(A.7)
Wt +1 ≥ 0 lim t t →∞ ∏ Rs s =0 Ma sfruttando la natura recursiva di tale problema, possiamo riscriverlo ancora in un altro modo, utilizzando la cosiddetta Bellman Equation:30
Vt (Wt ) =
Max {u (Ct ) + β Et [Vt +1 (Wt +1 )]}
(A.8)
∞ ct ,Wt +1 t = 0
{
}
Wt +1 = Rt +1 (Wt − Ct )
s.t.
Wt dato Wt +1 ≥ 0 dove Vt (Wt ) è la funzione valore (optimal value function) che risolve il problema di massimizzazione (A.8) e il problema (A.7) valutato al tempo t .31 Sostituendo il vincolo di bilancio nella (A.8) otteniamo
{
}
Vt (Wt ) = Max u (Ct ) + β Et Vt +1 ( Rt +1 (Wt − Ct ) ) ∞
{ct }t = 0
(A.9)
Ora, differenziando la (A.9) rispetto Ct otteniamo la first order condition (FOC) del problema: ∂Vt (Wt ) ∂W = u '(Ct ) + β Et Vt +1 '(Wt +1 ) t +1 = 0 ∂Ct ∂Ct
⇒ dove
u '(Ct ) = β Et [Vt +1 '(Wt +1 ) Rt +1 ]
⇒ (A.10)
∂Wt +1 = − Rt +1 . ∂Ct
30
Si vedano ad esempio Stokey-Lucas (1989), Ljungqvist-Sargent (2000), Cugno-Montrucchio (1998) e Bagliano-Bertola (1999) per ulteriori dettagli sui metodi di programmazione (ottimizzazione) dinamica. 31 Ovviamente al tempo 0 il problema (A.7) è risolto dalla optimal value function V 0 (W 0 ) .
41
Dobbiamo ora determinare Vt +1 '(Wt +1 ) . Possiamo farlo differenziando la (A.8) rispetto a Wt :
∂Vt (Wt ) ∂C ∂W = Vt '(Wt ) = u '(Ct ) t + β Et Vt +1 '(Wt +1 ) t +1 + ∂Wt ∂Wt ∂Wt ∂W ∂Ct + β Et Vt +1 '(Wt +1 ) t +1 ∂Ct ∂Wt Dal vincolo di bilancio sappiamo che ∂Wt +1 / ∂Wt = Rt +1 e ∂Wt +1 / ∂Ct = − Rt +1 . Utilizzando questi risultati avremo: Vt '(Wt ) =
∂Ct {u '(Ct ) − β Et [Vt +1 '(Wt +1 ) Rt +1 ]} + β Et [Vt +1 '(Wt +1 ) Rt +1 ] ∂Wt
Sfruttano la FOC (A.10) notiamo che il termine in parentesi graffe è uguale a zero. Quindi abbiamo Vt '(Wt ) = β Et [Vt +1 '(Wt +1 ) Rt +1 ]
e utilizzando ancora la (A.10)
Vt '(Wt ) = u '(Ct )
(A.11)
Valutando questa espressione al tempo t + 1 otteniamo
Vt +1 '(Wt +1 ) = u '(Ct +1 )
(A.12)
Sostituendo la (A.12) nella (A.10) otteniamo ciò che volevamo, ossia l’equazione di Eulero della sezione 2, valida per l’i-esima attività:
u '(Ct ) = β Et Rti+1u '(Ct +1 ) Possiamo anche riscriverla così:
u '(Ct +1 ) 1 = β Et Rti+1 u '(Ct ) Con preferenze CRRA,
42
u (C ) =
C1−γ − 1 , 1− γ
abbiamo
e
−γ i Ct +1 1 = β Et Rt +1 C t
(risky asset)
C −γ 1 = β R f Et t +1 Ct
(safe asset).
43
A.1.2) Equazioni di Eulero logaritmiche. Vediamo come si ricavano le equazioni (7) e (8), dalle quali poi si ricava la (9). Vediamo prima come si passa dalla (5) alla (7). La (5) è −γ i Ct +1 1 = β Et Rt +1 C t
(5)
Come detto nella sezione 2, sfruttiamo il fatto che per una variabile casuale X che ha distribuzione lognormale e omoschedastica vale la seguente proprietà:
1 log Et ( X ) = Et (log X ) + Var ( log X − Et (log X ) ) 2 Nel caso della (5) la nostra X , date le ipotesi fatte sulla distribuzione congiunta di consumo e rendimenti, è costituita da C Rti+1 t +1 Ct
−γ
Prendendo i logaritmi nella (5) e applicando la suddetta proprietà otteniamo:32 −γ i Ct +1 0 = ln( β ) + ln Et Rt +1 Ct
(B.1)
Sviluppiamo ora solo il secondo membro del lato destro. Abbiamo: −γ i Ct +1 i ln Et Rt +1 = Et rt +1 − γ (ct +1 − ct ) Ct 1 + Var rti+1 − γ (ct +1 − ct ) − Et rti+1 − γ (ct +1 − ct ) = 2
{
32
(
)}
Lavoriamo con i logaritmi naturali, quindi d’ora in poi useremo il simbolo “ln” e non “log”.
44
= Et rti+1 − γ Et (∆ct +1 ) +
{
}
1 Var (rti+1 − Et rti+1 ) − γ (ct +1 − Et ct +1 ) 2
(B.2)
Guardiamo ora a ciò che sta tra le parentesi graffe, ossia alla Var [•] . Supponendo che Z = rti+1 − Et rti+1
Y = ct +1 − Et ct +1
e
per le propietà della varianza abbiamo
Var ( Z − γ Y ) = Var ( Z ) + Var (γ Y ) − 2Cov( Z , γ Y ) = = Var ( Z ) + γ 2Var (Y ) − 2γ Cov( Z , Y ) Nel nostro caso avremo:
Var ( Z − γ Y ) = Var (rti+1 − Et rti+1 ) + γ 2 [Var (ct +1 − Et ct +1 ) ] −2γ Cov(rti+1 − Et rti+1 , ct +1 − Et ct +1 ) Ora, considerando che i valori attesi sono delle costanti, possiamo scrivere
Var ( Z − γ Y ) = Var (rti+1 ) + γ 2 [Var (ct +1 ) ] − 2γ Cov(rti+1 , ct +1 )
(B.3)
dove Var (rti+1 ) = Var (rti+1 − Et rti+1 )
Var (ct +1 ) = Var (ct +1 − Et ct +1 ) Cov(rti+1 , ct +1 ) = Cov(rti+1 − Et rti+1 , ct +1 − Et ct +1 )
Possiamo quindi riscrivere la (B.3) nel seguente modo: Var ( Z − γ Y ) = σ i2 + γ 2σ c2 − 2γσ ic
con
45
(B.4)
σ i2 = Var (rti+1 ) ,
σ c2 = Var (ct +1 ) ,
σ ic = Cov(rti+1 , ct +1 ) .
A questo punto, sostituendo la (B.4) nella (B.2) e recuperando la (B.1), dopo aver sistemato i termini esplicitando l’equazione per il rendimento azionario atteso, otteniamo la (7):
Et rti+1
=−
σ i2 2
+ ρ + γ Et ( ∆ct +1 ) −
γ 2σ c2 2
+ γσ ic
(7)
Si tenga presente che abbiamo usato, come ovunque nel testo, l’approssimazione
1 ln( β ) = ln = 0 − ln(1 + ρ ) ≅ − ρ 1+ ρ Nello stesso modo passiamo dalla (6) alla (8), anche se ora le cose sono un po’ più semplici. La (6) è
C −γ 1 = β R f Et t +1 Ct
(6)
Prendendo i logaritmi da ambo le parti abbiamo
0 = ln( β ) + r f − γ Et (∆ct +1 ) +
1 {Var [ −γ (ct +1 − Et ct +1 )]} = 2
= − ρ + r f − γ Et (∆ct +1 ) +
⇒
r f = ρ + γ Et ( ∆ct +1 ) −
(
)
1 2 2 γ σc ⇒ 2
γ 2σ c2 2
L’ultima espressione è appunto la (8). Sottraendo la (8) dalla (7) otteniamo la (9):
Et rti+1 − r f +
σ i2 2
46
= γ Cov(i, c) .
2 ASSET PRICING E MODELLI DI FINANZA COMPORTAMENTALE 1 Introduzione Nel capitolo precedente abbiamo visto una breve rassegna dei principali contributi in tema di asset pricing e consumo, con tutto ciò che ne deriva circa le implicazioni in termini di “paradossi” dei mercati finanziari (equity premium e risk-free rate puzzles). In questo capitolo spostiamo l’attenzione sui modelli di finanza comportamentale (Behavioral Finance): si tratta di una recente linea di ricerca, in forte espansione, che tenta di rendere conto di alcune tematiche tipiche dell’economia finanziaria ricorrendo all’utilizzo di modelli popolati da agenti economici “non pienamente” razionali. Basandosi sui risultati di alcune indagini sperimentali connesse alla psicologia degli investitori, tramite varie considerazioni viene infatti introdotto il concetto di “razionalità limitata”, dal quale discendono poi tutta una serie di interessanti implicazioni. In questa sede ci occuperemo però solo di alcuni contributi, strumentali agli scopi del presente lavoro, che si focalizzano specificamente sul comportamento aggregato del mercato azionario.33 Analizzeremo in particolare un contributo molto recente che ha sviluppato un approccio che appare assai promettente e getta le basi per tutta una serie di interessanti sviluppi. Nel tentativo di costruire un modello che descriva meglio la realtà dei dati, Barberis-Huang-Santos (2001)34 propongono un nuovo approccio, evitando di continuare nell’ulteriore affinamento dei tradizionali modelli basati sul consumo, con o senza habit formation. Viene proposta una fonte addizionale dalla quale il consumatore/investitore rappresentativo può trarre utilità. L’idea di fondo è la seguente: l’agente economico trae utilità non solo dal consumo, ma anche dalle fluttuazioni della propria ricchezza finanziaria. In particolare, sono proprio tali fluttuazioni a influenzare in maniera determinante l’avversione al rischio degli investitori, indipendentemente dalla loro correlazione con l’evoluzione del consumo. Tale idea ha le sue radici nel contributo di 33
Per una rassegna esaustiva dei contributi di Behavioral Finance si veda Barberis-Thaler (2003); per una rassegna specificamente mirata sul comportamento aggregato dei mercati azionari si veda Stracca (2002a). 34 Nel seguito della trattazione useremo l’acronimo BHS.
47
Kahneman-Tversky (1979), col quale fu introdotta la cosiddetta “utilità dei prospetti” (prospect theory): utilità che deriva all’agente economico non dal livello della ricchezza (o consumo) ma dalle sue fluttuazioni, misurate rispetto ad un livello di riferimento. La funzione di utilità viene quindi definita su guadagni e perdite. Nella sua versione più semplice, abbiamo una funzione del seguente tipo:
x U ( x) = λx
se
x≥0 x<0
λ >1
La forma funzionale proposta cattura anche la cosiddetta avversione alla perdita (loss aversion), ossia il fatto che l’agente è maggiormente sensibile a diminuzioni della propria ricchezza piuttosto che ad aumenti in essa. Del resto è semplice verificare che
dU ( x) = λ > 1 se x < 0 dx
dU ( x) = 1 se x ≥ 0 dx
Tale approccio ovviamente contrasta con i modelli di asset pricing tradizionali, nei quali viene supposto che, nel compiere le loro scelte di portafoglio, gli agenti economici tengano conto unicamente della loro utilità futura derivante dai livelli di consumo. Ma oramai esistono in letteratura numerosi contributi che dimostrano, tramite varie argomentazioni teoriche ed indagini sperimentali, che le spiegazioni standard comunemente accettate circa le attitudini degli individui nei confronti del rischio, sono ampiamente discutibili ed errate sotto vari aspetti (cfr. Rabin, 1998, 2002). Come sottolinea Rabin (2002), “….Our attitudes towards risk are driven instead primarily by attitudes towards change in wealth levels.” Nell’approccio BHS l’idea di fondo è che il consumatore/investitore può rimanere fortemente “amareggiato” da un investimento azionario sbagliato: un brusco ribasso di borsa comporta una marcata diminuzione del suo stock di ricchezza azionaria, facendolo sentire un investitore di “quart’ordine” o comunque di scarso livello. In altri termini, insorge un rimpianto nei confronti della scelta d’investimento effettuata. Tale impostazione teorica fu proposto inizialmente da Shlomo Benartzi e Richard Thaler, in un contributo sul Quarterly Journal of Economics nel 1995. Nel tentativo di fornire una possibile spiegazione per il paradosso del premio azionario, essi documentano che l’investitore medio verifica l’andamento del suo portafoglio almeno una volta all’anno e, su un arco temporale simile, può capitare di frequente che le azioni abbiano un rendimento inferiore ai bonds, anche se poi quando crescono di valore sono in grado di recuperare la perdita “con gli interessi”. Ma ciò che viene sottolineato è che se gli investitori valutano il rendimento dei loro investimenti ogni anno e sono avversi alla perdita, è ragionevole ipotizzare che essi desiderino un premio elevato per
48
aver affrontato il rischio di scoprire che i loro investimenti sono “in rosso”. L’analisi di Benartzi-Thaler è però uniperiodale, ossia statica, con tutti i limiti che tale tipo di analisi comporta; in BHS (2001) abbiamo invece un’analisi dinamica (intertemporale). In questi ultimi anni tale approccio è stato comunque aggiornato in varie direzioni e “terminologicamente” ridefinito:35 si parla ora spesso di loss aversion/narrow framing approach, a volte solo di approccio narrow framing.36 Detto in breve, e con riferimento al contesto della nostra trattazione, con il termine narrow framing si intende la valutazione isolata (ossia separata rispetto ad altre opportunità) di determinati investimenti finanziari. Tale campo di ricerca è comunque in grande fermento ed avremo modo in seguito di chiarire e dibattere meglio le questioni terminologiche.
2 Il modello BHS Vediamo ora nelle sue linee essenziali37 il contributo BHS (2001). In un contesto di equilibrio economico generale e mercati completi, si tenta di fornire una possibile soluzione ai vari paradossi dei mercati finanziari. Punto fondamentale dell’intera impostazione è che la fonte di utilità addizionale proposta “cattura” in particolare due ingredienti: a) come già detto, l’investitore “reagisce” maggiormente a riduzioni nella sua ricchezza finanziaria che ad aumenti in essa; in altre parole, la sensibilità manifestata di fronte a perdite di una certa entità è maggiore rispetto alla sensibilità manifestata nei confronti di guadagni di uguali proporzioni: questa caratteristica prende il nome di loss aversion; b) il grado di avversione alla perdita dell’investitore dipende dalle sue precedenti performances d’investimento finanziario: se in passato ha conseguito guadagni, una perdita conseguita oggi sarà più sopportabile (meno dolorosa); se in passato sul mercato azionario ha subito perdite, la loss aversion aumenta e quindi ci sarà maggiore avversione a ulteriori perdite correnti e future. Tale modello affonda le sue radici in due idee dovute agli studi di psicologia applicata alle scienze economiche. Come già menzionato, in un 35
Principalmente dai seguenti autori: Nicholas Barberis, Ming Huang, Richard Thaler, Tano Santos. Si vedano Barberis-Huang (2004a, 2004b). 37 Per aspetti ritenuti (da chi scrive) marginali o puramente analitici si rimanderà invece all’articolo originale. 36
49
articolo del 1979 pubblicato su Econometrica, Kahneman e Tversky proposero una teoria descrittiva per spiegare le decisioni prese in condizioni di incertezza (e tale teoria prese il nome di prospect theory): il tentativo era quello di spiegare le numerose incongruenze della teoria dell’utilità attesa. I due autori ricorsero all’idea che le persone assegnano molta importanza alle variazioni nella propria ricchezza finanziaria e che sono fortemente avverse nei confronti di variazioni negative in essa. L’idea di cui al punto b può invece farsi risalire a Thaler-Johnson (1990): essi trovarono evidenza sperimentale del fatto che, quando a delle persone vengono sottoposte in sequenza delle “scommesse” (gambles)38, tali persone sono più propense a correre rischi (meno avverse al rischio) se nelle scommesse precedenti hanno conseguito dei guadagni piuttosto che delle perdite (e sono quindi più avverse al rischio se nelle scommesse precedenti hanno subito perdite). In altre parole, le perdite nelle scommesse sono meno dolorose se sopraggiungono dopo precedenti guadagni, sono invece più dolorose se si sommano a precedenti perdite. Riassumendo, da tutto ciò emerge l’idea che determinati risultati passati possono influire notevolmente sulle scelte rischiose correnti e future. In BHS abbiamo quindi un primo tentativo, nell’ambito di questa letteratura, di indagare gli aspetti dinamici dell’avversione alla perdita e le sue implicazioni sulla scelta individuale. In particolare, in un modello che tiene conto di tali aspetti dinamici, c’è la possibilità di rendere conto della volatilità dei rendimenti azionari e della loro predicibilità, cosa invece assai problematica in un framework che non tenga conto delle determinanti della loss aversion. Ma se questo da un lato rende il modello più completo, dall’altro è portatore di una serie di complicazioni analitiche non indifferenti.39 Per questo motivo gli stessi autori, in alcuni lavori successivi, abbandonano l’idea di indagare ulteriormente gli aspetti dinamici dell’avversione alla perdita, rinunciando così a spiegare la volatilità azionaria, ottenendo però in compenso un modello più eclettico, valido in un contesto di equilibrio generale ma anche di equilibrio parziale (scelta di portafoglio). Vedremo tali lavori nella seconda parte di questo capitolo (paragrafi 4 e 5). Vediamo ora il modello BHS. Siamo in un framework alla Lucas (1978), come quello visto nel secondo paragrafo del capitolo 1 (sezione 1.2). Per semplicità, come spesso fatto in letteratura, viene ipotizzata l’esistenza di due sole attività finanziarie: un’attività rischiosa che rende un tasso lordo (fattore di interesse) Rt +1 = 1 + rt +1 tra t e t+1 e un’attività dal rendimento certo R f .40
38
Ovviamente in quanto scommesse si tratta di “giochi” che comportano determinati gradi di rischio. Complicazioni legate in particolare alla soluzione numerica del modello e alle connesse tecniche computazionali: ma in questa sede non le indagheremo. Rimandiamo il lettore interessato a BHS (2001). 40 Possiamo evitare di mettere l’indice temporale al tasso risk-free in quanto esso è conosciuto con certezza in ogni periodo. 39
50
L’attività rischiosa fornisce nel tempo un flusso di dividendi {Dt } che evolve secondo il seguente tasso di crescita stocastico: D log t +1 = g D + σ D ε t +1 Dt
con ε t +1 ≈ i.i.d .N (0,1)
(31)
La novità rilevante del modello emerge nel definire le preferenze dell’agente rappresentativo, al fine di catturare le idee sovra-esposte. Il consumatore/investitore fronteggia, su un orizzonte temporale infinito, il seguente problema di massimizzazione intertemporale:
∞ t Ct1−γ t +1 + β β ( , , ) E b v X S z ∑ 0 + 1 t t t t Max Ct , St t =0 1 − γ s.t. con
(32)
Wt +1 = RW , t +1 (Wt − Ct )
(
RW , t +1 = θ S , t Rt +1 + (1 − θ S , t ) R f
)
dove θ S, t è la quota di risparmio che l’agente destina al tempo t all’attività rischiosa (l’azione), mentre 1 − θ S , t è ovviamente la quota di risparmio destinata all’attività priva di rischio.41 Quale novità emerge dalla funzione di utilità? Il primo termine è quello standard che ritroviamo negli usuali modelli di asset pricing; la novità risiede nel secondo termine. Tale termine, v( X t +1 , S t , zt ) , rappresenta l’utilità derivante dalle fluttuazioni nel valore della ricchezza azionaria dell’individuo: in altre parole, le fluttuazioni nella sua ricchezza finanziaria rischiosa.42 In particolare, X t +1 rappresenta l’entità del guadagno o della perdita conseguita dall’agente sugli investimenti azionari fra t e t+1. L’utilità (disutilità) derivante all’investitore da tale guadagno (perdita) è misurata quindi dalla funzione v(⋅ ⋅ ⋅) . E’ immediato notare che v non è solo funzione di X t +1 ma anche di S t e zt , dove S t è il valore delle azioni detenute dall’investitore al tempo t, mentre zt è una variabile che misura le perdite o i guadagni conseguiti dall’investitore prima del tempo t. Ma vediamo di capire meglio e per passi successivi il significato delle variabili X e z .
41
Si ipotizza però che l’attività risk-free sia in zero-net supply, ossia in offerta netta pari a zero: ciò significa che θ S ,t = 1 .
42
Vengono tenute in conto solo le fluttuazioni dell’attività rischiosa perché il rendimento dell’attività risk-free al tempo t+1 è conosciuto con certezza già al tempo t: non c’è quindi nessun particolare elemento di rischio nelle variazioni della safe asset.
51
In prima approssimazione potremmo concordare sul fatto che sarebbe ragionevole supporre che il guadagno o la perdita derivante dagli investimenti azionari dell’individuo, in t+1, sia pari a
X t +1 = St Rt +1 − St
(33)
Ossia, considerare la differenza (positiva o negativa) tra ciò che rende al tempo t+1 il risparmio opportunamente investito e la ricchezza iniziale St . Ma BHS (2001) adottano una formulazione leggermente diversa:
X t +1 = St Rt +1 − S t R f = S t ( Rt +1 − R f )
(34)
Il livello di riferimento per misurare il guadagno o la perdita è dato quindi dal valore iniziale dell’attività finanziaria, parametrizzato però col tasso riskfree. Come si evince dalla (34), l’idea è che l’investitore sarà insoddisfatto se Rt +1 < R f e soddisfatto viceversa. Tale formulazione ha inoltre il pregio di rendere indifferente, nel valutare i guadagni e le perdite, il fatto di basarsi sulle fluttuazioni della ricchezza finanziaria complessiva (attività priva di rischio + attività rischiosa) o solo su quelle dell’attività “rischiosa”. Infatti, se Bt e St sono, rispettivamente, le quantità di bonds e di azioni detenute dall’investitore, supponendo di considerare le variazioni nella ricchezza finanziaria totale, secondo il criterio postulato nella (34) avremo
X t +1 = ( S t Rt +1 + Bt R f ) − ( S t + Bt ) R f = S t Rt +1 − S t R f = S t ( Rt +1 − R f ) Occupiamoci ora di z . Essa rappresenta la variabile di stato (stocastica) del modello, ed è definita nel seguente modo:
zt =
Zt St
Cos’è Z t ? Tale variabile rappresenta un livello di benchmark storico al quale l’investitore si riferisce per misurare la dimensione dell’utilità ricevuta dal guadagno o dalla perdita.43 Per alcuni investitori questo livello di riferimento può essere ad esempio una media di prezzi azionari recenti, per altri può invece essere il prezzo di un’azione in un particolare momento, ad esempio alla fine dell’anno. L’idea è comunque la seguente: in determinati momenti l’investitore confronta tale livello di riferimento con il suo stock di ricchezza 43
Notare che S t R f si differenzia da Z t perché è un livello di riferimento che determina la dimensione del guadagno/perdita, ma non la dimensione dell’utilità da esso ricevuta.
52
finanziaria rischiosa S t , al fine di valutare se ha conseguito guadagni o perdite sui mercati azionari. L’inclusione di S t e Z t come argomenti di v consente quindi alle performances d’investimento passate di influenzare il modo in cui sono vissute dall’investitore eventuali perdite future e quindi di influenzare e di far variare nel tempo la sua propensione/avversione al rischio. Per esigenze tecnico-analitiche, all’interno di v(...) è però preferibile usare zt (cfr. BHS, 2001). Una questione di notevole importanza è costituita poi dalla frequenza con la quale l’investitore fa il punto circa la sua situazione finanziaria. In altri termini: in quali periodi e con quale frequenza l’investitore valuta se sta guadagnando o perdendo? BHS (2001) seguono i risultati ottenuti da Benartzi-Thaler (1995), considerando l’anno come frequenza di valutazione “standard”. E’ vero che negli investimenti di tipo azionario generalmente l’orizzonte temporale di riferimento è piuttosto lungo, 3-5 anni o più, ma è comunque ragionevole supporre che almeno una volta all’anno l’individuo controlli seriamente le performances registrate dai suoi investimenti finanziari. Questa valutazione è del resto corroborata da una serie di elementi: siamo abituati a pagare le tasse una volta all’anno, riceviamo il report più dettagliato relativo ai nostri investimenti una volta all’anno e gli investitori istituzionali monitorano le performances dei loro gestori su base annuale (cfr. BHS, 2001). Vediamo ora come viene specificata la funzione v( X t +1 , S t , zt ) . Essa avrà una determinata specificazione a seconda del valore di zt . Abbiamo tre casi: zt = 1 (né guadagni né perdite precedenti), zt < 1 (precedenti guadagni) e zt > 1 (precedenti perdite). Nella Figura 1 sono rappresentati i 3 casi in un classico grafico ad assi cartesiani. Ovviamente, per valori positivi di X t +1 (siamo nel primo quadrante), ciò che è successo in passato non fa alcuna differenza, e quindi la funzione è unica. Le cose invece cambiano quando si considera ciò che accade nel terzo quadrante, quello relativo alle perdite ( X t +1 < 0 ). In questo caso abbiamo tre situazioni diverse, a seconda delle performances d’investimento passate. Notiamo che la forma della funzione riassume la caratteristica fondamentale delle preferenze dell’agente economico, ossia la maggiore sensibilità alle diminuzioni nella propria ricchezza piuttosto che ad aumenti in essa: si tratta, come già visto, della cosiddetta loss aversion. E’ anche visibile la cuspide che vi è nell’origine degli assi. Nel caso in cui zt < 1 (linea in neretto) l’investitore ha a disposizione una riserva di precedenti guadagni accumulati sugli investimenti azionari: questo significa che inizialmente eventuali perdite non sono così penalizzanti (le riserve di passati guadagni aiutano ad ammortizzarle), ma poi cominciano invece ad essere sempre più penalizzanti e quindi a fornire un sempre maggior livello di disutilità.
53
Formalmente, per il caso zt ≤ 1 , onnicomprensivo di due situazioni diverse (ne guadagni ne perdite passate; passati guadagni), abbiamo la seguente espressione:
v ( X t +1 , S t , z t ) = S t Rt +1 − S t R f = X t +1 S t ( zt R f − R f ) + λS t ( Rt +1 − zt R f )
con
Rt +1 ≥ zt R f
(35)
Rt +1 < zt R f
dove il parametro λ è maggiore di 1 e controlla la loss aversion dell’investitore. Nel caso in cui zt = 1 l’espressione (35) si riduce a X t +1 v( X t +1 , S t ,1) = λX t +1
con
Rt +1 ≥ R f ⇒ X t +1 ≥ 0
(36)
Rt +1 < R f ⇒ X t +1 < 0
E’ immediato notare che, rispetto alla (35), la (36) risulta più intuitiva e di più facile comprensione, soprattutto con riferimento alla Figura 1.
v(⋅)
X t +1 (Gain/Loss)
zt < 1 zt = 1 zt > 1
Figura 1
54
Abbiamo infine il caso rappresentato con la linea tratteggiata, zt > 1 . In questo caso la funzione v assume la seguente forma: X t +1 v ( X t +1 , S t , z t ) = λ ( zt ) X t +1
Rt +1 ≥ R f ⇒ X t +1 ≥ 0
con
Rt +1 < R f ⇒ X t +1 < 0
(37)
dove il valore di X t +1 è ovviamente dato dalla (34). Notiamo che λ ( z t ) > λ , e che λ ( zt ) è in questo caso non un semplice parametro che misura l’avversione alla perdita, bensì una funzione di penalizzazione dipendente dalle dimensioni delle perdite precedenti, misurate da zt :
λ ( zt ) = λ + k ( zt − 1)
(38)
con λ > 1 e k > 0 . Va sottolineato che la forma funzionale della (38) è quella scelta da BHS (2001), relativamente semplice, ma è possibile proporne altre più elaborate. Ma in questa sede ciò che ci preme sottolineare è semplicemente l’idea di fondo delle (37)-(38): più elevate sono le dimensioni delle perdite passate (ossia maggiore è zt ), più dolorose saranno le perdite future (o, in altri termini, maggiore sarà l’avversione alla perdita). Il parametro k misura quindi l’intensità dell’aumento dell’avversione alla perdita registrato dall’individuo dopo perdite passate. Rimane da specificare come il benchmark storico Z t reagisce a variazioni nel valore della ricchezza azionaria S t : detto in altri termini, dobbiamo specificare la dinamica della variabile di stato zt . In BHS (2001) viene utilizzata la seguente espressione: R + (1 − η )(1) zt +1 = η zt Rt +1
(39)
dove R è un parametro approssimativamente uguale al rendimento azionario medio registrato nel corso dell’anno e η rappresenta la memoria dell’investitore, controllando quanto sono duraturi gli effetti di precedenti guadagni/perdite relativamente al grado di condizionamento delle scelte future. E’ evidente che se η = 0 avremo zt +1 = 1 per qualunque t, e quindi l’effetto sulle scelte future di guadagni e/o perdite precedenti viene a mancare completamente: l’individuo “non ha memoria” e quindi anche eventuali perdite passate non hanno nessuna influenza sulle scelte future. Se invece η = 1 abbiamo
55
z t +1 = z t
R , Rt +1
e la memoria dell’individuo esplica così la sua massima valenza, assegnando “peso” esclusivamente al primo termine del lato destro della (39). Vediamo ora il ruolo e il significato del parametro bt . Esso è un parametro esogeno, utilizzato in parte per tarare opportunamente il modello, ma è specificato in maniera tale da contenere al suo interno anche un parametro di preferenza, cruciale per il funzionamento del modello BHS. Abbiamo:
bt = b0Ct−γ =
b0 , Ctγ
b0 ≥ 0
(40)
con Ct che rappresenta il consumo pro-capite aggregato al tempo t e risulta quindi esogeno per l’investitore. Il parametro bt è necessario e va “tarato” opportunamente perché deve assicurare che determinate quantità, come il rapporto prezzi-dividendi e l’equity premium, rimangano stazionarie al crescere della ricchezza aggregata nel tempo. A tale scopo, il consumo procapite aggregato Ct svolge un ruolo “ad hoc” di fondamentale importanza. Senza tale variabile infatti, il termine legato alla prospect theory44, al crescere della ricchezza aggregata finirebbe col dominare il termine “standard” relativo al consumo. Ma all’interno di bt , aldilà delle esigenze “ad hoc” relative alla stazionarietà delle variabili chiave, gioca un ruolo cruciale il parametro b0 , il quale consente di controllare l’importanza dell’utilità derivante dalle variazioni nella ricchezza finanziaria relativamente all’utilità derivante dal consumo. Se poniamo b0 = 0 abbiamo bt = 0 e ricadiamo così nei modelli standard di asset pricing basati sul consumo. Con b0 > 0 le cose invece cambiano. Ultimo aspetto di notevole importanza è la specificazione del rapporto prezzi-dividendi. Si ipotizza che esso sia funzione della variabile di stato zt :
Pt ≡ f t = f ( zt ) Dt Data la (41), relativamente al tasso di interesse rischioso, avremo:
44
β t +1v( X t +1, St , zt ) .
56
(41)
Rt +1 = (1 + rt +1 ) =
Pt +1 + Dt +1 1 + Pt +1 / Dt +1 Dt +1 1 + f ( z t +1 ) Dt +1 = = Pt Pt / Dt Dt f ( zt ) Dt
(42)
Abbiamo ora tutti gli “ingredienti” per analizzare e comprendere le principali proprietà della soluzione del modello. BHS (2001) caratterizzano la soluzione tramite lo studio delle equazioni di Eulero, ossia le condizioni di ottimo (del primo ordine) in un contesto di equilibrio generale. Vengono considerate due diverse Economie “artificiali”, l’Economia I e l’Economia II, e una soluzione per ogni Economia. Questo per rimarcare maggiormente le differenze tra l’approccio BHS e l’approccio basato sul consumo. Noi commenteremo in particolare i risultati relativi all’Economia II, in quanto più rilevante per gli scopi del presente lavoro.
Economia I. L’Economia I è un’economia alla Lucas (1978), quindi tipica dei modelli di asset pricing, tranne ovviamente, come visto, che per le preferenze del consumatore/investitore. Elemento fondamentale di distinzione con la successiva Economia II è che qui i processi stocastici di consumo e dividendi sono perfettamente correlati, mentre poi vedremo il caso più realistico dove tali processi sono separati e quindi solo debolmente correlati. Quando consumi e dividendi sono modellati come processi identici abbiamo che, C D log t +1 = log t +1 = g c + σ cε t +1 Ct Dt
(43)
dove ovviamente la media e la volatilità di C e D sono le stesse, g C e σ C . Notare che C è il consumo pro-capite aggregato: in equilibrio coinciderà poi con quello individuale dell’agente rappresentativo. D’ora in avanti per semplicità useremo C . Notiamo tra l’altro che combinando la (42) e la (43) abbiamo:
Rt +1 =
1 + f ( zt +1 ) gc +σ cε t+1 e f ( zt )
(44)
Caratterizzando l’equilibrio di tale economia, emerge un tasso risk-free costante ed un’equazione fondamentale di equilibrio, ottenuta dall’equazione di Eulero per l’attività rischiosa. Tale equazione viene risolta numericamente nell’incognita f (⋅) . Più in dettaglio, le due equazioni di Eulero risultano essere le seguenti:
57
(attività risk-free)
(attività rischiosa)
C −γ 1 = β R f Et t +1 Ct
(45)
−γ Ct +1 1 = β Et Rt +1 + b0 βEt [vˆ( Rt +1 , zt )] C t
(46)
dove per zt ≤ 1
vˆ( Rt +1 , zt ) =
∂v Rt +1 − R f = ∂S t ( zt R f − R f ) + λ ( Rt +1 − zt R f )
con
∂v Rt +1 − R f = ∂S t λ ( zt )( Rt +1 − R f )
con
Rt +1 ≥ zt R f Rt +1 < zt R f
e per zt > 1
vˆ( Rt +1 , zt ) =
Rt +1 ≥ R f Rt +1 < R f
La (45) si riferisce all’attività risk-free, ed è la classica condizione che ritroviamo nella letteratura dei modelli di asset pricing basati sul consumo. Da essa, usando la (43), è possibile ottenere un’espressione per il tasso privo di rischio, che risulta essere costante:
Rf =
1
β
eγg c − γ
2
σ c2 / 2
(47)
La (46) è invece l’equazione relativa all’attività rischiosa, ed è immediato notare che abbiamo una parte “nuova”, la seconda del lato destro, che non appare nella letteratura standard. In questa sede, come detto, ci limiteremo semplicemente ad analizzare e commentare i risultati ottenuti da BHS (2001) tramite esercizi di simulazione, una volta risolta l’equazione di equilibrio (risultante dalla manipolazione algebrica della 46) nell’incognita f ( z ) .45 Faremo però questo con riferimento all’Economia II.
Economia II. In questo caso consumo e dividendi seguono processi di crescita diversi. Abbiamo:
45
Per i dettagli analitici circa la derivazione delle equazioni di Eulero, le procedure iterative di risoluzione nell’incognita f (z ) e di successiva simulazione, si veda BHS (2001).
58
C log t +1 = g c + σ c ut +1 Ct D log t +1 = g D + σ D ε t +1 Dt
e
ε t ≈ i.i.d .N (0,1)
ut ≈ i.i.d .N (0,1) ,
con
Cov(ut , ε t ) = ω ,46
e
∀t
Avremo anche
Rt +1 =
1 + f ( zt +1 ) g D +σ D ε t +1 e f ( zt )
(48)
Nell’Economia II l’evoluzione nel tempo di consumo e dividendi è distinta e quindi il consumo non è costituito soltanto dalla totalità dei dividendi percepiti. Accanto al reddito finanziario avremo anche un reddito nonfinanziario, ad esempio il reddito da lavoro Yt :
Ct ≡ Dt + Yt
(49)
Anche in questo caso valgono ovviamente le equazioni di Eulero (45) e (46) e, come nel caso precedente, si ottiene un tasso privo di rischio costante ed uguale a quello dell’Economia I. Ma dalla (46), con alcune sostituzioni e manipolazioni algebriche, otteniamo in particolare la seguente equazione: 1 = β e g D −γgC +γ
σ C2 (1−ω 2 ) / 2
2
+ b0 β Et [vˆ(Rt +1 , z t )]
1 + f ( z t +1 ) (σ D −γωσ C )ε t +1 Et e + f ( zt )
(50)
Tale espressione rappresenta la condizione (del primo ordine) fondamentale, diversa da quella dell’Economia I, che caratterizza l’equilibrio dinamico del modello: come già detto, è necessario risolverla numericamente nell’incognita f (z ) , dopodiché si procede con la costruzione di dati simulati al fine di generare valori per i rendimenti azionari, il rapporto prezzi/dividendi e la loro volatilità. Segue poi il confronto con i valori empirici di tali variabili. Si noti che ω rappresenta al tempo stesso la covarianza e la correlazione dei due disturbi stocastici ε e u : data l’ipotesi di distribuzione normale standardizzata le deviazioni standard sono infatti
46
entrambe pari ad 1.
59
3 I risultati delle simulazioni: pregi del modello BHS e confronto con i modelli standard Una volta effettuate le simulazioni è possibile analizzare i pregi e i difetti del modello BHS. Nella “variante Economia II” il modello genera risultati che “clonano” bene il comportamento delle principali variabili aggregate del mercato azionario: l’elevato equity premium, l’elevata volatilità dei rendimenti azionari (mantenendo però basso e stabile il tasso d’interesse sui titoli privi di rischio)47 e la prevedibilità di lungo periodo dei rendimenti; tutto questo con una bassa correlazione fra crescita del consumo e rendimenti azionari. Vediamo le cose più in dettaglio, tramite il commento dei risultati presentati nella Tabella 2. Nella Tabella 1 sono riportati i valori dei parametri usati da BHS (2001) per calibrare il loro modello al fine di generare dati simulati. Si tenga presente che la maggior parte dei valori empirici sono ampiamente utilizzati anche nella letteratura di asset pricing “standard” basata (esclusivamente) sul consumo: è il caso dei tassi di crescita medi e della volatilità di consumo e dividendi. La correlazione tra queste due variabili ( ω ) è invece mutuata dalle stime di Campbell (2000). Per quanto riguarda i parametri di preferenza, abbiamo valori “standard” per γ e β , mentre il valore di λ è preso a prestito dall’evidenza sperimentale emersa nei lavori pionieristici di Kahneman e Tversky (1979, 1992) in tema di loss aversion. I valori di k e b0 vengono invece fatti variare nell’ambito di un certo intervallo per verificare la risposta del modello a differenti valori di tali parametri: non esistono precedenti circa la loro stima econometrica e quindi è necessario procedere implementando valori diversi, per tentativi successivi.
47
Si tenga comunque presente che il valore del tasso risk-free, “automaticamente” determinato all’interno del modello dalla scelta arbitraria dei parametri, anche se basso, è però non in linea con l’evidenza empirica: un primo, non trascurabile problema del modello BHS.
60
Tabella 148 Parametro Economia II 1.84% gC 1.84% gD 3.79% σC 12% σD 0.15 ω γ 1 β 0.98 2.25 λ (range) k (range) b0 η 0.9 Valori dei parametri per l’Economia II (dati USA, 1926-1995)
Tabella 249 b0 = 0 b0 = 0.7 b0 = 2 b0 = 100 b0 = 2 b0 = 100 k =3
k =3
k =3
k = 10
k =8
Valore empirico
rf
3.79
3.79
3.79
3.79
3.79
3.79
0.58
EP= Rt +1 − R f
0.65
1.3
2.62
3.68
5.02
5.88
6.03
σ ( Rt +1 − R f )
12
17.39
20.87
20.47
23.84
24.04
20.02
Sharpe ratio
0.05 76.6
0.07 29.8
0.13 22.1
0.18 17.5
0.21 14.6
0.24 12.7
0.3 25.5
0
2.9
2.7
2.4
2.5
2.2
7.1
Et ( Pt / Dt ) σ ( Pt / Dt )
Prezzi e rendimenti nell’Economia II (valori %) Relativamente ad η , la cosiddetta “memoria” dell’individuo, viene utilizzato un valore molto vicino ad 1 (0.9), basato sulla considerazione che ciò che accade nel passato rimane ben presente nella memoria del consumatore/investitore, influenzando notevolmente le sue scelte correnti e future. Nella successiva Tabella 2.2 compaiono invece, dalla terza riga in poi, i rendimenti, ottenuti tramite la (48), la loro volatilità e lo Sharpe ratio 48 49
Cfr. BHS (2001). Riadattata da BHS (2001).
61
[ ( Rt +1 − R f ) / σ R ]. Abbiamo anche la media del rapporto prezzi/dividendi e la relativa volatilità. Come si nota dal confronto dei risultati generati dal modello con la loro controparte empirica, il modello BHS fornisce buoni risultati. Possiamo osservare innanzitutto che quando b0 = 0 l’equity premium è fortemente lontano dal suo valore empirico (come nei modelli standard), mentre la volatilità del premio azionario rispecchia perfettamente quella dei sottostanti dividendi. Quando viene introdotta l’utilità derivante (anche) dalle fluttuazioni della ricchezza finanziaria le cose cominciano a migliorare notevolmente. Con k tenuto fisso a 3, è possibile notare che all’aumentare di b0 l’equity premium tende ad avvicinarsi sempre più al suo valore effettivo, e la stessa cosa accade per la volatilità azionaria, che viene quasi perfettamente replicata. Anche il valore del rapporto prezzi/dividendi migliora notevolmente. Osserviamo poi che aumentando il valore di k è possibile avvicinare sempre più il valore empirico dell’equity premium, e questo indipendentemente dal valore basso o elevato di b0 . Sembra però necessario un valore elevato di b0 al fine di clonarlo perfettamente. Notiamo inoltre che con l’aumento del valore di k migliora notevolmente anche lo Sharpe ratio. Va segnalato, infine, che la volatilità del rapporto prezzi/dividendi rimane non spiegata: ciò rappresenta un problema di non poco conto per tale modello. Ma qual’è la ratio che conduce al raggiungimento di certi, apprezzabili, risultati? In altri termini: come funziona il modello BHS? Qual’è il meccanismo di fondo? Partiamo dalla volatilità dei rendimenti. Come riesce il modello BHS a generare una volatilità più elevata dei sottostanti dividendi? Supponiamo che ci sia un’innovazione positiva (una “news”) sui dividendi, tramite il disturbo stocastico ε . Questo per definizione aumenterà i rendimenti (si veda la 48), andando così ad incrementare le riserve di precedenti guadagni finanziari dell’individuo: e sono proprio tali riserve che rendono l’agente economico meno avverso al rischio (perché le eventuali perdite future saranno comunque compensate ed “ammorbidite” dalle riserve di guadagni accumulati in passato), inducendolo così ad acquistare nuove azioni. Ne seguirà un aumento del prezzo e un ulteriore aumento dei rendimenti. Come risultato finale avremo che la volatilità dei rendimenti è maggiore di quella dei sottostanti dividendi. Lo stesso ragionamento vale, al contrario, se abbiamo un’innovazione negativa nei dividendi. Lo stesso meccanismo si applica per la predicibilità dei rendimenti futuri. Supponiamo ancora che l’economia sperimenti uno shock positivo sui dividendi: i rendimenti aumentano, i prior gains aumentano e quindi l’avversione al rischio (o meglio, l’avversione alla perdita) diminuisce, i prezzi aumentano, il rapporto prezzi-dividendi aumenta. L’investitore, confortato dai guadagni finanziari conseguiti, richiederà in futuro un rendimento medio più basso come compenso per rimanere sul mercato azionario. Per riassumere: ad elevati rapporti prezzi-dividendi oggi, seguono
62
rendimenti minori domani, e quindi fra queste due variabili c’è una relazione inversa, come documentato in passato da autorevoli studi empirici (vedi Campbell-Schiller, 1988 e Fama-French, 1988). Anche l’equity premium si spiega con le variazioni nell’avversione al rischio dell’individuo, o meglio, con il fatto che gli investitori sono avversi alle perdite: essi temono notevolmente le “cadute” tipiche dei mercati finanziari e quindi sono disposti a detenere azioni solo in cambio di un notevole premio per il rischio. Notiamo tra l’altro che, nel framework BHS, passando dall’Economia I all’Economia II, ossia separando i processi di crescita di consumo e dividendi, abbiamo come risultato che il premio azionario aumenta, cosa che invece non succede nei modelli standard.50 E questo perché nei modelli standard il rischio dell’investire in azioni è legato alla covarianza tra il rendimento di queste ultime e il consumo, mentre invece in BHS è legato ai movimenti nel valore degli investimenti finanziari dell’investitore, cioè alle fluttuazioni del mercato azionario. Di più: tali movimenti influiscono sull’avversione al rischio dell’individuo in maniera autonoma, aldilà della loro covarianza con il consumo (che in BHS è comunque bassa). Per quanto riguarda invece la spiegazione della bassa correlazione tra consumo e rendimenti, il ragionamento è il seguente. I rendimenti azionari dipendono, come visto, dai mutamenti nella percezione dell’avversione al rischio; quest’ultima a sua volta dipende dai movimenti passati del mercato azionario, i quali a loro volta subiscono l’influenza determinante degli shocks sui dividendi. Essendo nell’Economia II i dividendi separati dal consumo e quindi solo debolmente correlati con esso, avremo come logico risultato finale una debolissima correlazione anche tra variazione del consumo e tassi di rendimento. E questo è un risultato molto importante, ben diverso, come visto nel capitolo 1, da quello che accade invece nei modelli standard, dove essendo gran parte della volatilità dei mercati azionari spiegata dalle innovazioni nel consumo, inevitabilmente vi è una forte correlazione tra quest’ultimo e i rendimenti azionari.
4 Un’impostazione alternativa: la valutazione isolata dei rischi L’articolo Barberis-Huang-Santos (2001) ha avuto un certo successo, in un’ottica di Behavioral Finance, nello spiegare determinati fatti riguardanti l’andamento dei mercati finanziari a livello aggregato. Tra l’altro, sempre nel 50
Ci riferiamo, come oramai dovrebbe essere chiaro, ai “consumption-based asset pricing models”, con o senza l’ipotesi di “habit formation”.
63
2001, in un contributo sul Journal of Finance, adottando lo stesso tipo di approccio, gli stessi autori51 hanno tentato di rendere conto di ciò che accade quando l’investitore trae utilità (oltre che dal consumo) dalle fluttuazioni della ricchezza finanziaria registrate a livello di singola attività (singola azione), e non nell’intero portafoglio azionario. I risultati ottenuti in quest’ultimo paper sono in linea con quelli di BHS (2001). Va però segnalato che il modello BHS, oltre ad alcune incongruenze empiriche già menzionate nei precedenti paragrafi, soffre di tre importanti difetti a livello teorico. Per prima cosa, esso risulta fortemente intrattabile in contesti di equilibrio parziale: ciò rappresenta un problema soprattutto nelle analisi relative alle scelte di portafoglio.52 Secondo, è necessario inserire nel modello il fattore di scala rappresentato dal consumo pro-capite aggregato,
Ct −γ , altrimenti al crescere della ricchezza aggregata il termine relativo alla prospect theory finisce col dominare la parte relativa al consumo nella funzione di utilità, non assicurando più un equilibrio stazionario.53 Terzo, anche se per noi di marginale importanza, non è possibile calcolare esplicitamente la funzione valore indiretta dell’agente economico, e diventa quindi assai arduo verificare se le scelte degli individui sono coerenti con la loro attitudine ai cosiddetti independent monetary gambles.54 Queste limitazioni hanno spinto gli stessi autori (Barberis e Huang) a riformulare il modello, mantenendo sempre l’idea di una fonte di utilità aggiuntiva al consumo non derivante da quest’ultimo, ma apportando però alcune modifiche di una certa rilevanza che andremo ora ad esplorare. Le due caratteristiche di fondo del modello proposto da Barberis e Huang (2004a, 2004b), una delle quali già ampiamente discussa nel capitolo 2, sono la loss aversion e la “valutazione isolata” dei rischi (narrow framing). Per quanto riguarda la seconda, ne abbiamo fino ad ora fornito solo un breve cenno, ed ora è quindi necessario un approfondimento. Nei modelli tradizionali,55 l’agente economico adotta tipicamente il seguente comportamento: egli tende a “mixare” le nuove scelte che gli si prospettano con quelle già fronteggiate, dopodichè controlla se l’aggiunta della nuova scelta rischiosa56 migliora o peggiora la distribuzione futura del proprio consumo e/o della propria ricchezza. Ma una certa mole di lavoro sperimentale sulla teoria delle decisioni in condizioni di incertezza, cominciata con il lavoro di Tversky-Kahneman (1981), ha mostrato che gli individui 51
Non proprio: solo Barberis e Huang. E diventa problematico, ad esempio, trattare il tema della partecipazione al mercato azionario. 53 Per i dettagli su tale punto si veda BHS (2001). 54 Si tratta di una questione estremamente interessante ma che comunque esula dagli scopi del presente lavoro. Si veda BH (2004a, b), ma soprattutto Barberis-Huang-Thaler (2003). 55 Ci riferiamo ai modelli standard, basati, per intenderci, sulle tradizionali funzioni di utilità alla Von Neumann-Morgenstern definite su consumo o ricchezza. 56 In letteratura si usa dire, per intendere appunto una nuova scelta rischiosa, la nuova “scommessa” (gamble). 52
64
spesso non si comportano in questo modo. In varie occasioni, e vedremo quali, quando sono chiamati a compiere delle scelte rischiose, nel valutare i rischi che essi fronteggiano, sono propensi a compiere valutazioni isolate, ossia a fare narrow framing. In altre parole, essi valutano i rischi isolatamente, ossia separatamente rispetto ad altri rischi che stanno già fronteggiando. Come sottolineano BH (2004a), “……narrow framing means that the agent derives utility directly from the outcome of a specific gamble he is offered, and not just indirectly via its contribution to his total wealth. Equivalently, he derives utility from the gamble’s outcome over and above what would be justified by a concern for his overall wealth risk”. La “classica” dimostrazione di questo tipo di comportamento è dovuta a Tversky-Kahneman (1981) ed è, in sintesi, la seguente. A 150 soggetti viene posta la seguente domanda. Supponete di fronteggiare le due seguenti tipologie di scelte. Esaminatele entrambe e per ognuna indicate l’opzione da voi preferita: SCELTA 1: • A) un guadagno certo di $240; • B) 25% di chance di guadagnare $1.000 e 75% di chance di non guadagnare nulla; SCELTA 2 • C) una perdita certa di $750; • D) 75% di chance di perdere $1.000 e 25% di chance di non perdere nulla; Relativamente alla SCELTA 1, l’84% dei soggetti sceglie A, il 16% B; con riferimento alla SCELTA 2 invece, il 13% sceglie C, l’87% D. Ma la cosa sorprendente in tale esperimento è che, andando a verificare quali sono le scelte “combinate” degli individui, si scopre che la maggior parte dei soggetti (73%) sceglie la combinazione A&D, ossia 25% di chance di vincere $240, 75% di chance di perdere $760 mentre la combinazione meno scelta (3%) risulta essere B&C, ossia 25% di chance di vincere $250, 75% di chance di perdere $750. Ma è semplice notare che la combinazione A&D è dominata dalla combinazione B&C. Come si può spiegare e commentare tale contraddizione? Risulta evidente che i soggetti scelgono in maniera non ottimale, optando per una strategia dominata: per quale motivo? Ciò che accade è che gli individui,
65
invece di focalizzarsi sul risultato combinato delle decisioni 1 e 2, vale a dire sul risultato che determina la loro ricchezza finale, si focalizzano sul risultato di ogni singola decisione separatamente. Ed è per questo che in tale tipo di letteratura si usa dire che i soggetti in questione fanno “valutazioni isolate”, ossia, nella terminologia anglosassone, narrow framing. Tale spiegazione rappresenta quindi una teoria descrittiva delle decisioni, che ci dice non come gli agenti economici dovrebbero comportarsi per ottimizzare, bensì per quali motivi, in certi contesti, essi scelgono in maniera scorretta, conseguendo un risultato sub-ottimale. Ci sono varie situazioni del mondo reale dove è possibile riscontrare un comportamento di questo genere: in particolare nei casi in cui scelte preferibili sulla base di considerazioni teoriche supportate da dati empirici vengono invece non compiute a favore di scelte palesemente inferiori. Si pensi ad esempio alla cosiddetta non-partecipazione al mercato azionario (stock-market non participation) oppure all’equity home bias: in entrambi i casi favorevoli opportunità di diversificazione vengono rifiutate. Nel primo caso57 si tratta di un fenomeno, riscontrato nelle principali economie mondiali, secondo il quale molte famiglie destinano poche risorse all’acquisto di azioni, privilegiando altre attività, nonostante la forte differenza di rendimento a favore dell’investimento azionario. Ma non è tutto: essendo l’investimento azionario solo debolmente correlato con le altre attività,58 dati i principi base della teoria della diversificazione di portafoglio, esso risulta essere ancora più conveniente. Nel secondo caso la “competizione” è invece tra le azioni nazionali e le azioni estere. La teoria di portafoglio standard ci dice che sarebbe ottimale per gli agenti economici detenere una quota di azioni estere molto superiore a quella che viene effettivamente detenuta in portafoglio dagli investitori.59 E anche in questo caso vale il discorso appena fatto, relativo alla possibilità di diversificare convenientemente data la debole correlazione tra attività nazionali e attività straniere. Abbiamo quindi altri due paradossi: lo stock market participation puzzle e l’equity home bias puzzle. Ma esistono in letteratura delle teorie di “framing” che possono condurre gli individui a ragionare in termini di “valutazioni isolate”, con tutte le conseguenze che ciò comporta? A tal proposito, in BH (2004a) viene fatto particolare riferimento alla teoria proposta da Kahneman (2003) sull’American Economic Review nella sua Nobel Lecture. Vediamo brevemente di cosa si tratta. 57
Cfr. Mankiw-Zeldes (1991) e Bertaut-Haliassos (1995). Debolmente correlato con gli altri rischi (derivanti ovviamente da determinate attività) fronteggiati da un agente economico, sia esso individuo o famiglia: si pensi al cosiddetto “housing risk” o al capitale umano (valore attuale del reddito da lavoro futuro atteso). Alcuni recenti lavori forniscono evidenza empirica del fatto che tali rischi sono appunto solo marginalmente correlati con il rischio derivante dal mercato azionario. Si vedano in particolare Bertaut-Haliassos (1995) e Heaton-Lucas (2000). 59 Si vedano ad esempio French-Poterba (1991) e Lewis (1999). 58
66
L’idea di fondo è molto semplice: quando un individuo valuta un nuovo rischio, la distribuzione del nuovo “gamble”, considerata separatamente, è molto più “accessibile” della distribuzione della ricchezza totale, comprensiva dei rischi già in essere più il nuovo rischio da valutare. Cosa significa più “accessibile”? Tale espressione fa riferimento al fatto che molte decisioni vengono prese tenendo soprattutto in considerazione le caratteristiche e le informazioni, su di esse disponibili, più evidenti e di più facile elaborazione/interpretazione: in altre parole, le caratteristiche e le informazioni più accessibili. E dietro questa considerazione c’è l’idea che molte scelte vengono fatte seguendo prevalentemente il proprio intuito, piuttosto che elaborati ed impegnati ragionamenti. Notiamo che in qualche modo ci stiamo già allontanando dal concetto di perfetta razionalità degli agenti economici, marciando verso quello di razionalità limitata. Coerentemente alla spiegazione fornita da Kahneman (2003) e a supporto di essa, da parte nostra possiamo richiamare il contributo fornito alle scienze sociali da Simon (1982). Nel proporre argomenti a sostegno della sua ipotesi di razionalità limitata degli agenti economici, Simon sottolinea che le risorse cognitive di questi ultimi sono limitate: ciò costringe gli individui a semplificare lo spazio del problema decisionale, che risulterebbe altrimenti ingestibile perché eccessivamente complesso. Date queste premesse, è abbastanza logico pensare ai mercati finanziari come campo di applicazione dell’approccio teorico fin qui esposto. È infatti evidente che pochi settori dell’attività umana sono caratterizzati da una quantità di informazioni così massiccia come quella presente nei mercati finanziari (Slovic, 1972). Tali informazioni sono a tutti altamente accessibili, tenuto conto che si possono avere, quotidianamente ed in dosi abbondanti, da giornali, telegiornali, internet, ecc.60 Ma il problema risiede nella loro corretta ed ottimale elaborazione. L’avvento delle nuove tecnologie, rendendo prontamente disponibili informazioni riguardanti l’andamento dei mercati di tutto il mondo, ha contribuito notevolmente ad aumentare le difficoltà degli individui nell’utilizzare in modo proficuo l’ampio numero di informazioni a loro disposizione. Infatti, se è vero che una maggiore disponibilità di informazioni è sinonimo di maggiore accuratezza nel valutare le alternative di scelta, è altrettanto vero che una mole eccessiva di informazioni, come suggerito da Simon (1982), date le limitate risorse cognitive dell’individuo, rende lo spazio decisionale ingestibile. Ed è proprio nel tentativo di semplificare tale spazio che l’agente economico è portato a compiere valutazioni “isolate” a discapito di quelle “complessive”: tale comportamento ha come conseguenza quello di effettuare la scelta solo apparentemente 60
Ci riferiamo ovviamente alle informazioni, per così dire, di carattere “ordinario”. E’ evidente che informazioni di natura “straordinaria”, soprattutto in un primo momento, non sono facilmente accessibili a chiunque, bensì solo ad una ristretta cerchia di persone: soggetti direttamente coinvolti e persone “strettamente” addette ai lavori.
67
migliore. La valutazione “complessiva” del problema condurrebbe ad una scelta migliore rispetto a quella effettivamente compiuta, ma la mancanza dell’”ottimale” capacità di elaborazione delle informazioni conduce invece alla scelta effettiva (sub-ottimale). E la valutazione “complessiva” viene accantonata in favore di quella “isolata” proprio a causa della mancanza di questa “ottimale” capacità di elaborazione. L’esempio visto poco fa, tratto da Kahneman-Tversky (1981), si adatta molto bene a quanto appena detto. Infatti, elaborare il risultato di ognuna delle scelte in gioco, A, B, C e D, è molto più semplice ed accessibile dell’elaborazione del risultato complessivo a cui è possibile pervenire confrontando le due scelte combinate A&D e B&C. In quest’ultimo caso le distribuzioni sono molto meno ovvie e quindi meno accessibili delle singole distribuzioni (A, B, C, e D) così come vengono presentate nel quesito originale. Appare quindi evidente, in base a quanto detto, che nell’ambito dei processi di decision-making, i singoli risultati di cui sopra (A, B, C, D) rivestono un ruolo molto più importante di quello che gli è invece solitamente assegnato dalle tradizionali funzioni di utilità.
5 Narrow framing e utilità recursiva Come detto, BH (2004a) propongono una nuova metodologia per affrontare i problemi di scelta in contesti dove le decisioni comportano certi gradi di rischio, e gli ingredienti caratterizzanti tale metodologia sono appunto la loss aversion e il narrow framing dei rischi. Vediamo ora come si presenta formalmente questa impostazione teorica, premesso che l’ipotesi “cruciale” di base è quella già vista nell’approccio BHS, ossia la possibilità, per l’agente economico, di derivare utilità non solo dal consumo, ma anche dalle variazioni della ricchezza finanziaria. Per rendere evidenti i collegamenti con il modello analizzato nei paragrafi 2 e 3, cominceremo con un modello che riprende quasi “in toto” quanto già visto in quella sede (cfr. BH, 2004a). L’agente rappresentativo massimizza la seguente funzione di utilità multiperiodale:
∞ t C1−γ U 0 = E0 ∑ β t + b0Ct−γ β t +1v(GS ,t +1 ) t =0 1 − γ subordinatamente al vincolo di bilancio
68
(51)
Wt +1 = (Wt − Ct ) RW , t +1 con e
(
RW , t +1 = θ S , t RS , t +1 + θ N , t RN , t +1 + (1 − θ S , t − θ N , t ) R f , t GS , t +1 = θ S , t (Wt − Ct )( RS , t +1 − R f , t ) G v(G ) = λ G
per
G≥0 G<0
) (52)
λ >1
dove θ S , t è la quota di “risparmio” (ricchezza post-consumo) che l’agente destina all’attività rischiosa (l’azione), θ N , t è la quota di ricchezza destinata ad una qualunque attività non finanziaria (investimento immobiliare, capitale umano) e ( 1 − θ S , t − θ N , t ) è la quota di risparmio destinata all’attività priva di rischio.61 La variabile G svolge il ruolo che era di X nel modello BHS: rappresenta i guadagni o le perdite conseguiti/e sul mercato azionario. RW , t +1 misura il rendimento, tra t e t+1, dell’intera ricchezza dell’individuo, ossia del suo cosiddetto “portafoglio di mercato”. Le altre variabili hanno il solito significato già visto discutendo il modello BHS. Le analogie con la formulazione (32) sono tante. La differenza principale è che qui non sono considerati gli aspetti dinamici dell’avversione alla perdita, ossia non viene supposta né modellata la sua dipendenza dai risultati finanziari precedentemente conseguiti. Sono però presenti sia la “valutazione isolata” dei rischi, introdotta dalla funzione v(⋅) , che la loss aversion, introdotta dalla particolare forma di v(⋅) . Rispetto al modello precedente, in questa sede vengono considerate 3 attività invece di 2, e quindi il vincolo di accumulazione della ricchezza va opportunamente modificato, ma per il resto, fatto salvo quanto detto sopra circa gli aspetti dinamici dell’avversione alla perdita, siamo in un framework simile al precedente. Anche in BHS avevamo dunque narrow framing, ma in quella sede tale aspetto non è stato particolarmente evidenziato: si è preferito dare importanza alle performances passate conseguite sui mercati, in quanto determinanti nel “guidare” le future variazioni nell’avversione alla perdita dell’agente rappresentativo. Notiamo, inoltre, che nell’equazione che governa i guadagni e le perdite, la (52), la ricchezza iniziale viene sempre parametrizzata con il tasso risk-free, come nella (34). In questo caso però θ S , t ≠ 1 . Ma come discusso nell’introduzione al presente capitolo, tale formulazione presenta alcuni risvolti insoddisfacenti sotto vari profili. La novità introdotta da BH (2004a) è costituita dall’uso dell’utilità recursiva (o 61
Può trattarsi di un bond o di un titolo di Stato, ma anche più genericamente di una qualunque altra attività priva di rischio.
69
“utilità EZW”: Epstein-Zin-Weil), già brevemente vista nel capitolo 1. Abbiamo:
Ut = W (Ct , µ (Ut +1 I t )) dove µ (U t +1 I t ) è l’equivalente di certezza dell’utilità futura U t +1 , data l’informazione disponibile al tempo t. La funzione W (⋅,⋅) è un “aggregatore” che combina l’utilità futura U t +1 con il consumo corrente Ct al fine di “produrre” l’utilità corrente U t . Generalmente, nella maggior parte delle applicazioni che ritroviamo in letteratura, tale funzione aggregatrice assume la forma CES (Constant Elasticity of Substitution), W (C , x) = [(1 − β )C ρ + βx ρ ]ρ 1
con 0 < β < 1 , 0 ≠ ρ < 1 , mentre per l’equivalente di certezza si assume una forma funzionale omogenea di primo grado:
µ (kx) = kµ ( x) , k > 0 . Come già osservato nel primo capitolo, tale tipo di utilità62 nasce con l’intento principale di separare avversione relativa al rischio ed elasticità di sostituzione intertemporale (ESI). Ma come vedremo nei successivi capitoli, tale caratteristica assumerà in questo contesto un’importanza trascurabile. Utilizzando questa nuova formulazione delle preferenze, il problema di massimo del consumatore/investitore rappresentativo si modifica nel seguente modo:
[
(
])
Max Ut =W Ct , µ(Ut+1 It ) + b0 Et v(GS,t+1) s.t.
dove
Wt +1 = (Wt − Ct ) RW , t +1
[
ρ
[
]
1
µ ( x) = E ( x ) , δ
(54)
]
1
βx ρ ρ
(55)
0 ≠ δ <1
(56)
W (C , x) = (1 − β )C + δ
GS , t +1 = θ S , t (Wt − Ct )( RS , t +1 − R f , t ) 62
In letteratura si parla anche di preferenze GEU (Generalized Expected Utility).
70
(53)
(57)
G v(G ) = λ G
G≥0
per
λ >1
G<0
(58)
La novità è quindi rappresentata dal secondo argomento della funzione W (⋅,⋅) , che è stato “aumentato” per introdurre la possibilità di fare “valutazione isolata” sull’attività azionaria.63 D’ora in avanti chiameremo tale impostazione “approccio o modello BH” e le preferenze in essa utilizzate “preferenze BH”. Va inoltre osservato che l’equivalente di certezza è stato specificato tramite una forma piuttosto semplice (equazione 56), molto usata in letteratura: ciò che più conta è concentrarsi sugli effetti della “valutazione isolata”, prescindendo da eventuali complicazioni che potrebbero insorgere a causa di una forma funzionale più ricca ma anche più complessa e meno trattabile. Notiamo infine che siamo ancora nel caso con tre attività, ma il modello funziona anche se consideriamo solo due attività, come nel precedente capitolo, oppure n attività. Ovviamente in tal caso alcune espressioni andranno opportunamente modificate. Ad esempio, nel caso di n attività avremo: n Max Ut = W Ct , µ(Ut +1) + b0 ∑ Et [v(Gi,t +1)] 64 i=m+1
s.t. con
(59)
Wt +1 = (Wt − Ct ) RW , t +1 n
RW , t +1 = ∑θ i , t Ri , t +1 i =1
dove
[
W (C , x) = (1 − β )C
[
ρ
δ
]
1
+ βx ρ ρ
µ ( x) = E ( x )
]
1
δ
Gi , t +1 = θ i , t (Wt − Ct )( Ri , t +1 − Ri , z ) ,
63
i = m + 1,......n
E’ possibile introdurre tale possibilità anche sulle attività non finanziarie, o sia su queste che sull’azione: vedremo ora il caso con un numero imprecisato di attività sulle quali è possibile introdurre la possibilità di valutazione isolata da parte dell’investitore. Ovviamente deve trattarsi di attività rischiose. 64 Notiamo che rispetto alla (53) abbiamo omesso il set informativo It, ma solo al fine di mantenere la notazione più leggera.
71
G v(G ) = λ G
G≥0
per
λ >1
G<0
In questo caso sono stati aggiunti n − m nuovi termini al secondo argomento di W (⋅,⋅) , uno per ognuna delle n − m attività che l’investitore valuta isolatamente.65 Relativamente all’espressione che definisce i guadagni o le perdite conseguite, avremo tante equazioni quante sono le attività soggette a valutazione isolata, da m + 1 fino a n , per un totale di n − m equazioni. Ri , z rappresenta invece un generico livello di riferimento rispetto al quale valutare le performances conseguite sui mercati: come visto nei paragrafi precedenti, tale variabile può essere sostituita dal tasso risk-free, oppure da 1.66 Il caso illustrato nelle equazioni (53) – (58), dove l’unica attività soggetta a narrow framing era l’azione, rientra nella fattispecie n = 3 e m = 2 , con θ S ,t = θ 3,t , θ N ,t = θ 2,t , ecc. Se supponiamo che delle tre attività la prima sia la risk-free asset e che le attività 2 e 3 siano due generiche attività rischiose, dove solo l’attività 3 è soggetta a valutazione isolata, l’utilità recursiva da massimizzare sarà la seguente: 3 Ut =W Ct , µ(Ut +1) + b0 Et [v(Gi,t +1)] = i =3 = W(Ct , µ(Ut +1) + b0Et v(G3,t +1) )
∑
[
]
Wt +1 = (Wt − Ct ) RW , t +1
s.t. con
(60)
(61)
(
RW , t +1 = θ 2, t R2, t +1 + θ 3, t R3, t +1 + (1 − θ 2, t − θ 3, t ) R f
)
G3, t +1 = θ 3, t (Wt − Ct )( R3, t +1 − R f ) G v(G ) = λ G
per
G≥0 G<0
λ >1
(62) (63)
E’ immediato verificare che il caso appena formalizzato non è altro che il caso generale con n = 3 e m = 2 : avremo quindi una sola attività ( n − m ) soggetta a valutazione isolata. 65
Cfr. BH (2004a). In quest’ultimo caso il valore della ricchezza iniziale risulterà non parametrizzato e quindi semplicemente uguale a θ i , t (Wt − Ct ) per ogni i. 66
72
Con riferimento a quest’ultima impostazione, quella delle equazioni (60) - (63), è possibile accennare brevemente ad alcune possibili applicazioni a situazioni che comportano scelte rischiose, tipiche dell’economia finanziaria. Il modello appare infatti adatto per indagare varie tematiche, quali ad esempio l’equity premium e il risk-free rate puzzle, la non partecipazione al mercato azionario, oppure l’equity home bias puzzle. Ma vedremo meglio nelle pagine successive come sia possibile ottenere risultati estremamente interessanti relativamente ai vari paradossi dei mercati finanziari.
73
3 VALUTAZIONE DEI RISCHI E PREMIO AZIONARIO: APPLICAZIONI QUANTITATIVE AI PAESI DEL G7
1 Il paradosso del premio azionario Vediamo come il modello presentato nella seconda parte del capitolo precedente (approccio BH) possa essere utilizzato per indagare e possibilmente spiegare i paradossi del premio per il rischio e del tasso riskfree, presentati e discussi nel primo capitolo. Consideriamo una semplice economia ad agente rappresentativo, dove le preferenze e i vincoli sono descritti dalle equazioni (53) – (58). Seguendo BH (2004a, b) e la letteratura prevalente, modifichiamo solo alcuni dettagli analitici a fini semplificativi. Con riferimento alle equazioni (55) e (56) supponiamo infatti che ρ = δ = 1 − γ , dove γ ha l’usuale significato. E’ prassi comune porre gli esponenti della funzione aggregatrice uguali a quelli dell’espressione funzionale dell’equivalente di certezza. Ponendoli poi entrambi uguali a 1 − γ , ciò che accade è che viene “persa” la separazione tra avversione al rischio ed elasticità di sostituzione intertemporale (ESI), ma in questo contesto, come già accennato, ciò non rappresenta un problema. Avremo quindi:
[
W (C , x) = (1 − β )C e
[
1−γ
1− γ
µ ( x) = E ( x
)
+
]
]
1 1−γ 1−γ βx
1 1− γ
,
0 <γ ≠1
La funzione massimizzata dall’agente, la (53), fatte le dovute sostituzioni diventa quindi la seguente,
74
1
1−γ 1 1−γ U t = (1 − β )Ct1−γ + β [ Et (U t1+−1γ )]1−γ + b0 Et v(GS ,t +1 ) ,
(64)
subordinatamente ai “soliti” vincoli. BH (2004a) dimostrano che le condizioni di ottimo del primo ordine per tale problema sono le seguenti:
C 1 = βR f Et ( t +1 ) −γ Ct
γ
1− γ C ⋅ βEt ( t +1 ) −γ RW , t +1 Ct
(65)
C Et ( t +1 ) − γ ( R S , t +1 − R f ) C + 0= t C Et ( t +1 ) − γ Ct + b0 R f (
β 1− β
)
1 1− γ
(
1−αt
αt
)
−γ 1− γ
(66)
[
Et v ( R S , t +1 − R f )
]
C Et ( t +1 ) −γ ( RW , t +1 − R f ) C + 0= t C Et ( t +1 ) − γ Ct + b0 R f (
β 1− β
)
1 1− γ
(
1−αt
αt
)
−γ 1− γ
(67)
[
θ S , t Et v ( RS , t +1 − R f )
]
dove α t ≡ Ct / Wt è il rapporto consumo/ricchezza. Notiamo che la (67) è una condizione “di comodo” che ci tornerà utile per calcolare il valore delle variabili-chiave del modello, ed è stata ottenuta dall’espressione della (66) valevole per il modello con n attività.67 A questo punto è opportuno fare un certo numero di ipotesi semplificatrici al fine di poter utilizzare il modello per derivare alcune interessanti implicazioni quantitative. A tale scopo, consideriamo un equilibrio nell’ambito del quale (cfr. BH, 2004a, b):
67
Si veda l’Appendice A.3.1.
75
1) Il tasso risk-free è una costante R f .68 2) Il consumo e il rendimento azionario evolvono nel tempo secondo i seguenti tassi di crescita logaritmici:
log(
C t +1 ) = g C + σ C ε C , t +1 Ct
log( RS , t +1 ) = g S + σ S ε S , t +1
ε C ,t 0 1 ω ε ≈ 0 , ω 1 S , t
dove
3) Il rapporto consumo/ricchezza è una costante α . Sfruttando tale ipotesi abbiamo che
RW ,t +1 =
Wt +1 1 Ct +1 = Wt − Ct 1 − α Ct
da cui segue che
log( RW ,t +1 ) = gW + σ W ε W ,t +1 dove
1 gW = g C + log( ), 1−α
σ W = σ C e ε W ,t +1 = ε C ,t +1 .
4) La frazione di ricchezza complessiva destinata al mercato azionario è costante nel tempo. Ossia:
θ S ,t =
St = θ S , ∀t St + N t
dove S t è il valore totale della ricchezza azionaria e N t il valore totale della ricchezza non finanziaria. Utilizzando le ipotesi appena elencate è possibile dimostrare che le condizioni (65) - (67) diventano le seguenti:69
68
Osserviamo comunque che questa ipotesi era già implicita nell’espressione usata per il tasso riskfree, ossia senza il pedice t. 69 Per i dettagli sulla derivazione delle condizioni (68) - (70) si veda l’Appendice Matematica A.3.1 alla fine del capitolo.
76
1
1− γ
γ
γ
1−α
−γ 1− γ
α = 1− β R f
0 = b0 R f (
β 1− β
1 g S + σ S2 2 ⋅ [e
0 = b0 R f (
con εˆS =
1− β
α
)
)
1 1− γ
(
1−α
α
)
−γ 1− γ
θS
(68)
− R f + (λ − 1) ⋅
1 g S + σ S2 − γσ S σ C ω 2 )]] + e
1 g S + σ S2 2 [e
N (εˆS − σ S ) − R f N (εˆS )]] +
log( R f ) − g S
σS
(
1 g S + σ S2 2 [e
N (εˆS − σ S ) − R f N (εˆS
β
1 g S + σ S2 2 ⋅ [e
)
1 1− γ
1 (1− γ )σ C2 2 e
1 1−α
(69)
− Rf
− R f + (λ − 1) ⋅ 1 g C + σ C2 − γσ C2 2 e
(70)
− Rf
e dove N (⋅) rappresenta la funzione di ripartizione
della normale standardizzata.70 Dati i valori di certi parametri,71 possiamo risolvere queste tre equazioni nelle tre incognite α , R f e g S , al fine di determinare il tasso risk-free ( r f = R f − 1 ) e il premio azionario generati dal modello.72 Notiamo che l’equity premium è dato da
EP = Et (rS , t +1 ) − r f Essendo
log( RS , t +1 ) ≡ log(1 + rS , t +1 ) = g S + σ S ε S , t +1 ⇒ ⇒ rS , t +1 = e
g S + σ S ε S ,t +1
70
−1 ,
Si veda l’Appendice Matematica A.3.2 alla fine del capitolo per i dettagli su quest’ultimo punto. Ed in particolare assumerà notevole importanza la scelta dei parametri di preferenza, γ , λ e b0 . Sarà proprio facendo variare tali parametri che genereremo, per alcuni paesi, una serie di risultati relativamente all’equity premium e al tasso risk-free. 72 La risoluzione delle equazioni (68) – (70) verrà eseguita con il software di elaborazione numerica MatLab. I codici (o programmi) sono disponibili su richiesta presso l’autore. Si veda anche l’Appendice A.3.3. 71
77
prendendo il valore atteso al tempo t da entrambi i lati avremo
Et (rS , t +1 ) = e
gS +
σ S2 2
−1
Nel derivare quest’ultima espressione abbiamo tenuto conto del fatto che se una variabile casuale x si distribuisce secondo una Normale standardizzata, allora E (e
a + bx
)=e
a+
b2 2
.
Trovato R f nel sistema di tre equazioni di cui sopra, avendo a disposizione anche g S , siamo in grado di calcolare il premio per il rischio tramite la seguente espressione:
EP = (e
gS +
σ S2 2
− 1) − r f = e
gS +
σ S2 2
− Rf .
(71)
2 Implicazioni quantitative del modello E’ ora possibile procedere con l’applicazione del modello alle economie facenti parte del G7, al fine di indagare le tematiche dell’equity premium e del risk-free rate puzzle. BH (2004a, b) forniscono solo alcune brevi applicazioni, puramente indicative, relative agli USA. Tali autori non tentano nessuna applicazione del loro modello a paesi diversi dagli USA e, proprio per tale motivo, non sono in grado di rilevare la presenza di alcuni comportamenti piuttosto interessanti. In questa sede invece, dopo aver visto i risultati da essi ottenuti, vedremo cosa succede con dati diversi da quelli statunitensi, analizzando in particolare i casi di Gran Bretagna, Italia, Germania, Francia, Giappone, Canada e Svezia. Prenderemo in considerazione anche la Svezia perché, pur non essendo un paese del G7, su tale paese sono disponibili, relativamente a rendimenti e consumi, dati di ottima qualità e relativi ad un lasso temporale piuttosto lungo. Relativamente ai parametri relativi a consumo e rendimenti azionari, abbiamo le Tabelle 1 e 2, dove il significato delle variabili è quello usuale. Abbiamo poi le Tabelle 3 e 4 relative ai valori empirici delle variabili cruciali, ossia di maggior interesse: ad essa faremo riferimento per verificare la “bontà” del modello.
78
Per quanto riguarda la scelta dei parametri comportamentali γ , λ e b0 , ci atterremo a criteri che ci consentano di utilizzare parametri coerenti con la teoria prevalente e con le stime econometriche e l’evidenza sperimentale disponibili su tale argomento. L’avversione al rischio sarà implementata per valori non superiori a 3. Il parametro relativo alla loss aversion assumerà valori tendenzialmente non distanti dalle stime basate su autorevoli indagini sperimentali, ossia valori attorno a 2.25.73 Per il grado di narrow framing il discorso è invece più complesso, perché si tratta di un “territorio” ancora piuttosto inesplorato, soprattutto a livello di stime econometriche. In alcuni casi implementeremo quindi un range di valori abbastanza ampio, al fine di vedere come reagisce il modello nei diversi casi.74 Relativamente al fattore di sconto intertemporale, β , useremo un valore prossimo all’unità, oramai divenuto standard nella letteratura di calibrazione dei modelli: 0.98. Per quanto riguarda infine la scelta di θ S , consapevoli che l’ipotesi che sia un valore costante nel tempo è piuttosto restrittiva, useremo per ogni paese valori che facciano riferimento, approssimativamente, a dati recenti sulla ricchezza famigliare.
A) USA Cominciamo dando uno sguardo ai risultati principali trovati da BH (2004b) relativi all’economia USA (con dati relativi al periodo 1889-1985). Notiamo innanzitutto che i casi ( γ , λ , b0 ) = (1.5, 3, 0) e ( γ , λ , b0 ) = (3, 3, 0) non sono stati riportati perché avremmo avuto gli stessi valori ottenuti con λ = 2 : quando b0 = 0 il valore di λ è completamente insignificante perché “esce” dal modello (si osservino le equazioni 69 e 70). Come possiamo notare osservando la Tabella 5, il modello è in grado di produrre un sostanzioso premio per il rischio ed allo stesso tempo un basso tasso risk-free, in accordo con l’evidenza empirica. In particolare, si nota come sia possibile diminuire r f ed innalzare l’equity premium (attraverso l’aumento di Et rS , t +1 e quindi g S ) aumentando il grado di valutazione isolata
b0 . Ovviamente, a parità di avversione relativa al rischio, tale tendenza sarà tanto maggiore quanto più elevata è l’avversione alla perdita λ . Il meccanismo all’opera è quello già discusso nel capitolo precedente. L’agente economico trae utilità (anche) direttamente dalle variazioni nella sua ricchezza azionaria, ed essendo maggiormente sensibile alle perdite che ai guadagni conseguiti in tale ricchezza, percepisce il mercato azionario come 73
Si vedano Tversky-Kahneman (1992) e Barberis-Thaler (2003). Per un riferimento si veda Barberis-Huang-Santos (2001), Barberis-Huang (2001) e quanto riportato nei primi tre paragrafi del capitolo 2 del presente lavoro. 74
79
particolarmente rischioso: per detenere azioni in equilibrio pretenderà quindi un premio azionario maggiore. Allo stesso tempo, la valutazione isolata effettuata sul mercato azionario e la forte avversione alle perdite azionarie, comportano l’acquisto di attività finanziarie dal rendimento “certo” e il differimento del consumo ai periodi futuri: è così possibile spiegare la diminuzione del tasso risk-free. Notiamo, tra l’altro, che r f diminuisce quando nel modello vengono introdotti narrow framing e loss aversion (ossia quando b0 è diverso da zero), ma anche quando, a parità di γ e b0 , viene aumentato il valore dell’avversione alla perdita λ . Lo stesso discorso vale per l’aumento dell’equity premium. Quando il grado di narrow framing è nullo ritorniamo al modello standard, e l’unico parametro di preferenza che rimane attivo è l’avversione al rischio. Le equazioni (68) – (70) diventano le seguenti, 1
1− γ
γ
γ
α = 1− β R f
1 (1− γ )σ C2 2 e
1 g S + σ S2 − γσ S σ C ω 2 0=e
1
− Rf
1 g C + 2 σ C −γσ C 0= e − Rf 1−α 2
(72)
(73)
2
(74)
e risulta evidente quanto appena detto. Dalla tabella si può anche notare che con b0 = 0 , aumenti di γ comportano un leggero aumento del premio azionario, ma soprattutto, in accordo con la teoria standard, un aumento di r f . Infatti, l’aumento dell’avversione relativa al rischio ha come conseguenza l’aumento della riluttanza dell’agente rappresentativo a sostituire il consumo tra stati diversi del mondo, ed il rovescio della medaglia di tale fatto è costituito dalla diminuzione dell’elasticità di sostituzione intertemporale (ESI):75 ne consegue che il consumatore/investitore preferisce consumare subito, anziché posporre il consumo a periodi futuri, e per farlo è disposto ad indebitarsi, innalzando così i tassi d’interesse. E per non essere tratti in inganno, si ricordi (vedi capitolo 1, prima parte del paragrafo 2) che è sì vero che un aumento di γ , innalzando l’avversione al rischio dell’investitore, induce all’acquisto di attività finanziarie risk-free (risparmio precauzionale), con il conseguente aumento dei loro prezzi e la discesa dei tassi, ma è altrettanto vero che 75
Si ricordi che la reciprocità tra avversione relativa al rischio ed ESI, date le ipotesi fatte al primo paragrafo del presente capitolo, è ancora una caratteristica del modello, nonostante l’uso delle preferenze recursive: ad un aumento dell’una corrisponde quindi una diminuzione dell’altra.
80
l’effetto legato alla crescita del consumo corrente è in grado di controbilanciare le cose, comportando, come effetto netto, un aumento del tasso d’interesse.76
B) GRAN BRETAGNA Vediamo ora il caso della Gran Bretagna. Analizzeremo due casi, su due diversi lassi temporali: uno relativo al periodo 1919-1998 (e lo indicheremo con “long”) e l’altro al periodo 1970-1999 (chiameremo invece quest’ultimo “short”). Come risulta dalla Tabella 1, useremo un valore di θ S pari a 0.25, ma usando un valore non troppo lontano, ad esempio 0.20, otterremmo comunque dei risultati qualitativamente simili.77 Come si evince dalla Tabella 6, il comportamento qualitativo del modello è simile a quello visto per gli USA. L’introduzione della valutazione isolata e di un certo grado di loss aversion comportano una riduzione del tasso d’interesse privo di rischio e un aumento del premio azionario. Possiamo osservare, in particolare, che quando ( γ , λ , b0 ) = (1.5, 3, 0.05), siamo in grado di replicare quasi perfettamente i valori empirici di riferimento (si veda la Tabella 3). Anche in questo caso abbiamo omesso di mettere i casi come ( γ , λ , b0 ) = (1.5, 3, 0), dove è ovvio che, essendo λ insignificante, abbiamo gli stessi valori del caso ( γ , λ , b0 ) = (1.5, 2, 0). Nella terza parte della tabella abbiamo implementato una serie di valori di b0 un po’ più lunga del solito: l’intento è quello di evidenziare che quando portiamo il valore di γ a 3, se lasciamo inalterato a 2 il valore di λ , nemmeno aumenti consistenti del grado di narrow framing, oltre una certa soglia, sono sufficienti per ridurre in maniera apprezzabile r f . Diventa infatti necessario aumentare anche il grado di avversione alle perdite: anzi, portandolo a 3 (ultima parte della tabella) arriviamo addirittura a produrre, accanto ad un equity premium ampiamente positivo, un tasso d’interesse negativo, e questo con moderati livelli di valutazione isolata. Vediamo ora il caso della Gran Bretagna con dati 1970-1999. I risultati ottenuti sono quelli riportati nella Tabella 7. Come si nota immediatamente, in questo caso abbiamo generato risultati per molti valori di b0 , più che nel caso precedente. La tendenza vista in precedenza è comunque confermata: l’introduzione combinata degli ingredienti narrow framing&loss aversion consente di ottenere risultati in linea con l’evidenza empirica.
76
Ovviamente tale ragionamento è valido per valori dell’avversione relativa al rischio non eccessivamente elevati (cfr. capitolo 1, paragrafo 2). 77 E’ opportuno osservare che tale considerazione vale per la maggior parte dei casi che vedremo.
81
Notiamo che anche in questo caso, oltre una certa soglia, il solo aumento di b0 non è più sufficiente per ottenere risultati migliori. Diventa infatti necessario aumentare contemporaneamente anche λ . Con riferimento al tasso risk-free, il risultato migliore è ottenibile aumentando anche il livello dell’avversione al rischio, oltre a quello dell’avversione alla perdita. Ad esempio, con ( γ , λ , b0 ) = (3, 3, 0.50), otteniamo un livello di r f pari all’1.57%, con un premio per il rischio del 9.62%. Nella seconda e nella quarta parte della tabella abbiamo riportato risultati per più valori del grado di valutazione isolata, al fine di sottolineare una tendenza molto importante: oltre certi livelli (0.50 in questo caso), un aumento anche marcato di b0 , è appena sufficiente per ridurre solo marginalmente r f (ed aumentare il premio azionario). Ciò significa, evidentemente, che il grado di valutazione isolata degli investitori, oltre una certa soglia, tende a perdere la sua importanza e a ridurre il suo impatto sulle variabili cruciali del modello. Osserviamo infine una cosa piuttosto interessante e solo apparentemente discordante col modello teorico sottostante. E’ possibile notare che non sempre ad aumenti dell’avversione al rischio, a parità di altri parametri, seguono aumenti del tasso d’interesse, come la teoria vorrebbe. In particolare, quando b0 ≠ 0 e λ = 3 , dalla Tabella 6 vediamo che, in alcuni casi, aumenti di γ implicano una diminuzione di r f . Abbiamo infatti, ad esempio,
e
( γ , λ , b0 ) = (1.5, 3, 0.05) ⇒
r f = 1.17%
( γ , λ , b0 ) = (3, 3, 0.05)
⇒
r f = −0.34%
( γ , λ , b0 ) = (1.5, 3, 0.10) ⇒
r f = 0.90%
( γ , λ , b0 ) = (3, 3, 0.10)
r f = −0.47%
oppure,
e
⇒
Notiamo che abbiamo lo stesso tipo di comportamento, in parte, anche nel caso “short”. Si osservino e si confrontino in particolare le ultime tre righe della seconda parte e della quarta parte della Tabella 7: possiamo notare che aumenti di b0 comportano un effetto via via minore di γ su r f . In altre parole, per valori sempre più elevati di b0 , l’effetto positivo dell’avversione al rischio sul tasso d’interesse tende ad attenuarsi, fino a diventare di segno negativo. Ma a ben vedere, tutto ciò è perfettamente coerente con la teoria esposta in questo capitolo, che assegna un peso notevole alla valutazione isolata dei rischi e all’avversione verso le perdite azionarie nell’influenzare le
82
scelte degli investitori. Ed effettivamente, relativamente al tasso d’interesse, l’effetto introdotto dalla valutazione isolata dei rischi è leggermente superiore all’effetto (di segno contrario) dell’avversione al rischio γ .
C) ITALIA Passiamo ora al caso italiano. Abbiamo svolto un’analisi su un lasso di tempo limitato, 1971-1998. Sottolineiamo innanzitutto che il caso italiano è per certi versi simile a quello canadese e a quello giapponese. Si osservino le Tabelle 3 e 4: abbiamo valori dell’equity premium non così elevati come negli altri casi. Sono valori comunque non conciliabili con la teoria standard, ma non raggiungono i valori, quasi doppi, dei restanti paesi. Tutto ciò semplicemente per dire che il caso italiano, insieme ai casi di Canada e Giappone, potrebbe discostarsi non poco dalla tendenza generale, che è comunque favorevole al modello BH. Nella Tabella 8 sono presentati i principali risultati. E’ evidente che le cose non funzionano così bene come per USA e Gran Bretagna. Le tendenze di fondo del modello sono indubbiamente le solite, ma il problema è riuscire ad ottenere un valore di r f vicino al suo valore empirico ed allo stesso tempo un premio per il rischio non troppo elevato e vicino al dato reale. Nella tabella non compare, ma con ( γ , λ , b0 ) = (1.5, 2, 0.053), siamo in grado di ottenere EP = 4.68%: tale risultato è però poco significativo se si pensa che è ottenuto con un tasso d’interesse pari al 4.37%. Comunque, riassumendo, la cosa insoddisfacente è che quando si intravede la possibilità di replicare il tasso d’interesse, si è comunque ben lontani dal replicare l’equity premium. Del resto, e questo è piuttosto evidente e ben conosciuto, il caso italiano, per vari elementi strutturali, non è così facilmente paragonabile ai casi USA/Gran Bretagna. Si pensi ad esempio all’atteggiamento degli individui nei confronti dell’investimento azionario, alla struttura del mercato dei capitali, alla struttura dei portafogli famigliari, ecc.78 In Italia la cultura dell’investimento azionario è cosa piuttosto recente, al contrario dei paesi anglosassoni, dove già da molti anni esiste una maggiore cultura finanziaria e una maggiore dimestichezza nell’utilizzo di certi prodotti finanziari (si pensi ad esempio ai derivati).79 E’ quindi ragionevole supporre che l’approccio BH, date le sue caratteristiche distintive, si adatti alla realtà italiana in maniera piuttosto approssimativa. Ma recentemente, le massicce privatizzazioni che 78
In relazione alle differenze con gli USA si veda Faiella-Neri (2004). Esistono oramai diversi lavori che enfatizzano l’importanza della diffusione di una certa cultura finanziaria al fine di promuovere ulteriormente lo sviluppo dei mercati finanziari di alcuni paesi e di ampliare le possibilità di diversificare con profitto i propri investimenti. Si veda ad esempio HaliassosHassapis (2001). 79
83
hanno caratterizzato il nostro paese, unitamente al mutamento del quadro macroeconomico internazionale (bassi tassi d’interesse), promettono, forse non in tempi brevi, di contribuire a cambiare le cose.
D) GERMANIA Vediamo ora il caso della Germania. I risultati principali sono riportati nella Tabella 9. Il modello funziona molto bene: è evidente, dai risultati ottenuti, che è possibile generare un equity premium elevato e vicino al valore empirico, in contemporanea con un basso tasso risk-free, anch’esso prossimo al suo valore empirico. Va comunque segnalato che i risultati migliori sono ottenuti con λ = 3 . Notiamo, infine, che come accadeva anche per altri paesi, in certi casi (vedi prima parte della tabella) un aumento di b0 oltre certi livelli non ha più effetti consistenti su tassi d’interesse e premio azionario.
E) FRANCIA Anche per la Francia abbiamo risultati coerenti con l’evidenza empirica, tenuto ovviamente conto dell’implementazione di valori ragionevoli per i parametri relativi alle preferenze (si veda la Tabella 10). La tendenza è la solita: un aumento del grado di narrow framing implica una diminuzione di r f ed un aumento del premio per il rischio richiesto dagli investitori per detenere azioni in equilibrio. In alcuni casi, come già osservato per la Gran Bretagna, relativamente agli effetti dispiegati sul tasso d’interesse, l’aumento di b0 controbilancia l’aumento del parametro di avversione relativa al rischio, con effetto netto negativo (il tasso diminuisce).
F) GIAPPONE Come nel caso dell’Italia, anche per il Giappone le cose non funzionano così bene. Anzi, abbiamo più problemi in questo caso che in quello italiano. Nella Tabella 11 abbiamo riportato i principali risultati. Anche nel caso del Giappone abbiamo il problema di generare, simultaneamente, un premio azionario abbastanza elevato ed un basso tasso d’interesse. Tra l’altro, nel caso giapponese il tasso d’interesse è di un punto percentuale più basso di quello italiano: questo rende le cose ancora più problematiche.
84
G) CANADA Vediamo la situazione del Canada. Notiamo innanzitutto (Tabelle 3 e 4) che il dato empirico relativo al premio per il rischio è simile a quello di Italia e Giappone, ossia relativamente basso. E come si nota dalla Tabella 12, anche in questo caso è abbastanza problematico replicare l’evidenza empirica. In generale, però, troviamo confermate le tendenze e le caratteristiche di fondo del modello BH. L’introduzione della valutazione isolata circa il rischio derivante dal mercato azionario produce, come nei casi precedenti, una riduzione del tasso d’interesse e un corrispondente aumento del premio azionario per il rischio. Oltre una certa soglia del grado di valutazione isolata non abbiamo più nessun particolare effetto su tasso d’interesse ed equity premium. Per quanto concerne gli effetti di variazioni dell’avversione relativa al rischio sul tasso d’interesse, abbiamo una situazione standard e ampiamente prevedibile: ad aumenti di γ corrispondono aumenti di rf .
H) SVEZIA Il modello manifesta il solito comportamento qualitativo, ma dal punto di vista quantitativo tende ad allinearsi ai casi che funzionano meno bene. Possiamo infatti vedere che non è così semplice “clonare” allo stesso tempo tasso privo di rischio e premio azionario. Ma nel caso ( γ , λ , b0 ) = (1.5, 3, 0.10) è comunque possibile avvicinarsi con buona approssimazione ai valori empirici di riferimento. Anche per la Svezia vale il fatto che, superata una certa soglia del grado di valutazione isolata, gli effetti dispiegati su tasso d’interesse e premio azionario sono assai modesti.
3 Conclusioni Come detto all’inizio del capitolo, BH (2004a, b) testano la validità del loro modello soltanto in riferimento al caso statunitense. Questo, oltre ad essere di per sé limitante, non fornisce l’opportunità di individuare la presenza di alcuni interessanti comportamenti, cosa che invece viene fatta e sottolineata in questa sede. L’approccio proposto da Barberis e Huang sembra dimostrarsi “robusto” anche con riferimento a paesi diversi dagli USA. E’ vero che i dati di Italia, Giappone e Canada non vanno perfettamente d’accordo col modello, ma la loro tendenza di fondo è quella “attesa” e vista
85
in altri casi. Comunque, considerando tutti i casi visti, sono due i punti che meritano di essere riassunti e ribaditi. La possibilità per l’agente economico di derivare utilità, oltre che dal consumo, anche dalle fluttuazioni della sua ricchezza azionaria, combinata con un certo grado di valutazione isolata del rischio derivante dal mercato azionario, più l’avversione alle perdite finanziarie,80 contribuisce notevolmente a migliorare le performances dei modelli con mercati completi e senza frizioni, nel replicare l’andamento effettivo del premio azionario e del tasso risk-free. Il meccanismo è semplice: l’investitore, nelle sue valutazioni d’investimento, dà più peso alla sua avversione verso le possibili perdite finanziarie che alla sua voglia di cogliere sui mercati favorevoli opportunità d’investimento. Si aggiunga a questo il fatto che l’eventuale acquisto di azioni viene valutato “a sè”, senza essere “combinato” con i rischi già fronteggiati. Tutto ciò contribuisce a rendere l’investimento azionario particolarmente rischioso e spinge quindi l’investitore a chiedere, in equilibrio, un premio per il rischio maggiore rispetto ai modelli standard. Un altro aspetto degno di nota, che non ritroviamo nei lavori di BH (2004a, b), è quello relativo al rapporto tra γ e b0 . Come visto, l’aumento di tali variabili ha sul tasso d’interesse risk-free un effetto di segno contrario. Il parametro di avversione relativa al rischio, essendo il reciproco dell’elasticità di sostituzione intertemporale (ESI), tende, aumentando, a spingerlo in alto, a causa della diminuita ESI (che spinge gli agenti ad indebitarsi per aumentare il loro consumo corrente), mentre l’aumento del grado di narrow framing (combinato col grado di avversione alla perdita) tende a spingerlo verso il basso. L’effetto legato all’aumento di b0 si spiega con l’aumento del rischio derivante dal mercato azionario, il quale comporta un dirottamento delle risorse finanziarie verso attività diverse, quali titoli privi di rischio e attività non finanziarie. L’acquisto di attività “certe” aumenta il loro prezzo, abbassandone il relativo tasso d’interesse. Notiamo che quest’ultimo effetto è lo stesso generato dal risparmio a fini precauzionali indotto dall’aumento di γ . Infatti, come visto (capitolo 1, paragrafo 2), l’aumento dell’avversione al rischio non implica solo un aumento del tasso d’interesse (crescita del consumo corrente), ma anche un sua diminuzione (risparmio precauzionale): ma per valori di γ non troppo elevati, ossia coerenti con la parametrizzazione delle preferenze individuali, l’effetto dominante è quello legato alla crescita del consumo, e quindi i tassi aumentano. L’effetto generato dal grado di valutazione isolata, aggiungendosi a quello del risparmio precauzionale, è invece in grado di controbilanciare l’effetto netto legato all’aumento dell’avversione al rischio, comportando una riduzione del tasso d’interesse. Ed è proprio questa capacità del modello di ribaltare gli effetti della “classica” avversione al rischio, a generare la possibilità di 80
Introdotta, quest’ultima, dalla forma particolare della funzione v .
86
replicare, con moderati gradi di approssimazione, i valori empirici del premio azionario e del tasso risk-free. Un breve cenno alla questione dell’aggregazione. E’ implicito che utilizzando un modello ad agente rappresentativo, stiamo supponendo che le preferenze individuali in oggetto valgano anche nell’aggregato. Del resto, è ragionevole ritenere che se tutti gli individui di un’economia hanno preferenze caratterizzate da narrow framing e loss aversion, aggregando tali individui, lo stesso tipo di preferenze non dovrebbe avere problemi a rimanere preservato. Appare comunque evidente l’importanza di indagare il grado di narrow framing degli investitori da varie prospettive, al fine di verificare ulteriormente quanto effettivamente “pesa” nei processi di scelta degli agenti economici. Dopo aver analizzato le cose in un contesto di equilibrio generale, potrebbe essere “redditizio”, e quindi fonte di importanti informazioni aggiuntive, analizzare il fenomeno in un contesto di equilibrio parziale, tipico delle scelte di portafoglio. Questo è ciò che faremo nel capitolo successivo.
87
TABELLE
Tabella 1 (Dati tratti da Campbell, 2003)81 USA GB “long” GB “short” ITA
GER
Periodo
1889-1985
1919-1998
1970-1999
1971-1998
1978-1997
gC
1.84% 3.79% 20% 0.10
1.55% 2.88% 22.17% 0.422
2.20% 2.50% 21.2% 0.197
2.20% 1.70% 27% -0.033
1.68% 2.43% 20.10% -0.151
0.20
0.25
0.25
0.15
0.15
σC σS ω C, S θS
Parametri del modello
Tabella 2 (Dati tratti da Campbell, 2003) FRA
JAP
CAN
SVE
Periodo
1973-1998
1970-1999
1970-1999
1920-1998
gC
1.23%
3.20%
2.1%
1.77%
σC σS ω C, S
2.91%
2.55%
1.97%
2.81%
23.42%
21.90%
17.28%
18.64%
-0.117
0.398
0.35
0.21
θS
0.15
0.20
0.25
0.15
Parametri del modello
81
Ad esclusione dei dati relativi agli USA, che sono tratti da BHS (2001) e BH (2004b), e sono comunque considerati standard nella letteratura di asset pricing. Campbell (2003) fornisce stime più aggiornate (1891-1998), ma abbiamo avuto modo di verificare che esercizi fatti con tali stime forniscono risultati in linea con quelli presentati nella Tabella 5.
88
Tabella 3 (Dati tratti da Campbell, 2003) USA GB “long” GB “short” ITA Periodo 1891-1998
GER
1919-1998
1970-1999
1971-1998
1978-1997
rf
2%
1.25%
1.30%
2.37%
3.22%
EP
6.72%
8.67%
9.17%
4.68%
8.67%
Valori empirici di riferimento
Tabella 4 (Dati tratti da Campbell, 2003) FRA JAP CAN SVE Periodo 1973-1998 1970-1999 1970-1999 1920-1998
rf
2.71%
1.38%
2.7%
2.2%
EP
8.30%
5.10%
4%
6.5%
Valori empirici di riferimento
Tabella 5 – USA (1889-1985) γ λ b0 rf EP 1.5 2 0 4.70% 0.12% 1.5 2 0.05 3.60% 3.75% 1.5 2 0.10 3.30% 4.66% 1.5 1.5
3 3
0.05 2.60% 7.06% 0.10 2.20% 8.16%
3 3 3
2 2 2
0 6.90% 0.24% 0.05 4.90% 3.40% 0.10 4.30% 4.45%
3 3 0.05 2.80% 6.91% 3 3 0.10 2% 8.22% Riadattata da BH (2004b)
89
γ
Tabella 6 – UK (1919-1998) λ b0 rf gS EP
1.5 1.5 1.5
2 2 2
0 4.34% 0.05 2.74% 0.10 2.43%
2.20% 0.42% 4.72% 4.70% 5.20% 5.53%
1.5 1.5
3 3
0.05 0.10
1.17% 0.90%
7.10% 8.85% 7.51% 9.58%
3 3 3 3 3
2 2 2 2 2
0 0.05 0.10 0.50 2
6.50% 3.81% 3.05% 2.41% 2.30%
4.65% 5.46% 5.68% 5.85% 5.88%
3 3
3 3
0.05 -0.34% 6.58% 9.80% 0.10 -0.47% 6.61% 9.96%
1.31% 4.43% 5.42% 6.25% 6.39%
Nostra elaborazione
γ
Tabella 7 – UK (1970-1999) λ b0 rf gS EP
1.5 1.5 1.5 1.5
2 2 2 2
0 5.39% 3.16% 0.16% 0.05 4% 5.29% 3.82% 0.10 3.63% 5.90% 4.85% 2 3.15% 6.63% 6.13%
1.5 1.5 1.5 1.5 1.5
3 3 3 3 3
0.05 0.10 0.50 2 10
2.63% 2.17% 1.82% 1.76% 1.75%
7.41% 8.10% 8.60% 8.69% 8.71%
7.50% 8.73% 9.63% 9.79% 9.82%
3 3 3 3 3
2 2 2 2 2
0 0.05 0.10 0.50 2
8.70% 6.50% 5.57% 4.48% 4.26%
6.41% 7.06% 7.32% 7.62% 7.68%
0.34% 3.25% 4.46% 5.88% 6.17%
3 3 3 3 3
3 3 3 3 3
0.05 0.10 0.50 2 10
3.69% 2.33% 1.57% 1.47% 1.44%
7.83% 8.18% 8.37% 8.40% 8.41%
6.91% 8.65% 9.62% 9.76% 9.80%
Nostra elaborazione
90
γ
Tabella 8 - Italia (1971-1998) λ b0 rf gS EP
1.5 1.5 1.5 1.5
2 2 2 2
0 0.05 0.10 0.50
1.62% 4.93% 5.93% 7.03%
-0.024% 4.55% 5.96% 7.54%
1.5 1.5 1.5 1.5
3 3 3 3
0.05 3.42% 7.94% 0.10 3% 9.23% 0.50 2.63% 10.33% 2 2.56% 10.54%
8.86% 10.74% 12.36% 12.68%
3 3 3
2 2 2
0 8.86% 0.05 7.16% 0.10 6.42%
4.80% 6.67% 7.46%
-0.048% 3.70% 5.32%
3 3 3
3 3 3
0.05 5.38% 8.56% 0.10 4.19% 9.78% 2 3% 10.96% Nostra elaborazione
7.60% 10.17% 12.72%
5.43% 4.40% 4.08% 3.72%
Tabella 9 – Germania (1978-1997) λ b0 rf gS EP 1.5 2 0 4.58% 2.34% -0.14% 1.5 2 0.05 3.73% 5.09% 3.61% 1.5 2 0.10 3.52% 5.76% 4.55% 1.5 2 0.50 3.29% 6.48% 5.56% 1.5 2 2 3.24% 6.64% 5.78%
γ
1.5 1.5 1.5
3 3 3
0.05 3.02% 7.32% 0.10 2.74% 8.18% 0.50 2.50% 8.94%
3 3 3
2 2 2
0 7% 4.55% -0.23% 0.05 5.54% 6.23% 3.03% 0.10 5% 6.80% 4.20%
3 3 3 3
3 3 3 3
0.05 4.14% 7.75% 0.10 3.40% 8.53% 0.20 3% 8.94% 0.50 2.78% 9.18% Nostra elaborazione
91
6.74% 7.97% 9%
6.10% 7.70% 8.56% 9.05%
Tabella 10 – Francia (1973-1998) λ b0 rf gS EP
γ 1.5 1.5 1.5
2 2 2
0 3.84% 0.91% -0.12% 0.05 2.73% 4.52% 4.80% 0.10 2.52% 5.18% 5.72%
1.5 1.5 1.5 1.5
3 3 3 3
0.01 0.03 0.05 0.10
2.95% 2.10% 1.81% 1.58%
3.80% 6.51% 7.40% 8.10%
3 3 3 3 3
2 2 2 2 2
0 0.05 0.10 0.50 2
5.47% 3.33% 2.82% 2.37% 2.28%
2.35% -0.25% 4.77% 4.47% 5.33% 5.58% 5.82% 6.56% 5.91% 6.75%
3 3 3 3
3 3 3 3
0.01 4% 4% 2.97% 0.03 1.81% 6.41% 7.77% 0.05 1.09% 7.18% 9.33% 0.10 0.70% 7.59% 10.18% Nostra elaborazione
γ
3.80% 7.59% 8.86% 9.86%
Tabella 11 – Giappone (1970-1999) λ b0 rf gS EP
1.5 1.5 1.5 1.5
2 2 2 2
0 0.05 0.10 0.50
6.98% 6.17% 5.81% 5.30%
4.68% 6.43% 7.20% 8.28%
1.5 1.5 1.5 1.5
3 3 3 3
0.05 0.10 0.50 2
5.33% 4.75% 4.13% 4%
8.20% 5.84% 9.41% 7.78% 10.68% 9.83% 10.94% 10.26%
3 3 3
2 2 2
0 12% 9.60% 0.05 10.77% 10.32% 0.10 10.10% 10.70%
0.74% 2.78% 3.89%
3 3 3
3 3 3
0.05 9.44% 11.07% 0.10 8.19% 11.77% 0.50 6.48% 12.69% Nostra elaborazione
4.97% 7% 9.80%
92
0.35% 3.05% 4.26% 5.96%
Tabella 12 – Canada (1970-1999) λ b0 rf gS EP 1.5 2 0 5.26% 3.81% 0.18% 1.5 2 0.05 4.18% 5.50% 3% 1.5 2 0.10 3.87% 6% 3.91% 1.5 2 0.50 3.53% 6.50% 4.80% 1.5 2 2 3.46% 6.61% 4.98%
γ
1.5 1.5 1.5
3 3 3
0.05 3.14% 7.1% 5.83% 0.10 2.74% 7.70% 6.88% 0.50 2.40% 8.21% 7.78%
3 3 3
2 2 2
0 8.50% 7% 0.36% 0.05 6.78% 7.52% 2.65% 0.10 6.07% 7.73% 3.60%
3 3 3
3 3 3
0.05 4.86% 8.07% 5.17% 0.10 3.74% 8.37% 6.62% 0.50 2.85% 8.61% 7.78% Nostra elaborazione
Tabella 13 – Svezia (1920-1998) γ λ b0 rf gS EP 1.5 1.5 1.5 1.5 1.5
2 2 2 2 2
0 0.05 0.10 0.50 1
4.69% 3.97% 3.78% 3.57% 3.54%
3% 5.35% 5.96% 6.64% 6.74%
1.5 1.5 1.5 1.5
3 3 3 3
0.05 0.10 0.50 1
3.35% 3.09% 2.84% 2.81%
7.32% 5.86% 8.14% 7% 8.91% 8.12% 9.02% 8.27%
3 3 3
2 2 2
0 7.22% 5.57% 0.1% 0.05 6.04% 6.90% 2.7% 0.10 5.61% 7.37% 3.65%
3 3 3
3 3 3
0.05 4.88% 8.17% 5.26% 0.10 4.22% 8.88% 6.7% 0.50 3.57% 9.56% 8.11% Nostra elaborazione
93
3.75% 3.11% 3.95% 4.9% 5.04%
APPENDICE MATEMATICA A.3.1) Derivazione delle equazioni (68) - (70). Vediamo come si ottengono le tre condizioni (68) – (70) del testo. BH (2004a) dimostrano che dal problema di massimizzazione generale con n attività, costituito dall’equazione (59) e seguenti del capitolo 2, se supponiamo che la prima attività sia quella priva di rischio, che il relativo rendimento lordo venga preso come punto di riferimento per valutare le fluttuazioni della ricchezza azionaria, e che θ i ,t > 0 ∀i > 1 , è possibile giungere alle due seguenti condizioni di ottimo del primo ordine:82
C 1 = βR f Et ( t +1 ) −γ Ct
γ
C 1−γ ⋅ βEt ( t +1 ) −γ RW ,t +1 Ct
(1)
C Et ( t +1 ) −γ ( Ri ,t +1 − R f ,t ) C + 0= t C Et ( t +1 ) −γ Ct + b0 I {i > m}R f ,t (
β 1− β
)
1 1−γ
(
1 − αt
αt
i = 2,......., n )
−γ 1−γ
[
Et v( Ri ,t +1 − R f ,t )
(2)
]
Le tecniche utilizzate per ottenere tali espressioni sono quelle della programmazione dinamica, lunghe e tediose ma non complicate.83 Notiamo subito che la (1) non è altro che la (65). Nella (2) compare un indicatore, I {i > m}, che sta a significare che abbiamo 1 per valori i > m e 0 per valori i ≤ m . Data l‘esigenza di indagare il paradosso del premio azionario e quello 82
Supponiamo inoltre che gli esponenti della funzione aggregatrice e della funzione dell’equivalente di certezza siano uguali a 1 − γ . 83 Anche se in questo caso ci sono alcune complicazioni dovute all’uso delle funzioni indicatrici. Il lettore interessato a tale dimostrazione può consultare la sezione “Proof of Proposition 1” nell’Appendice di BH (2004a).
94
del tasso risk-free, come suggerito da BH (2004a), al fine di non fissare un valore a priori per r f , è particolarmente utile avere a disposizione una terza condizione, ricavata facendo la somma “pesata” delle equazioni contenute nella (2), con l’i-esima equazione pesata con θ i, t . Otteniamo la seguente espressione:
C Et ( t +1 ) −γ ( RW ,t +1 − R f ,t ) C + 0= t Ct +1 −γ Et ( ) C t
β
+ b0 R f ,t ( ) 1− β
1 1−γ
(
1−αt
αt
)
−γ 1−γ
(3)
n
∑ Et [θ i,t v( Ri,t +1 − R f ,t )]
i = m +1
A questo punto, tenendo presente che il modello analizzato nel testo ha solo tre attività e solo una è soggetta a narrow framing (l’azione), la 2 e la 3 si riducono alla (66) e alla (67). Abbiamo n = 3 , m = 2 e 3 = S . Sfruttando poi le ipotesi fatte ai punti 1 – 4, dalle (65) – (67) possiamo ottenere le (68) – (70). Partiamo dalla (65). Sostituendo in tale espressione il tasso di crescita del consumo, il rendimento della ricchezza complessiva, e utilizzando le altre ipotesi, abbiamo:
[
(
1 = βR f Et e
−γgC −γσ C ε C ,t +1
1 gW = g C + log( ), 1−α
dove
)]⋅ [βE (e t
−γgC −γσ C ε C ,t +1
)]
γ
g +σ ε ⋅ e W W W ,t +1 1−γ
σ W = σ C e ε W ,t +1 = ε C ,t +1 . Proseguendo
risolvendo i valori attesi, dopo alcuni passaggi otteniamo γ
γ 2σ 2 1 1−γ −γgC + 2 C ⋅ βEt e (1−γ ) gC +(1−γ )σ C ε C ,t +1 ⋅ 1 = βR f e 1 − α
⇒
−γg + 1 = βR f e C
2 γ 2σ C 2
γ
1 1−γ (1−γ ) gC + β 1−γ e 1−α γ
95
2 (1−γ ) 2 σ C 2
⇒
γ
1−γ
⇒
⇒ 1= β
1 1−γ
γ
1 1−γ Rf e 1−α 1
1−α = β γ R f −
⇒
γ −1 γ
e
2 γσ C 2
⇒
− 12 (γ −1)σ C2
(4)
Nel risolvere i valori attesi, come già puntualizzato nel testo, abbiamo tenuto conto del fatto che se una variabile casuale x si distribuisce secondo una Normale standardizzata, allora E (e
a + bx
)=e
a+
b2 2
.
A questo punto dalla (4), dopo altri semplici passaggi, otteniamo la (68). Vediamo ora la (66). Tramite alcuni passaggi algebrici è piuttosto semplice dimostrare che il primo membro a destra del segno di uguaglianza risulta uguale a e
gS +
σ S2 2
−γωσ S σ C
− Rf
(5)
Bisogna invece prestare maggiore attenzione al secondo membro del lato destro dell’equazione, o meglio, al termine in valore atteso. Per tale termine abbiamo:
Et v( RS ,t +1 − R f ) = Et v(e Et [ I RS ,t +1 ≥ R f (e
Et [ I g S +σ S ε S ,t +1 ≥log( R f ) (e
(
σ S ε S ,t +1
e gS Et Iε S ,t +1 ≥εˆS e
g S +σ S ε S ,t +1
g S +σ S ε S ,t +1
) − R E (I f
t
g S +σ S ε S ,t +1
− Rf ) =
− R f ) + I RS ,t +1 < R f λ (e
− R f )] + Et [ I g
ε S ,t +1 ≥εˆS
S +σ S ε S , t +1 < log( R f )
) + λe E ( I gS
g S +σ S ε S ,t +1
t
λ (e
− R f )] = g S +σ S ε S ,t +1
σ S ε S ,t +1 ε S ,t +1 <εˆS e
− R f )] =
) − λR E (I f
t
ε S ,t +1 <εˆS
)=
dove stiamo usando una funzione indicatrice e
εˆS =
log( R f ) − g S
σS
.
Dobbiamo ora risolvere i 4 membri dell’ultima espressione. Nel fare tale operazione è necessario risolvere i valori attesi che comprendono anche le
96
funzioni indicatrici, e facciamo questo tenendo conto del fatto che, in generale,
E ( I ε <εˆ ) = N (εˆ ) E ( I ε <εˆ e aε ) = e
a2 2
N (εˆ − a)
Nel nostro caso specifico avremo quindi: =e
gS +
σ S2 2
N (σ S − ε S ) − R f N (−ε S ) + λ e
gS +
σ S2 2
N (ε S − σ S ) − λ R f N (ε S ) =
Utilizzando il fatto che N ( x) = 1 − N (− x) e N (− x) = 1 − N ( x) , possiamo scrivere =e
gS +
σ S2 2
− Rf + e =e
gS +
σ S2 2
gS +
σ S2 2
[λ N (ε S − σ S ) − N (ε S − σ S )] − R f [λ N (ε S ) − N (ε S )] =
− R f + (λ − 1)[e
gS +
σ S2 2
N (ε S − σ S ) − R f N (ε S )] .
(6)
Combinando la (5) e la (6) abbiamo la (69). Per ottenere la (70) partendo dalla (67), notiamo che dobbiamo solo calcolare l’espressione per il primo membro del lato destro, visto che il secondo membro comprende il valore atteso della funzione v(•) che abbiamo appena calcolato. Il primo membro del lato destro è pari a 2
1 gC + σ2C −γσ C2 e − Rf . 1−α Combinando la (6) e la (7) otteniamo la (70).
97
(7)
A.3.2) Funzione di ripartizione e funzione di errore. Vediamo cosa c’è dietro l’espressione N (⋅) presente nelle tre equazioni (68) – (70). Come detto, si tratta della funzione di ripartizione della distribuzione di probabilità “Normale standard”, e nel nostro caso sta ad indicare il valore atteso di una funzione che assume un certo valore a seconda del valore positivo o negativo del suo argomento. Il riferimento è alla funzione v(⋅) . Nelle equazioni (68) – (70) abbiamo infatti che
E ( I ε <εˆ ) = N (εˆ ) dove abbiamo formalizzato, usando un “indicatore” (indicator function), quanto appena detto. La funzione di ripartizione della Normale standard è, per definizione,
1 P ( X ≤ x) = N ( x) = 2π
x
∫e
−
t2 2 dt
−∞
x
=
∫ f (t )dt
(1)
−∞
t2
1 −2 dove f (t ) = e è la funzione di densità della Normale standard. La 2π funzione di ripartizione fornisce la probabilità che ha la variabile casuale X di assumere un valore minore o uguale a un certo valore x. Nella risoluzione del sistema di tre equazioni in tre incognite, N (⋅) viene implementata in MatLab in funzione della cosiddetta erf (error function), una funzione di errore, in quanto il software riconosce tale tipo di funzione e la utilizza per risolvere numericamente le procedure in cui essa è coinvolta. Tale funzione si ottiene moltiplicando per 2 l’integrale della funzione di densità della gaussiana con media pari a 0 e varianza pari a ½. Il valore generico che ne segue è il seguente:
erf ( x) =
2
π
x
∫0
2
e −t dt
(2)
Tale funzione ha una serie di proprietà, alcune delle quali saranno sfruttate nelle dimostrazioni che seguiranno. Come scrivere N ( x) in funzione dell’ erf ( x) ? Troveremo la soluzione invertendo una nota relazione della statistica matematica che ci fornisce l’erf in funzione della N ( x) . La relazione è la seguente:
98
erf ( x) = 2 N ( x 2 ) − 1
(3)
x 2
∫ f (t )dt
N (x 2) =
dove
(4)
−∞
Prima di invertire la (3), verifichiamo tale relazione per sostituzione. A tale scopo sostituiamo la (4) nel lato destro della (3), ottenendo
1 2 2π
x 2
∫
e
−
t2 2 dt − 1
(5)
−∞
A questo punto operiamo un cambio di variabile all’interno dell’integrale. Poniamo
t t2 ⇒ z2 = , 2 2
z=
da cui segue che, t = z 2 , dt = 2dz e, per il cambio dell’estremo superiore dell’integrale, t ≤ x 2 ⇒ z 2 ≤ x 2 ⇒ z ≤ x . Facendo le dovute sostituzioni nella (5) e alcune semplificazioni, abbiamo 1 2 2π
x
∫
e
2 2dz − 1 = π
−z2
−∞
x
∫
2
e − z dz − 1
(6)
−∞
Ora sfruttiamo il fatto che
erf (+∞) =
+∞
e notiamo di passaggio che
∫0
2
π
2
e − z dz =
+∞
∫0
π 2
2
e − z dz = 1
(7)
.
Sostituendo la (7) nella (6) otteniamo 2
π
x
∫e
−∞
−z2
dz −
2
π
+∞
∫e 0
−z2
x +∞ 2 2 −z2 dz = e dz − e − z dz = π −∞ 0
∫
99
∫
x 0 +∞ 2 2 −z2 −z2 = e dz + e dz − e − z dz = π −∞ 0 0
∫
∫
=
2
π
x
∫
∫
2
e − z dz = erf ( x)
0
2
Arriviamo all’ultima espressione perché, essendo e − z una funzione simmetrica divisa in due dall’asse delle ordinate, vale la seguente relazione: +∞
∫e
−z2
0
dz =
∫e
−z2
dz =
−∞
0
π 2
.
(8)
Dimostrata la relazione (3), ora la invertiremo al fine di esplicitare la N ( x) in funzione dell’error function. Premettiamo subito che arriveremo a dimostrare che erf ( x) = 2 N ( x 2 ) − 1 ⇒ N ( x) =
1 x + 1 erf 2 2
Abbiamo:
1 1 erf ( x) = 2 N ( x 2 ) − 1 ⇒ N ( x 2 ) = erf ( x) + ⇒ 2 2 x 2
⇒
1
1
∫ f (t )dt = 2 erf ( x) + 2
(9)
−∞
Possiamo riscrivere l’ultimo membro del lato destro, ½, in un certo modo, utilizzando il fatto che, lavorando con la Normale standard, 0
∫
−∞
x
f (t )dt =
∫
x
∫
f (t )dt − f (t )dt =
−∞
0
1 2
Sostituendo la (10) nella (9) abbiamo: x 2
∫
−∞
x
x
1 f (t )dt = erf ( x) + f (t )dt − f (t )dt ⇒ 2 0 −∞
∫
100
∫
(10)
x 2
∫
⇒
−∞
x
1 f (t )dt = erf ( x) + N ( x) − f (t )dt ⇒ 2 0
∫
x 2
x
1 f (t )dt + f (t )dt − erf ( x) ⇒ 2 0
∫
⇒ N ( x) =
∫
−∞
x 2
1 ⇒ N ( x) = 2π
∫
e
−
t2 2 dt
−∞
1 + 2π
x
∫0 e
−
t2 2 dt
1 − erf ( x) 2
(11)
Ora è necessario operare un altro cambio di variabile, sia nel primo che nel secondo integrale del lato destro della (11). Procedendo nello stesso modo visto sopra, abbiamo
z=
t t2 ⇒ z2 = 2 2
t = z 2 , dt = 2dz e, per il cambio dell’estremo superiore del primo integrale, t ≤ x 2 ⇒ z 2 ≤ x 2 ⇒ z ≤ x . Per l’estremo superiore del secondo integrale x 84 . Facendo le dovute sostituzioni abbiamo invece t ≤ x ⇒ z 2 ≤ x ⇒ z ≤ 2 nella (11) otteniamo N ( x) =
1 2π
x
∫
e−z
2
2dz +
−∞
⇒ N ( x) =
x
1
π
∫e
−z2
−∞
1 2π
dz +
x/ 2
∫0
1
π
e−z
2
x/ 2
∫0 e
1 2 2dz − 2 π −z2
1
x
e π ∫0
dz −
2 e − z dz ⇒ 0 x
∫
−z2
dz
Moltiplicando ambo i lati per due e raccogliendo abbiamo: x x/ 2 x 2 2 −z2 −z2 e dz + e dz − e − z dz ⇒ 2 N ( x) = π −∞ 0 0
∫
84
∫
L’estremo inferiore rimane zero.
101
∫
⇒ 2 N ( x) =
x x x/ 2 2 2 2 − z 2 e dz − e − z dz + e − z dz ⇒ π −∞ 0 0
∫
∫
∫
0 x/ 2 2 −z2 −z2 ⇒ 2 N ( x) = e dz + e dz π −∞ 0
∫
∫
(12)
Usando la (8) possiamo riscrivere la (12) come segue: 2 N ( x) =
2
π
+∞
∫0 e
−z2
dz +
2
x/ 2
π
∫0 e
−z2
dz
Ma è allora immediato verificare che possiamo ancora scriverla in questo modo:
x 2 N ( x) = erf (+∞) + erf ⇒ 2 x ⇒ 2 N ( x) = 1 + erf 2 E’ ora semplice pervenire all’espressione cercata: N ( x) =
1 x + 1 erf 2 2
(13)
La (13) è l’espressione utilizzata nel risolvere con MatLab le equazioni (68) – (70) nelle tre incognite α , R f e g S .
102
A.3.3) Codici MatLab per la risoluzione numerica delle equazioni (68) – (70). N.B.: su richiesta presso l’autore, i codici MatLab sono anche disponibili in formato elettronico (
[email protected]).
File Narrow.m gamma = 1.5; beta = 0.98; lambda = 2; gc = 0.022; sigmac = 0.017; sigmas = 0.27; omega = -0.033; thetas = 0.15; b0 = 0.05; p = [gamma, beta, lambda, gc, sigmac, sigmas, omega, thetas, b0]; Rf = 1.05; gs = 0.05; x0 = [Rf; gs]; [y,f1,f2] = phi( x0, p ); f1, f2 options = optimset( 'display', 'off', 'TolX', 1e-10, 'TolFun', 1e-10 ); [x, phi_val] = fminsearch( @phi, x0, options, p ); x [y,f1,f2] = phi(x, p ); f1, f2.
103
File Phi.m function [y, f1, f2] = phi(x,p) %PHI Summary of this function goes here % Detailed explanation goes here Rf = x(1); gs = x(2); gamma = p(1); beta = p(2); lambda = p(3); gc = p(4); sigmac = p(5); sigmas = p(6); omega = p(7); thetas = p(8); b0 = p(9); sigma2c = sigmac*sigmac; sigma2s = sigmas*sigmas; epss = (log( Rf ) - gs)/ sigmas; alfa = 1 - beta^(1/gamma)*(Rf)^((1-gamma)/gamma)*exp( .5*(1-gamma)*sigma2c ); f1 = b0 * Rf * (beta / (1-beta))^(1/(1-gamma)) * ((1-alfa)/alfa)^(-gamma/(1-gamma)) * ... ( exp( gs + .5*sigma2s ) - Rf ... + ( lambda - 1)*( exp( gs + .5*sigma2s ) * N( epss - sigmas) - Rf*N(epss) ) ... ) ... + exp( gs + .5*sigma2s - gamma*sigmas*sigmac*omega ) - Rf; f2 = b0 * Rf * (beta / (1-beta))^(1/(1-gamma)) * ((1-alfa)/alfa)^(-gamma/(1-gamma)) * thetas * ... ( exp( gs + .5*sigma2s ) - Rf ... + ( lambda - 1)*( exp( gs + .5*sigma2s ) * N( epss - sigmas) - Rf*N(epss) ) ... ) ... + (1/(1-alfa)) * exp( gc + (.5-gamma)*sigma2c ) - Rf; y = f1*f1 + f2*f2.
104
File N.m function y = N( x ) %N Summary of this function goes here % Detailed explanation goes here y = 0.5 * ( erf( x/sqrt(2) ) + 1 ); %y = erf(x).
105
4 VALUTAZIONE ISOLATA, SCELTE DI PORTAFOGLIO E “HOME BIAS” AZIONARIO 1 Introduzione Nella letteratura di asset pricing esiste in varie forme, fin dagli anni ’70, il cosiddetto paradosso dell’home bias nella detenzione di azioni (equity home bias puzzle). Di cosa si tratta? La teoria di portafoglio “standard” (modelli media-varianza) è concorde nel ritenere che per gli agenti economici sarebbe ottimale detenere una quota di azioni estere molto superiore a quella effettivamente detenuta in portafoglio dagli investitori.85 Nella sua versione più semplice, portafogli con un “peso estero” modesto sono dominati, in termini di rischio-rendimento, da portafogli con un “peso estero” maggiore. Inoltre, essendo in alcuni casi i rendimenti delle azioni nazionali solo debolmente correlati con i rendimenti delle attività estere, dati i fondamenti della teoria della diversificazione di portafoglio, detenere una cospicua quota di azioni straniere risulterebbe particolarmente conveniente. Ma l’evidenza empirica disponibile contrasta fortemente con quanto suggerito dalla teoria. Le posizioni in attività estere dei principali paesi sono infatti assai modeste, e ciò è sinonimo di una scarsa diversificazione internazionale di portafoglio. In particolare, French-Poterba (1991) e TesarWerner (1995) stimano che, per USA e Giappone, agli inizi degli anni ’90, l’investimento in attività azionarie “di casa” ammontava a più del 90% della ricchezza azionaria complessiva,86 mentre si attestava attorno all’80% della ricchezza azionaria per Gran Bretagna e Germania.87 Cooper-Kaplanis (1986) sostengono che il fenomeno dell’home bias azionario è presente anche in paesi più piccoli. Essi stimano per Olanda e Svizzera una quota di attività nazionali pari, rispettivamente, al 56.5% e 65% della ricchezza azionaria complessiva; in un lavoro più recente (Cooper85
Si vedano, tra i pionieri, Levy-Sarnat (1970) e Solnik (1974); per rassegne recenti Lewis (1999) e Obstfeld-Rogoff (2000). 86 Per la precisione, con riferimento a French-Poterba (1991), 94% per gli USA e 98% per il Giappone. 87 Notiamo, di passaggio, che tale fenomeno nella detenzione di attività finanziarie, come documentato da Golub (1990) e Tesar-Werner (1995), è riscontrabile anche nel mercato obbligazionario.
106
Kaplanis, 1994), gli stessi autori stimano che l’investimento azionario nazionale, come frazione del portafoglio azionario complessivo, varia dal 65% della Francia al 100% della Svezia. E nei paesi “piccoli” (come la Svezia o l’Italia), l’incentivo all’investimento estero dovrebbe essere maggiore, visto che le azioni di tali paesi concorrono solo in minima parte alla formazione dell’ipotetico “portafoglio efficiente internazionale”. Durante gli anni ’90 la tendenza ad investire all’estero sembra però essere leggermente aumentata: Tesar-Werner (1998) forniscono evidenza che gli investitori americani, nel 1996, detenevano circa il 10% del proprio portafoglio azionario in attività estere. Siamo comunque a livelli ancora troppo bassi rispetto a quanto previsto dai modelli teorici. Varie spiegazioni sono state fornite in letteratura relativamente a tale fenomeno. Lewis (1999) fornisce un’esauriente rassegna di tali contributi. Vengono considerati modelli che incorporano l’idea che le attività finanziarie “di casa” siano più adeguate di quelle estere per assicurarsi contro i “rischi nazionali”, modelli che indagano il ruolo dei beni di consumo non scambiabili internazionalmente, l’idea che i costi di diversificazione siano maggiori dei potenziali guadagni e, infine, il ruolo degli errori di misurazione nelle statistiche disponibili. Ma c’è unanime consenso sul fatto che nessuna di queste spiegazioni contribuisce in maniera definitiva a rendere conto dell’home bias azionario. D’altra parte, se diamo uno sguardo ai dati a livello “microeconomico”, le cose sembrano cambiare ben poco. Da alcuni anni sono infatti disponibili numerose Survey, relative a vari paesi, che raccolgono dati a livello delle singole famiglie e consentono analisi piuttosto dettagliate, in base a varie categorie (età, livello di istruzione, ecc.). Consideriamo ad esempio il caso italiano. Dall’analisi dei dati della Banca d’Italia (Indagine sul Reddito e la Ricchezza delle Famiglie Italiane, 1998, 2000, 2002) emerge, tra le altre cose, una tendenza inequivocabile. L’investimento in attività finanziarie estere è molto modesto e rappresenta solo una piccola parte del portafoglio finanziario “rischioso” degli investitori; per il 2002 siamo ad esempio poco sopra il 2% del totale delle attività finanziarie rischiose (ossia senza attivi monetari).88 Ma ciò che merita di essere sottolineato è che sono soprattutto i laureati quelli che investono all’estero. Si osservino le Tabelle 1, 2 e 3. E’ evidente che anche i laureati investono la maggior parte della loro ricchezza in attività nazionali, ma rappresentano comunque una categoria di persone che ha nel proprio portafoglio una quota non trascurabile di attività estere. Ed è comunque facilmente verificabile che all’aumentare del livello di istruzione si riscontra un corrispondente aumento sia nell’ammontare investito in attività 88
Stiamo supponendo che un portafoglio comprensivo di tutte le tipologie di attività finanziarie ad esclusione degli attivi monetari (depositi, c/c, ecc.), possa rappresentare una valida proxy dell’ipotetico portafoglio finanziario “rischioso” delle famiglie.
107
estere che nella partecipazione al mercato finanziario estero (sulle percentuali di partecipazione si vedano le Tabelle 4, 5 e 6).
Composizione % - Portafoglio “rischioso” Azioni nazionali Fondi nazionali Gestioni Patrimoniali Obbligazioni Titoli di Stato Azioni estere Bonds+Fondi esteri Altro estero Estero totale Portafoglio rischioso
Maturità 19,61 21,64 25,81 5,90 25,36 0,49 1,14 0,06
Laurea 19,22 30,13 15,51 16,58 16,58 0,58 1,28 0,14
0,68
0,80
1,68
1,99
100,00
100,00
100,00
100,00
Tabella 1 – Dati 1998 – Istruzione - (Ns. elaborazione)
Composizione % - Portafoglio “rischioso” Azioni nazionali Fondi nazionali Gestioni Patrimoniali Obbligazioni Titoli di Stato Azioni estere Bonds+Fondi esteri Altro estero Estero totale Portafoglio rischioso
Maturità 24,18 24,86 14,57 10,51 24,07 0,90 0,74 0,18
Laurea 20,40 31,54 14,19 10,57 18,76 0,83 1,06 2,65
0,32
1,12
1,82
4,54
100,00
100,00
100,00
100,00
Tabella 2 - Dati 2000 – Istruzione - (Ns. elaborazione)
108
Composizione % - Portafoglio “rischioso” Azioni nazionali Fondi azionari nazionali Gestioni Patrimoniali Obbligazioni Titoli di Stato Azioni estere Bonds+Fondi esteri Altro estero
Estero totale Portafoglio rischioso
Maturità 23,27 21,92 7,47 24,59 21,00 0,42 1,09 0,24
Laurea 16,50 15,57 17,91 24,40 21,42 1,29 2,65 0,26
0,42
0,94
1,75
4,20
100,00
100,00
100,00
100,00
Tabella 3 - Dati 2002 – Istruzione - (Ns. elaborazione)
% di partecipazione all’interno della relativa categoria Azioni estere Bonds+Fondi esteri Altro estero
Attività finanziarie estere
0,16
0,28
1,21
3,20
% di famiglie sul totale
34,71
26,73
29,87
8,70
100,00
Tabella 4 – Dati 1998 – Istruzione - (Ns. elaborazione)
% di partecipazione all’interno della relativa categoria Azioni estere Bonds+Fondi esteri Altro estero
Attività finanziarie estere
0,11
0,80
1,56
4,64
% di famiglie sul totale
33,37
27,64
29,82
9,17
Tabella 5 – Dati 2000 – Istruzione - (Ns. elaborazione)
109
100,00
% di partecipazione all’interno della relativa categoria Azioni estere Bonds+Fondi esteri Altro estero
Attività finanziarie estere
0,05
0,76
1,66
3,75
% di famiglie sul totale
32,25
28,41
30,32
9,02
100,00
Tabella 6 – Dati 2002 – Istruzione - (Ns. elaborazione)
La cosa ancor più interessante è che l’evidenza empirica appena discussa risulta essere estremamente coerente con i fondamenti concettuali dell’approccio comportamentale analizzato nei capitoli precedenti. Come vedremo meglio in questo capitolo, ciò vale in particolare per i modelli di portafoglio che utilizzano le cosiddette “preferenze BH”. Avvalendoci di tali preferenze, sosterremo la tesi che sono soprattutto le persone con minori capacità di elaborazione delle informazioni quelle che meno diversificano i propri investimenti finanziari. Ed è ragionevole supporre che tra le persone con scarsa capacità di elaborazione ci siano quelle meno istruite, mentre quelle con un livello di istruzione superiore (maturità, laurea) hanno sicuramente maggiori capacità di elaborazione. Si ricordino le argomentazioni proposte nel paragrafo 4 del secondo capitolo. Riassumiamo qui, per comodità del lettore, i passi più importanti. Quando un individuo valuta un nuovo rischio, la sua distribuzione di probabilità, considerata separatamente, è molto più “accessibile” della distribuzione della ricchezza totale, comprensiva dei rischi già in essere più il nuovo rischio da valutare. Cosa significa più “accessibile”? Tale espressione fa riferimento al fatto che molte decisioni vengono prese tenendo soprattutto in considerazione le caratteristiche e le informazioni, su di esse disponibili, più evidenti e di più facile elaborazione/interpretazione: in altre parole, le caratteristiche e le informazioni più accessibili. E dietro questa considerazione c’è l’idea che molte scelte vengono fatte seguendo prevalentemente il proprio intuito, piuttosto che elaborati ed impegnati ragionamenti (cfr. Kahneman, 2003). Notiamo che ci stiamo già allontanando dal concetto di perfetta razionalità degli agenti economici, marciando verso quello di razionalità limitata. Coerentemente alla spiegazione fornita da Kahneman (2003) e a supporto di essa, da parte nostra possiamo richiamare il contributo fornito alle scienze sociali da Simon (1982). Nel proporre argomenti a sostegno della sua ipotesi di razionalità limitata degli agenti economici, Simon sottolinea che le risorse cognitive di questi ultimi sono limitate: ciò costringe gli individui a semplificare lo spazio del problema decisionale, che risulterebbe altrimenti
110
ingestibile perché eccessivamente complesso. Date queste premesse, è abbastanza logico pensare ai mercati finanziari come campo di applicazione dell’approccio teorico fin qui esposto. È infatti evidente che pochi settori dell’attività umana sono caratterizzati da una quantità di informazioni così massiccia come quella presente nei mercati finanziari (Slovic, 1972). Tali informazioni sono a tutti altamente accessibili, tenuto conto che si possono avere, quotidianamente ed in dosi abbondanti, da giornali, telegiornali, internet, ecc.89 Ma il problema risiede nella loro corretta ed ottimale elaborazione. L’avvento delle nuove tecnologie, rendendo prontamente disponibili informazioni riguardanti l’andamento dei mercati di tutto il mondo, ha contribuito notevolmente ad aumentare le difficoltà degli individui nell’utilizzare in modo proficuo l’ampio numero di informazioni a loro disposizione. Infatti, se è vero che una maggiore disponibilità di informazioni è sinonimo di maggiore accuratezza nel valutare le alternative di scelta, è altrettanto vero che una mole eccessiva di informazioni, come suggerito da Simon (1982), date le limitate risorse cognitive dell’individuo, rende lo spazio decisionale ingestibile. Ed è proprio nel tentativo di semplificare tale spazio che l’agente economico è portato a compiere valutazioni “isolate” a discapito di quelle “complessive”: tale comportamento ha come conseguenza quello di effettuare la scelta solo apparentemente migliore. La valutazione “complessiva” del problema condurrebbe ad una scelta migliore rispetto a quella effettivamente compiuta, ma la mancanza dell’”ottimale” capacità di elaborazione delle informazioni conduce invece alla scelta sub-ottimale. E la valutazione “complessiva” viene involontariamente accantonata, in favore di quella “isolata”, proprio a causa della mancanza di questa “ottimale” capacità di elaborazione.90 L’esempio tratto da Kahneman-Tversky (1981) e discusso nel capitolo 2 (quarto paragrafo), si adatta molto bene a quanto appena detto. Infatti, elaborare il risultato di ognuna delle scelte in gioco, A, B, C e D, è molto più semplice ed accessibile dell’elaborazione del risultato complessivo a cui è possibile pervenire confrontando le due scelte combinate A&D e B&C. In quest’ultimo caso le distribuzioni sono molto meno ovvie e quindi meno accessibili delle singole distribuzioni (A, B, C, e D) così come vengono presentate nel quesito originale. Appare quindi evidente, in base a quanto detto, che nell’ambito dei processi di decision-making, i singoli risultati di cui sopra (A, B, C, D) rivestono un ruolo molto più importante di quello che gli è invece solitamente assegnato dalle tradizionali funzioni di utilità. 89
Ci riferiamo ovviamente alle informazioni, per così dire, di carattere “ordinario”. E’ evidente che informazioni di natura “straordinaria”, soprattutto in un primo momento, non sono facilmente accessibili a chiunque, bensì solo ad una ristretta cerchia di persone: soggetti direttamente coinvolti e persone “strettamente” addette ai lavori. 90 Tra i lavori recenti, in tema di home bias, che sottolineano l’importanza delle informazioni e della loro ottimale elaborazione, si veda in particolare Van Nieuwerburgh-Veldkamp (2004).
111
Ed è partendo da queste premesse che, nel presente lavoro, svilupperemo il nostro contributo. Infatti, date le argomentazioni appena esposte, appare piuttosto semplice, anche alla luce dell’evidenza empirica risultante dalle Indagini della Banca d’Italia, fare la seguente considerazione. Quali sono i soggetti in grado di elaborare in maniera ottimale (o comunque meglio di altri) l’immane mole di informazioni presente nell’ambito dei mercati finanziari? Forse le persone meglio istruite, in particolare quelle con un livello di istruzione pari o superiore alla laurea. Non a caso sono proprio tali persone quelle che, relativamente, investono di più all’estero, cogliendo così almeno una parte delle opportunità di diversificazione offerte dai mercati. Appare quindi opportuno costruire e risolvere un modello che, partendo dalle premesse teoriche appena discusse, possa rendere conto coerentemente dei comportamenti effettivi degli investitori. E a tale scopo sembrano adattarsi particolarmente bene le preferenze utilizzate da Barberis e Huang nel loro approccio (si veda, di nuovo, il capitolo 2, paragrafi 4 e 5).
2 Un modello di scelta internazionale di portafoglio con valutazione isolata dei rischi 2.1 Il modello Possiamo quindi applicare le “preferenze BH” ad un contesto di scelta di portafoglio internazionale, al fine di indagare il paradosso dell’equity home bias. Nella letteratura di behavioral finance connessa ai modelli che utilizzano preferenze con narrow framing (letteratura, è bene sottolinearlo, appena ai suoi inizi), nell’ambito delle analisi di equilibrio parziale, non esiste un lavoro in tale direzione; viene invece indagato, in maniera piuttosto superficiale e solo con riferimento a dati USA, il paradosso della non-partecipazione ai mercati azionari (stock market non-participation puzzle).91 Consideriamo una semplice economia a due paesi, ad esempio il Paese A e il Resto del Mondo (RdM). In un contesto di equilibrio parziale, analizziamo soltanto le scelte dell’agente rappresentativo che vive nel Paese A (considerata per ipotesi l’economia “nazionale”). Siamo in un’economia di puro scambio alla Lucas (1978), quindi senza produzione e senza redditi 91
Si veda Barberis-Huang-Thaler (2003). Stracca (2002b) accenna alla possibilità di indagare l’equity home bias puzzle tramite l’utilizzo della prospect theory, ma non costruisce e non risolve esplicitamente nessun modello in tal senso.
112
derivanti dal lavoro. L’unica fonte di reddito è di natura finanziaria. L’orizzonte temporale fronteggiato dagli individui è infinito. Supponiamo che esistano tre attività finanziarie: l’agente economico ripartisce la propria ricchezza tra di esse. La prima è costituita da un titolo nazionale privo di rischio, ma potrebbe anche trattarsi di semplice cash on hand fruttifero di un rendimento certo. La seconda attività è il “mercato azionario” nazionale: in altri termini, un’attività rischiosa (un fondo azionario) rappresentativa del mercato azionario del Paese A. La terza attività è un’azione estera. Supponiamo che tutte le attività finanziarie siano offerte sul mercato in quantità fissa: non indaghiamo il lato dell’offerta di tali attività. Entrambe le attività rischiose hanno un rendimento dato, esogeno al modello, del seguente tipo:
con
log( RD ,t +1 ) = g D + σ D ε D ,t +1
(75)
log( R F ,t +1 ) = g F + σ F ε F ,t +1
(76)
ε D ,t 0 1 ω ≈ N , ε 0 ω 1 F ,t
i.i.d.
dove i rendimenti logaritmici medi e le deviazioni standard, g i e σ i , sono dati, e gli shocks stocastici ε i sono di natura esogena. Anche l’attività priva di rischio ha un rendimento dato. Il flusso di dividendi ha natura esogena ed è incorporato nei rendimenti. Per semplificare ulteriormente le cose, supponiamo che il tasso di cambio tra i due paesi sia pari ad 1 e non soggetto a fluttuazioni (cambi fissi). Tutte le variabili del modello sono espresse in termini reali. Adottando le preferenze recursive dell’approccio BH (equazione 59), il consumatore/investitore fronteggerà quindi la seguente funzione di utilità:
U t = W (Ct , µ (U t +1 ) + b0 [ Et (G D, t +1 )] + b0 [ Et (G F , t +1 )])
(77)
Notiamo che in questo modo stiamo facendo narrow framing su entrambe le attività rischiose, con la stessa intensità ( b0 è lo stesso per le due attività). Con riferimento alle equazioni (55) e (56), supponiamo che ρ = δ = 1 − γ , dove γ è il coefficiente di avversione relativa al rischio. E’ prassi comune porre gli esponenti della funzione aggregatrice uguali a quelli dell’espressione funzionale dell’equivalente di certezza. Ponendoli poi entrambi uguali a 1 − γ , significa perdere la separazione tra avversione al rischio ed elasticità di sostituzione intertemporale (ESI), ma in questo contesto, come già accennato, ciò non rappresenta un problema. Essendo quindi
113
[
W (C , x) = (1 − β )C 1−γ + βx1−γ
]
1 1−γ
e
[
]
1
µ ( x) = E ( x1−γ ) 1−γ
la funzione di utilità massimizzata dall’agente rappresentativo può essere riscritta come 1− γ
1 F 1− γ 1− γ 1− γ + b0 ∑ Et [v(Gi , t +1 )] U t = (1 − β )Ct + β [ Et (U t +1 )] i=D
1 1 − γ
(78)
dove i = D, F . La sommatoria utilizzata sta ad indicare che F
∑ Et [v(Gi,t +1 )] = Et v(GD,t +1 ) + Et v(GF ,t +1 ) .
i=D
E’ ora necessario adattare il “tradizionale” vincolo di accumulazione della ricchezza al semplice modello di scelta di portafoglio da noi formulato. Considerando le tre attività finanziarie e i relativi rendimenti, l’agente massimizzerà la (78) subordinatamente al vincolo
Wt +1 = (Wt − Ct ) RW , t +1 con
(
RW ,t +1 = (1 − θ D ,t − θ F ,t ) R f + θ D ,t R D ,t +1 + θ F ,t R F ,t +1
)
dove θ D,t e θ F ,t sono, rispettivamente, le quote di ricchezza finanziaria investite nel mercato azionario domestico e in quello estero, mentre (1 − θ D ,t − θ F ,t ) è la quota investita nell’attività (nazionale) risk-free. E’ quindi evidente che θ f ,t + θ D ,t + θ F ,t = 1 . Inoltre avremo
G D,t +1 = θ D,t (Wt − Ct )( RD,t +1 − R f ) G F ,t +1 = θ F ,t (Wt − Ct )( R F ,t +1 − R f ) G v(G ) = λ G
per
114
G≥0 G<0
λ >1.
(79)
2.2 Derivazione delle condizioni di ottimo del problema consumo/portafoglio
Il problema di massimizzazione intertemporale, avendo natura recursiva, può essere risolto tramite le tecniche di programmazione dinamica. Abbiamo la seguente funzione valore (Bellman equation): U t = V (Wt ) =
F Max W Ct , µ [V (Wt +1 )] + b0 ∑ Et v(Gi ,t +1 ) Ct ,{θ i ,t }n i=D i =1
(80)
Tenendo conto della funzione aggregatrice W (C , x) , la (80) si trasforma come segue: 1−γ F 1−γ V (Wt ) = Max (1 − β )Ct + β µ [V (Wt +1 )] + b0 ∑ Et v(Gi ,t +1 ) Ct ,{θ i ,t }n i=D i =1
1
1−γ
(81)
Possiamo pervenire ad una formulazione della value function dalla quale sarà poi possibile notare che le decisioni di consumo e di portafoglio sono separabili. Osserviamo infatti che data la forma di Gi , t +1 ,
Gi , t +1 = θ i , t (Wt − Ct )( Ri , t +1 − R f ) , i = D, F
(82)
possiamo congetturare per la funzione valore la seguente forma,
V (Wt ) = AtWt ,
(83)
dove At è una costante (o meglio, come vedremo, la risoluzione di un problema di massimo); la bontà di tale congettura sarà poi verificata expost.92 Sostituendo la (82), e la (83) valutata al tempo t+1, nella (81), e tenendo presente il vincolo, ossia Wt +1 = (Wt − Ct ) RW , t +1 , abbiamo
92
Sottolineiamo che si tratta di una procedura comunemente adottata nella risoluzione dei problemi di ottimizzazione dinamica (cfr. Stokey-Lucas, 1989).
115
1−γ
F V (Wt ) = Max (1 − β )Ct1−γ + β µ [ At +1 (Wt − Ct ) RW ,t +1 ] + b0 ∑ Et v[θ i ,t (Wt − Ct )( Ri ,t +1 − R f )] Ct ,θ i ,t i=D
1 1 − γ
Sfruttando l’omogeneità di primo grado delle funzioni µ (i) e v(i) otteniamo 1
1−γ F 1−γ 1−γ V (Wt ) = Max (1 − β )Ct + β (Wt − Ct ) µ[ At +1RW ,t +1 ] + (Wt − Ct )b0 ∑ Et v[θi ,t ( Ri ,t +1 − R f )] Ct ,θi ,t i=D
Raccogliendo (Wt − Ct ) ed elevando alla 1 − γ ciò che sta tra le parentesi quadre, abbiamo 1
1−γ F 1−γ 1−γ 1−γ V (Wt ) = Max (1 − β )Ct + β (Wt − Ct ) µ ( At +1RW ,t +1 ) + b0 ∑ Et v[θ i ,t ( Ri ,t +1 − R f )] Ct ,θ i ,t i=D (84)
Possiamo notare dall’(84) che le decisioni ottime di consumo e di portafoglio sono separabili. In particolare, essendo il problema di portafoglio dato da F Pt* = Max µ ( At +1 RW ,t +1 ) + b0 ∑ Et v[θ i ,t ( Ri ,t +1 − R f )] , θ i ,t i=D
(85)
possiamo riscrivere la funzione valore come segue:
V (Wt ) = Max Ct
{
(1 − β )Ct1−γ
1−γ
+ β (Wt − Ct )
1 * 1−γ 1−γ (Pt )
}
.
(86)
L’equazione (86) rappresenta ovviamente il problema di scelta ottimale del consumo (supponendo di conoscere già la soluzione di portafoglio Pt* ): tale problema può essere però riformulato in maniera diversa. Ponendo α t ≡ Ct / Wt possiamo infatti riscrivere il problema (86) nel seguente modo:
At = Max (1 − β )α αt
1−γ t
1−γ
+ β (1 − α t )
116
* 1−γ
( Pt )
1 1−γ
.
(87)
Per passare dalla (86) alla (87) è necessario dividere entrambi i lati della prima espressione per Wt (la stessa operazione va fatta anche sotto il simbolo Max , ossia nella variabile rispetto alla quale si massimizza). Abbiamo:
[
V (Wt ) 1 = Max (1 − β )Ct1−γ + β (Wt − Ct )1−γ ( Pt* )1−γ Ct Wt Wt W
]
1 1−γ
;
t
V (Wt ) ≡ At ed elevando entrambi i lati alla 1 − γ possiamo riscrivere Wt la precedente equazione come
ponendo
At1−γ
1 = Max Ct W Wt t
1−γ
[(1 − β )C
C = Max (1 − β ) t Ct Wt Wt
1−γ
1−γ t
]
+ β (Wt − Ct )1−γ ( Pt* )1−γ =
W − Ct + β t Wt
1−γ
( Pt* )1−γ .
A questo punto, sfruttando il fatto che α t ≡ Ct / Wt , abbiamo
[
]
At1−γ = Max (1 − β )α t1−γ + β (1 − α t )1−γ ( Pt* )1−γ , αt
ed elevando entrambi i membri alla 1 /(1 − γ ) otteniamo, infine, la (87). Risulta quindi già evidente che la congettura (83) è verificata. Notiamo comunque che sostituendo α t ≡ Ct / Wt nell’(87), è possibile verificare ulteriormente la nostra congettura di partenza, ossia che AtWt = V (Wt ) = all’equazione (84).93 Consideriamo ora il problema (87). Per trovare la condizione di ottimo del primo ordine è necessario derivare, nell’argomento del Max , rispetto ad α t , ed uguagliare a zero. Abbiamo:
[
1 (1 − β )α t1−γ + β (1 − α t )1−γ ( Pt* )1−γ 1−γ
] [(1 − γ )(1 − β )α 1 −1 1−γ
−γ t
]
− (1 − γ ) β (1 − α t ) −γ ( Pt* )1−γ = 0 ⇒
[(1−γ )(1−β)α γ −(1−γ )β(1−α ) γ (P ) γ ]= 0⇒ − t
t
−
* 1− t
(1 − β )α t−γ = β (1 − α t ) −γ ( Pt* )1−γ 93
Si veda l’Appendice matematica A.4.1.
117
(88)
dove Pt* , come visto, è la soluzione del problema di portafoglio.94 Esplicitando la (88) per Pt* e sostituendo l’espressione così ottenuta nella (87), otteniamo
At = (1 − β )
1 1−γ
−γ α t1−γ
,
(89)
ed al tempo t+1 avremo
At +1 = (1 − β )
1 1−γ
−γ 1−γ α t +1
.
(90)
A questo punto possiamo sostituire la (90) nel problema di portafoglio (85), ottenendo 1 −γ F 1−γ 1−γ Pt = Max µ[(1 − β ) α t +1 RW ,t +1 ] + b0 ∑ Et v[θ i ,t ( Ri ,t +1 − R f )] θ i ,t i=D *
⇒
1 −γ F 1−γ 1−γ Pt = Max (1 − β ) µ (α t +1 RW ,t +1 ) + b0 ∑ Et v[θ i ,t ( Ri ,t +1 − R f )] θ i ,t i=D
⇒
*
(91)
dove abbiamo utilizzato, ancora, l’omogeneità di primo grado della funzione
µ (i) per portare fuori dalla medesima (1 − β )1 /(1−γ ) . Esplicitando tale funzione nella forma CES,
[
]
1
µ ( x) = E ( x1− γ ) 1− γ , possiamo riscrivere il problema di portafoglio come segue: 1 −γ 1 F 1−γ 1−γ 1−γ 1−γ Pt = Max (1 − β ) [ Et (α t +1 RW ,t +1 )] + b0 ∑ Et v[θ i ,t ( Ri ,t +1 − R f )] θ i ,t i=D *
dove
(
)
RW ,t +1 = (1 − θ D ,t − θ F ,t ) R f + θ D ,t R D ,t +1 + θ F ,t R F ,t +1 .
94
Soluzione ipotizzata: in realtà vedremo che per risolvere compiutamente il problema (85) è necessario un procedimento iterativo che tenga conto della condizione del primo ordine per il consumo, la (88).
118
(92)
2.3 Soluzione numerica del modello Come si risolve il problema di portafoglio posto dalla (92)? E’ ovviamente necessario massimizzare e risolvere rispetto alle quote di portafoglio θ i , ma la difficoltà è costituita dal fatto che tali quote vengono poi espresse in funzione di α (oltre che di altri parametri), ossia in funzione della soluzione del problema di massimizzazione del consumo, soluzione di cui non disponiamo. Una possibile strategia di soluzione è la seguente. Facciamo una guess (un’ipotesi) sulla soluzione del problema (87), vale a dire sul valore ottimo di α : tra l’altro, ciò significa ipotizzare, tramite la (89), anche un valore ottimo per A . Risolviamo la (92) per tale valore di α e sostituiamo il valore di Pt* così ottenuto nella condizione del primo ordine per la scelta ottima del consumo, la (88), così da generare un nuovo possibile valore ottimo di α . A questo punto risolviamo ancora la (92) per questo nuovo valore di α e continuiamo iterativamente con questo procedimento fino al raggiungimento della convergenza tra il valore ottimo di α che emerge dalla (88) e quello ipotizzato un passo prima per la soluzione della (92).95 Nel risolvere il modello facciamo inoltre le seguenti ulteriori ipotesi: 1) Supponiamo che l’attività risk-free sia predeterminata e scelta in forma fissa, in un ammontare pari a θ f : l’investitore deve quindi scegliere soltanto come ripartire il proprio investimento azionario tra l’attività nazionale e quella estera; 2) Consideriamo la presenza di un vincolo di non negatività sulle quote di attività detenute: θ i ,t ≥ 0 . 3) Supponiamo che l’individuo faccia narrow framing solo sull’attività estera: si tratta di una semplificazione, perché è legittimo pensare che la stessa cosa possa accadere anche per l’altra attività rischiosa. Possiamo però supporre che l’azione di casa rappresenti in qualche modo un rischio più “familiare”, la cui distribuzione di probabilità è più facilmente “mixabile” con le distribuzioni di altri rischi, mentre la stessa cosa non vale per l’azione straniera. Tale interpretazione la ritroviamo, del resto, in diversi contributi di finanza comportamentale. Huberman (2001) sottolinea, ad esempio che c’è una maggiore tendenza ad investire nelle attività finanziarie che risultano più familiari e che di conseguenza, in quanto tali, forniscono all’agente economico un livello di sicurezza tale da creare l’illusione di poter 95
Tale procedimento sarà implementato tramite l’utilizzo del software di elaborazione numerica MatLab.
119
controllare, meglio che in altri casi, la bontà di alcuni investimenti (cfr. anche Goetzmann-Kumar, 2002 e Kelly, 1995). Riassumendo, l’individuo deve quindi scegliere tra l’attività nazionale e quella estera: sarà sufficiente massimizzare rispetto ad una delle due attività, perché dato che θ f + θ D ,t + θ F ,t = 1 , una volta scelto ad esempio θ F ,t , la restante quota incognita risulterà automaticamente determinata. Massimizzeremo rispetto all’attività estera, ossia rispetto a θ F ,t . Nel fare questo si impone però la necessità di congetturare dei valori costanti per α t e θ F ,t , in quanto non troveremo le classiche policy functions, bensì soluzioni costanti nel tempo. Tenendo conto della guess
(α t ,θ F ,t ) = (α ,θ F ) , e della valutazione isolata solo sull’attività estera, il problema di portafoglio (92) diventa il seguente: 1 −γ 1 P* = Max (1 − β )1−γ α 1−γ [ Et ( RW1−,γt +1 )]1−γ + b0 Et v[θ F ( RF ,t +1 − R f )] θF
(
RW ,t +1 = θ f R f + θ D RD ,t +1 + θ F RF ,t +1
dove
(93)
)
θ D = 1 −θ f −θ F .
con
Notiamo che nell’ambito della risoluzione del problema di portafoglio (93), ciò che arreca particolari problemi, dal punto di vista analitico, è la risoluzione del valore atteso
Et ( RW1−,γt +1 ) , vale a dire, sostituendo l’espressione per RW ,t +1 (si tenga conto anche della 75 e della 76),
[
Et θ f R f + (1 − θ f − θ F )e
g D +σ Dε D ,t +1
+θFe
]
g F +σ F ε F ,t +1 1−γ
Come è possibile procedere? Applicheremo la quadratura numerica, secondo le linee proposte da Tauchen-Hussey (1991), ampiamente utilizzata nella
120
letteratura di asset pricing per risolvere gli integrali che scaturiscono da certi valori attesi.96
3 I risultati del modello: alcune applicazioni Risolveremo il modello in relazione ad alcune coppie di “economie”. Nel fare questo useremo parametri tratti da Michaelides (2003) e Campbell (2003), con riferimento, rispettivamente, al periodo 1973-2001 e al periodo 1919-1998. Tali valori, relativi ai rendimenti, alla volatilità e alle correlazioni, vengono costruiti dagli autori sopra citati basandosi sull’indice internazionale MSCI. Prenderemo in considerazione i dati relativi ad USA, Italia, Gran Bretagna e un’area denominata “Europa”, comprendente 12 paesi: Austria, Belgio, Svizzera, Germania, Danimarca, Spagna, Francia, Gran Bretagna, Italia, Olanda, Norvegia e Svezia. UN ESEMPIO ILLUSTRATIVO. Cominciamo però con una semplice applicazione, avente natura puramente illustrativa. Supponiamo di avere, nella nostra economia a due paesi, A e RdM, i seguenti dati: R f = 1.02 , g D = 0.06 , σ D = 0.20 , g F = 0.06 ,
σ F = 0.20 , θ f = 0.40 , β = 0.98 . Consideriamo, per semplicità e a scopo puramente “didattico”, un valore nullo della correlazione tra i due rendimenti. Le due attività azionarie hanno stesso rendimento e stessa volatilità: prescindendo da costi di transazione e frizioni di altro tipo, potremmo ragionevolmente attenderci un’equa ripartizione della ricchezza residua, θ D = 0.30 e θ F = 0.30 . Questo è infatti ciò che più o meno accade con b0 = 0 . Come si evince osservando la Tabella 7, dalla risoluzione del modello con valutazione isolata e avversione alla perdita (ossia con b0 ≠ 0 e λ ), emerge invece che l’attività estera, soggetta a narrow framing, è detenuta in misura via via decrescente all’aumentare di b0 . Il meccanismo all’opera è il solito, già visto e discusso nel secondo e nel terzo capitolo.97 L’investitore, nelle sue valutazioni d’investimento, dà più peso alla sua avversione verso le possibili perdite finanziarie che alla sua voglia di cogliere, sui mercati nazionali ed esteri, favorevoli opportunità d’investimento. Si aggiunga a questo il fatto che l’eventuale acquisto di azioni estere viene valutato “a sè”, 96
Useremo in particolare la quadratura di Gauss-Hermite, tipica delle distribuzioni che vanno da meno infinito a più infinito, implementandola tramite MatLab (si veda Judd, 1998). I codici utilizzati per risolvere l’intero modello sono disponibili, su richiesta, presso l’autore. Si veda anche l’Appendice A.4.2 alla fine del capitolo. 97 Si rivedano in particolare i paragrafi 4 e 5 del capitolo 2 e il capitolo 3.
121
senza essere “combinato” con i rischi già fronteggiati. Tutto ciò contribuisce a rendere l’investimento azionario estero particolarmente rischioso e spinge l’investitore a detenere soprattutto azioni nazionali. L’attività estera è quindi percepita come meno appetibile di quello che risulterebbe essere se l’investitore fosse in grado, tramite la “corretta” capacità di elaborazione delle informazioni, di operare una valutazione congiunta delle due attività rischiose.
β
γ
0.98 0.98 0.98 0.98
3 3 3 3
Paese A - RdM λ θD b0 2.25 0 32% 2.25 0.10 37% 2.25 0.20 45% 2.25 0.30 54.4% Tabella 7
θF 28%, 23%, 15%, 5.6%
CASO ITALIA - USA. Ma vediamo come funziona il modello facendo alcune applicazioni con dati tratti dalle economie reali. Supponiamo che l’economia nazionale sia quella italiana e l’economia estera quella statunitense.98 E’ evidente che l’idea che l’investitore italiano possa diversificare all’estero solo in attività americane è fortemente esemplificativa: esistono svariate possibilità di diversificare i propri investimenti finanziari. Ciononostante, tale semplice modellizzazione è in grado di evidenziare, in maniera soddisfacente, le caratteristiche essenziali del modello. Tale ragionamento vale anche per i casi che presenteremo successivamente. Per renderci conto del livello di “home bias” presente negli investimenti finanziari italiani, possiamo dare ancora un’occhiata ad alcuni dati tratti dalle recenti Indagini della Banca d’Italia sul Reddito e la Ricchezza delle Famiglie Italiane (1998, 2000, 2002). Facendo una media dei dati risultanti dalle tre Indagini, ciò che emerge è che il portafoglio delle famiglie italiane, dal 1998 al 2002, è stato al 99% composto da attività finanziarie nazionali (di ogni tipo), e solo all’1% da attività finanziarie estere (vedi Grafico 1).99 Risulta quindi evidente il livello di sotto-diversificazione finanziaria del “paese Italia”. 98
Nei casi che vedremo il primo paese sarà sempre da intendere come paese “nazionale”, il secondo come paese “straniero”. 99 Abbiamo fatto riferimento al totale delle attività finanziarie e non alle sole attività azionarie a causa dei problemi di omogeneità esistenti tra le varie tipologie d’investimento tra Italia ed estero. Ad esempio, per l’estero, i fondi comuni sono un’unica voce e non vengono suddivisi in fondi azionari e non azionari. Per le attività nazionali tale suddivisione c’è, ma solo per l’anno 2002 (cfr. Banca d’Italia 1998, 2000, 2002).
122
Il dato della Tabella 8 relativo alla quota investita nell’attività risk-free, θ f , è tratto dalle Indagini della Banca d’Italia sopracitate.100 I valori dei parametri di preferenza utilizzati rispecchiano sostanzialmente quanto detto nel precedente capitolo. Ci atterremo quindi a criteri che ci consentano di utilizzare parametri coerenti con la teoria prevalente e con le stime econometriche e l’evidenza sperimentale disponibili su tale argomento. Per b0 usiamo invece un range di valori, al fine di verificare il comportamento del modello al variare di tale parametro.
Grafico 1
%
Composizione di Portafoglio - Famiglie Italiane (Media 1998 - 2002) 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0%
Attività estere Attività nazionali
Attività finanziarie
Nostra Elaborazione su Dati Banca d’Italia 1998 – 2000 - 2002
100
Se si considera una media delle tre Indagini, ciò che risulta è che nel portafoglio finanziario delle famiglie italiane il totale delle attività risk-free (titoli di Stato + attivi monetari di vario tipo (libretti, c/c, ecc.)) pesa per circa il 64% (nostra elaborazione su dati Banca d’Italia). Ma alcuni titoli di Stato pluriennali, come ad esempio i BTP, vanno considerati attivi rischiosi. Di qui l’utilizzo di θ f = 0.50 . Si veda anche, in particolare per un confronto con gli USA, Faiella-Neri (2004).
123
Vediamo ora come funziona il modello. Come prima cosa, notiamo che quando il grado di valutazione isolata è nullo, il modello si comporta come previsto dalle teorie standard: dati i valori di rendimenti e volatilità (quest’ultima nettamente a favore dell’attività estera), le preferenze conducono l’individuo a detenere buona parte delle proprie attività finanziarie rischiose sotto forma di azioni estere (38% contro 12%). Se invece introduciamo le “preferenze BH”, come si vede dalla Tabella 9, all’aumentare del grado di valutazione isolata, la quota di ricchezza destinata all’attività estera diminuisce. E questo nonostante un rendimento medio simile, una volatilità nettamente a favore dell’attività americana e una correlazione di medio livello, non così elevata.
ITA – USA (1973-2001) ITA USA 1.03 Rf 0.074 0.39
gD
σD
0.077 0.185 0.50
gF
σF ω D,F
0.50
θf
0.50 Tabella 8
0.98 0.98 0.98 0.98 0.98 0.98
ITA – USA (1973-2001) γ λ b0 θD θF 3 2.5 0 12% 38% 3 2.5 0.10 17.5% 32.5% 3 2.5 0.20 23% 27% 3 2.5 0.30 28% 22% 3 2.5 0.50 32% 18% 3 2.5 0.55 41% 9%
0.98 0.98 0.98
4 4 4
2.5 0 2.5 0.10 2.5 0.55
0.98
5
2.5
β
11% 13% 36%
39% 37% 14%
0 9% Tabella 9
41%
124
La metà degli investimenti finanziari dell’investitore rappresentativo italiano è costituita dall’attività priva di rischio ( θ f = 0.50 ): la restante metà viene ripartita tra le due attività rischiose, con la fetta più grossa destinata al mercato azionario nazionale. La valutazione isolata a cui è soggetta l’attività straniera rende quest’ultima meno appetibile di quanto risulterebbe invece a seguito di una “corretta” valutazione, combinata con l’altra attività rischiosa. Nel suo portafoglio l’investitore dà così maggior peso all’attività “di casa”, rinunciando ad una conveniente opportunità di diversificazione. Tale comportamento è coerente con l’evidenza empirica disponibile e contraddice diversi modelli di portafoglio “standard”. Emerge quindi ancora la caratteristica distintiva di questo approccio teorico: in un’ottica descrittiva, esso rende conto di come si comportano gli agenti nelle loro scelte effettive (sub-ottimali), non di come dovrebbero comportarsi per raggiungere l’ottimo. Notiamo inoltre che all’aumentare di γ , a parità di λ e b0 , si registra un aumento nella quota dell’attività estera: l’aumentata avversione relativa al rischio comporta, ceteris paribus, uno spostamento di risorse verso l’attività straniera, che presenta una misura di rischio, la varianza, ben inferiore rispetto all’attività nazionale.
CASO GRAN BRETAGNA - USA. Per questo caso abbiamo utilizzato parametri relativi a dati su un periodo temporale più esteso, 1919-1998, tratti da Campbell (2003). La Tabella 10 raccoglie i parametri utilizzati, mentre nella Tabella 11 abbiamo i principali risultati della soluzione numerica del modello, il cui comportamento è, ancora una volta, in linea con le nostre proposizioni teoriche. Quando b0 = 0 la quota investita all’estero è piuttosto elevata (37%), quasi quanto quella destinata all’attività nazionale (43%). Quindi l’investitore diversifica, come previsto dai modelli standard. L’introduzione e il progressivo aumento del grado di valutazione isolata riducono invece la propensione dell’investitore britannico ad investire all’estero. Si nota, rispetto al caso precedente, al fine di generare un determinato comportamento, la necessità di un valore inferiore del grado di narrow framing, accompagnato però da un livello di avversione alla perdita leggermente superiore. E’ invece interessante osservare cosa succede quando varia l’avversione al rischio, a parità degli altri parametri comportamentali. In due casi abbiamo la stessa situazione vista nel caso Italia-USA: l’investitore si sposta sull’attività con volatilità inferiore. Ma in un caso, quando b0 = 0.10 , abbiamo invece un comportamento contrario, in quanto diminuisce la quota detenuta all’estero.
125
GB – USA (1919-1998) UK USA 1.0125 Rf gD
σD
0.077 0.22
gF
σF ω D,F
0.50
θf
0.20
0.071 0.185 0.50
Tabella 10
β 0.98 0.98 0.98 0.98 0.98 0.98 0.98 0.98
GB - USA (1919-1998) γ λ b0 θD 3 3 0 43% 3 3 0.10 52% 3 3 0.20 66% 3 3 0.25 72.5% 3 3 0.30 78.3% 4 4 4
3 0.10 61% 3 0.20 62% 3 0.30 73% Tabella 11
θF 37% 28% 14% 7.5% 1.7% 19% 18% 7%
CASO USA - EUROPA. Supponiamo ora che l’economia nazionale sia quella statunitense, con quella estera rappresentata invece da un’area denominata Europa, comprendente Austria, Belgio, Svizzera, Germania, Danimarca, Spagna, Francia, Gran Bretagna, Italia, Olanda, Norvegia e Svezia. Abbiamo effettuato una semplice media aritmetica per ottenere i dati di rischio e rendimento relativi a tale area; stessa cosa dicasi per la correlazione.101 L’idea è quella di costruire un’area europea sufficientemente rappresentativa, dove l’investitore USA possa diversificare i suoi investimenti finanziari. Va comunque sottolineato che, prendendo in considerazione solo i 6 paesi principali di
101
Sempre sulla base dei dati riportati in Michaelides (2003).
126
quest’area, si ottengono, relativamente a rendimenti, volatilità e correlazioni, risultati simili al gruppo dei 12. Come si nota dalla Tabella 13, il comportamento dell’investitore americano, date le ipotesi del modello, conferma la tendenza già osservata negli altri casi. In particolare, al fine di replicare l’evidenza empirica, è necessario un livello di narrow framing piuttosto modesto e un valore dell’avversione alla perdita (2.8) che si colloca a metà strada rispetto ai valori visti nei due casi precedenti. Non deve sorprendere il fatto che, nei tre casi discussi, il valore dei parametri di preferenza necessario per ottenere certi risultati, sia soggetto a variazioni. E’ infatti evidente che il valore di tali parametri tende a variare in relazione alle caratteristiche dell’economia presa in considerazione e alle relative misure di rischio e rendimento delle attività finanziarie. E’ così possibile “inferire”, per i vari paesi, determinati valori relativi ai parametri comportamentali.
USA – EUROPA (1973-2001) USA EURO 1.02 Rf gD
σD
0.077 0.185
gF
σF ω D,F
0.60
θf
0.20
0.086 0.27 0.60
Tabella 12
USA – EUROPA (1973-2001) γ λ b0 θD θF 0.98 3 2.8 0 56.4% 23.6% 0.98 3 2.8 0.01 56.5% 23.5% 0.98 3 2.8 0.05 57.5% 22.5% 0.98 3 2.8 0.10 64.5% 15.5% 0.98 3 2.8 0.20 78.3% 1.7%
β
0.98 0.98
4 4
2.8 0.05 66% 2.8 0.10 72.6%
14% 7.4%
0.98
5
2.8 0.05 69% Tabella 13
11%
127
Sempre osservando la Tabella 13, possiamo vedere che quando l’avversione relativa al rischio aumenta, a parità di altri parametri, la quota di portafoglio estero diminuisce: l’azione europea è più rischiosa di quella americana e quindi l’investitore ne riduce la quantità detenuta. Potremmo continuare con altre applicazioni, relative ad altri paesi o macro-aree: otterremmo più o meno gli stessi risultati, a conferma della buona validità del modello teorico in oggetto. Ciò che invece, a questo punto, appare particolarmente interessante osservare, è che i due parametri che caratterizzano il modello come un modello di finanza comportamentale (con alla base l’ingrediente cruciale della prospect theory), rimangono sempre coerenti con i valori utilizzati in altri studi e simulazioni.102 In particolare, il grado di valutazione isolata b0 , al fine di generare certi risultati, non manifesta quasi mai la necessità di superare l’unità (in alcuni studi a volte la supera, ma di poco). Il presente capitolo costituisce quindi un risultato importante e un ulteriore contributo nell’indagare quella sorta di “scatola nera” costituita dai parametri comportamentali ( b0 e λ ) che in qualche modo tentano di cogliere le preferenze dell’individuo più strettamente connesse alle sue emozioni.
4 Considerazioni conclusive In questo capitolo abbiamo fornito un contributo che, adottando un approccio di Finanza Comportamentale basato sulle preferenze, cerca di spiegare ciò che viene osservato nei dati circa i portafogli azionari delle famiglie. La teoria di portafoglio standard è concorde nel ritenere che sarebbe ottimale per gli agenti economici detenere una quota di azioni estere molto superiore a quella effettivamente detenuta. Ciò che accade, in altre parole, è che favorevoli opportunità di diversificazione vengono rifiutate. Per quale motivo? Attraverso la costruzione e la soluzione numerica di un semplice modello di scelta internazionale di portafoglio, viene fornita a tale quesito una risposta abbastanza soddisfacente. Il meccanismo all’opera fa leva sulle limitate capacità di elaborazione delle informazioni dell’individuo: l’attività estera è percepita come meno appetibile di quello che risulterebbe essere se l’investitore fosse in grado, tramite la “corretta” capacità di elaborazione, di operare una valutazione congiunta delle due attività rischiose. Ciò che ne 102
Cfr. Barberis-Huang-Santos (2001), Barberis-Huang (2001), Barberis-Huang (2004a, b), BarberisHuang-Thaler (2003) e il terzo capitolo del presente lavoro.
128
segue è una modestissima detenzione di attività estere. Ma quali sono i soggetti in grado di elaborare in maniera ottimale (o comunque meglio di altri) l’immane mole di informazioni presente nell’ambito dei mercati finanziari? Forse le persone meglio istruite, in particolare quelle con un livello di istruzione pari o superiore alla laurea. Nel caso italiano, l’evidenza empirica disponibile a livello delle singole famiglie, fornisce un robusto supporto a tale interpretazione, mostrando che sono proprio tali persone quelle che, relativamente, investono di più all’estero, cogliendo così almeno una parte delle opportunità di diversificazione offerte dai mercati. A margine della presentazione e del commento dei risultati del modello, notiamo inoltre che tutto ciò che abbiamo visto finora relativamente alla possibile risoluzione del paradosso dell’equity home bias, ha ovvie ripercussioni in termini di risk sharing internazionale. Nell’ambito di un’ampia categoria di modelli, sia quelli con mercati completi che quelli con mercati incompleti, sono state proposte varie teorie e diverse spiegazioni nel tentativo di rendere conto del perché gli individui non si assicurino contro le fluttuazioni stocastiche del reddito, pur avendo a disposizione la possibilità di smorzare tali fluttuazioni tramite l’acquisto di assets internazionali, incorrelati agli investimenti rischiosi (compreso quello in capitale umano) già sostenuti in casa propria.103 E tale incorrelazione sarebbe l’elemento fondamentale nel rendere conveniente l’acquisto di attività estere. Il reddito (finanziario) derivante da queste ultime potrebbe essere utilizzato per assicurarsi contro le variazioni inattese dei flussi di reddito derivanti dalle attività finanziarie nazionali e dal lavoro. E’ quindi evidente che nei modelli di scelta di portafoglio, come quello appena analizzato, le tematiche di risk sharing rappresentano l’altra faccia della medaglia: emergono come diretta conseguenza della scelta “ottima” di portafoglio e del principio chiave che dovrebbe guidare tale scelta, quello della diversificazione. Ma abbiamo visto che spesso l’investitore non diversifica affatto, anzi, preferisce, per vari motivi, “concentrare” i propri rischi in un unico “paniere”. Questa prospettiva può gettare nuova luce e aprire nuovi e stimolanti filoni di ricerca in tema di di risk sharing internazionale. Ovviamente, relativamente al nostro semplice modello, al fine di esplorare al meglio le tematiche di risk sharing, il quadro andrebbe arricchito inserendo il reddito (stocastico) da lavoro e modificando altri dettagli nella maniera ritenuta più opportuna dal ricercatore.
103
Si vedano, ad esempio, Canova-Ravn (1996), Lewis (1999, 2000), van Wincoop (1994), BottazziPesenti-van Wincoop (1996), Obstfeld (1994).
129
APPENDICE MATEMATICA A.4.1) Dimostrazione della relazione V(Wt ) = AtWt . Partiamo dall’equazione (87) e sostituiamo al suo interno α t ≡ Ct / Wt , al fine di verificare che At Wt = V (Wt ) , ossia che At Wt coincide con l’equazione (84). Abbiamo: 1
At = Max (1 − β )α t1−γ + β (1 − α t )1−γ ( Pt* )1−γ 1−γ = αt
1
1−γ 1−γ 1−γ Ct Ct * 1 − γ = Max (1 − β ) + β 1 − ( Pt ) = Ct Wt Wt Wt 1
Ct1−γ (Wt − Ct )1−γ * 1−γ 1−γ = Max (1 − β ) 1−γ + β ( Pt ) = Ct Wt Wt1−γ Wt Raccogliendo a fattor comune
1 = Max Ct W Wt t
1−γ
1 = Wt
1 Wt1−γ
[(1 − β )C
1−γ t
1−γ
, otteniamo
+ β (Wt − Ct )1−γ ( Pt* )1−γ
1
1−γ =
]
Elevando entrambi i membri che stanno tra parentesi graffe alla abbiamo = Max Ct
Wt
[
1 (1 − β )Ct1−γ + β (Wt − Ct )1−γ ( Pt* )1−γ Wt
130
]
1 1−γ
.
1 , 1−γ
Quindi
At = Max Ct
Wt
[
1 (1 − β )Ct1−γ + β (Wt − Ct )1−γ ( Pt* )1−γ Wt
]
1 1−γ
.
Moltiplichiamo ora entrambi i lati per Wt (la stessa operazione va fatta anche sotto il simbolo Max , ossia nella variabile rispetto alla quale si massimizza):
[
AtWt = Max (1 − β )Ct1−γ + β (Wt − Ct )1−γ ( Pt* )1−γ Ct
]
1 1−γ
= 1
1−γ 1−γ F 1−γ 1−γ = Max (1 − β )Ct + β (Wt − Ct ) Max µ ( At +1 RW ,t +1 ) + b0 ∑ Et v[θ i ,t ( Ri ,t +1 − R f )] = Ct i=D θi ,t
1
1−γ F 1−γ 1−γ 1−γ = Max (1− β )Ct + β (Wt − Ct ) µ( At +1RW ,t +1) + b0 ∑ Et v[θi,t (Ri,t +1 − R f )] = V (Wt ) Ct ,θi,t i=D
Notiamo che l’ultima espressione non è altro che l’(84): segue quindi che AW t t = V (Wt ) .
131
A.4.2) Codici MatLab per la risoluzione numerica dei problemi (87) e (93). N.B.: su richiesta presso l’autore, i codici MatLab sono anche disponibili in formato elettronico (
[email protected]).
File Esegui.m104 Rf = 1.02; g2 = 0.077; sigma2 = 0.185; g3 = 0.086; sigma3 = 0.27; alpha_guess = 0.04; beta = 0.98; gamma = 3; lambda = 2.8; omega = 0.60; theta1 = 0.20; b0 = 0.10; b2 = 0; b3 = b0; solve_cpp( alpha_guess, Rf, theta1, g2, sigma2, g3, sigma3, beta, gamma, lambda, omega, b2,b3 ).
104
Notiamo che nei files descritti in questa Appendice l’attività nazionale è l’attività 2, mentre quella estera è l’attività 3.
132
File Cpp_obj.m function At = cpp_obj( alpha, Rf, theta1, g2, sigma2, g3, sigma3, ... beta, gamma, lambda, omega, b2,b3 ) rho = 1-gamma; [theta3, b_star] = solve_bstar( Rf, theta1, g2, sigma2, g3, sigma3, alpha, beta, gamma, lambda, omega, b2,b3 ); At = -((1-beta)*alpha^rho + beta*(1-alpha)^rho * b_star^rho )^(1/rho); %At = ((1-beta)*alpha^rho + beta*(1-alpha)^rho * b_star^rho ); disp( sprintf( 'alpha=%g -> theta3=%g, b_star=%g, At=%g', alpha, theta3, b_star, At ) ).
File Bstar_obj.m function bstar = bstar_obj( theta3, Rf, theta1, g2, sigma2, g3, sigma3, ... alpha, beta, gamma, lambda, omega, b2,b3 ) % [ theta3, bstar ] = bstar_obj( theta3, Rf, theta1, g2, sigma2, theta3, g3, sigma3, ... % alpha, beta, gamma, lambda, omega ) % % Calcola la funzione obiettivo per calcolare Bstar e ricavare theta3 theta2 = 1 - theta1 - theta3; gamma1 = 1/(1-gamma); f = expvalue1( Rf, theta1, g2, sigma2, theta3, g3, sigma3, gamma, omega ); f = ( f * (1-beta) * alpha^(-gamma))^gamma1; f = f + b2 * expvalue_v( theta2, g2, sigma2, Rf, lambda ); f = f + b3 * expvalue_v( theta3, g3, sigma3, Rf, lambda ); bstar = -f; %disp([theta3,bstar]).
133
File Expvalue1.m function [ e ] = expvalue1( Rf, theta1, g2, sigma2, ... theta3, g3, sigma3, ... gamma, omega ) % [ e ] = expvalue1( Rf, theta1, g2, sigma2, theta3, g3, sigma3, gamma, omega ) % % Calcola il valore atteso di % ( theta1*Rf + (1-theta1-theta3)*exp(g2+sigma2*x) + % theta3*exp(g3+sigma3*y) )^(1-gamma) % xmax = 1e3; xmin = -xmax; ymax = xmax; ymin = -ymax; e = dblquad(@integranda,xmin,xmax,ymin,ymax,1e-4,[],... Rf, theta1, g2, sigma2, theta3, g3, sigma3, gamma, omega ).
File Expvalue_v.m function [ phi ] = expvalue_v( thetai, gi, sigmai, Rf, lambda ) % [ phi ] = expvalue_v( gi, sigmai, Rf, lambda ) % % Calcola phi = thetai * (exp( gi + sigmai^2/2 ) - Rf % + (lambda-1) * ( % exp(gi + sigmai^2/2) * N(xii-sigmai) % - Rf * N(xii) ) % ) egsigmai = exp( gi+sigmai*sigmai/2); xii = (log( Rf) - gi) / sigmai; phi = egsigmai - Rf ; phi = phi + (lambda-1) * ( egsigmai * N( xii - sigmai )- Rf*N(xii) ); phi = thetai * phi.
134
File Integranda.m function [ f ] = integranda( x,y, ... Rf, theta1, g2, sigma2, ... theta3, g3, sigma3, ... gamma, omega ) % Calcola % ( theta1*Rf + (1-theta1-theta3)*exp(g2+sigma2*x) + % theta3*exp(g3+sigma3*y) )^(1-gamma) * pdf(x,y) % % dove E[x] = E[y] = 0, Var(x) = Var(y) = 1 and Cov(x,y) = omega % ed x e y sono normalmente distribuiti. c1 = theta1*Rf; f = ( c1 + (1-theta1-theta3)*exp(g2 + sigma2*x) + theta3*exp(g3 +sigma3*y) ).^(1gamma); pdf = exp( - (x.*x + y.*y -2*omega*x.*y)/(2- 2*omega*omega) ) / (2*pi*sqrt(1omega*omega)); f = f.*pdf.
File N.m function y = N( x ) %N Summary of this function goes here % Detailed explanation goes here y = 0.5*( erf( x/sqrt(2) ) + 1).
135
File Solve_Bstar.m function [ theta3, b_star ] = solve_bstar( Rf, theta1, g2, sigma2, g3, sigma3, ... alpha, beta, gamma, lambda, omega, b2,b3 ) % [theta3, b_star] = solve_bstar( Rf, theta2, g2, sigma2, g3, sigma3, ... % alpha, beta, gamma, lambda, omega, b0 ) % tmin = 1e-8; tmax = 1-theta1 -1e-8; [theta3, b_star] = fminbnd( @bstar_obj, tmin, tmax, ... optimset( 'TolX', 1e-4, 'Display', 'on'), ... Rf, theta1, g2, sigma2, g3, sigma3, ... alpha, beta, gamma, lambda, omega, b2,b3 ); b_star = -b_star.
136
File Solve_Cpp.m function [alpha, theta3] = solve_cpp( alpha0, Rf, theta1, g2, sigma2, g3, sigma3, ... beta, gamma, lambda, omega, b2, b3 ) % [alpha, theta3] = solve_cpp( Rf, theta1, g2, sigma2, g3, sigma3, ... % beta, gamma, lambda, omega, b2, b3 ) % % Solve the Consumption-Portfolio problem % alpha_min = 1e-6; % alpha_max = 1; % alpha = fminbnd( @cpp_obj, alpha_min, alpha_max, ... % optimset( 'TolX', 1e-5, 'Display', 'on'), ... % Rf, theta1, g2, sigma2, g3, sigma3, beta, gamma, lambda, omega, b0 ) ; % [theta3, b_star] = solve_bstar( Rf, theta1, g2, sigma2, g3, sigma3, alpha, beta, gamma, lambda, omega, b0 ); b_star = -1e5; b_old = 1e5; alpha_old = 1e5; alpha = alpha0; prec=1e-4; while ( abs(alpha-alpha_old)*100 > prec ) % | abs(b_star - b_old)*100 > prec ) disp( sprintf( 'alpha=%g', alpha) ); b_old = b_star; [theta3, b_star] = solve_bstar( Rf, theta1, g2, sigma2, g3, sigma3, alpha, beta, gamma, lambda, omega, b2,b3 ); disp( sprintf( 'alpha=%g -> theta3=%g, b_star=%g', alpha, theta3, b_star) ); alpha_old = alpha; alpha = 1 / (b_star^((1-gamma)/gamma) * (beta/(1-beta))^(1/gamma) + 1); end.
137
CONCLUSIONI Il contributo fornito in questo lavoro può essere brevemente riassunto nei seguenti termini. In primo luogo, emerge un dato incontrovertibile: i modelli basati sulla perfetta razionalità degli agenti economici, pur validi sotto diversi profili, hanno non pochi problemi nello spiegare alcuni caratteristici paradossi della letteratura di asset pricing. Introducendo alcuni elementi tipici degli studi di Finanza Comportamentale (Behavioral Finance) è invece possibile fornire risposte piuttosto soddisfacenti e comprendere in maggior dettaglio alcune problematiche “classiche” dell’economia finanziaria. In particolare, basandosi sul lavoro pionieristico di Kahneman e Tversky (1979) relativo alla prospect theory, è possibile utilizzare una tipologia di preferenze che consente al consumatore/investitore di derivare utilità, oltre che dal consumo, direttamente dalle variazioni della propria ricchezza azionaria (modello BHS). Nel secondo e nel terzo capitolo abbiamo visto come, recentemente, tale approccio sia stato affinato al fine di “catturare” alcune caratteristiche peculiari del modo di pensare dell’investitore quando valuta e sceglie i suoi futuri investimenti finanziari (“approccio o modello BH”). Le implicazioni derivabili in un contesto di equilibrio generale con agente rappresentativo, con particolare riferimento all’equity premium puzzle, sono di notevole interesse. Ed il primo contributo originale del presente lavoro risiede proprio nel verificare, in questa direzione, la validità dell’approccio BH (capitolo 3). Infatti, relativamente alla possibile spiegazione dei paradossi dell’equity premium e del tasso risk-free, BarberisHuang (2004a, b) forniscono solo alcune brevi applicazioni, puramente indicative, relative agli Stati Uniti. Tali autori risolvono il loro modello solo con riferimento ai dati USA, senza tentare alcuna applicazione ad altri paesi: questo, oltre ad essere di per sé limitante, non fornisce l’opportunità di individuare la presenza di alcuni interessanti comportamenti del modello, cosa che invece viene fatta e sottolineata in questa sede. Infatti, dopo aver visto i risultati da essi ottenuti, abbiamo verificato ciò che accade con dati diversi da quelli statunitensi, analizzando in particolare i casi di Gran Bretagna, Italia, Germania, Francia, Giappone, Canada e Svezia. L’analisi dei risultati ci consente di affermare che, nel complesso, l’approccio BH appare “robusto” anche con riferimento a paesi diversi dagli USA. Dell’analisi fatta nel terzo capitolo sono comunque due i punti che meritano di essere sottolineati. La possibilità per l’agente economico di derivare utilità, oltre che dal consumo, anche dalle fluttuazioni della sua ricchezza azionaria, combinata
138
con un certo grado di valutazione isolata del rischio derivante dal mercato azionario, più l’avversione alle perdite finanziarie (loss aversion), contribuisce notevolmente a migliorare le performances dei modelli con mercati completi e senza frizioni, nel replicare l’andamento effettivo del premio azionario e del tasso risk-free. Il meccanismo è semplice: l’investitore, nelle sue valutazioni d’investimento, dà più peso alla sua avversione verso le possibili perdite finanziarie che alla sua propensione a cogliere sui mercati favorevoli opportunità d’investimento. Si aggiunga a questo il fatto che l’eventuale acquisto di azioni viene valutato “a sè”, senza essere “mixato” con i rischi già fronteggiati. Tutto ciò contribuisce a rendere l’investimento azionario particolarmente rischioso e spinge quindi l’investitore a chiedere, in equilibrio, un premio per il rischio maggiore rispetto ai modelli standard. Tale analisi vale per la maggior parte dei paesi in oggetto, con alcune riserve, in particolare, per i casi di Italia e Giappone. Del resto il caso italiano, per vari elementi strutturali, non è così facilmente paragonabile ad altri casi (ad esempio USA/Gran Bretagna). Si pensi ad esempio all’atteggiamento degli individui nei confronti dell’investimento azionario, alla struttura del mercato dei capitali, alla struttura dei portafogli famigliari, ecc. In Italia la cultura dell’investimento azionario è cosa piuttosto recente, al contrario dei paesi anglosassoni, dove già da molti anni esiste una maggiore cultura finanziaria e una maggiore dimestichezza nell’utilizzo di certi prodotti finanziari (si pensi ad esempio ai derivati). E’ quindi ragionevole supporre che l’approccio BH, date le sue caratteristiche distintive, si adatti alla realtà italiana in maniera piuttosto approssimativa. Ma recentemente, le massicce privatizzazioni che hanno caratterizzato il nostro paese, unitamente al mutamento del quadro macroeconomico internazionale (bassi tassi d’interesse), promettono, forse non in tempi brevi, di contribuire a cambiare le cose. Tra l’altro, in letteratura esistono oramai diversi lavori che enfatizzano l’importanza della diffusione di una certa cultura finanziaria al fine di promuovere ulteriormente lo sviluppo dei mercati finanziari di alcuni paesi e di ampliare le possibilità di diversificare con profitto i propri investimenti (si veda ad esempio HaliassosHassapis, 2001). Il secondo aspetto rilevante, ciò che non ritroviamo nei lavori di Barberis-Huang (2004a, b), è quello relativo al rapporto tra γ (l’avversione relativa al rischio) e b0 (il grado di valutazione isolata). Come visto nel capitolo 3, l’aumento simultaneo di tali variabili ha sul tasso d’interesse riskfree un effetto di segno contrario. Il parametro di avversione relativa al rischio, essendo il reciproco dell’elasticità di sostituzione intertemporale (ESI), tende, aumentando, a spingerlo in alto, a causa della diminuita ESI (che induce gli agenti ad indebitarsi per aumentare il loro consumo corrente), mentre l’aumento del grado di narrow framing (combinato col grado di avversione alla perdita) tende a spingerlo verso il basso. L’effetto legato
139
all’aumento di b0 si spiega con l’aumento del rischio derivante dal mercato azionario, il quale comporta un dirottamento delle risorse finanziarie verso attività diverse, quali titoli privi di rischio e attività non finanziarie. L’acquisto di attività “certe” aumenta il loro prezzo, abbassandone il relativo tasso d’interesse. Notiamo che quest’ultimo effetto è lo stesso generato dal risparmio a fini precauzionali indotto dall’aumento di γ . Infatti, come argomentato nel primo capitolo (prima parte paragrafo 2), l’aumento dell’avversione al rischio non implica solo un aumento del tasso d’interesse (crescita del consumo corrente), ma anche un sua diminuzione (risparmio precauzionale): ma per valori di γ non troppo elevati, ossia coerenti con la parametrizzazione delle preferenze individuali, l’effetto dominante è quello legato alla crescita del consumo, e quindi i tassi aumentano. L’effetto generato dal grado di valutazione isolata, aggiungendosi a quello del risparmio precauzionale, è invece in grado di controbilanciare l’effetto netto legato all’aumento dell’avversione al rischio, comportando una riduzione del tasso d’interesse. Ed è proprio questa capacità del modello di ribaltare gli effetti della “classica” avversione al rischio, a generare la possibilità di replicare, con moderati gradi di approssimazione, i valori empirici del premio azionario e del tasso risk-free. Nel quarto capitolo abbiamo nuovamente utilizzato le preferenze BH per indagare quali sono i motivi che spingono gli agenti economici a detenere quasi esclusivamente azioni di “casa propria” (equity home bias). La teoria di portafoglio standard ci dice infatti che sarebbe ottimale per gli agenti economici detenere una quota di azioni estere molto superiore a quella che viene effettivamente detenuta in portafoglio dagli investitori. Ciò che accade, in altre parole, è che favorevoli opportunità di diversificazione vengono rifiutate. Per quale motivo? Attraverso la costruzione e la soluzione numerica di un semplice modello di scelta internazionale di portafoglio ad agente rappresentativo, caratterizzato però da preferenze con narrow framing, viene fornita una risposta soddisfacente a tale quesito. Il meccanismo all’opera, caratteristico dell’approccio di finanza comportamentale analizzato, fa leva sulle limitate capacità di elaborazione delle informazioni dell’individuo: l’attività estera è percepita come meno appetibile di quello che risulterebbe essere se l’investitore fosse in grado, tramite la “corretta” capacità di elaborazione, di operare una valutazione congiunta delle due attività finanziarie rischiose (l’azione nazionale e quella estera). Ciò che ne segue è una modestissima detenzione di attività estere, a prescindere dai profili di rischio/rendimento. Abbiamo implementato tale modello con riferimento ad alcune coppie di economie, di cui la prima assunta come economia “nazionale” e la seconda come economia “estera”. Sono stati analizzati i casi Italia-USA, Gran Bretagna-USA e USA-Europa, ottenendo sempre risultati in linea con le nostre proposizioni teoriche.
140
Va inoltre evidenziato che i due parametri che caratterizzano il modello come un modello di finanza comportamentale, ossia il grado di valutazione isolata e quello di avversione alle perdite ( λ ), al fine di generare risultati coerenti con l’evidenza empirica, rimangono sempre coerenti con i valori utilizzati in altri studi e simulazioni (cfr. Barberis-Huang-Santos 2001, Barberis-Huang 2001, Barberis-Huang-Thaler, 2003, Barberis-Huang, 2004a, b). In particolare, il grado di valutazione isolata non manifesta quasi mai la necessità di superare l’unità (in alcuni studi a volte la supera, ma di poco). L’analisi da noi svolta costituisce quindi un risultato importante e un ulteriore contributo nell’indagare quella sorta di “scatola nera” costituita dai parametri comportamentali ( b0 e λ ) che in qualche modo tentano di cogliere le preferenze dell’individuo più strettamente connesse alle sue emozioni. I risultati ottenuti nel capitolo 4 costituiscono il contributo originale più rilevante del presente lavoro. Infatti, nella letteratura di finanza comportamentale connessa ai modelli che utilizzano preferenze con narrow framing (letteratura, è bene sottolinearlo, molto recente), nell’ambito delle analisi di equilibrio parziale, non esiste un lavoro in tale direzione. E, parimenti, nell’ambito della vasta letteratura sull’equity home bias, non esistono lavori che tentano di fornire una spiegazione soddisfacente ricorrendo a preferenze di tipo behavioral. Stracca (2002b) accenna alla possibilità di indagare l’equity home bias puzzle tramite l’utilizzo della prospect theory e delle sue implicazioni, ma non costruisce esplicitamente nessun modello in tale direzione. D’altra parte, la risoluzione di questo tipo di modelli è notevolmente complicata dal fatto di dover ricorrere a soluzioni numeriche, data l’impossibilità di ottenere soluzioni analitiche in forma chiusa. Il fatto di dover utilizzare tecniche computazionali rende le cose sicuramente più complesse da un punto di vista operativo, ma allo stesso tempo consente di derivare implicazioni molto interessanti da modelli altrimenti intrattabili e, quindi, inutilizzabili. Il nostro lavoro costituisce quindi un primo e importante contributo in un’area di ricerca che è solo ai suoi inizi e promette sviluppi futuri estremamente interessanti.
141
BIBLIOGRAFIA Abel, A.B. (1990), “Asset prices under habit formation and catching up with the Joneses”, American Economic Review (Papers and Proceedings), 80, 3842. Abel, A.B. (1999), “Risk premia and term premia in general equilibrium”, Journal of Monetary Economics, 43, 3-33. Bagliano, F. C. e G. Bertola (1999), Metodi dinamici e fenomeni macroeconomici, Il Mulino, Bologna. Banca d’Italia (1998), Indagine sul Reddito e la Ricchezza delle Famiglie Italiane, Roma. Banca d’Italia (2000), Indagine sul Reddito e la Ricchezza delle Famiglie Italiane, Roma. Banca d’Italia (2002), Indagine sul Reddito e la Ricchezza delle Famiglie Italiane, Roma. Barberis, N. e M. Huang (2004a), “Preferences with frames: a new utility specification that allows for the framing of risks”, working paper, Yale School of Management, Yale University. Barberis, N. e M. Huang (2004b), “The Loss Aversion/Narrow Framing Approach to the equity premium puzzle”, in R. Mehra (ed), Handbook of Investments: Equity Premium, North-Holland, Amsterdam. Barberis, N. e M. Huang (2001), “Mental accounting, loss aversion and individual stock returns”, Journal of Finance, 56, 1247-1292. Barberis, N., M. Huang e T. Santos (2001), “Prospect theory and asset prices”, Quarterly Journal of Economics, 116, 1-53. Barberis, N., M. Huang e R. Thaler (2003), “Individual preferences, monetary gambles and the equity premium”, working paper, Graduate School of Business, University of Chicago. Barberis, N. e R. Thaler (2003), “A survey of behavioral finance”, in G. Constantinides, M. Harris e R. Stulz (eds), Handbook of the Economics of Finance, North-Holland, Amsterdam. Benartzi, S. e R. Thaler (1995), “Myopic loss aversion and the equity premium puzzle”, Quarterly Journal of Economics, 110, 75-92. Bottazzi, L. e P. Pesenti, E. van Wincoop (1996), “Wages, profits and the international portfolio puzzle”, European Economic Review, 40, 219-254. Campbell, J.Y. (2003), “Consumption-based asset pricing”, in G. Constantinides, M. Harris and R. Stulz (eds), Handbook of the Economics of Finance, North-Holland, Amsterdam. Campbell, J.Y. (2000a), “Asset prices, consumption and the business cycle”, in J. B. Taylor and M. Woodford (eds), Handbook of Macroeconomics, NorthHolland, Amsterdam.
142
Campbell, J.Y. (2000b), “Asset pricing at the millenium”, Journal of Finance, 55, 1515-1567. Campbell, J.Y. e J.H. Cochrane (1999), “By force of habit: A consumptionbased explanation of aggregate stock market behavior”, Journal of Political Economy, 107, 205-251. Campbell, J.Y. e R. Schiller (1988), “Stock prices, earnings, and expected dividends”, Journal of Finance, 43, 661-676. Canova, F. e M. Ravn (1996), “International consumption risk sharing”, International Economic Review, 37, 573-601. Cochrane, J. (1991), “A simple test of consumption insurance”, Journal of Political Economy, 99, 957-976. Constantinides, G. (1990), “Habit formation: A resolution of the equity premium puzzle”, Journal of Political Economy, 98, 519-543. Cooper, I. e E. Kaplanis (1986), “Costs of crossborder investment and international equity market equilibrium“, in J. Edwards (ed), Recent Advances in Corporate Finance, Cambridge U. Press. Cooper, I. e E. Kaplanis (1994), “Home bias in equity portfolios, inflation hedging, and international capital market equilibrium“, Review of Financial Studies, 7, 45-60. Cugno, F. and L. Montrucchio (1998), Scelte intertemporali, Carocci, Firenze. Epstein, L. and S. Zin (1989), “Substitution, risk aversion, and the temporal behavior of consumption and asset returns: A theoretical framework”, Econometrica, 57, 937-968. Epstein, L. and S. Zin (1991), “Substitution, risk aversion, and the temporal behavior of consumption and asset returns: An empirical investigation”, Journal of Political Economy, 99, 263-286. Faiella, I. e A. Neri (2004), “La ricchezza delle famiglie italiane e americane”, Temi di Discussione, n. 501, Banca d’Italia. Fama, E. e K. French (1988), “Dividend yields and expected stock returns”, Journal of Financial Economics, 96, 246-273. French, K. e J. Poterba (1991), “International diversification and international equity markets”, American Economic Review, 81, 222-226. Goetzmann, W. e A. Kumar (2002), “Equity portfolio diversification“, ICF working paper, n. 00-59, Yale University. Golub, S. (1990), “International capital mobility: net versus gross stocks and flows”, Journal of International Money and Finance, 9, 424-439. Haliassos, M. e C. Bertaut (1995), “Why do so few hold stocks?”, Economic Journal, 105, 1110-1129. Haliassos, M. e C. Hassapis (2001), “Equity culture and household behavior”, working paper, University of Cyprus. Hall, R. E. (1988), “Intertemporal substitution in consumption”, Journal of Political Economy, 96, 339-357.
143
Hansen, L.P. and K.J. Singleton (1983), “Stochastic consumption, risk aversion, and the temporal behavior of asset returns”, Journal of Political Economy, 91, 249-268. Heaton, J. e D. Lucas (2000), “Portfolio choice in the presence of background risk”, Economic Journal, 110, 1-26. Huberman, G. (2001), “Familiarity breeds investment”, Review of Financial Studies, 14, 659-680. Jappelli, T. and L. Pistaferri (2000), Risparmio e scelte intertemporali, Il Mulino, Bologna. Judd, K. (1998), Numerical methods in economics, Mit Press, Cambridge (USA). Kahneman, D. (2003), “Maps of bounded rationality: psychology for behavioral economics”, American Economic Review, 93, 1449-1475. Kahneman, D. e A. Tversky (1979), “Prospect theory: an analysis of decision under risk”, Econometrica, 37, 263-291. Kelly, M. (1995), “All their eggs in one basket: portfolio diversification of US households”, Journal of Economic Behavior and Organization, 27, 87-96. Kocherlakota, N. (1990), “On the discount factor in growth economies”, Journal of Monetary Economics, 25, 43-47. Kocherlakota, N. (1996), “The equity premium: It’s still a puzzle”, Journal of Economic Literature, 34, 42-71. Kreps, D. and E. Porteus (1978), “Temporal resolution of uncertainty and dynamic choice theory”, Econometrica, 46, 185-200. Levy, H. e M. Sarnat (1970), “International diversification of investment portfolios”, American Economic Review, 60, 668-675. Lewis, K. (1999), “Trying to explain home bias in equities and consumption”, Journal of Economic Literature, 37, 571-608. Lewis, K. (2000), “Why do stocks and consumption imply such different gains from international risk sharing?”, Journal of International Economics, 52, 135. Ljungqvist, L. and T. Sargent (2000), Recursive macroeconomic theory, Mit Press, Cambridge, MA. Lucas, R.E. (1978), “Asset prices in an exchange economy”, Econometrica, 46, 1429-1446. Mace, B. (1991), “Full insurance in the presence of aggregate uncertainty”, Journal of Political Economy, 99, 928-956. Mankiw, G. e S. Zeldes (1991), “The consumption of stockholders and nonstockholders”, Journal of Financial Economics, 29, 97-112. Mehra, R. e E. Prescott (1985), “The equity premium: A puzzle”, Journal of Monetary Economics, 15, 145-161. Mehra, R. and E. Prescott (2003), “The equity premium in retrospect”, in G. Constantinides, M. Harris and R. Stulz (eds.), Handbook of the Economics of Finance, North-Holland, Amsterdam.
144
Michaelides, A. (2003), “International portfolio choice, liquidity constraints and the home equity bias puzzle”, Journal of Economic Dynamics & Control, 28, 555-594. Obstfeld, M. (1994), “Risk-taking, global diversification and growth”, American Economic Review, 84, 1310-1329. Obstfeld, M. e K. Rogoff (2000), “The six major puzzles in international macroeconomics: is there a common cause?“, in NBER Macroeconomics Annual. Pratt, J. (1964), “Risk aversion in the small and in the large”, Econometrica, 32, 122-136. Rabin, M. (1998), “Psychology and Economics”, Journal of Economic Literature, 36, 11-46. Rabin, M. (2002), “A perspective on psychology and economics”, European Economic Review, 46, 657-685. Shiller, R.J. (1982), “Consumption, asset markets, and macroeconomic fluctuations”, Carnegie Mellon Conference Series on Public Policy, 17, 203238. Simon, H. (1982), Models of bounded rationality, MIT Press, Cambridge (USA). Slovic, P. (1972), “Psychological study of human judgment: implications for investment decision making”, Journal of Finance, 27, 779-799. Solnik, B. (1974), “An equilibrium model of the international capital market”, Journal of Economic Theory, 8, 500-524. Stokey, N. and R.E. Lucas, (with E. Prescott) (1989), Recursive methods in economic dynamics, Harvard University Press, Cambridge, MA. Stracca, L. (2002a), “Behavioral finance and aggregate market behavior: where do we stand?”, working paper, BCE, Francoforte. Stracca, L. (2002b), “The optimal allocation of risks under prospect theory”, ECB working paper n. 161, Francoforte. Sundaresan, S.M. (1989), “Intertemporally dependent preferences and the volatility of consumption and wealth”, Review of Financial Studies, 2, 7388. Tauchen, G. e R. Hussey (1991), “Quadrature-based methods for obtaining approximate solutions to nonlinear asset pricing models“, Econometrica, 59, 371-396. Tesar, L. e I. Werner (1995), “Home bias and high turnover”, Journal of International Money and Finance, 14, 467-492. Tesar, L. e I. Werner (1998), “The internationalization of securities markets since the 1987 crash”, in R. Litan e A. Santomero (eds), BrookingsWharton papers on Financial Services, The Brookings Institution, Washington. Thaler, R. (1999), “Mental accounting matters”, Journal of Behavioral Decision Making, 12, 183-206.
145
Thaler, R. e E. Johnson (1990), “Gambling with the house money and trying to break even: the effects of prior outcomes on risky choice“, Management Science, 36, 643-660. Tversky, A. e D. Kahneman (1981), “The framing of decisions and the psychology of choice“, Science, 211, 453-458. Tversky, A. e D. Kahneman (1992), “Advances in prospect theory: cumulative representation of uncertainty”, Journal of Risk and Uncertainty, 5, 297-323. Van Nieuwerburgh, S. e L. Veldkamp (2004), “Information immobility and the home bias puzzle“, working paper, Stern School of Business, New York University. Van Wincoop, E. (1994), “Welfare gains from international risk sharing”, Journal of Monetary Economics, 34, 175-200. Weil, P. (1989), “The equity premium puzzle and the risk-free rate puzzle”, Journal of Monetary Economics, 24, 401-421.
146