Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4)
Regressione con Variabili “Dummy”
Regressione con Variabili “Dummy” • La variabile dummy assume valore 0 o 1. • E’ utilizzata per trasformare dei valori qualitativi (Si/No) in 1/0. Esempio: Spiegare i prezzi delle case Variabile dipendente: Prezzo della casa Variabili Esplicative: • D1 = 1 se la casa ha un ingresso auto (=0 in caso negativo). • D2 = 1 se ha una stanza di ricreazione (=0 se non ha). • D3 = 1 se ha una cantina (=0 se non). • D4 = 1 se ha riscaldamento centralizzato (=0 se non). • D5 = 1 se ha condizionatori d’aria (=0 se non).
Analisi della Varianza • Analisi della Varianza = ANOVA • E’ una tecnica statistica molto utilizzata in diverse discipline (ma poco utilizzata in economia). • ANOVA è un caso speciale di regressione con variabili dummy. • La regressione con variabili dummy è uno strumento più generico e più dettagliato.
Regressione Semplice con una Variabile Dummy
Y = α + βD + e
• Stima OLS, intervalli di confidenza, test delle ipotesi, ecc. elaborati nel modo usuale. • Interpretazione lievemente differente.
Regressione Semplice con una Variabile Dummy • Valore stimato per l’ osservazione “i” (punto sulla retta di regressione):
ˆ = αˆ + βˆD Y i i • Poichè Di = 0 o 1 o
ˆ = αˆ Y i o
ˆ = αˆ + βˆ Y i
Esempio: prezzo delle case (continua) • Regrediamo Y = prezzo della cassa su D = dummy per condizionatori d’aria (=1 se la casa ha condizionatori d’aria, = 0 altrimenti). • Risultato:
αˆ = 59,885 βˆ = 25,996 αˆ + βˆ = 85,881 • Il prezzo medio della casa con aria condizionata è $85,881 • Il prezzo medio della casa senza aria condizionata è $59,885
Regressione Multipla con variabili Dummy Y = α + β D + ... + β D + e 1 1 k k Esempio: prezzo delle case (continua) Regrediamo Y = prezzo della casa su D1 = accesso auto e D2 = stanza di ricreazione (dummy) Quattro tipi di case: 1. Case con accesso auto e stanza di ricreazione (D1=1, D2=1) 2. Case con accesso auto ma senza stanza di ricreazione (D1=1, D2=0) 3. Case con stanza di ricreazione ma sen za accesso auto (D1=0, D2=1) 4. Case senza stanza di ricreazione e senza accesso auto (D1=0, D2=0)
Esempio: prezzo delle case (continua) Esempio: prezzo delle case (continua) Coeff. Inter. D1 D2
St. Error 2837.6 3062.4 2788.6
47099.1 21159.9 16023.7
t Stat 16.60 6.91 5.75
Pvalue 2.E-50 1.E-11 1.E-08
Lower 95% 41525 15144 10546
Upper 95% 52673 27176 21502
1. Se D1=1 e D2=1, allora
Yˆ = αˆ + βˆ + βˆ = 47,099 + 21,160 + 16,024 = 84,283 1
2
“Il prezzo medio delle case con accesso auto e stanza di ricreazione è $84,283”.
Esempio: prezzo delle case (continua) 1. Se D1 = 1 e D2=0, allora
Yˆ = αˆ + βˆ = 47,099 + 21,160 = 68,259 1
“Il prezzo medio delle case con accesso auto ma non stanza di ricreazione è $68,259”. 2. Se D1=0 e D2=1, allora
Yˆ = αˆ + βˆ = 47,099 + 16,024 = 63,123 2
“Il prezzo medio delle case con stanza di ricreazione ma non accesso auto è $63,123”. 3. Se D1=0 e D2=0, allora
Yˆ = αˆ = 47,099 “Il prezzo medio delle case senza accesso auto e senza stanza di ricreazione è $47,099”.
Regressione Multipla con Dummy e nonDummy Variabili Esplicative Y =α + β D+ β X +e 1 2 Esempio: prezzo delle case (continua) Regrediamo Y = prezzo casa su D = aria condizionata e X = dimensione del lotto. Stime OLS :
αˆ = 32,693 βˆ 1 = 20,175 βˆ 2 = 5.64
Esempio: Prezzo delle Case (continua) • Per case con condizionatore d’aria D = 1 e
ˆ = 52,868 + 5.64 X Y i i • Per case senza condizionatore d’aria D=0 e
ˆ = 32,693 + 5.64 X Y i i • Due regressioni differenti in relazione alla presenza o meno di condizionatori d’aria. • Le due linee di regressione avranno intercetta diversa ma stessa pendenza (perciò stesso effetto marginale)
Esempio: prezzo delle case (continua) • Come spiegare i risultati OLS : • “Un metro quadrato in più nella dimensione della casa determina un aumento del prezzo pari a $5.64 ” (Nota: no ceteris paribus poiché l’effetto marginale è lo stesso sia per case con condizionatore d’aria che per case senza condizionatore d’aria) • “Case con condizionatori d’aria tendono a valere $20,175 in più di case senza condizionatori d’aria, ceteris paribus” (Nota: in questo caso abbiamo la qualificazione ceteris paribus ) • “Se consideriamo case con dimensioni simili, quelle con condizionatori d’aria tendono a valere $20,175 in più”
Un’altra Regressione relativa al Prezzo delle Case Y =α + β D + β D + β X + β X +e 1 1 2 2 3 1 4 2 • Regrediamo Y = prezzo della casa su D1 = variabile dummy relativa all’accesso auto, D2 = variabile dummy per la stanza di ricreazione, X1 = dimensione del lotto e X2 = numero di stanze da letto • Stime OLS:
αˆ =-2736 βˆ 1=12,598 βˆ 2=10,969 βˆ 3=5.197 βˆ 4=10,562
Un’altra Regressione relativa al Prezzo delle Case (cont.) 1. Se D1=1 e D2=1, allora Yˆ = 20,831 + 5.197 X + 10,562 X . 1 2
Questa è la retta di regressione per le case con accesso auto e stanza di ricreazione. 2. Se D1=1 e D2=0, allora
Yˆ = 9,862 + 5.197 × X + 10,562 × X . 1 2 Questa è la retta di regressione per le case con accesso auto ma senza stanza di ricreazione.
Un’altra Regressione relativa al Prezzo delle Case (cont.) 1. Se D1=0 e D2=1, allora
Yˆ = 8,233 + 5.197 X + 10,562 X . 1 2 Questa è la retta di regressione per le case con la stanza di ricreazione e non accesso auto. 2. Se D1=0 e D2=0, allora
Yˆ = −2,736 + 5.197 X + 10,562 X . 1 2 Questa è la retta di regressione per le case senza accesso auto e senza stanza di ricreazione.
Un’altra Regressione relativa al Prezzo delle Case (cont.) • Esempi esplicativi: • “Case con accesso auto tendono a valere $12,598 di più di case simili senza accesso auto.” • “Se consideriamo case con lo stesso numero di stanze da letto, aggiungendo un metro quadrato alla dimensione del lotto queste tenderanno ad avere un prezzo maggiorato di $5.197.” • “Una stanza da letto aggiuntiva tenderà ad aumentare di $10,562 il valore della casa, ceteris paribus”
Termini Moltiplicativi di Variabili Dummy e NonDummy Y = α + β D + β X + β Z + e. 1 2 3
dove Z=D×X. • Z è o 0 (per osservazioni con D=0) o X (per osservazioni con D=1) • Se D=1 allora Yˆ = (αˆ + βˆ ) + ( βˆ + βˆ ) X . 1
2
3
• Se D=0, allora Yˆ = αˆ + βˆ X . 2
• Due diverse rette di regressione corrispondenti a D=0 e D=1 con intercette e pendenza diverse. • L’effetto marginale di X su Y è differente per D=0 e D=1.
Ancora un Esempio Diverso del Prezzo delle Case • Regrediamo Y = prezzo della casa su D = dummy per l’aria condizionata, X = dimensione della casa e Z = D×X • Stime OLS:
αˆ = 35,684 βˆ 1 = 7,613 βˆ 2 = 5.02 βˆ 3 = 2.25. • L’effetto marginale della dimensione della casa è 7.27 per case con aria condizionata ma solo $5.02 per case senza aria condizionata. • Incrementando la dimensione della casa il suo valore tenderà ad aumentare di più nel caso vi sia aria condizionata.
Variabili Dipendenti Dummy • Esempio: • La variabile dipendente rappresenta la scelta del mezzo di trasporto. • 1 = “Si, vado a lavoro in macchina” • 0 = “No, non vado a lavoro in macchina” • Non discuteremo questo caso. • Nota solo i seguenti punti: • Ci sono problemi con lo stimatore dei minimi quadrati ordinari (OLS estimation). Tuttavia lo stimatore OLS è adeguato in molti casi. • Stime migliori sono ottenute utilizzato il metodo “Logit” e “Probit”. Excel non ha procedure automatiche per questi metodi, abbiamo bisogno di un applicativo econometrico differente (es. Gretl).