Econometria lezione 13 validità interna ed esterna
Econometria lezione 13
AA 2014-2015 Paolo Brunori
popolazione studiata e popolazione di interesse
Econometria lezione 13 validità interna ed esterna
- popolazione studiata: popolazione da cui è stato estratto il campione - popolazione di interesse: popolazione per la quale ci interessa che siano valide le nostre conclusioni - le rivelazioni Invalsi servono per valutare l’intero sistema scolastico ma i dati sono raccolti solo in alcuni anni del ciclo scolastico
validità interna ed esterna
Econometria lezione 13 validità interna ed esterna
- validità interna: le inferenze statistiche sugli effetti casuali sono validi per la popolazione studiata - validità esterna: le inferenze statistiche sugli effetti casuali possono essere generalizzate alla popolazione di interesse
validità interna
Econometria lezione 13 validità interna ed esterna
- βi devono essere corretti e consistenti - SE(βˆi ) devono essere stimati precisamente - quando questi requisiti vengono meno si ha violazione di una o piú assunzioni OLS: 1 2 3 4
E(ui |Xi ) = 0 ∀Xi X , Y sono i.i.d. gli outlier sono improbabili non vi è collinearità perfetta
minacce alla validità esterna: differenze nelle popolazioni
Econometria lezione 13 validità interna ed esterna
- cavie animali - immigrati in periodi diversi - a chi possiamo generalizzare i risultati sui distretti californiani? - più simili le popolazioni più facilmente generalizzabili le stime della regressione
minacce alla validità esterna: differenze di contesto
Econometria lezione 13 validità interna ed esterna
- differenze nelle istituzioni (scuole pubbliche/private) - differenze nell’ambiente fisico (pomodori, navi) - più simile l’ambiente più facilmente generalizzabili le stime
valutare la validità esterna di uno studio
Econometria lezione 13 validità interna ed esterna
- esistono studi simili? (Massachusetts) - risultati coerenti su popolazioni simili rafforzano la validità esterna di uno studio - questi sono tutti problemi che dovrebbero essere pensati prima - ma noi generalmente dobbiamo trovare soluzioni ex post
5 minacce alla validità interna
Econometria lezione 13 validità interna ed esterna
1 variabili omesse 2 incorretta specificazione della forma funzionale 3 misura imprecisa delle variabili 4 selezione del campione 5 causalità simultanea
1. variabili omesse
Econometria lezione 13 validità interna ed esterna
- se escludiamo una variabile Z che determina Y ed è correlata con un regressore X1 si ha corr(ui , X1i ) 6= 0 - distorsione che persiste anche nei grandi campioni - risolvibile introducendo Z nel modello - o inserendo una variabile di controllo X2 tale che: E(ui |X1,i , X2,i ) = E(ui |X1,i ) - introdurre o meno una variabile di controllo?
inclusione di variabili di controllo
Econometria lezione 13 validità interna ed esterna
- questa inclusione va soppesata con la perdita di precisione delle stime - dopo aver specificato la relazione di interesse la scelta si basa su 4 passaggi: a fare un elenco delle fonti possibili di distorsione da variabili omesse b inserire le variabili in elenco e testare l’ipotesi che abbiano coefficienti nulli c controllare che i coefficienti iniziali non siano significativamente alterati d rappresentare in modo completo questo procedimento
Econometria lezione 13 validità interna ed esterna
Econometria lezione 13 validità interna ed esterna
assenza di variabili di controllo
Econometria lezione 13 validità interna ed esterna
- quando non ci sono variabili di controllo che possano garantire indipendenza nella media condizionata - si può ricorrere ad un’analisi panel (12-18 novembre) - a un modello con variabili strumentali (3 dicembre)
2. incorretta specifica della forma funzionale
Econometria lezione 13 validità interna ed esterna
- rende distorte le stime OLS - in pratica si tratta dell’omissione di una variabile (trasformazione lineare di una inserita) - per cui introdurre la variabile omessa dovrebbe essere possibile - se la variabile dipendente è discreta la cosa p `iù complicata (19 novembre)
3. errori di misura nelle variabili
Econometria lezione 13 validità interna ed esterna
- i test Invalsi potrebbero misurare le abilità con margine d’errore - il titolo di studio dei genitori riportato incorrettamente dagli alunni
errore di misura nel regressore
Econometria lezione 13 validità interna ed esterna
˜ = - il reddito X è misurato imprecisamente X 6 X - la regressione stimata diventa: ˜ i + [β1 (Xi − X ˜ i ) + ui ] Yi = β0 + β1 X ˜ i + vi Yi = β 0 + β 1 X - il termine errore vi è una funzione dell’errore di misura ˜ allora β1 è - se l’errore di misura è correlato con X distorto
errore di misura nel regressore classico
Econometria lezione 13
- l’errrore di misura ‘classico’ compare nel caso in cui: ˜ i = Xi + wi X con corr(wi , Xi ) = 0 e corr(wi , ui ) = 0 - in questo caso βˆ1 è inconsistente: βˆ1 →
2 σX 2 + σ 2 β1 σX w
- β1 è sempre sottostimato e l’entità di questa distorsione dipende dalla varianza relativa di w rispetto a X 2 e σ 2 si potrebbe calcolare il vero - conoscendo σX w coefficiente β1
validità interna ed esterna
errori di misura della variabile indipendente
Econometria lezione 13 validità interna ed esterna
˜ i = Yi + wi , con - se si tratta di errore classico Y corr(wi , Yi ) = 0 e corr(wi , ui ) = 0 - la varianza di βˆ1 sarà maggiore ma β1 è consistente
4. dati mancanti e selezione del campione
Econometria lezione 13 validità interna ed esterna
- il problema di fondo è lo stesso - i dati mancanti non sono tutti uguali: I I I
mancanti completamente a caso mancanti in base a X mancanti in base a X e Y
dati mancanti completamente a caso
Econometria lezione 13 validità interna ed esterna
- unico effetto: ridurre la dimensione del campione - → stime meno precise ma consistenti
dati mancanti in base a X
Econometria lezione 13 validità interna ed esterna
- effetto 1: riduzione della dimensione del campione - effetto 2: riduzione della variabilità (o intervallo di variazione) di X - → stime meno precise ma consistenti
dati mancanti in base a X e Y
Econometria lezione 13 validità interna ed esterna
- effetto 1: riduzione della dimensione del campione - effetto 2: riduzione della variabilità (o intervallo di variazione) di X - effetto 3: possibile correlazione fra gli errori e i regressori (vince London) - → stime inconsistenti
5. causalità simultanea
Econometria lezione 13
- abbiamo sempre ipotizzato X → Y - in molti casi è vero anche che Y → X - in questo caso si parla di causalità simultanea - la conseguenza è correlazione fra regressore ed errore: Y i = β 0 + β 1 X i + ui Xi = γ0 + γ1 Yi + vi ˆ i , ma Yi piccolo influenza - esempio: ui < 0 → Yi < Y Xi attraverso γ1 - le stime sono distorte e il problema non facilmente risolvibile (3 dicembre)
validità interna ed esterna
validità interna: inconsistenza degli errori standard
Econometria lezione 13 validità interna ed esterna
- l’inferenza sulle stime ha un livello di confidenza diverso da quello desiderato - le fonti sono l’eteroschedasticità dell’errore - la correlazione del termine errore fra le osservazioni.
eteroschedasticità
Econometria lezione 13 validità interna ed esterna
- si risolve calcolando errori standard robusti
correlazione dell’errore tra le osservazioni
Econometria lezione 13 validità interna ed esterna
- avviene perché le osservazioni sono ripetute nel tempo (autocorrelazione) - o perchè una variabile omessa da luogo ad errori correlati per osservazioni adiacenti (area geografica) - le stime βi non sono distorte o inconsistenti - ma l’inferenza è scorretta: i livelli di confidenza non corrispondono a quelli desiderati - il problema si risolve derivando formule alternative per gli errori standard