L'assunzione di omogeneità nel metodo OLS
- OLS assume che tutti le osservazioni siano generate dallo stesso "processo stocastico" (tutte comparabili);
- Le osservazioni sono un campione tratto dalla medesima popolazione;
- Tuttavia il campione può essere composto da gruppi distinti in cui il valore medio di Y può differire;
- Ciò è possibile anche per una singola osservazione (outlier) ;
- Anche per gruppi sistematici (ad esempio il 4° trimestre).
Quali sono le implicazioni per OLS?
. Se non "controllati", questi effetti di gruppo entrano a far parte del termine di errore;
. Come conseguenza generiamo una forma di correlazione simultanea tra errori e variabili indipendenti;
. Violazione dell'assunzione di indipendenza;
. Bias da variabili omesse + non consistenza.
. Le variabili "dummy" costituiscono un modo semplice e flessibile
. per misurare effetti di gruppo
. Sono però ammissioni di ignoranza relativamente al perchè
. certi gruppi si comportino difformemente
. Si cerchino quindi le motivazioni teoriche e le si modellino
. Se possibile, si cerchi di misurare il fenomeno più direttamente
Come si costruisce un variabile D? Si consideri il caso binario
Acquisisce solo 2 valori: Es: differenze di genere nella relazione fra reddito e "skills"
Se l'osservazione riguarda un maschio (= 1) o una femmina (= 0).
Il modello di regressione lineare diventa
Il modello che mette in relazione reddito, Y, alle capacità, X, e al genere può visualizzarsi come segue:
§ Questo assume che abbiamo ordinato i dati in modo da avere le "femmine" per prime.
§ In generale, se I dati non sono ordinati avremmo nella 3 rd colonna zero e uno in corrispondenza del genere
Dummy Variable Regression
§ Le D permettono all'intercetta di gruppi diversi di differire tra gruppi
§ E' possibile che sia l'intercetta che il coeff. angolare varino tra gruppi:
SHIFT NELL'INTERCETTA
§ Le variabili D sono utili anche perchè consentono di condurre test sui gruppi.
§ Es. E' il reddito nel gruppo "Maschi" diverso da quello del gruppo "Femmine" (a parità di skills).
§ Femmine è il "control group", cioè quello contro il quale si confronta.
§ Se I "Maschi" sono "differenti", allora d 1 sarà significativ. diff da 0.
§ H 0 : d 1 = 0
Possiamo anche utilizzare la forma generalizzata per verificare se anche la pendenza della retta varia tra I gruppi (i.e. the wage paid to skill levels)
Se I "Maschi" sono "differenti", allora sia d1 che d2 signif. differenti da 0. Null Hypothesis is H0: d1 = d2 = 0
Le dummy sono utilissime anche per:
i) Annullare osservazioni: outliers (dummy observation specific)
ii) Creare test per testare la presenza di gruppi generati da processi stocastici diversi
iii) Studiare la stabilità del modello (molto utile e importante)
iv) Trattare la destagionalizzazione dei dati
Prof. Paolo Mattana
Successivo: Il test di Chow sui gruppi
Sommario: Index