Obiettivo importante: scoprire l'esistenza di relazioni tra le variabili
Abbiamo già visto l'analisi di correlazione:
- solo relazioni lineari;
- solo intensità della relazione
Con l'analisi di regressione abbiamo la possibilità di studiare la natura della relazione fra le variabili e la forma che essa assume
Prime limitazioni:
- Consideriamo solo due variabili (vedremo successivamente l'estensione al caso n-dimensionale);
- Il modello di regressione semplice prevede l'esistenza di una variabile endogena e di una variabile esogena;
- Inizieremo con modelli lineari.
Ricordiamoci sempre che la retta di regressione vera (quella della popolazione) è sconosciuta e tale resterà
Obiettivo: "immaginarci" la retta vera a partire dalle informazioni campionarie. Un metodo a mia disposizione è quello di "adattare" una retta alla nuvola di punti che rappresenta il mio campione e sperare di ottenere una stima (predizione) accettabile della retta vera.
NB: Si parla di:
. disturbi quando si ragiona sulla retta "vera"
. errori o residui quando si ragiona sulla retta stimata
Quale retta scelgo? Criterio di scelta
. deviazioni dalla media?
. modulo delle deviazioni dalla media?
. deviazioni al quadrato?
Cosa implica la scelta del criterio?
Prof. Paolo Mattana
Successivo: Teoria della regressione II
Sommario: Index