Il test di Shapiro-Wilk è considerato in letteratura uno dei test più potenti per la verifica della normalità, soprattutto per piccoli campioni. La verifica della normalità avviene confrontando due stimatori alternativi della varianza s2: uno stimatore non parametrico basato sulla combinazione lineare ottimale della statistica d'ordine di una variabile aleatoria normale al numeratore, e il consueto stimatore parametrico, ossia la varianza campionaria, al denominatore. I pesi per la combinazione lineare sono disponibili su apposite tavole. La statistica W può essere interpretata come il quadrato del coefficiente di correlazione in un diagramma quantile-quantile. Il comando per effettuare il test di normalità in questione in ambiente R è shapiro.test() presente nel package stats. Esso restituisce come risultato il valore della statistica W e il relativo p-value:
Il p-value è decisamente elevato rispetto ai livelli di significatività a cui di solito si fa riferimento: ciò ci fa propendere per l’ipotesi nulla ovvero la normalità della distribuzione degli errori.
Test di Jarque- Bera
Il test di Jarque – Bera è impiegato molto spesso per la verifica dell’ipotesi di normalità in campo econometrico. Esso si basa sulla misura dell’asimmetria e della curtosi di una distribuzione. Si considera in particolare la distribuzione asintotica di una combinazione dei noti coefficienti b3 e b4 (o gamma3 e gamma4) che è di tipo chi-quadro. In R tale test è presente nel package tseries ed è richiamabile tramite il comando jarque.bera.test() che restituisce il valore della statistica, i gradi di libertà e il p-value:
Anche in questa circostanza il p-value è sufficientemente elevato per impedirci di rifiutare l’ipotesi di normalità della distribuzione dei residui.
Test di Breusch – Pagan per omoschedasticità
Il test di Breusch-Pagan, largamente utilizzato in econometria per verificare l’ipotesi di omoschedasticità, applica ai residui gli stessi concetti della regressione lineare. Esso è valido per grandi campioni, assume che gli errori siano indipendenti e normalmente distribuiti e che la loro varianza (σ2 t) sia funzione lineare del tempo t secondo:
ciò implica che la varianza aumenti o diminuisca al variare di t, a seconda del segno di b. Se si ha l’omoschedasticità, si realizza l’ipotesi nulla:
H0: b = 0
Contro l’ipotesi alternativa bidirezionale:
H0: b ≠ 0
Per la sua verifica, si calcola una regressione lineare, a partire da un diagramma di dispersione (Graf. 15) che:
- sull’asse delle ascisse riporta il tempi t
- sull’asse delle ordinate il valore dei residui corrispondente
Si ottiene una retta di regressione, la cui devianza totale (SQR) è in rapporto alla devianza d’errore precedente (SQE) calcolata con i dati originari secondo una relazione di tipo quadratico che, se è vera l’ipotesi nulla, al crescere del numero delle osservazioni si distribuisce secondo una variabile casuale chiquadro con un grado di libertà.
Per effettuare il test di Breusch Pagan in R è necessario caricare il package lmtest ove è contenuta la funzione bptest().
library(lmtest)
Possiamo effettuare la verifica in tre modi diversi:
a) facendo regredire i valori delle ore lavorare rispetto al trend e alla stagionalità stimati secondo un modello del tipo: ore ~ -1+trend+stagionalita, senza considerare l’intercetta:
b) facendo regredire gli errori su una costante:
c) per verificare se la varianza dei residui è monotona crescente o decrescente nel tempo si può procedere in questo modo:
L’output fornisce il valore della statistica del test (BP), il numero dei gradi di libertà (df) e il p-value corrispondente. Poiché il numero delle osservazioni è abbastanza elevato il test risulta applicabile e, in tutti i modelli esaminati, risulta non essere significativo (il p-value è di gran lunga superiore al livelli significatività di solito utilizzati nell’analisi statistica) e quindi di accetta l’ipotesi nulla, ossia di varianza dei residui costante nel tempo.
Test di autocorrelazione
Si può avere un fenomeno di autocorrelazione temporale, a causa dell'inerzia o stabilità dei valori osservati, per cui ogni valore è influenzato da quello precedente e determina in parte rilevante quello successivo. Esistono diversi test statistici per saggiare la presenza di una correlazione seriale dei residui di una serie storica. In questa sede si farà riferimento ai test di Box-Pierce, Ljung-Box Tests e Durbin-Watson.
Vito Ricci
Successivo: Uso del correlogramma
Sommario: Index