Home > Doc > Analisi delle serie storiche con R > Modelli stocastici

Analisi delle serie storiche con R

Modelli stocastici

Introduzione

L’approccio moderno o stocastico (contrapposto a quello classico o deterministico) si basa sul concetto mutuato dal calcolo delle probabilità di processo stocastico. Definiamo il processo stocastico come una famiglia (o successione) di variabili aleatorie Xt(W) definite sullo stesso spazio degli eventi W e ordinate secondo un parametro t (appartenente allo spazio parametrico T) che nell’analisi delle serie storiche è il tempo. In questo modo la serie storica può considerarsi come una realizzazione campionaria finita del processo stocastico. Utilizzeremmo la notazione Xt per indicare il processo stocastico e la notazione xt per riferirci ad una sua determinazione, ovvero ad una serie storica. Del processo stocastico possono considerarsi alcuni indicatori di sintesi o valori caratteristici:

Clicca per ingrandire

Di solito si fa riferimento ad una particolare categoria di processi stocastici: quelli stazionari in senso debole (si trascura in tale contesto la stazionarietà in senso forte). Un processo si dice stazionario in senso debole:

in media se (ossia la media è costante ed è finita e non dipende dal parametro t)

in varianza se (ossia la varianza è costante ed è finita e non dipende da t)

in covarianza se (ossia le covarianze sono finite e dipendono solo dal ritardo temporale k)

Se k=0 si che γ(0) =σ2 ; la funzione { γ(k), k>0} è detta funzione di autocovarianza del processo stazionario. Un processo è stazionario in senso debole tout court se è stazionario in media, varianza e covarianza. In processo stazionario anche la funzione di correlazione dipende solo dal lag temporale k, infatti:

ρk , essendo un coefficiente di correlazione, varia tra –1 e 1. Se k=0 chiaramente ρ0 =1. La funzione { ρ(k), k>0} è detta funzione di autocorrelazione del processo stazionario. Per poter applicare l’approccio moderno all’analisi delle serie storiche è necessario che queste vengano rese stazionarie eliminando il trend e la stagionalità con i metodi esposti nei paragrafi precedenti. È sulla serie dei residui, quindi, che si dovrà operare, magari dopo aver applicato alcuni tests di specificazione, come ad esempio quello per verificare la omoschedasticità, ossia la stazionarietà in varianza. Di un processo stocastico stazionario Xt si possono stimare i valori caratteristici con i dati delle n osservazioni della serie storica xt:

Clicca per ingrandire

Applichiamo questi concetti alla serie dei residui standardizzati stimati con il metodo stl() contenuti nel vettore res.stl. Calcoliamo la stima della media del processo:

mean(res.stl)

-7.824039

e della varianza temporale:

var(res.stl)

468553

Per quanto riguarda le funzioni di autocovarianza e di autocorrelazione si usa il comando acf() che permette di ottenere il correlogramma (Graf.31) o il grafico delle autocovarinaze (Graf. 32) oppure la semplice stampa delle autocovarianze o dei coefficienti di autocorrelazione:

acf(res.stl,type="correlation",plot=TRUE,main="Correlogramma della serie dei residui")

acf(res.stl,type="covariance",plot=TRUE, main=”Grafico delle autocovarianze”)

I principali argomenti di acf(), oltre alla serie storica, sono type, con il quale ci specifica se si vogliono calcolare le autocovarianze (type=”covariance”) o i coefficienti di correlazione type=”correlation”)

e plot che serve per indicare se tracciare il grafico (plot=TRUE) che è il valore di default oppure se stampare l’output (plot=FALSE)

Clicca per ingrandire

che fornisce i lag e I corrispondenti coefficienti di autocorrelazione o le autocovarianze. Con il comando acf() è possibile stimare anche i coefficienti di correlazione parziale specificando l’argomento type=”partial”. Analogo risultato si ottiene con il comando pacf(). La correlazione (k) tra dati distanti k lag è influenzata dalle relazioni lineari con i dati intermedi. La funzione di autocorrelazione parziale (k) misura la correlazione tra xt e xt+k dopo che sia stata eliminata la parte “spiegabile linearmente” da xt+1, xt+2, . . . , xt+k-1 . E’ una misura dei legami lineari tra xt e xt+k depurata dall’influenza delle variabili che stanno in mezzo. Per stimare le (k) si può far ricorso a formule che le esprimono in funzione della autocorrelazioni ordinarie oppure a procedure ricorsive.

pacf(res.stl,plot=TRUE,main="Grafico delle correlazioni parziali")

pacf(res.stl,plot=FALSE)

Partial autocorrelations of series 'res.stl', by lag

0.0833 0.1667 0.2500 0.3333 0.4167 0.5000 0.5833 0.6667 0.7500 0.8333 0.9167 -0.185 -0.100 -0.157 -0.218 -0.018 -0.187 -0.238 -0.143 -0.098 -0.014 -0.015 1.0000 1.0833 1.1667 1.2500 1.3333 1.4167 1.5000 0.131 -0.046 -0.053 -0.125 -0.136 -0.154 0.031

La funzione ccf() consente di calcolare le correlazioni o le covarianze incrociate tra due serie storiche.

Vito Ricci

Successivo: Esame di alcuni processi stocastici

Sommario: Index