Negli esempi precedenti abbiamo esaminato processi stazionari, cioè processi in cui la variabile considerata può variare entro un range ben definito. Se consideriamo processi non stazionari la varabile da predire può variare al di fuori di qualunque range di valori e ciò comporta un problema nella normalizzazione dei dati.
La normalizzazione infatti consiste nel riportare valori reali del processo a valori compresi tra 0 e 1 o tra -1 e 1 a seconda del tipo di rete e di funzione di trasferimento dei neuroni: si ottiene questo nel modo più semplice dividendo tutti i valori del processo per il valore più alto di essi, ma in un processo non stazionario quest'ultimo non è conosciuto.
Per risolvere questo problema si rende necessario effettuare una normalizzazione non lineare del processo in modo che la variabile analizzata, che può teoricamente variare tra -inf e +inf , vari tra -k e +k. Si possono utilizzare funzioni logaritmiche, radici cubiche e funzioni non lineari come la sigmoide utilizzata nella funzione di trasferimento dei neuroni di una rete e_b_p. Naturalmente l'imprecisione aumenta se ci si avvicina agli estremi della funzione dato che il rapporto tra la variazione della variabile normalizzata e quella non normalizzata decresce.
esempio 1 di normalizzazione per proc. non stazionario:
x_normaliz= 1/(1+exp(-x))
dove -inf < x < +inf e 0 < x_normaliz < 1
esempio 2 di normalizzazione per proc. non stazionario:
x_normaliz=logn(x)/k
dove 0 < x < +inf e
k=costante valutata in base alla probabilità che la variabile oltrepassi un certo valore.
Naturalmente con una normalizzazione di tipo 1 abbiamo la certezza che tutti i valori normalizzati cadano entro il range 0.0/1.0, mentre con il secondo metodo dobbiamo fare una ipotesi restrittiva sui valori massimi che la variabile potrà assumere.
In ogni caso, l'utilizzo di funzioni di questo tipo è più utile per effettuare delle "ridistribuzioni dei dati" (non tratteremo qui questo argomento). Per aggirare il problema dei processi non stazionari si possono considerare serie storiche di derivate anziché di valori della variabile: in questo modo siamo sicuri che i dati in ingresso sono compresi tra due valori definiti.
Analogamente al caso di serie storiche di valori della variabile, gli intervalli di campionamento dei dati per l'addestramento dovranno essere tanto più piccoli quanto più alta è la frequenza di variazioni significative della variabile.
Luca Marchese
Successivo: Previsione Multivariata
Sommario: Indice