Distribuzioni di probabilità frattali
Il fatto che le distribuzioni delle serie storiche siano leptocurtotiche, è un dato accettato dagli studiosi. La spiegazione più comune a questo fenomeno è che le informazioni giungono ai mercati in forma intermittente piuttosto che in un modo continuo e costante. Se la distribuzione delle informazioni è leptocurtotica, conseguentemente lo sarebbe anche la distribuzione delle variazioni dei prezzi.
Mandelbrot (1964 - 1983) suggerisce che le distribuzioni dei rendimenti delle attività dei mercati seguano il comportamento di una famiglia di distribuzioni chiamate distribuzioni paretiane o anche Pareto-Lévy (o L-stabili) in nome del primo matematico francese, Paul Lévy, che ne studiò le proprietà basandosi, a sua volta, sugli studi dell'economista Vilfredo Pareto sulla distribuzione dei redditi.
Benché gli studi di Lévy risalgano al 1925, sarà Mandelbrot a evidenziare la natura frattale di queste distribuzioni. Le variabili, alla cui base vie è una distribuzione di questo tipo, sono caratterizzate dalla tendenza a seguire trend e cicli, così come ad avere improvvisi cambiamenti di direzione. Inoltre presentano, se confrontate con la Normale usualmente utilizzata nei calcoli statistici, le code spesse e un picco immediatamente attorno alla valore in cui si ammassa la maggior parte delle osservazioni. Tuttavia non sono implementate nei modelli statistici poiché spesso non dispongono dei primi due momenti (media e varianza) o presentano solo la media, ma la varianza è infinita, situazione che non si verifica nella realtà.
In alcuni casi si ritiene inaccettabile un modello basato su una distribuzione con varianza infinita e si preferisce riformulare le teorie esistenti ricorrendo alla distribuzione più utilizzata, quella Normale, piuttosto che insinuare il dubbio che le basi teoriche degli ultimi decenni di ricerche in campo economico e finanziario siano da rivedere affondo (Cootner, 1964; Shiller, 1989). La Normale, tra le tante tipologie di distribuzione esistenti, è quella che fornisce una semplice e pratica rappresentazione della forma della distribuzione delle variabili in esame, nonostante si allontani dalla vera forma della distribuzione dei dati reali (Nolan John P. 2000).
Un importante classe di distribuzioni è quella delle distribuzioni stabili:
– una variabile casuale X ha una distribuzione stabile se per ogni n≥ 2 esistono una costante positiva cn ed un numero reale pn tali che:
(3.1)
dove X1 … Xn sono copie indipendenti di X. In parole, la forma della distribuzione della somma di n copie di X è la stessa di X moltiplicata per un fattore di scala cn e traslata di una quantità pn . Se pn = 0 la distribuzione è strettamente stabile. La distribuzione stabile sarà anche simmetrica se vale che X ~ –X (Feller W., 1971).
Una distribuzione strettamente stabile è anche frattale poiché la forma della distribuzione della somma di n indipendenti copie è la stessa della distribuzione di partenza una volta corretta per il fattore di scala cn . I frattali sono oggetti che mantengono la stessa forma qualunque sia la scala di riferimento; in questo caso siamo in presenza di variabili le cui distribuzioni di probabilità sono uguali qualunque sia la scala di riferimento (eccetto che per l'eventuale fattore di traslazione pn ). I grafici del gruppo di figure 3.2 ne sono un esempio. La funzione caratteristica della famiglia delle distribuzione di Lévy è così definita:
(3.2a)(3.2b)
Questa funzione è caratterizzata da quattro parametri: α, β, γ, δ (x è la variabile osservata e i la quantità immaginaria per la quale vale che i2 = -1). In particolare:
1. α ε (0, 2]. È l'esponente caratteristico che misura lo spessore delle code e influenza quindi la natura della distribuzione. Quando α ε (1, 2] esiste solo il momento primo.
2. β ε [-1, 1]. Misura lo skewness ovverosia la misura della asimmetria della distribuzione. Quando β = 0 la distribuzione è simmetrica. Per β> 0 (e 1 < α < 2) la forma della distribuzione presenta una coda più lunga e spessa a destra. Viceversa per β < 0.
3. γ ε (0, + ∞). È il fattore di scala; l'equivalente della deviazione standard per la Normale. Si noti però che non hanno lo stesso significato.
4. δ ε (-∞, +∞). È il parametro di locazione: il punto attorno al quale si ammassa la maggior parte delle osservazioni. Quando 1 < α> 2 il parametro δ equivale alla media della distribuzione e quando β = 0, δ rappresenta anche la mediana.
La 3.2 è una generalizzazione di un'intera famiglia di distribuzioni stabili. La distribuzione Normale e quella di Cauchy sono due casi particolari che rappresentano gli estremi opposti di questo gruppo di distribuzioni. Ponendo α = 2, β = 0, γ = σ2/2 e δ = µ ciò che si ottiene è la funzione caratteristica C(x) di una distribuzione Normale con media µ e varianza σ2; si riporta anche la funzione di densità di probabilità P(x) necessarie per tracciare le curve dei grafici di figura 3.3
(3.3a) (3.3b)
Ponendo α = 1, β = 0, γ = b e δ = a ciò che si ottiene è la funzione caratteristica della distribuzione di Cauchy con a il parametro di locazione e b il parametro di scala:
(3.4a) (3.4b)
Il grafico di sinistra in figura 3.3 mette a confronto le due distribuzioni. Si può notare che la distribuzione di Cauchy presenta delle code più ampie di quella di una normale. Modificando il parametro di scala a da 1 a ½ quello che si ottiene è il grafico di destra. La somiglianza con i grafici 3.1 è immediata anche se la similitudine si ferma solo a questo. Nella distribuzione Normale la media, la mediana, e la moda coincidono e sono pari a µ, mentre la distribuzione di Cauchy non ha né la media né la varianza (che è infinita), ma solo la moda e la mediana coincidenti con il parametro a.
Ha significato parlare di varianza solo nel conteso della distribuzione Normale: il suo valore medio è il punto massimo della curva; una volta determinata tale media la sua forma dipende solo dalla varianza (o dallo scarto quadratico medio che equivale alla radice quadrata della varianza). Può accadere che si confonda la varianza con la variabilità. Con riferimento alla distribuzione di Cauchy è più appropriato parlare di variabilità poiché il parametro b della 3.4 non rappresenta la varianza, ma un dato che consente di sapere di quanto ci si deve allontanare dal fattore di locazione a affinché l'area al di sotto della curva corrisponda ad una data probabilità.
Figura 3.3 - (sinistra) La curva di spessore più sottile rappresenta la distribuzione di probabilità di Cauchy (a=0; b=1). Come si nota presenta delle code più spesse di quella di una Normale (µ=0, σ2=1) ed è più bassa al centro. A sinistra l'istogramma è quello di una Cauchy (a=0, b=½).
Invarianza in somma delle distribuzioni L-stabili
Per definizione una distribuzione L-stabile è qualunque distribuzione che sia invariante in somma. La distribuzione della somma di variabili L-stabili indipendenti, identicamente distribuite (IID), cioè con uguali valori di α, β, γ, δ, è essa stessa una distribuzione L-stabile (Mandelbrot, 1983). Sia n il numero delle variabili L-stabili e si consideri il logaritmo naturale delle funzioni caratteristiche 3.2 moltiplicato per n:
(3.5a)(3.5b)
Le relazioni 3.5 sono uguali alle 3.2 eccetto che per il parametro di locazione δ e di scala γ moltiplicati per n. Ovverosia la distribuzione della somma di n copie della distribuzione di partenza, è la stessa eccetto che per il punto di locazione e il fattore di scala. Mentre l'esponente caratteristico α e di asimmetria β non cambiano.
Il risultato non cambia se le n variabili L-stabili sommate hanno parametri di locazione δ e di scala γ, diversi. La somma di n variabili L-stabili, con stesso esponente caratteristico α e di asimmetria β, ma differenti parametri di locazione e di scala, è ancora una distribuzione L-stabile. Il logaritmo naturale della funzione caratteristica della somma di n variabili ciascuna con parametro di locazione δj e di scala γj (j = 1...n) è così definito:
(3.6a)(3.6b)
In questo modo la funzione caratteristica è spiegata ancora dai parametri α e β, e dal parametro di locazione e di scala composti, rispettivamente, dalla somma dei parametri di locazione e di scala delle singole variabili sommate.
La proprietà di invarianza in somma è alla base dell'interesse verso questo tipo di distribuzioni perché potrebbero rendersi adatte a descrivere la distribuzione reale delle variazioni dei prezzi. Qualunque sia l'intervallo considerato (t, t+n) le variazioni dei prezzi tra un intervallo e l'altro possono essere viste come la somma delle variazioni degli stessi prezzi tra un sottointervallo ( t, t+m con m<n) e l'altro.
Se le variazioni dei prezzi tra una transazione e l'altra sono delle variabili L-stabili distribuite IID con esponente caratteristico α, allora le variazioni giornaliere, settimanali e mensili avranno la stessa distribuzione eccetto che per il punto centrale di accumulo e il fattore di scala. Per esempio se le distribuzioni delle variazioni percentuali a un giorno sono distribuite normalmente con media µ, varianza σ2 ed esponente caratteristico α, allora le distribuzioni delle variazioni percentuali a cinque giorni saranno ancora normalmente distribuite, ma con media 5µ, varianza 5σ2 ed esponente caratteristico α (ipotesi di varianza).
Come accennato all'inizio del precedente paragrafo, le informazioni giungendo agli operatori in modo incostante potrebbero influire sulle variazioni dei prezzi in modo diverso tra una transazione e l'altra riflettendo il modo con cui le informazioni sono acquisite. Un ipotesi è che il flusso delle singole informazioni sia distribuito L-stabilmente con valori costanti di α e β, ma differenti valori per i parametri di locazione e di scala γ e δ. Se tali informazioni si combinano assieme, data la proprietà di invarianza delle distribuzioni L-stabili, le variazioni dei prezzi tra una transazione e l'altra per diversi intervalli (giornalieri, settimanali o mensili) seguiranno la stessa distribuzione con i medesimi α e β (Mandelbrot, 1983).
La dimensione frattale di una distribuzione L-stabile e simmetrica
Si consideri l'espressione 3.1. È dimostrato che il parametro di scala Cn ha la seguente forma (Feller W., 1971):
(3.7)
Da ciò deriva che la somma di n copie indipendenti di una variabile stabile X con osservazioni distribuzione in modo simmetrico ed esponente caratteristico α, ha la stessa distribuzione di X, ma con un fattore di scala che è pari a n 1/α.
Per la distribuzione Normale α = 2. Quindi la somma di n indipendenti copie di una variabile normalmente distribuita X, ha un fattore di scala pari a n1/2 . Per la distribuzione di Cauchy α = 1. Quindi la somma di n indipendenti copie di una variabile X con distribuzione di Cauchy, ha un fattore di scala pari a n. Sia Y la variabile ottenuta dividendo X per il fattore a n 1/α La somma di n copie indipendenti di Y sarà pari a:
(3.8)
Dividendo il logaritmo del numero delle copie della variabile di partenza X, per il logaritmo del fattore di scala cn = n 1/α si ottiene la dimensione frattale di una distribuzione simmetrica L-stabile. Ricordando l'equazione 2.6 si ha che:
(3.9)
Per una distribuzione Normale, quindi, la dimensione frattale è pari a due come quella di un piano; per la distribuzione di Cauchy è pari a uno come quella di una retta. Fra questi due estremi possono quindi esistere un'infinità di distribuzione ciascuna caratterizzata dal proprio esponente caratteristico α.
Una verifica empirica
Per verificare l'ipotesi di invarianza fatta al paragrafo 3.4.2 si sono prese in considerazione le variazioni percentuali a uno, cinque, dieci, venti, trenta, novanta e centottanta giorni dell'indice S&P 500 dal 4 gennaio 1928 al 25 aprile 2001, le stesse usate per tracciare i grafici delle figure 3.2.
In tabella 3.2 in ciascuna colonna è riportata la media effettiva (indicata in grassetto su sfondo grigio) delle variazioni percentuali nei sette orizzonti considerati (moltiplicate per 10.000 per una più facile lettura). I dati di ogni riga della tabella, sopra e sotto la diagonale della stessa (ovvero tutti quelli non in grassetto), sono stati ottenuti moltiplicando la media effettivamente misurata sul campione (quella indicata in grassetto), per il coefficiente indicato tra parentesi. Questo è ottenuto rapportando i diversi orizzonti temporali. Per esempio il coefficiente 2 della cella (2; 10 gg.) è ottenuto rapportando 10 a 5 oppure il fattore 1/6 della cella (5; 5 gg.) è ottenuto dal rapporto 5 su 30. Nello stesso modo sono stati calcolati gli altri coefficienti.
La stessa procedura è stata applicata anche alla varianza con i risultati evidenziati in tabella 3.3. Per la proprietà di invarianza, modificare l'orizzonte di riferimento, per il quale è determinabile una media (ovvero un parametro di locazione) e una varianza (ovvero un fattore di scala), equivale a moltiplicare la media e la varianza per il coefficiente tra parentesi. Se si considera un orizzonte temporale, preso come riferimento per la stima della media e della varianza degli altri orizzonti, il risultato deve essere equivalente a quello della media e varianza effettivi per questi ultimi. Analizzando le tabelle 3.2 e 3.3 si può notare che effettivamente la media e la varianza effettive e quelle stimate come spiegato sopra, tendono a coincidere.
La verifica della costanza dell'esponente caratteristico α può essere fatta indirettamente. Dato che α incide sulla forma della distribuzione, se questa rimane costante se ne può dedurre che α non è mutato. La tabella 3.4 è stata ottenuta dividendo la numerosità delle osservazioni nelle code della distribuzione per il numero totale di osservazioni del campione. Ciò che rileva è che la probabilità che un valore cada nelle code della distribuzione è fondamentalmente la stessa in tutti gli orizzonti considerati (con l'eccezione dei 180 giorni) e quindi si può dedurne che α non si è modificato significativamente. Questo implica che un investitore con orizzonti temporali brevi (uno, cinque giorni) corre lo stesso rischio di un altro che opera su orizzonti più lunghi tra quelli considerati. Questo tipo di distribuzione si ipotizza sia il risultato di un processo a memoria lunga generato da un processo stocastico non lineare che agisce nell'evoluzione della serie storica (Peters, 1994).
Giancarlo Fabbro
Successivo: L'Ipotesi dei Mercati Frattali (Fractal Market Hypothesis)
Sommario: Indice