"In una sequenza casuale di numeri la probabilità che uno di essi inizi per 1 o per 9 è praticamente la stessa". Fino alla fine del diciannovesimo secolo questa affermazione aveva un senso e non aveva mai trovato alcuna confutazione. L’astronomo Newcomb fece un'osservazione casuale, che il progresso tecnologico non avrebbe più permesso. Quando i computer non esistevano ancora, i calcoli si facevano a mano. Per semplificare la vita di chi aveva a che fare tutti i giorni con centinaia di calcoli, erano utilizzati i logaritmi, che permettono di trasformare le moltiplicazioni in addizioni, al prezzo di consultare le "tavole dei logaritmi", che danno la conversione tra un numero ed il suo logaritmo. Newcomb, che come tutti gli astronomi aveva bisogno di sviluppare moltissimi calcoli, si accorse che i bordi delle prime pagine di un manuale contenente delle tabelle logaritmiche erano più sporchi (e quindi più utilizzati) di quelli delle ultime pagine. Sembrava che gli capitasse più spesso di cercare il logaritmo di un numero che iniziava con una cifra "piccola". Newcomb, dopo aver annotato ciò, non se ne occupò più.
Una cinquantina di anni dopo, il fisico Frank Benford, che all'epoca lavorava all'interno dei Research Laboratories della General Electric, decise di migliorare l’affermazione dell’astronomo con alcune evidenze empiriche. Egli raccolse all'incirca ventimila dati relativi a ventuno elementi tra di loro assai diversi, misurando la frequenza delle cifre da 1 a 9 compresi, non tenendo in considerazione lo 0. Quello che riuscì ad ottenere fu che le frequenze delle nove cifre prese in considerazione non erano equamente ripartite. Infatti, ad esempio, notò che mentre la probabilità che la prima cifra fosse pari a 1 era mediamente del 30,6%, quella che la prima cifra fosse pari a 9 era mediamente pari al 4,7%. Benford non riuscì a spiegare questo fenomeno, ma formulò una legge, che da quel momento prese il suo nome (anche definita la “legge della prima cifra”). Essa può essere così espressa: “in un qualunque insieme di numeri, indipendentemente dal campione scelto, vi sono delle apposite percentuali di probabilità di trovare numeri la cui prima cifra inizia per 1 o numero successivo”. Volendo esprimere la legge in formula statistica:
dove n= 1, …, 9
Nella pagina precedente sono indicati altri due modalità utilizzate per rappresentare la probabilità che un numero inizi con una determinata cifra50. Dalle ipotesi avanzate, secondo il campione di dati preso in considerazione, la percentuale di numeri la cui prima cifra inizia per 1 dovrà aggirarsi intorno al 30%, così come i numeri che iniziano per 2 attorno al 17% e via via sino ad arrivare al numero 9.
Una spiegazione dei risultati ottenuti da Benford fu data da Pinkham nel 1961 da un punto di vista puramente logico: il matematico provò ad applicare la legge di Benford ad alcuni elementi naturali, tra cui la lunghezza dei fiumi americani. Sulla base dei risultati ottenuti egli affermò che, se esiste una legge che disciplina la prima cifra dei numeri relativi, ad esempio, ad alcuni fenomeni naturali, questa deve valere indipendentemente dalle unità di misura adottate, deve essere cioè invariante di scala. Lo studioso osservò infatti che se, ad esempio, si misura la lunghezza dei fiumi americani in chilometri o in miglia cambiavano i singoli numeri, ma le frequenze relative della prima cifra significativa erano le stesse. Pinkham ha quindi dimostrato l'invarianza di scala della legge di Benford e, in particolare, che essa è l'unica legge sulla distribuzione delle prime cifre che gode di questa proprietà.
Trent'anni dopo che Pinkham aveva interprato i risultati ottenuti da Benford, nel 1995 si diede la prima spiegazione rigorosa della legge di Benford. Elaborando la condizione sufficiente affinché dei dati casuali seguissero detta legge, se si scelgono in modo casuale delle distribuzioni, che godono della proprietà di essere "scale or base invariant", e dei campioni casuali sono presi da ciascuna di queste distribuzioni, le frequenze relative della prima cifra significativa dei numeri che si ottengono unendo i campioni casuali seguiranno la legge di Benford. Nel 2009, il fisico Fewster ha osservato che molte ricerche condotte fino ad allora sulla legge di Benford evidenziavano che, anche se spesso la legge era rispettata, le spiegazioni a supporto di ciò non erano soddisfacenti. L'autore, anche tramite procedure grafiche, ha fornito una delucidazione semplice ed intuitiva delle diverse circostanze in cui la legge può essere applicata. Per verificare se dei dati casuali estratti da una qualsiasi distribuzione sono conformi alla legge di Benford (condizione che l'autore indica con "benfordness") bisogna controllare il supporto della distribuzione di log10: se tale supporto è sufficientemente ampio, allora ci si dovrebbe attendere "benfordness".
[50] Fonte: Wikipedia
Successivo: 8.3.2 Utilizzo della legge di Benford in ambito economico
Sommario: Indice