Si può effettuare un test sulla distribuzione dei dati contenuti nel training set al fine di verificare se esistono concentrazioni di dati non uniformemente distribuite sul range di ciascun input. Una disuniforme distribuzione dei dati potrebbe compromettere la capacità di generalizzazione della rete, anche dopo un risultato soddisfacente in fase di addestramento.
Scegliendo la opzione "data distribution test" contenuta in "data preprocessing", si ottiene una relazione di distribuzione per ogni coppia di input dove il range di ogni input viene diviso in cinque regioni come mostrato in fig.5. Una corretta distribuzione si ha quando la quantità di dati è equamente distribuita in ogni casella per ogni coppia di input. Tramite questo test è possibile anche scoprire una possibile relazione tra due inputs: ciò rappresenterebbe un appesantimento inutile per il training della rete ed è conveniente eliminare una delle variabili correlate.
Luca Marchese
Successivo: Interfacce Fuzzy
Sommario: Indice