Risultati in Weka

Completata la costruzione del dataset secondo la procedura sopra descritta è stato usato Weka per l’analisi dei dati.
Weka mette a disposizione dell’utente vari algoritmi per l’apprendimento da esempi, tra questi, dopo innumerevoli prove, sono stati scelti:

Nonostante il dataset non sia di dimensioni adeguate e alcuni attributi dipendono da altri si è voluto comunque utilizzare un classficatore bayesiano e osservarne i risultati.

Il miglior classificatore

=== Stratified cross-validation ===
=== Summary ===

Correctly Classified Instances          93               56.0241 %
Incorrectly Classified Instances        73               43.9759 %
Kappa statistic                          0.4711
Mean absolute error                      0.2075
Root mean squared error                  0.3237
Relative absolute error                 74.7189 %
Root relative squared error             86.8423 %
Total Number of Instances              166    

=== Detailed Accuracy By Class ===

TP Rate   FP Rate   Precision   Recall  F-Measure   ROC Area  Class
  0.926     0.058      0.758     0.926     0.833      0.972    da1a3
  0.519     0.065      0.609     0.519     0.56       0.873    da4a6
  0.37      0.072      0.5       0.37      0.426      0.67     da7a9
  0.481     0.101      0.481     0.481     0.481      0.752    da10a12
  0.333     0.094      0.409     0.333     0.367      0.662    da13a15
  0.71      0.141      0.537     0.71      0.611      0.848    da16a20

=== Confusion Matrix ===

  a  b  c  d  e  f   <-- classified as
 25  1  1  0  0  0 |  a = da1a3
  4 14  2  2  3  2 |  b = da4a6
  3  2 10  6  2  4 |  c = da7a9
  0  2  2 13  5  5 |  d = da10a12
  1  1  4  4  9  8 |  e = da13a15
  0  3  1  2  3 22 |  f = da16a20

La percentuale di istanze classificate correttamente è la più alta che si è riusciti ad ottenere in fase di validazione.

Questi risultati dimostrano un comportamento buono del classificatore sulle prime ed ultime posizioni e peggiore in quelle di metà classifica.