Risultati in Weka
Completata la costruzione del dataset secondo la procedura sopra descritta è stato usato Weka per l’analisi dei dati.
Weka mette a disposizione dell’utente vari algoritmi per l’apprendimento da esempi, tra questi, dopo innumerevoli prove, sono stati scelti:
Nonostante il dataset non sia di dimensioni adeguate e alcuni attributi dipendono da altri si è voluto comunque utilizzare un classficatore bayesiano e osservarne i risultati.
Il miglior classificatore
=== Stratified cross-validation ===
=== Summary ===
Correctly Classified Instances 93 56.0241 %
Incorrectly Classified Instances 73 43.9759 %
Kappa statistic 0.4711
Mean absolute error 0.2075
Root mean squared error 0.3237
Relative absolute error 74.7189 %
Root relative squared error 86.8423 %
Total Number of Instances 166
=== Detailed Accuracy By Class ===
TP Rate FP Rate Precision Recall F-Measure ROC Area Class
0.926 0.058 0.758 0.926 0.833 0.972 da1a3
0.519 0.065 0.609 0.519 0.56 0.873 da4a6
0.37 0.072 0.5 0.37 0.426 0.67 da7a9
0.481 0.101 0.481 0.481 0.481 0.752 da10a12
0.333 0.094 0.409 0.333 0.367 0.662 da13a15
0.71 0.141 0.537 0.71 0.611 0.848 da16a20
=== Confusion Matrix ===
a b c d e f <-- classified as
25 1 1 0 0 0 | a = da1a3
4 14 2 2 3 2 | b = da4a6
3 2 10 6 2 4 | c = da7a9
0 2 2 13 5 5 | d = da10a12
1 1 4 4 9 8 | e = da13a15
0 3 1 2 3 22 | f = da16a20
La percentuale di istanze classificate correttamente è la più alta che si è riusciti ad ottenere in fase di validazione.
Questi risultati dimostrano un comportamento buono del classificatore sulle prime ed ultime posizioni e peggiore in quelle di metà classifica.