Data Mining e Scoperta di Conoscenza


 

Informazioni generali sui progetti

1.      Il gruppo deve preparare un rapporto di circa 10 pagine in cui

a.       Viene descritto analiticamente l’algoritmo che hai implementato.

b.      Le parti essenziali del codice Java che utilizzato sono commentate, e l’intero codice è messo in appendice

c.       Gli esperimenti effettuati sono commentati quantitativamente e qualitativamente e illustrati graficamente.

2.      Ogni componente del gruppo deve preparare delle slides Powerpoint (non più di 10 slides) in cui riassume gli esiti del progetto e il suo contributo allo studio effettuato.

La valutazione verrà effettuata secondo due criteri:

 

PROPOSTE DI PROGETTI:

Numero

Argomenti

Persone Materiale di riferimento
1 Implementazione algoritmo di Clustering LIMBO Marco Lavecchia, Giuseppe Sergi Periklis Andritsos, Panayiotis Tsaparas, Renée J. Miller, Kenneth C. Sevcik: LIMBO: Scalable Clustering of Categorical Data.
2 Implementazione algoritmo di Clustering CURE Francesco Lizzano, Marco Lucanto S. Guha, R. Rastogi, and K. Shim. Cure: An efficient clustering algorithm for large databases
3 Implementazione algoritmo di Clustering BIRCH   T. Zhang, R. Ramakrishnan, and M. Livny. BIRCH : an efficient data clustering method for very large databases.
4 Implementazione schema di classificazione RAINFOREST Matranga Angelo J. Gehrke, R. Ramakrishnan, V. Ganti, "RainForest: A Framework for Large Decision Tree Construction of Large DataSets"
5 Valutazione rischio di "Mancato pagamento"    
6 Analisi comportamento clienti postali    
7 Realizzazione Spam Filter Ritacco Ettore, Magurno Giuseppe T. Fawcett, "In vivo Spam Filtering".
8 Realizzazione di un "Intrusion Detector" Congiurato Antonio, Frangella Emilio Lee and Stolfo Tutorial on Data Mining for Network Intrusion Detection
9 Implementazione algoritmo FP-Growth Grasso Giovanni J. Han, J. Pei, and Y. Yin. Mining Frequent Patterns without Candidate Generation.
10 Implementazione algoritmo ROCK Fionda Valeria S. Guha, R. Rastogi, and K. Shim: "ROCK: A robust clustering algorithm for categorical Data".
11 Rete neurale per il riconoscimento facciale    
12 Expectation Maximization per il clustering di sequenze   Cadez, Gaffney, Smyth, A general probabilistic framework for clustering individuals
13 Implementazione di un task per la segmentazione delle immagini    
14 Data mining per l'analisi dei dati di clickstream Picardi Raffaele, Giorgio Tesoniero, Andrea Tundis KDD Cup 2000
15 Data mining per intelligent web caching Marinaro Domenico Web log mining for predictive web caching
16 Outlier Detection in Weka Scordio Howard Feature Bagging for Outlier Detection
17 Implementazione di un algoritmo di Co-Clustering    
18 Implementazione algoritmo Transactional K-Means Sergio Giampietro  
19 Implementazione algoritmo SLIPPER Liveri Nicola William W. Cohen and Yoram Singer (1999): Simple, Fast, and Effective Rule Learner
20 Realizzazione di un sistema predittivo dei risultati del campionato Mondiale Germania 2006 Aiello Francesco, Leo Vittorio  
21 Implementazione algoritmo QUEST

Morrone Salvatore , Violante Girolamo

Loh, W.-Y. and Shih, Y.-S. (1997), Split selection methods for classification trees, Statistica Sinica, vol. 7, 815-840