Docente/i:
Paolo Giudici
Denominazione del corso: Data mining
Codice del corso: 340031
Corso di laurea: Management e tecnologie dell'e-business
Settore scientifico disciplinare: SECS-S/02
Crediti formativi: CFU 5
Sito web del corso: http://www.datamininglab.it
Obiettivi formativi specifici
l corso costituisce un’introduzione alle principali metodologie impiegate nella moderna metodologia di analisi dei dati nota come Data Mining. La metodologia verrà corredata dallo svolgimento di esercitazioni pratiche mediante software di analisi statistica dei dati.
Il corso dapprima introdurrà il significato e l’ambito applicativo del data mining. Verranno quindi esaminati i principali concetti statistici e computazionali necessari per risolvere problemi di data mining: dall’organizzazione delle basi di dati, all’analisi esplorativa, alla specificazione di modelli, computazionali e statistici, di tipo descrittivo e previsivo, ai modelli locali. Particolare enfasi verrà dedicata al tema del confronto fra metodi alternativi, mediante opportune metodologie di validazione.
La metodologia presentata verrà illustrata facendo riferimento ad applicazioni reali in ambito aziendale, ed all’impiego dei principali software di data mining. Le lezioni verranno corredate da esercitazioni pratiche ed attività di laboratorio.
Programma del corso
Il programma del corso è disponibile alla pagina http://economia.unipv.it/datamininglab/Corsi/data_mining_interfacolta.htm
Prerequisiti
Prerequisito è avere sostenuto almeno un corso di analisi statistica dei dati e/o di basi di dati. E' consigliato il corso di statistica per le applicazioni aziendali. In assenza di tale esame lo studente può seguire una parte di tale corso (impartito nel I trimestre), previo accordo con il docente.
Tipologia delle attività formative
Lezioni (ore/anno in aula): 12
Esercitazioni (ore/anno in aula): 10
Laboratori (ore/anno in aula): 0
Progetti (ore/anno in aula): 0
Materiale didattico consigliato
GIUDICI, P., 2005. Data Mining: metodi informatici, statistici e applicazioni. Mc Graw Hill, Milano.
Materiale distribuito in aula.
Modalità di verifica dell'apprendimento
Analisi completa del database a disposizione, con elaborazione di presentazione finale (40%)
Discussione orale sull’elaborato (40%)
|