Docente/i:
Paolo Giudici
Denominazione del corso: Data mining
Codice del corso: 340031
Corso di laurea: Management e tecnologie dell'e-business
Settore scientifico disciplinare: SECS-S/02
Crediti formativi: CFU 5
Sito web del corso: http://www.unipv.it/dipstea
Obiettivi formativi specifici
l corso costituisce un’introduzione alle principali metodologie impiegate nella moderna metodologia di analisi dei dati nota come Data Mining. La metodologia verrà corredata dallo svolgimento di esercitazioni pratiche mediante software di analisi statistica dei dati.
Il corso dapprima introdurrà il significato e l’ambito applicativo del data mining. Verranno quindi esaminati i principali concetti statistici e computazionali necessari per risolvere problemi di data mining: dall’organizzazione delle basi di dati, all’analisi esplorativa, alla specificazione di modelli, computazionali e statistici, di tipo descrittivo e previsivo, ai modelli locali. Particolare enfasi verrà dedicata al tema del confronto fra metodi alternativi, mediante opportune metodologie di validazione.
La metodologia presentata verrà illustrata facendo riferimento ad applicazioni reali in ambito aziendale ed istituzionale, con particolare riferimento al tema della misurazione e gestione dei rischi, finanziari, operativi e sanitari. Le lezioni verranno corredate da esercitazioni pratiche, attività di laboratorio e testimonianze di esperti qualificati.
Programma del corso
Nell’anno accademico 2007-2008 il corso di data mining si focalizzerà, oltre che sugli aspetti di base inerenti l'attività di analisi statistica dei dati (data mining), sugli aspetti metodologici inerenti la misurazione e la gestione del rischio in organizzazioni complesse. La crescente complessità della nostra società, dovuta in particolare alla forte crescita dell’informatizzazione e dell’internazionalizzazione, ha determinato una crescente attenzione non solo ai risultati attesi, ma anche ai rischi connessi a qualunque tipo di attività socio-economica, con particolare riferimento a contesti di grande impatto sulla popolazione, come il credito, la finanza e la sanità. Acquisisce pertanto maggiore rilevanza la conoscenza degli strumenti metodologici ed informatici necessari per addivenire alla misurazione di tali rischi, alla simulazione di scenari ed alla gestione strategica degli stessi.
Il corso si propone di investigare tali strumenti, nei contesti nei quali la necessità di misurazione è particolarmente importante, a causa di obblighi normativi oppure per motivi di sostenibilità economica delle relative attività. Nell’ultima parte del corso verrà affrontata la misurazione dei rischi nelle strutture ospedaliere, introducendo sia la problematica della gestione del rischio clinico che le tecnologie informatiche adatte alla simulazione di organizzazioni complesse.
Articolazione del corso
Il corso si articolerà in quattro moduli principali:
- Introduzione all’analisi statistica dei dati (data mining)
- Misurazione dei rischi finanziari e di impresa
- Gestione dei rischi finanziari e di impresa
- Misurazione e gestione dei rischi clinici e sanitari
Per ciascuno dei quattro argomenti sono previste lezioni, tenute da docenti e professionisti esperti ed esercitazioni con il software di analisi che verrà reso disponibile.
Prerequisiti
Prerequisito è avere sostenuto almeno un corso di analisi statistica dei dati e/o di basi di dati.
Tipologia delle attività formative
Lezioni (ore/anno in aula): 30
Esercitazioni (ore/anno in aula): 20
Laboratori (ore/anno in aula): 0
Progetti (ore/anno in aula): 0
Materiale didattico consigliato
GIUDICI, P., 2005. Data Mining: metodi informatici, statistici e applicazioni. Mc Graw Hill, Milano.
Paolo Giudici. Materiale distribuito in aula.
Modalità di verifica dell'apprendimento
Analisi completa del database a disposizione, con elaborazione di presentazione finale (50%)
Discussione orale sull’elaborato (50%)
|