|
Docente/i:
Riccardo Bellazzi
Silvana Quaglini
Denominazione del corso: Data mining e supporto alle decisioni in medicina
Codice del corso: 503001
Corso di laurea: Bioingegneria
Settore scientifico disciplinare: ING-INF/06
Crediti formativi: CFU 12
Sito web del corso: aim.labmedinfo.org
Obiettivi formativi specifici
Il corso si propone di fornire allo studente competenze metodologiche e tecniche per:
- impiegare in ambito biomedico una vasta classe di algoritmi che sono in grado di apprendere regole decisionali da dati e di migliorare automaticamente le loro prestazioni sulla base dell’esperienza.
- modellizzare problemi medici complessi, in cui si richiede di prendere decisioni in presenza di incertezza e/o tenendo conto delle preferenze del paziente. Si tratteranno problemi diagnostici, terapeutici e di monitoraggio.
Lo studente, alla fine del corso, deve essere in grado di:
- impiegare un percorso metodologicamente adeguato per apprendere modelli decisionali dai dati
- utilizzare strumenti software e pacchetti statistici di apprendimento automatico
- formalizzare un problema decisionale, individuando le variabili del dominio e scegliendo i formalismi più adatti, sia ai fini dell’acquisizione della conoscenza (interazione con la controparte medica per la costruzione del modello e interazione con il paziente per l’elicitazione delle preferenze), sia ai fini della risoluzione del problema. Fra le classi di problemi decisionali, particolare enfasi sarà data alle valutazioni economiche preliminari alla decisione sull’avviamento o meno di un programma sanitario.
Il corso conterrà sia lezioni teoriche che esercitazioni pratiche al calcolatore
Programma del corso
Apprendimento di regole decisionali
- Introduzione al corso: Apprendimento automatico e Data mining nelle scienze biomediche.
- Ambiti di applicazione dei metodi automatici per la classificazione: diagnosi, prognosi, ricerca
- I concetti di base: esempi, istanze, attributi e rappresentazione delle regole decisionali
Apprendimento supervisionato
- Alberi decisionali: apprendimento, tecniche di pruning
- Metodi bayesiani: Naive Bayes, analisi discriminante
- Modelli di regressione: modello lineare, regressione logistica, reti neurali, support-vector machines
- Metodo k-nearest e misure di distanza
- Apprendimento di regole: metodi di covering, metodi beam-search
- Tecniche di feature selection. Information gain e Relief
Valutazione degli algoritmi di apprendimento e problemi di valutazione in ambito biomedico
- Training e Testing. Accuratezza, calibrazione, specificità e sensitività, precisione e recall, misura F
- Metodi per la valutazione delle prestazioni. Cross validazione, Bootstrap e Curve ROC.
Apprendimento non supervisionato
- Regole di associazione
- Metodi di clustering: K-means, K-medoids, clustering gerarchico, Self-organizing maps
- Valutazione dei risultati dei metodi di clustering
Metodologie per il data mining in bio-medicina
- Applicazioni del data mining in bio-medicina: diagnosi, prognosi, classificazione, genomica funzionale
- La metodologia CRISP per il data mining in bio-medicina.
Esercitazioni e laboratori
- Uso dei software Orange, Weka e Matlab per la soluzione di problemi di classificazione.
- Soluzione di problemi su data set forniti durante il corso.
Introduzione all'analisi decisionale
L’incertezza e le preferenze come problemi fondamentali delle decisioni in medicina e breve ripasso dei concetti di base della teoria delle probabilità
La teoria delle decisioni
- Quantificazione del valore di un esito (stato di salute, vita attesa)
- metodi per la quantificazione delle utilità (rating scale, standard gamble, time-trade-off
- utilità attesa di una decisione
- i QALY (Quality-adjusted life-years)
- dominanza probabilistica di una strategia rispetto alle altre possibili
Alberi decisionali
- metodologie per la costruzione e la risoluzione;
- uso di un software per la gestione di alberi decisionali;
- rappresentazione di processi di Markov all’interno di un albero decisionale;
- analisi di sensitività e della soglia, univariata e multivariata;
Diagrammi di influenza
- Analogia con le reti probabilistiche
- Metodologie per la costruzione e la risoluzione;
- uso di un software per la realizzazione di diagrammi di influenza
Valutazioni economiche dei programmi sanitari
- Analisi costo-efficacia, costo-beneficio, costo-utilità;
- i punti di vista della societa', del SSN,del terzo pagante
- lettura critica di un articolo di letteratura sull’argomento
Prerequisiti
Vengono richieste conoscenze di base sulla teoria delle probabilità e di statistica. Per la parte pratica, viene richiesta una certa dimestichezza con l’uso degli strumenti informatici.
Tipologia delle attività formative
Lezioni (ore/anno in aula): 65
Esercitazioni (ore/anno in aula): 30
Attività pratiche (ore/anno in aula): 22
Materiale didattico consigliato
T. Mitchell. Machine Learning. Mc Graw Hill..
P. Tan, M. Steinbach, V. Kumar. Introduction to data mining. Addison Wesley..
I. Witten, E. Frank. Data mining. Morgan Kaufmann.
Riccardo Bellazzi. Slides delle lezioni.
M.C. Weinstein, H.V. Fineberg. Analisi decisionale. L. Franco Angeli Editore.
David M. Eddy. Clinical Decision Making. Jones and Bartlett Publishers.
Silvana Quaglini. Slides delle lezioni.
Modalità di verifica dell'apprendimento
L'esame comprende una prova scritta, una prova orale, una prova pratica e la consegna di una relazione.
|