|
Docente/i:
Riccardo Bellazzi
Denominazione del corso: Apprendimento automatico in medicina
Codice del corso: 502956
Corso di laurea: Computer Engeneering
Sede: Pavia
Settore scientifico disciplinare: ING-INF/06
Crediti formativi: CFU 6
Sito web del corso: http://elearning2.unipv.it/ingegneria/
Obiettivi formativi specifici
Il corso si propone di fornire allo studente competenze metodologiche e tecniche per impiegare in ambito biomedico una vasta classe di algoritmi che sono in grado di apprendere regole decisionali da dati e di migliorare automaticamente le loro prestazioni sulla base dell’esperienza. Lo studente, alla fine del corso, deve essere in grado di impiegare un percorso metodologicamente adeguato per apprendere modelli decisionali dai dati e utilizzare strumenti software e pacchetti statistici di apprendimento automatico Il corso conterrà sia lezioni teoriche che esercitazioni pratiche al calcolatore
Programma del corso
Apprendimento di regole decisionali - Apprendimento supervisionato
- Introduzione al corso: Apprendimento automatico e Data mining nelle scienze biomediche.
- Ambiti di applicazione dei metodi automatici per la classificazione: diagnosi, prognosi, ricerca
- I concetti di base: esempi, istanze, attributi e rappresentazione delle regole decisionali
- Alberi decisionali: apprendimento, tecniche di pruning
- Metodi bayesiani: Naive Bayes, analisi discriminante
- Modelli di regressione: modello lineare, regressione logistica, reti neurali, support-vector machines
- Metodo k-nearest e misure di distanza
- Apprendimento di regole: metodi di covering, metodi beam-search
- Tecniche di feature selection. Information gain e Relief
- Valutazione degli algoritmi di apprendimento e problemi di valutazione in ambito biomedico
- Training e Testing. Accuratezza, calibrazione, specificità e sensitività, precisione e recall, misura F
- Metodi per la valutazione delle prestazioni. Cross validazione, Bootstrap e Curve ROC.
Apprendimento non supervisionato
- Regole di associazione
- Metodi di clustering: K-means, K-medoids, clustering gerarchico, Self-organizing maps
- Valutazione dei risultati dei metodi di clustering
Esercitazioni e applicazioni
- Applicazioni del data mining in bio-medicina: diagnosi, prognosi, classificazione, genomica funzionale
- La metodologia CRISP per il data mining in bio-medicina.
- Uso dei software Orange, Weka e Matlab per la soluzione di problemi di classificazione.
- Soluzione di problemi su data set forniti durante il corso.
Prerequisiti
Vengono richieste conoscenze di base sulla teoria delle probabilità e di statistica. Per la parte pratica, viene richiesta una certa dimestichezza con l’uso degli strumenti informatici.
Tipologia delle attività formative
Lezioni (ore/anno in aula): 45
Esercitazioni (ore/anno in aula): 0
Attività pratiche (ore/anno in aula): 0
Materiale didattico consigliato
T. Mitchell. Machine Learning. Mc Graw Hill.
P. Tan, M. Steinbach, V. Kumar. Introduction to data mining. Addison Wesley.
I. Witten, E. Frank. Data mining. Morgan Kaufmann.
R. Bellazzi. Slides.
Modalità di verifica dell'apprendimento
L'esame comprende una prova scritta e la consegna di una relazione.
|