|
Docente/i:
Riccardo Bellazzi
Denominazione del corso: Apprendimento automatico in biomedicina
Codice del corso: 064014
Corso di laurea: Ingegneria Informatica
Settore scientifico disciplinare: ING-INF/06
L'insegnamento è affine per:
Crediti formativi: CFU 5
Sito web del corso: n.d.
Obiettivi formativi specifici
Il corso si propone di fornire allo studente competenze metodologiche e tecniche per impiegare in ambito biomedico una vasta classe di algoritmi che sono in grado di apprendere regole decisionali da dati e di migliorare automaticamente le loro prestazioni sulla base dell’esperienza. Ogni argomento trattato durante le lezioni sarà oggetto di esercitazioni e laboratori.
Programma del corso
Lezioni teoriche - concetti di base
- Introduzione al corso: Apprendimento automatico e Data mining nelle scienze biomediche.
- Ambiti di applicazione dei metodi automatici per la classificazione: diagnosi, prognosi, ricerca
- I concetti di base: esempi, istanze, attributi e rappresentazione delle regole decisionali
Lezioni teoriche - apprendimento supervisionato
- Alberi decisionali: apprendimento, tecniche di pruning
- Naive Bayes e metodi bayesiani
- Modelli di regressione: modello lineare, regressione logistica, reti neurali, support-vector machines
- Metodo k-nearest e misure di distanza
- Apprendimento di regole: metodi di covering, metodi beam-search
- Tecniche di feature selection. Information gain e Relief
Valutazione degli algoritmi di apprendimento e problemi di valutazione in ambito biomedico
- Training e Testing. Accuratezza, calibrazione, specificità e sensitività, precisione e recall, misura F
- Metodi per la valutazione delle prestazioni. Cross validazione e Curve ROC.
Apprendimento non supervisionato
- Regole di associazione
- Metodi di clustering: K-means, K-medoids, clustering gerarchico, Self-organizing maps
- Valutazione dei risultati dei metodi di clustering
Metodologie per il data mining in bio-medicina
- Problemi biomedici: diagnosi, prognosi, classificazione, genomica funzionale
- La metodologia CRISP per il data mining in bio-medicina.
Esercitazioni e laboratori
- Uso dei software Orange, Weka e Matlab per la soluzione di problemi di classificazione.
- Soluzione di problemi su data set forniti durante il corso.
Prerequisiti
Nessun prerequisito
Tipologia delle attività formative
Lezioni (ore/anno in aula): 27
Esercitazioni (ore/anno in aula): 13
Attività pratiche (ore/anno in aula): 12
Materiale didattico consigliato
T. Mitchell. Machine Learning. Mc Graw Hill.
P. Tan, M. Steinbach, V. Kumar. Introduction to Data Mining. Addison Wesley.
Riccardo Bellazzi. Slides delle lezioni. disponibili presso aim.labmedinfo.org.
I. Witten, E. Frank. Data Mining. Morgan Kaufmann.
Modalità di verifica dell'apprendimento
Prove in itinere scrittte e relazione orale su un problema di apprendimento automatico. Negli appelli regolari l'esame è orale e prevede domande sui temi trattati nel corso ed una relazione su un problema di apprendimento.
|