Fac. INGEGNERIA - Univ. Pavia - Italy - Elaborazione di dati biomedici

Home		Didattica > Insegnamenti1314 > Elaborazione di dati biomedici

Organizzazione e Sedi

Immatricolarsi ai C.d.L.

Immatricolarsi ai C.d.L.M.

Orientamento

Didattica

Introduzione

Appelli d’esame

Avvisi

Bandi Insegnamenti

Calendario attività

Insegnamenti 16-17

Insegnamenti 15-16

Insegnamenti 14-15

Insegnamenti 13-14 Sede di Pavia

Elenco

Scheda

Insegnamenti 13-14 Sede di Mantova

Insegnamenti 12-13 Sede di Pavia

Insegnamenti 12-13 Sede di Mantova

Insegnamenti 11-12 Sede di Pavia

Insegnamenti 11-12 Sede di Mantova

Insegnamenti 10-11

Insegnamenti 09-10

Insegnamenti 08-09

Insegnamenti 07-08

Insegnamenti 06-07

Orario lezioni 1° semestre

Orario lezioni 2° semestre

Piani di studio

Regolamenti didattici

Sedute di laurea

Erasmus

Erasmus Placement

Tutorato

Prenotazione Aule

Master

Esami: Iscrizioni online

Bandi e Offerte lavoro

Esami di Stato

Mobilità/Erasmus

Rapporti di riesame

Assicurazione Qualità

Guida dello Studente

Guida 2016-17
I contenuti della guida sono disponibili on-line.

Scorciatoie

Appelli esami

Appunti e dispense..

Avvisi

Biblioteca

Calendari

Docenti

Insegnamenti 16-17

Iscrizioni online

Lauree

Orario lezioni

Piani di studio

Regolamenti didattici

Tutorato

Cerca nel sito

Elaborazione di dati biomedici

Insegnamento Anno Accademico 13-14

Docente/i: Paolo Magni

Denominazione del corso: Elaborazione di dati biomedici
Codice del corso: 502497
Corso di laurea: Bioingegneria
Sede: Pavia
Settore scientifico disciplinare: ING-INF/06
L'insegnamento è caratterizzante per: Bioingegneria
Crediti formativi: CFU 6
Sito web del corso: http://aimed11.unipv.it/iscrizioni/main.htm

Obiettivi formativi specifici

Il corso si propone di fornire allo studente le competenze necessarie per padroneggiare i metodi di analisi statistica e probabilistica più usati nella letteratura medico scientifica. Tali metodi giocano un ruolo importante in settori di ricerca quali la bioinformatica, lo studio del genoma e delle reti metaboliche cellulari, la messa a punto di nuovi farmaci e la valutazione del loro effetto, l�individuazione di geni responsabili di malattie, lo studio della diffusione di epidemie, la medicina predittiva, lo studio del funzionamento del cervello, e così via. Verranno pertanto forniti gli strumenti per la corretta progettazione di uno studio e per l'analisi efficace dei risultati. A tal fine, il corso fornisce dapprima gli strumenti di base di probabilità e statistica per poi addentrarsi in tecniche di analisi più complesse quali i molteplici test statistici proposti in letteratura per i diversi tipi di variabile e regressione lineare semplice e multipla. Gli esempi che verranno illustrati durante il corso e gli esercizi proposti saranno prevalentemente di carattere biomedico. E' opportuno sottolineare che la competenza nell'analisi statistica dei dati è un requisito sempre più importante in numerosi tipi di carriera, non solo in ambito biomedico, ma anche in altre aree del settore industriale e finanziario.

Programma del corso

Introduzione alla biostatistica: cos'e'?

Statistica descrittiva
Vengono illustrate le principali tecniche con cui si possono estrarre informazioni di sintesi a partire da dati sperimentali

Tipi di dati: variabili qualitative/quantitative. Tipi di scale di misura: nominale/ordinale/ad intervalli/di rapporti. Matrice dei dati.
Strumenti di sintesi: distribuzione (tabelle) di frequenza per dati raggruppati e creazione delle classi.
Sintesi quantitativa: misure di tendenze centrale (media aritmetica/pesata/geometrica/armonica/quadratica, mediana, moda, intervallo medio, media interquartile), quantili (quartili/decili/percentili,frattile), misure di dispersione o variabilit� (campo o intervallo di variazione/differenza interquartile/scarti della media/scarto medio assoluto/devianza o somma dei quadrati/varianza o quadrato medio/deviazione standard o scarto quadratico medio/coefficiente di variazione), Disuguaglianza di Markov, di Chebychev e di Cramer, momenti di ordine superiore, indici di forma (simmetria: skewness di Pearson, Gamma1 di Fisher, Beta1 di Pearson; curtosi: mesocurtica/leptocurtica/platicurtica, Gamma2 di Fisher, Beta2 di Pearson).
Sintesi qualitativa (grafici): istogrammi o poligoni/distribuzioni cumulate, diagrammi a rettangoli, ortogrammi, aerogrammi, pittogrammi, diagrammi polari, dotplot, boxplot, diagrammi di dispersione a due variabili, diagrammi cartesiani a due variabili).

Gli studi statistici
Vengono illustrate le principali caratteristiche degli studi condotti in ambito biomedico.

Scopo di uno studio.
Progetto di uno studio. Campionamento: metodi probabilistici e non; campione di convenienza, a valanga, casuale semplice, pesato, sistematico, stratificato, a grappolo. Campioni a due o pi� stadi.
Epidemiologia: misure e indici specifici (prevalenza, incidenza, morbidit�, morbosit�, morbilit�, letalit�, mortalit�, rischio relativo, riduzione del rischio assoluto, riduzione del rischio relativo), tassi grezzi, specifici e standardizzazione, rapporto tra proporzioni, rapporto tra odds.
Tipi di studi: osservazionali (descrittivi/analitici - ecologici, trasversali, retrospettivi, prospettici longitudinali), sperimentali (trial clinici, sul campo, di popolazione). Studi clinici nelle diverse fasi di sviluppo di un farmaco.
Accuratezza, precisione e numero di cifre significative nella raccolta dati.

Statistica matematica: elementi di probabilità
Vengono introdotti i concetti elementari della teoria della probabilità, il teorema di Bayes, e le più importanti classi di distribuzioni di probabilità.

Eventi e spazio campionario, combinazione di eventi, calcolo combinatorio di raggruppamenti semplici (permutazioni, disposizioni, combinazioni).
Definizione di probabilit� matematica o classica, frequentista e soggettiva, vari tipi di convergenza di successioni di variabili aleatorie, assiomi della probabilit�, probabilit� condizionate e indipendenza condizionale, teorema della probabilit� totale e teorema di Bayes e sua applicazione ai test di screening (veri/falsi positivi, veri/falsi negativi, sensibilit�, specificit�, efficienza, valore predittivo positivo/negativo, curva ROC, calcolo prevalenza con test di screening).
Variabili casuali (discrete/continue), funzione di distribuzione cumulativa, funzione di densit�, funzione di probabilit� di massa, momenti di variabili casuali.
Variabili casuali congiunte, funzione di distribuzione cumulativa congiunta e di densit� congiunta, distribuzione e densit� marginale, probabilit� di massa congiunte e marginali, distribuzioni condizionate, variabili casuali indipendenti, covarianza, correlazione, funzioni di variabili casuali (distribuzione, media, varianza e propagazione dell'incertezza).
Variabili casuali vettoriali.
Distribuzioni di probabilit� di variabili discrete: uniforme, bernoulli, binomiale/multinomiale, Poisson, geometrica e Pascal, binomale negativa, ipergeometrica.
Distribuzioni di probabilit� di variabili continue: rettangolare, normale o gaussiana (approssimazione alla normale e teorema del limite centrale, lognormale, esponenziale (Erlang), gamma, gamma inversa, weibull, beta, dirichlet, chi2, t-student, F-fisher.
Quale distribuzione seguono i dati? I grafici di probabilit� (qqplot).
Simulazione come strumento per l'investigazione dei dati.

Statistica inferenziale: teoria della stima
Vengono introdotti i concetti basi della teoria della stima.

L�inferenza statistica e le distribuzioni campionarie.
Teoria della stima: stima puntuale e per intervallo, stima alla Fisher, stima bayesiana, stima parametrica e stima non parametrica (es. momenti campionari), stimatore e sue propriet� (polarizzazione, consistenza, efficienza), stimatori lineari, limite di Cramer-Rao e informazione di Fisher anche nel caso vettoriale (matrice di covarianza della stima), metodi per la costruzione di stimatori (metodo dei momenti, stima a massima verosimiglianza e sue propriet�, stima bayesiana, stimatori puntuali e distribuzioni coniugate), intervalli di confidenza.
Stima dei parametri di distribuzioni note: binomiale e proporzioni, Poisson e tassi, normale, esponenziale. Propriet� di questi stimatori.
Distribuzione campionarie e intervalli di confidenza dei conteggi di frequenza (proporzioni), della media, di differenza di medie, varianza e del rapporto di varianza.
Intervalli di confidenza, numerosit� del campione e livello fiduciario.
Valutazione delle distribuzioni campionarie e degli intervalli di confidenza attraverso la simulazione.

Statistica inferenziale: i test statistici
Vengono presentati i concetti alla base dei test statistici e presentati i principali test parametrici e non parametrici.

Definizione di un test (statistica del test e distribuzione della statistica del test) e relazione con gli intervalli di confidenza, ipotesi nulla (bilaterale/unilaterale) e ipotesi alternativa e regola di rifiuto (alfa), p-value, test parametrici e non parametrici, errore di tipo I e tipo II e protezione, potenza e significativit�, fattori che incidono sulla potenze (alfa, delta, sigma2, n) e loro relazioni nella distribuzione z, potenza a priori (n) e a posteriori (beta).
Criteri che guidano nella scelta del test (tipo dati, scala di misura, simmetria/normalit� della distribuzione, omoschedasticit� dei diversi campioni. Confronto tra test: il rapporto potenza-efficienza.
Variabile effetto misurata almeno su scala intervallare: 1 campione: ipotesi sulla media per popolazione normale o numerosa (test t e z) e calcolo della potenza a priori e a posteriori, ipotesi sulla varianza per popolazione normale (test chi2). 2 campioni indipendenti: ipotest sulla differenza tra due medie per popolazioni normali o numerose (test t e z) e calcolo della potenza a priori e a posteriori, ipotest sulla varianza di due popolazioni normali (test F). 2 campioni appaiati: ipotesi sulla differenza tra due medie per popolazioni normali o numerose (test t). Ipotesi sull'appartenenza di un osservazione a un campione normale (test t). Pi� campioni indipendenti: ipotesi sulla varianza di pi� popolazioni normali (test Hartley, Cochran, Bartlett, Levene), ipotesi sulle medie di pi� popolazioni normali (test ANOVA una via), confronti multipli pianificati ortogonali e metodo dei polinomi ortogonali o post-hoc e correzione per confronti multipli (Bonferroni, Scheff�, LSD, HSD, Dunnett). Pi� campioni dipendenti: ipotesi sul confronto tra le medie (test ANOVA per misure ripetute). Pi� campioni indipendenti classificati secondo due fattori senza interazione (test ANOVA a due vie e quadrati latini), classificati secondo pi� fattori senza interazione (test ANOVA a pi� vie, quadrati greco-latini), classificati secondo pi� fattori con interazione (test ANOVA per esperimenti fattoriali). Quanti fattori considerare? L�efficienza relativa. Valutazione dell�effetto del trattamento tramite R2 e eta.
Variabile effetto misurata su scala nominale: 1 campione: ipotesi su una proporzione (test z, binomiale), ipotesi sulla distribuzione e test di bont� di adattamento (test chi2, test G, test T2 di Freeman-Tukey). 2 campioni indipendenti: studio di fattori di rischio e tabelle di contingenza, test sulla differenza di due proporzioni (test z) e tabelle 2x2 (test chi2, test G), test esatto di Fisher, potenza a priori e posteriori, rischio relativo (test z e formula di Miettinen), odds ratio (test z e formula di Miettinen, test chi2 di Mantel-Haenszel), rapporto di tassi (test z e formula di Miettinen). Test di indipendenza e di omogeneit� e associazione tra variabili (coefficiente di contingenza di Pearson e phic di Cramer). 2 campioni dipendenti: test McNemar (variabili dicotomiche), estensione test McNemar o test di Bowker (variabili politomiche). Pi� campioni indipendenti: tabelle 2xN e MxN (test chi2, test G, metodo esatto). Pi� campioni dipendenti: test Q di Cochran.
Variabile effetto misurata su scala ordinale: 1 campione: ipotesi sulla casualit� di un campione temporale o spaziale (test delle successioni), ipotesi sulla tendenza centrale (test del segno, test di Wilcoxon o dei ranghi con segno, test di casualizzazione), ipotesi sull'omogeneit� di conteggi (test di Poisson e indice di dispersione), bont� di adattamento (test di Kolmogorov-Smirnov). 2 campioni dipendenti: ipotesi sulla tendenza centrale (test dei segni, test di Wilcoxon, test di casualizzazione). 2 campioni indipendenti: ipotesi sull'effetto ordine (test di Gart), ipotesi sulla tendenza centrale (test della mediana, test di Wilcoxon-Mann-Whitney, test U Mann-Whitney, test S di Kendall, test di casualizzazione), aderenza di due distribuzioni (test successioni o test di Wald-Wolfowitz, test di Kolmogorov-Smironv), ipotesi sulle varianze (test di Siegel-Tukey). Pi� campioni: ipotesi sulla tendenza centrale (test della mediana, Kruskal-Wallis), ipotesi sulla varianza. Pi� campioni indipendenti classificati secondo due fattori (analisi della varianza per ranghi a due vie di Friedman), confronti multipli.

Correlazione e regressione lineare
Regressione semplice e multipla.

Prerequisiti

Il linguaggio usato in statistica è prevalentemente matematico. Occorrono alcune delle nozioni dei corsi di Analisi Matematica e Geometria e Algebra. In particolare saranno utili le nozioni di limite, di integrale e di derivata, di serie, di funzione di più variabili e di funzioni vettoriali, di massimizzazione/minimizzazione di funzione di una o più variabili oltre che la teoria degli insiemi ed elementi di logica.

Tipologia delle attività formative

Lezioni (ore/anno in aula): 60
Esercitazioni (ore/anno in aula): 0
Attività pratiche (ore/anno in aula): 0

Materiale didattico consigliato

Materiale distribuito dal docente agli iscritti alla mailing list del corso

W. Navidi. Probabilità e statistica per l'ingegneria e le scienze. McGraw-Hill. E. 39,00. Libro di riferimento del corso.

W. W. Daniel. Biostatistica. EdiSES. E. 46,00. Testo di approfondimento.

L. Soliani. Manuale di statistica per la ricerca e la professione. http://www.dsa.unipr.it/soliani. I capitoli 1,2,3,4,5,6,7,8,9,10,11,12,15 sono alcuni degli argomenti del corso.

Laboratorio virtuale di probabilità e statistica. http://www.ds.unifi.it/VL/VL_IT/index.html. Sito con risorse interattive per studenti e docenti di probabilità.

Modalità di verifica dell'apprendimento

L'esame consiste in una prova scritta e in una prova orale in cui vengono valutate sia la conoscenza dei fondamenti teorici sia la capacità di risolvere esercizi.