Metodi Numerici per l'Informatica, a.a. 2007-08

Docente: Dario Fasino.

Quando e dove: Il corso verrà svolto nel periodo didattico 24/09 -- 30/11/2007 con il seguente orario settimanale:

Verranno occasionalmente aggiunte esercitazioni in laboratorio (LAB2, orari da concordare).

Di che si tratta: Insegnamento obbligatorio per studenti iscritti alla Laurea Specialistica in Tecnologie dell'Informazione (6 CFU).

Finalità: Il corso esporrà le basi teoriche e implementative di alcune tecniche matematiche per il trattamento di problemi relativi al recupero di documenti sul web, alla loro classificazione e ordinamento, quali il Latent Semantic Indexing, l'algoritmo PageRank, i metodi per il data clustering. Il corso prevede la trattazione di vari esempi, casi di studio e lo svolgimento di attività sperimentali in laboratorio. Dopo aver superato l'esame, si ritiene che lo studente conosca e sappia utilizzare tecniche dell'algebra lineare numerica nell'ambito dell'Information Retrieval e del Data Mining.

Programma provvisorio: Richiami di algebra lineare: spazi vettoriali Rn, matrici, norme vettoriali e matriciali, prodotti scalari, fattorizzazioni notevoli di matrici. Decomposizione ai valori singolari. Problemi ai minimi quadrati lineari. Regolarizzazione di Tikhonov. Elaborazione numerica delle immagini: Il modello lineare dello sfocamento delle immagini; Point Spread Function; ricostruzione di immagini sfocate e affette da rumore; compressione di immagini. Modelli matematici per l'Information Retrieval: Matrice termini-documenti e modello dello spazio vettoriale. Strategia del Latent Semantic Indexing (LSI). Tecniche numeriche per il clustering e la classificazione automatica dei documenti: ordinamento di documenti in un ipertesto in base all'analisi dei link; l'algoritmo di Kleinberg; hub e authorities. Il modello probabilistico di navigazione in un ipertesto; catene di Markov; la Google matrix e il vettore PageRank; metodi per il calcolo di densità stazionarie e loro utilizzo negli algoritmi di page ranking.

Modalità d'esame: Due prove di valutazione intermedia, un progettino in Matlab, una eventuale prova orale. Primi appelli utili: 11/12/2007 ore 9:30 aula 48, 08/01/2008 ore 9:30 aula 48.

Riferimenti bibliografici:



Calendario delle lezioni


Materiale didattico

Il materiale didattico di questo corso (slides delle lezioni, riferimenti bibliografici, dispense) è disponibile sul sito materialedidattico.uniud.it