Web Information Retrieval
- Corso della laurea specialistica in Tecnologie dell'Informazione,
A.A. 04/05
- Docente: Stefano Mizzaro
- Il programma preliminare del
corso con gli argomenti principali (un programma più
dettagliato è presentato e discusso nei lucidi della prima
lezione del corso).
- È stato creato un gruppo di
discussione per questo corso. Per iscriverti, mandami un email.
- I risultati delle
valutazioni della didattica da parte degli
studenti.
- Modalità d'esame: orale su appuntamento.
- Elenco delle lezioni e degli argomenti (i lucidi usati a lezione,
insieme ad altro materiale, sono sul sito per il materiale
didattico dell'università di Udine):
- 4/5/2005. Introduzione al corso: obiettivi, programma, argomenti,
bibliografia, modalità d'esame, ecc.
- 5/5/2005] Cos'è l'information retrieval, modelli concettuali dell'IR, problemi e difficoltà
- 6/5/2005 I modelli dell'IR: Booleano e Spazio vettoriale. La Regola di Bayes.
- 9/5/2005 I modelli dell'IR: Modello probabilistico
- 12/5/2005 Prima parte: I modelli dell'IR, i modelli evoluti: LSI e reti neurali. Seconda parte: Linguaggi per la formulazione dell'interrogazione.
- 13/5/2005 Tecniche per la gestione della riformulazione. Relevance feedback, analisi locale automatica, analisi globale automatica.
- 16/5/2005 Modelli statistici (e cenni a semantici) dei testi. Da documenti a indice: pre-elaborazioni per la costruzione dell'indice.
- 17/5/2005 Struttura dell'indice invertito. Uso e costruzione. Compressione.
- 19/5/2005 Interfacce utente per il reperimento di informazioni. Introduzione. Richiami di HCI (cenni). Modello Berry-picking. Scelta della collezione.
- 20/5/2005 Interfacce utente per il reperimento di informazioni - 2: formulazione dell'interrogazione, presentazione dei documenti reperiti, relevance feedback.
- 23/5/2005 Interfacce utente per il reperimento di informazioni - 3: Altri 3 esempi di interfacce. Assistenti per l'IR: FIRE, SAM, IRA.
- 24/5/2005 Il clustering: definizioni, algoritmi di base, esempi. Clustering gerarchico e clustering euristico. La Multi-Cluster Hypothesis.
- 25/5/2005 Seminario di Vincenzo Della Mea: La ricerca di informazioni su banche dati mediche: PubMed.
- 26/5/2005 La valutazione di sistemi d'IR. Introduzione, Il concetto di relevance, i vari tipi di relevance. Precisione e richiamo.
- 27/5/2005 La valutazione di sistemi d'IR: Le metriche. Curve P/R, altre metriche classiche. L'ADM (Average Distance Measure): definizione, esempi, confronti con P e R.
- 30/5/2005 La valutazione di sistemi d'IR - 3. Classificazione delle metriche. Approccio "test collection". Studi utente.
- 6/6/2005 Introduzione al Web IR: considerazioni generali, caratteristiche della collezione e degli utenti, le 3 generazioni di motori di ricerca.
- 7/6/2005 Il grafo del Web: stima dimensioni (numero di nodi). Introduzione alle reti piccolo mondo.
- 9/6/2005 Il grafo del Web: 3 studi su diametro, connessione, forma, distribuzioni indegree e outdegree.
- 10/6/2005 Analisi dei link e della connettività per stimare la qualità delle pagine Web. Algoritmi Pagerank e HITS di Kleinberg.
- 13/6/2005 Prima parte: Cenni al filtraggio delle informazioni (basato sul contenuto e collaborativo). Seconda parte: Cenni al problema dello spam dei MdR; Pagine web duplicate e siti duplicati (mirror); Architettura di Google.
- 14/6/2005 Seminario di Paolo Massa (IRST-ITC, Trento, http://moloko.itc.it/paoloblog/ ) su: "Trust in Recommender Systems: an historical overview and recent developments".
- 15/6/2005 Prima parte: Seminario di Gianluca
Demartini sulla misura di efficacia ADM (Average Distance Measure). Seconda parte: Cenni alle problematiche del crawling sul Web.
- 16/6/2005 Conclusione del corso. Riassunto, cenni a lavori di approfondimento (relazioni, seminari, laboratori, tesi).
Stefano Mizzaro
Last modified: Thu Sep 22 18:44:38 CEST 2005