Il corso fa parte del V anno del Corso di Laurea in Informatica, Università di Pisa, ed è attivato per il I semestre dell'Anno Accademico 2000/01, con inizio il 27.09.2000 e termine il 13.12.1999, con il seguente orario:
Giorno Orario Aula Luogo Lunedí ore 16.00 -- 18.00 E Polo Didattico "L. Fibonacci" (Via Buonarroti) Mercoledí ore 14.00 -- 16.00 E Polo Didattico "L. Fibonacci" (Via Buonarroti)
Chi avesse intenzione di usufruire dell'orario di ricevimento è cortesemente invitato a telefonare in precedenza allo 050.3152892 per annunciare il proprio arrivo.
Giorno Orario Ufficio Luogo Lunedí ore 14.00 -- 16.00 18 IEI-CNR Mercoledí ore 16.00 -- 18.00 18 IEI-CNR
Testi dei compiti degli anni precedenti
Appello I II III IV V VI 1998/1999 Testo Testo Testo Testo [compito non svolto] Testo 1999/2000 Testo Testo [compito non svolto] [compito non svolto] [compito non svolto] Testo I compiti non svolti sono quelli ai quali non si è presentato alcun candidato.
Nessuno. E' utile la conoscenza degli argomenti trattati nei corsi di Calcolo delle Probabilità e Statistica. Il corso presenta svariati punti di contatto con i corsi di Basi di Dati e Sistemi Informativi e Apprendimento Automatico.
I motori di ricerca su WWW, quali AltaVista, Excite e Yahoo, sono l'odierna "punta dell'iceberg" dell'Information Retrieval, la disciplina che si occupa del progetto di sistemi per la ricerca di documenti in forma digitale. La caratteristica fondamentale di questa disciplina è l'impossibilità di formalizzare il concetto di "rilevanza di un documento a un bisogno informativo". Il corso introdurrà quindi un insieme di tecniche per il progetto di "motori di ricerca", incentrate su modelli quantitativi per la determinazione del grado, o della probabilità, di rilevanza di un documento a un bisogno informativo.
WWW search engines such as AltaVista, Excite and Yahoo are the "tip of the iceberg" of Information Retrieval, the discipline that deals with the design of systems for the search of documents in digital form. The fundamental trait of this discipline is the inherent impossibility of formalising the notion of "relevance of a document to an information need". This course will thus present a number of techniques for the design of search engines; these techniques revolve around quantitative models for the estimation of the degree, or of the probability, of relevance of a document to an information need.
Programma delle esercitazioni (6 ore) - Umberto
Straccia
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Avvertenza. Si ricorda che il Centro di Calcolo del Dipartimento di Informatica non autorizza la stampa di materiale didattico presso le proprie strutture (vedi comunicato del direttore del CDC). Il materiale didattico qui contenuto può quindi essere scaricato unicamente per la visualizzazione o per la stampa con mezzi propri.
Vorrei segnalare a chi fosse interessato che sono disponibile a seguire lavori di tesi nel settore dell'information retrieval e, in particolare, della categorizzazione automatica di documenti. L'invito si indirizza in particolare alle persone che sono a pochi esami (<4, possibilmente anche meno) dalla tesi, e che hanno trovato di proprio interesse gli argomenti trattati nel corso BDR. E' titolo preferenziale avere anche seguito il corso di apprendimento automatico. Le tesi abbracciano in genere l'intero ciclo progetto-implementazione-sperimentazione.Chi fosse interessato è invitato a consultare la pagina dei temi disponibili e a contattarmi per un colloquio preliminare.