Sistema di classificazione e recupero dei documenti basato sul linguaggio naturale
Autore
Debora Desideri - Università degli Studi di Roma La Sapienza - [2001-02]
Documenti
Abstract
La tesi è strutturata in quattro capitoli, escluso il presente, e diverse appendici. Il codice è contenuto in un volume separato.
Il secondo capitolo riguarda lo stato dell’arte, cioè tutto ciò che esiste ed è stato realizzato o studiato nel campo della classificazione di documenti e del recupero degli stessi. Viene descritto il metodo più usato nella rappresentazione dei documenti, e vengono esposti gli algoritmi di classificazione più citati in letteratura ed i modelli esistenti su cui si basa il recupero dei documenti.
Il terzo capitolo descrive in dettaglio il sistema che è stato realizzato, spiega la procedura con la quale sono state estratte le informazioni dai documenti, il metodo scelto per la classificazione, come sono state gestite le interrogazioni in linguaggio naturale e l’algoritmo realizzato per la ricerca.
Il quarto capitolo descrive i metodi esistenti per valutare i sistemi di classificazione e di recupero di documenti, gli esperimenti realizzati al fine di stimare la validità del sistema realizzato e di confrontare i risultati con quelli di altri sistemi presenti in letteratura o realizzati nell’ambito del progetto.
Il secondo capitolo riguarda lo stato dell’arte, cioè tutto ciò che esiste ed è stato realizzato o studiato nel campo della classificazione di documenti e del recupero degli stessi. Viene descritto il metodo più usato nella rappresentazione dei documenti, e vengono esposti gli algoritmi di classificazione più citati in letteratura ed i modelli esistenti su cui si basa il recupero dei documenti.
Il terzo capitolo descrive in dettaglio il sistema che è stato realizzato, spiega la procedura con la quale sono state estratte le informazioni dai documenti, il metodo scelto per la classificazione, come sono state gestite le interrogazioni in linguaggio naturale e l’algoritmo realizzato per la ricerca.
Il quarto capitolo descrive i metodi esistenti per valutare i sistemi di classificazione e di recupero di documenti, gli esperimenti realizzati al fine di stimare la validità del sistema realizzato e di confrontare i risultati con quelli di altri sistemi presenti in letteratura o realizzati nell’ambito del progetto.
Questa tesi è correlata alle categorie