Implementazione di un Query Language per Knowledge Discovery
Autore
Andrea Romei - Università degli Studi di Pisa - [2001-02]
Documenti
Abstract
La ricerca si è spinta negli ultimi anni verso un settore dell’informatica ed in particolare dei sistemi per la gestione dei dati conosciuto con l’acronimo di KDD (Knowledge Discovery in Databases). Mentre gli attuali DBMS si occupano di memorizzare ed organizzare i dati di interesse della corporazione, il KDD si propone di mettere a disposizione dell’analista gli strumenti per analizzare, capire e visualizzare la conoscenza contenuta in tali dati.
Una definizione poco tecnica del KDD ma che rende almeno parzialmente l'idea del target annunciato da questo settore di ricerca è la seguente: "Il KDD è un metodo per “torturare” i dati finché questi non confessano".
Allo stato attuale, numerosi ricercatori sono stati in grado di porre le basi per trattare il KDD come processo di query e hanno dettato le condizioni che dovrebbe soddisfare un query language (QL) in grado di supportarlo.
In questo contesto, l’idea è realizzare un QL che permetta di combinare e condividere differenti modelli per l’estrazione della conoscenza ad alto livello da grosse quantita' di dati.
Ogni modello di dati che rappresenta l’informazione estratta non è vincolato quindi ad essere trattato separatamente, ma attraverso un frame-work unico si consente di confrontare e manipolare informazione appartenente a livelli di astrazione differenti a supporto delle diverse fasi del processo KDD.
In questa tesi viene quindi implementato un linguaggio per KDD utilizzando XML come base per la rappresentazione della conoscenza e Java come linguaggio di programmazione.
Una definizione poco tecnica del KDD ma che rende almeno parzialmente l'idea del target annunciato da questo settore di ricerca è la seguente: "Il KDD è un metodo per “torturare” i dati finché questi non confessano".
Allo stato attuale, numerosi ricercatori sono stati in grado di porre le basi per trattare il KDD come processo di query e hanno dettato le condizioni che dovrebbe soddisfare un query language (QL) in grado di supportarlo.
In questo contesto, l’idea è realizzare un QL che permetta di combinare e condividere differenti modelli per l’estrazione della conoscenza ad alto livello da grosse quantita' di dati.
Ogni modello di dati che rappresenta l’informazione estratta non è vincolato quindi ad essere trattato separatamente, ma attraverso un frame-work unico si consente di confrontare e manipolare informazione appartenente a livelli di astrazione differenti a supporto delle diverse fasi del processo KDD.
In questa tesi viene quindi implementato un linguaggio per KDD utilizzando XML come base per la rappresentazione della conoscenza e Java come linguaggio di programmazione.
Questa tesi è correlata alla categoria