Web Usage Mining - Progettazione e sviluppo di un sistema di raggruppamento basato su pattern sequenziali
Autore
Daniele Munarin - Università degli Studi di Padova - [2006-07]
Documenti
Abstract
Per Web mining si intende l'utilizzo delle tecniche di data mining per scoprire ed estrarre informazioni da documentazione, servizi e siti del World Wide Web.
In questa tesi si impiega un algoritmo di Web usage mining per scoprire i percorsi di navigazione più frequenti effettuati da promotori finanziari delle reti gestite da Simgenia SIM S.p.A. durante l'utilizzo del sito dell'azienda. Attraverso la descrizione dei comportamenti di navigazione dei promotori è possibile, ad esempio, modificare il sito per rendere la navigazione più efficace. In generale, con tecniche di Web usage mining si può estrarre della conoscenza su utenti e siti Web non nota a priori.
La tesi introduce i concetti di base e la terminologia usata, che sono il punto di partenza per capire l'argomento di cui si tratta, per poi addentrarsi nello specifico nel Web usage mining e nella applicazione sviluppata. Per rendere l'esposizione del lavoro metodologico e sperimentale più efficace, la tesi tratta il tema del Web Usage Mining nei primi capitoli. In tale ambito di ricerca sono numerose le pubblicazioni che dimostrano come sia effettivamente possibile l'utilizzo dei più avanzati algoritmi di data mining, che sono solitamente usati nei Data Warehouse, anche in ambito Web.
La tesi si pone l'obiettivo di presentare tale argomento ponendo l'accento in primo luogo sulle problematiche ad esso associate e le relative soluzioni presenti in letteratura. Si cercherà, mettendone in luce le potenzialità e i limiti, di dare la misura dell'applicabilità e dell'utilità di tali tecniche, illustrando gli ambiti di sviluppo possibili e mettendole in pratica in un ambito seppur limitato e particolare, come una intranet aziendale.
La tesi vuole mettere in luce, nei diversi stadi di elaborazione dei dati, tutte le problematiche sorte, le soluzioni prese e quelle proposte in letteratura. Inoltre si vogliono fornire suggerimenti e delle linee guida per la progettazione e lo sviluppo futuro di integrazioni e miglioramenti ai tool di mining.
Il lavoro è stato svolto presso SIMGENIA SIM S.P.A. in Stage dall'Agosto 2006 al Febbraio 2007.
In questa tesi si impiega un algoritmo di Web usage mining per scoprire i percorsi di navigazione più frequenti effettuati da promotori finanziari delle reti gestite da Simgenia SIM S.p.A. durante l'utilizzo del sito dell'azienda. Attraverso la descrizione dei comportamenti di navigazione dei promotori è possibile, ad esempio, modificare il sito per rendere la navigazione più efficace. In generale, con tecniche di Web usage mining si può estrarre della conoscenza su utenti e siti Web non nota a priori.
La tesi introduce i concetti di base e la terminologia usata, che sono il punto di partenza per capire l'argomento di cui si tratta, per poi addentrarsi nello specifico nel Web usage mining e nella applicazione sviluppata. Per rendere l'esposizione del lavoro metodologico e sperimentale più efficace, la tesi tratta il tema del Web Usage Mining nei primi capitoli. In tale ambito di ricerca sono numerose le pubblicazioni che dimostrano come sia effettivamente possibile l'utilizzo dei più avanzati algoritmi di data mining, che sono solitamente usati nei Data Warehouse, anche in ambito Web.
La tesi si pone l'obiettivo di presentare tale argomento ponendo l'accento in primo luogo sulle problematiche ad esso associate e le relative soluzioni presenti in letteratura. Si cercherà, mettendone in luce le potenzialità e i limiti, di dare la misura dell'applicabilità e dell'utilità di tali tecniche, illustrando gli ambiti di sviluppo possibili e mettendole in pratica in un ambito seppur limitato e particolare, come una intranet aziendale.
La tesi vuole mettere in luce, nei diversi stadi di elaborazione dei dati, tutte le problematiche sorte, le soluzioni prese e quelle proposte in letteratura. Inoltre si vogliono fornire suggerimenti e delle linee guida per la progettazione e lo sviluppo futuro di integrazioni e miglioramenti ai tool di mining.
Il lavoro è stato svolto presso SIMGENIA SIM S.P.A. in Stage dall'Agosto 2006 al Febbraio 2007.
Questa tesi è correlata alla categoria