Clustering visuale per l'analisi di dati microarray
Autore
Vinicio Longo - Università degli Studi della Calabria - [2003-04]
Documenti
  • Preview
  • Indice
  • Bibliografia
  • Tesi completa: 118 pagine
  • Abstract
    La presente tesi si colloca nel campo del Data Mining su dati posti in forma matriciale.
    Il Data Mining è un passo fondamentale del processo di scoperta della conoscenza (Knowledge Discovery), ed è l’applicazione di una o più tecniche che permettono l’esplorazione di grosse quantità di dati, principalmente già strutturati, con lo scopo di individuare informazioni nascoste e significative e di renderle disponibili e direttamente utilizzabili.
    Esistono vari software che implementano queste tecniche, uno di questi è Eureka! Uno strumento di Visual Data Mining che aiuta l’utente in una serie di analisi su insiemi di dati, come la classificazione e la clusterizzazione utilizzando algoritmi di decomposizione come l’SVD (Singular Value Decomposition) e fornendone una rappresentazione grafica.
    Eureka! è stato implementato principalmente come un’estensione della libreria di machine learning Weka di Java, integrando e aggiungendo alcune tecniche di discretizzazione e un clustering visuale.
    In questo contesto sono stati inseriti suggerimenti grafici che non sono stati integrati nella precedente estensione della libreria. Tali suggerimenti sono stati messi a punto tramite l’inserimento di tasti e opzioni che permettono di evidenziare particolari caratteristiche e particolari informazioni nei dati.
    La tesi è articolata nel seguente modo:
    Il primo capitolo fornisce una overview su cosa si intende per Data Mining e quali sono le principali tecniche utilizzate per l’estrapolazione di nuove informazioni.
    Inoltre il capitolo contiene una descrizione dei vari metodi di clusterizzazione, una descrizione dell’analisi, predizione e classificazione dei dati eventualmente partizionati.
    Il secondo capitolo fornisce una descrizione delle funzionalità del sistema di Visual Data Mining Eureka!. Viene inizializzata un introduzione di cosa è la Singular Value Decomposition per poi essere descritta in modo più minuzioso nel successivo capitolo.
    Infine, viene mostrata l’applicazione dell’SVD nel campo del Data Mining.
    Nel terzo capitolo viene descritto in modo approfondito la fattorizzazione del dataset di partenza posto sottoforma matriciale evidenziando una prima ricombinazione lineare degli elementi della matrice di partenza e successivamente descrivendo le modalità di costruzione delle matrici U, V e Λ come combinazione lineare degli elementi della matrice di partenza precedentemente ricombinati.

    Nel quarto capitolo si procede alla descrizione dell’implementazione della classe relativa alla visualizzazione delle caratteristiche dei dati di partenza (matrice V) e successivamente vengono illustrate le modalità di implementazione della suddetta classe evidenziandone i passi salienti.
    Inoltre mettendo a fuoco le potenzialità dell’applicazione dell’ SVD, relativamente ad un determinato dataset, vengono evidenziati i benefici relativi all’introduzione del suggerimento legato a tale visualizzazione.
    Nel quinto capitolo si procede alla descrizione dell’implementazione del suggerimento grafico relativo all’individuazione di partizioni di dati omogenee, evidenziando le particolarità delle modalità della visualizzazione di tale suggerimento.
    Infine nel sesto e ultimo capitolo vengono sfruttate le potenzialità del sistema e i suggerimenti precedentemente implementati per effettuare clustering visuale su dati microarray, di due dataset relativi a frammenti di tessuto di due patologie tumorali: tumore del colon e leucemia, al fine di evidenziare controtendenze e informazioni rilevanti fra i vari tipi di frammenti di tessuto (malato e normale).
    Questa tesi è correlata alla categoria


    Skype Me™! Tesionline Srl P.IVA 01096380116   |   Pubblicità   |   Privacy

    .:: segnala questa pagina ::.
    | Scrivici | | Ricerca tesi | | Come pubblicare | | FAQ | | Cinema | | Biografie |
    | Registrati | | Elenco tesi | | Borse di studio | | Personaggi | | Economia | | Libri usati |
    | Parole chiave | | La tesi del giorno | | Cronologia | | Formazione | | Ingegneria | | Glossario |
    | Home personale | | Ultime tesi pubblicate | | Una parola al giorno | | Database dei master | | Sociologia | | Approfondimenti |
      La redazione è a tua disposizione dalle ore 9:00 alle ore 18:30 (dal lunedì al venerdì) - tel. 039 6180216
      Pubblicità   |   Privacy