Sviluppo di algoritmi paralleli per l’analisi di ”storie” simulative
Autore
Gian Paolo Ghilardi - Università degli Studi di Milano - [2003-04]
Documenti
  • Preview
  • Indice
  • Bibliografia
  • Tesi completa: 103 pagine
  • Abstract
    Uno dei problemi più importanti a cui la Bioinformatica è chiamata a fornire risposte è quello del cosiddetto protein folding : si tratta di determinare la struttura tridimensionale delle proteine a partire dalla conoscenza della loro struttura primaria. Questo problema è diventato ancora più pressante dopo la mappatura del genoma di varie specie viventi, che ci può fornire la struttura primaria di un gran numero di proteine ancora sconosciute. Infatti è la struttura 3D che rende le proteine funzionanti e non esiste ancora una metodologia prevalente per
    individuarla a partire dalle informazioni della loro sequenza di aminoacidi.
    La simulazione meccanico-statistica è una delle tecniche adottate per acquisire dettagli altrimenti difficilmente ottenibili ed utili alla comprensione a livello microscopico dei meccanismi coinvolti nel funzionamento di sistemi biomolecolari complessi (quali le proteine durante la fase di folding ).

    Questa tecnica è molto efficace ma può comportare enormi richieste sia di potenza elaborativa, sia di spazio per l’immagazzinamento (storage ) di grandi quantità di dati. E’ possibile trovare risposta alle esigenze di potenza elaborativa conducendo su aggregati di macchine (cluster s) simulazioni e analisi dei dati.

    Sul cluster Linux di PC di cui disponiamo sono state effettuate simulazioni di un frammento attivo della fibronectina (FN13), una proteina di notevole rilevanza biologica: essa è coinvolta infatti nella migrazione cellulare durante lo sviluppo, nella regolazione della crescita delle cellule e nella loro differenziazione e nella crescita dei tumori.

    Scopo principale del lavoro di tesi è stato quello di progettare e implementare versioni parallele di programmi, precedentemente codificati in modo seriale, per l’analisi statistica dell’evoluzione temporale (”storia” simulativa) della struttura e della dinamica dei sistemi simulati, come appunto il frammento FN13, del quale sono state studiate diverse forme.

    In fase implementativa è stato opportuno rispettare alcuni requisiti:
    • il linguaggio prescelto è il Fortran77 per motivi di coerenza con il codice originale.
    • per la parallelizzazione del codice sono state scelte le librerie MPI nella
    versione MPICH in quanto compatibile con vari moduli del pacchetto AM-
    BER, scelto per condurre le simulazioni su piattaforma Linux (il sistema
    operativo installato sui PC).
    • il cluster è gestito con openMosix che fornisce ottimi strumenti per una
    agevole amministrazione del sistema e si è rivelato utile anche per la realizzazione del progetto.

    La parallelizzazione di uno di tali programmi (quello che analizza la mobilità del solvente) è stata realizzata secondo tre diversi approcci o ”modelli” per quanto concerne la distribuzione del lavoro sui nodi del cluster. L’efficienza di ciascuna delle tre versioni è stata misurata attraverso numerose prove condotte sul cluster.

    I risultati dei test indicano che il modello più efficiente è quello che trae vantaggio dalla presenza del filesystem di openMosix, benchè sia stata disabilitata la feature più interessante messa a disposizione da questo software, ossia la ”migrazione dei processi”. Ciò si è reso necessario in quanto essa interferiva con il normale funzionamento del programma usato per eseguire la simulazione (cioè il modulo SANDER del pacchetto AMBER).

    Il guadagno derivante dalla parallelizzazione, in termini di tempo e di ottimizzazione dell’uso delle risorse, si è rivelato rilevante. Inoltre lo schema può essere considerato paradigmatico in quanto è adottabile per parallelizzare tutta una serie di altri programmi aventi analoga struttura ma con richieste computazionali anche più elevate.

    L’esperienza accumulata indica anche che probabilmente è possibile ottenere ulteriori miglioramenti, analizzando più approfonditamente l’interazione fra i vari software coinvolti e risolvendo eventuali reciproche incompatibilità.
    Questa tesi è correlata alla categoria


    Skype Me™! Tesionline Srl P.IVA 01096380116   |   Pubblicità   |   Privacy

    .:: segnala questa pagina ::.
    | Scrivici | | Ricerca tesi | | Come pubblicare | | FAQ | | Cinema | | Biografie |
    | Registrati | | Elenco tesi | | Borse di studio | | Personaggi | | Economia | | Libri usati |
    | Parole chiave | | La tesi del giorno | | Cronologia | | Formazione | | Ingegneria | | Glossario |
    | Home personale | | Ultime tesi pubblicate | | Una parola al giorno | | Database dei master | | Sociologia | | Approfondimenti |
      La redazione è a tua disposizione dalle ore 9:00 alle ore 18:30 (dal lunedì al venerdì) - tel. 039 6180216
      Pubblicità   |   Privacy