Riconoscimento Di Caratteri Manoscritti Mediante Rete Neurale Addestrata Con Algoritmo Costruttivo Topologico
Autore
Luigi Brugnolo - Università degli Studi di Roma La Sapienza - [1993-94]
Documenti
  • Preview
  • Indice
  • Bibliografia
  • Tesi completa: 209 pagine
  • Abstract
    Un riconoscitore generale di caratteri, che possa essere tanto sofisticato da performare ogni funzione arbitraria, è solo una possibilità teorica. Attualmente i sistemi di riconoscimento possono trattare soltanto limitate e ben definite classi di caratteri.
    Un riconoscitore, da un punto di vista puramente teorico, è un apparato che deve performare una serie di operazioni allo scopo di assegnare certi oggetti (patterns) ad una serie data di classi C0, C1, ..., Cm , in accordo con il valore di certe caratteristiche X1, ..., Xn. E' chiaro che gli oggetti, che devono essere riconosciuti, posseggono intrinsecamente dei "valori" individuali X1, ..., Xn, che devono poter essere calcolati o computati in ognuno di essi.
    C1, ..., Cm sono le classi di interesse, o classi proprie. In una applicazione di riconoscimento dei caratteri, C1, ..., Cm rappresentano le differenti forme che devono essere discriminate (ciascun carattere o simbolo, normalmente, corrisponde a più di una forma). C0 è una classe speciale, chiamata classe di reject: se un oggetto è classificato come appartenente a C0, significa che il riconoscitore non è riuscito ad assegnarlo esattamente ad una delle classi proprie C1, ..., Cm.
    X1, ..., Xn possono essere considerate come coordinate in uno spazio n-dimensionale (spazio delle caratteristiche); e gli oggetti, che devono essere riconosciuti, possono essere rappresentati da punti in questo spazio. In questa ottica, costruire un riconoscitore significa definire gli m sottoinsiemi dello spazio delle caratteristiche (non necessariamente disgiunti) che devono essere utilizzati come regioni di decisione per le proprie classi. Un oggetto è classificato come appartenente ad una propria classe se il suo punto rappresentativo P appartiene solo alla corrispondente regione di decisione. Se P appartiene a più regioni di decisione, o a nessuna, il riconoscitore realizza che non è possibile assegnare all'oggetto la sua propria classe, e allora lo rigetta.
    Vari paradigmi del riconoscimento dei caratteri possono essere messi in relazione, dal punto di vista teorico, con le reti neurali.
    Consideriamo, di nuovo, il problema di classificazione a M classi (ai, i=1, ..., M) unitamente ad un sistema di classificazione che ripartisca lo spazio dei pattern in M regioni di decisione Ri. La probabilità di corretta classificazione di un pattern x incognito è [20]:
    Il classificatore Bayesiano massimizza la probabilità selezionando le regioni che massimizzano l'integrando, cioè assegnando un pattern alla classe ai (ovvero alla regione Ri) tale che p(x|ai)P(ai) sia massima. Per la regola di Bayes, p(x|ai)P(ai) è proporzionale alla probabilità a posteriori p(ai|x) della classe wi dato il pattern x in input.
    Poichè è stato dimostrato che reti del tipo Perceptron possono stimare le densità di probabilità di una distribuzione a partire da un insieme finito di esempi [21, 22], un Perceptron può essere una buona approssimazione di un classificatore Bayesiano.
    Da un altro punto di vista, si può interpretare l'elaborazione, operata da una rete neurale nella soluzione di un problema di Pattern Recognition, come approssimazione successiva delle ipersuperfici di separazione fra le classi. E' stato dimostrato che due livelli nascosti (hidden) di neuroni sono sufficienti per approssimare qualunque superficie di separazione fra le classi [23].
    Inoltre è stato dimostrato [24] che qualunque applicazione continua tra due spazi Euclidei può essere, approssimativamente, realizzata da reti con almeno uno strato hidden e funzioni di trasferimento sigmoidali.
    Infine è stato dimostrato che con un solo livello hidden si possono approssimare anche regioni sconnesse [25]
    Poichè è impensabile ottenere la soluzione generale esatta del problema di 'discriminazione tra M classi', il quesito viene tradotto in quello di cercare una buona soluzione approssimata. Quindi uno o due strati hidden sono sufficienti per risolvere (in approssimazione) qualunque problema di classificazione.
    Per quanto riguarda il numero di nodi della rete, la topologia del problema specifico gioca un ruolo fondamentale. Esistono teorie applicabili alla definizione dei requisiti minimali sulle dimensioni della rete, e sul numero di campioni che essa è in grado di apprendere [26]
    Tuttavia, quando si tratta di pattern reali, i risultati possono essere abbastanza sorprendenti: una rete piccola e addestrata su un numero limitato di campioni può fornire (in alcuni casi) buoni risultati di generalizzazione.
    Questa tesi è correlata alle categorie


    Skype Me™! Tesionline Srl P.IVA 01096380116   |   Pubblicità   |   Privacy

    .:: segnala questa pagina ::.
    | Scrivici | | Ricerca tesi | | Come pubblicare | | FAQ | | Cinema | | Biografie |
    | Registrati | | Elenco tesi | | Borse di studio | | Personaggi | | Economia | | Libri usati |
    | Parole chiave | | La tesi del giorno | | Cronologia | | Formazione | | Ingegneria | | Glossario |
    | Home personale | | Ultime tesi pubblicate | | Una parola al giorno | | Database dei master | | Sociologia | | Approfondimenti |
      La redazione è a tua disposizione dalle ore 9:00 alle ore 18:30 (dal lunedì al venerdì) - tel. 039 6180216
      Pubblicità   |   Privacy