Caractérisation et extraction informatique de la structure d'un tableau par une méthode implémentant un réseau de neurones

( Télécharger le fichier original )
par Pacifique BISIMWA MUGISHO
Institut Supérieur Pédagogique - Licence en Informatique de Gestion 2011

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

4.6. Conclusion

Dans ce chapitre, nous avons étalé, de manière précise, notre démarche d'implémentation du réseau de neurones en langage Java. Pour ce faire, il s'est avéré nécessaire de souligner la possibilité d'utilisation des objets très intéressants et disponibles dans le langage Java, à savoir : les conteneurs. C'est donc à travers ces derniers que nous avons implémenté l'algorithme d'extraction de la structure d'un tableau en utilisant un réseau de neurones. Dans le but de vérifier le fonctionnement du réseau implémenté, nous l'avons expérimenté sur quelques tableaux de test.

A l'issue de cette expérimentation, nous avons constaté que la méthodologie proposée donne des résultats qui, bien qu'imparfaits, sont néanmoins encourageants car, comme nous l'avons remarqué, seuls la taille et la position inclinée de l'image avaient un impact négatif sur les résultats de la détection.

CONCLUSION GENERALE

Notre recherche est partie du constat que le problème de la réédition automatique des documents imprimés est encore loin d'être complètement résolu surtout lorsqu'il s'agit des documents tabulaires. Ce constat nous a amené à considérer le cas de l'extraction de la structure d'un tableau figurant sur un document imprimé. De là, nous avons avancé l'hypothèse selon laquelle un réseau de neurones permettrait d'extraire la structure d'un tableau à partir de l'image de ce dernier.

L'hypothèse étant fixée, nous nous sommes penchés sur la revue de la littérature dans le domaine de la reconnaissance de tableaux.

A l'issue de cette exploration, nous avons constaté qu'en dépit du nombre élevé des travaux déjà réalisés dans le domaine de la reconnaissance des tableaux, très peu, sinon aucun n'a déjà abordé le problème d'extraction de la structure des tableaux en utilisant les réseaux des neurones.

Par la suite, nous avons donc examiné ce problème en fondant notre approche sur l'implémentation d'un réseau de neurones utilisant comme seule connaissance à - priori : les éléments structurels d'un tableau.

Nous avons montré comment calculer le seuil de binarisation qui permet une bonne détection du tableau par le réseau de neurones. Et nous avons présenté l'algorithme d'extraction de la structure d'un tableau par le réseau de neurones avant de détailler l'implémentation de cet algorithme en langage Java.

Les résultats expérimentaux préliminaires nous ont semblé prometteurs mais aussi, ont laissé entrevoir des zones où des améliorations doivent être faites. Ainsi, des recherches futurs pourraient examiner comment améliorer l'algorithme du réseau afin qu'il soit capable de :

- Corriger automatiquement l'angle d'inclinaison d'une image de tableau,

- Détecter plusieurs tableaux dans un document ;

- Détecter des tableaux présentant une structure complexe (lignes fusionnées, colonnes fusionnées, etc.),

- Détecter des tableaux ornementaux (c'est - à - dire des tableaux dont les bordures ne sont pas constitués de lignes droites).

Tels ont été l'objet, la méthode et les résultats de nos efforts. Certes, ils sont sujets à plus d'une objection. Néanmoins, nous pouvons compter sur leur mérite dans la mesure où ils concrétisent notre volonté d'apporter une pierre à l'édifice de la science.

précédent sommaire suivant

"Aux âmes bien nées, la valeur n'attend point le nombre des années" Corneille