4.6. Conclusion
Dans ce chapitre, nous avons étalé, de
manière précise, notre démarche d'implémentation du
réseau de neurones en langage Java. Pour ce faire, il s'est
avéré nécessaire de souligner la possibilité
d'utilisation des objets très intéressants et disponibles dans le
langage Java, à savoir : les conteneurs. C'est donc à travers ces
derniers que nous avons implémenté l'algorithme d'extraction de
la structure d'un tableau en utilisant un réseau de neurones. Dans le
but de vérifier le fonctionnement du réseau
implémenté, nous l'avons expérimenté sur quelques
tableaux de test.
A l'issue de cette expérimentation, nous avons
constaté que la méthodologie proposée donne des
résultats qui, bien qu'imparfaits, sont néanmoins encourageants
car, comme nous l'avons remarqué, seuls la taille et la position
inclinée de l'image avaient un impact négatif sur les
résultats de la détection.
![](Caracterisation-et-extraction-informatique-de-la-structure-d-un-tableau-par-une-methode-implement95.png)
84
CONCLUSION GENERALE
Notre recherche est partie du constat que le problème
de la réédition automatique des documents imprimés est
encore loin d'être complètement résolu surtout lorsqu'il
s'agit des documents tabulaires. Ce constat nous a amené à
considérer le cas de l'extraction de la structure d'un tableau figurant
sur un document imprimé. De là, nous avons avancé
l'hypothèse selon laquelle un réseau de neurones permettrait
d'extraire la structure d'un tableau à partir de l'image de ce
dernier.
L'hypothèse étant fixée, nous nous sommes
penchés sur la revue de la littérature dans le domaine de la
reconnaissance de tableaux.
A l'issue de cette exploration, nous avons constaté
qu'en dépit du nombre élevé des travaux déjà
réalisés dans le domaine de la reconnaissance des tableaux,
très peu, sinon aucun n'a déjà abordé le
problème d'extraction de la structure des tableaux en utilisant les
réseaux des neurones.
Par la suite, nous avons donc examiné ce
problème en fondant notre approche sur l'implémentation d'un
réseau de neurones utilisant comme seule connaissance à - priori
: les éléments structurels d'un tableau.
Nous avons montré comment calculer le seuil de
binarisation qui permet une bonne détection du tableau par le
réseau de neurones. Et nous avons présenté l'algorithme
d'extraction de la structure d'un tableau par le réseau de neurones
avant de détailler l'implémentation de cet algorithme en langage
Java.
Les résultats expérimentaux préliminaires
nous ont semblé prometteurs mais aussi, ont laissé entrevoir des
zones où des améliorations doivent être faites. Ainsi, des
recherches futurs pourraient examiner comment améliorer l'algorithme du
réseau afin qu'il soit capable de :
- Corriger automatiquement l'angle d'inclinaison d'une image
de tableau,
- Détecter plusieurs tableaux dans un document ;
- Détecter des tableaux présentant une structure
complexe (lignes fusionnées, colonnes fusionnées, etc.),
- Détecter des tableaux ornementaux (c'est - à -
dire des tableaux dont les bordures ne sont pas constitués de lignes
droites).
![](Caracterisation-et-extraction-informatique-de-la-structure-d-un-tableau-par-une-methode-implement96.png)
85
Tels ont été l'objet, la méthode et les
résultats de nos efforts. Certes, ils sont sujets à plus d'une
objection. Néanmoins, nous pouvons compter sur leur mérite dans
la mesure où ils concrétisent notre volonté d'apporter une
pierre à l'édifice de la science.
![](Caracterisation-et-extraction-informatique-de-la-structure-d-un-tableau-par-une-methode-implement97.png)
86
|