b) Les résultats des tests
L'expérimentation des différentes
méthodologies a produit les résultats ci - après (à
l'exception de M1 qui se retrouve dans les autres méthodologies et M9
qui, à notre connaissance, n'a jamais été
expérimentée) :
Méthodologie
|
Nombre de documents pour le test
|
Taux de reconnaissance ou détection
correcte
|
M2
|
20
|
100%
|
M3
|
305
|
85%
|
M4
|
20
|
90%
|
M5
|
1
|
100%
|
M6
|
20
|
84%
|
M7
|
50
|
82%
|
M8
|
1125
|
95,31%
|
Tableau 1.2 : Grille présentant le
résultat de tests des différentes approches.
1.2.4. Problèmes et difficultés
rencontrés
La reconnaissance de tableaux étant un domaine qui
présente encore des zones d'ombre, nous avons pu relever par - ci, par -
là quelques écueils qui constituent encore des véritables
défis pour le chercheur en Intelligence Artificielle. Ainsi, d'une
manière générale, nos recherches nous ont montré
que des zones d'ombre persistent encore pour :
- la reconnaissance de tableaux contenant des
éléments non textuels (tels que graphismes, dessins, etc.) ;
- la reconnaissance de tableaux dont les bordures ne sont pas
bien définis (cas des tableaux détériorés ou des
tableaux sans bordures explicites.) ;
- la reconnaissance de tableaux présentant des lignes
droites ornementales (c'est-à-dire dont les bordures et le quadrillage
sont constitués de ces sortes de lignes) ;
- la reconnaissance de tableaux manuscrits ;
- la reconnaissance de plusieurs tableaux pouvant figurer sur un
seul document.
![](Caracterisation-et-extraction-informatique-de-la-structure-d-un-tableau-par-une-methode-implement40.png)
41
1.2.5. Conclusion
Au total, comme nos recherches nous l'ont prouvé, le
domaine de la reconnaissance de tableaux demeure encore non exploré
complètement jusqu'à présent. Et c'est un domaine d'autant
plus intéressant que des recherches menées dans ce sens
pourraient faciliter l'éclosion des nouvelles heuristiques en
Intelligence Artificielle. En fait, les algorithmes développés en
reconnaissance de tableaux pourraient ainsi être intégrés
dans les systèmes OCR afin d'améliorer l'efficacité de ces
derniers.
De plus, il est facile de remarquer que, jusque maintenant,
les systèmes de reconnaissance de tableaux autonomes et performants
demeurent encore rares. Ainsi, des recherches menées dans le sens du
développement de tels systèmes ne peuvent que donner un coup de
pouce aux développeurs des systèmes informatiques qui se verront
dotés des meilleurs outils nécessaires à une production
logicielle de qualité.
C'est dans cette optique que, nous avons choisi d'appesantir
nos efforts sur une approche jusqu'alors inexplorée en reconnaissance de
tableaux : l'approche neuronale. Au fait, à travers cette approche, nous
nous proposons d'élaborer un système capable de détecter
des tableaux dans des documents aussi bien manuscrits qu'imprimés et
d'en extraire la structure avant d'exporter cette structure au format html,
facilitant ainsi sa reproduction.
Le chapitre qui suit traite essentiellement du problème
de la reconnaissance des tableaux, tel que nous le concevons et de la
manière dont il peut être résolu par les réseaux de
neurones.
![](Caracterisation-et-extraction-informatique-de-la-structure-d-un-tableau-par-une-methode-implement41.png)
42
|