2.4. Méthodologie adoptée
Dans le chapitre précédent nous avons
jeté un regard analytique sur quelques algorithmes que nous avons
intentionnellement sélectionnés par leur pertinence
évidente par rapport à nos travaux. Il ressort de nos
observations que, pour la plupart de ces algorithmes, l'étape de
prétraitement était quasi indispensable et influençait
considérablement les résultats. Cela s'expliquerait par le fait
que cette étape permet d'accroître l'efficacité de
l'algorithme qui, de ce fait, n'exécutera que les tâches pour
lesquelles il a été créé sans s'occuper d'autres
tâches superflues tels que la correction d'angles d'inclinaison,
l'élimination des bruits, etc.
De ce qui précède nous trouvons que
l'étape de prétraitement est indispensable à l'algorithme
que nous proposons dans la suite. Cela dit, notre approche étant
essentiellement neuronale, la majorité des étapes de notre
algorithme se trouvent à l'intérieur même (c'est - à
- dire dans la structure) du réseau de neurone à
implémenter. Ces étapes pourront donc être décrites
de manière détaillée dans le chapitre qui suivra (traitant
sur l'implémentation de ce réseau). Cependant, les grandes lignes
de notre méthodologie s'énoncent comme suit :
- Acquisition d'image
- Prétraitement
- Extraction des caractéristiques du tableau
- Génération de la structure du tableau au
format HTML
Schématiquement, le procédé ci - dessus peut
être représenté comme suit :
Acquisition d'image
|
|
Extraction des caractéristiques du tableau
|
Prétraitement
|

Réseau
Aire de sortie
Gradient
Rétine
Génération du document HTML

54
2.5. Conclusion
Au total, le problème de la reconnaissance de tableaux
est celui qui demande la prise en compte du risque d'erreur lors de la
détection même des pixels pouvant appartenir au tracé d'un
tableau. Ainsi, la décision à prendre par le système de
reconnaissance se trouve - t - elle soumise à la gestion de ce risque en
considérant le caractère aléatoire lié à la
manière dont peut se présenter l'image d'un tableau (tableau avec
logos, tableau contenant du texte, etc.).
Ainsi posé, ce problème nous a amené
à proposer, parmi toutes les solutions existantes et envisageables, une
qui nous a semblé non expérimentée jusque maintenant,
à savoir : le réseau de neurones. Une présentation des
généralités sur les réseaux de neurones s'est
avérée nécessaire avant d'étaler les grandes lignes
de la méthodologie que nous proposons pour résoudre ce
problème.

55
|