CHAPITRE 3. CONTRIBUTIONS À LA RECONNAISSANCE
DES CARACTÈRES
ARABES IMPRIMÉS
caractères mais pas pour les autres. Au cours de ce
travail, nous proposons un système qui répond aux
problèmes suivants : La squelettisation, la segmentation , l'extraction
et la sélection des primitives, la reconnaissance et le
post-traitement.
Partant d'un document imprimé, la squelettisation de ce
dernier permet de le représenter en "fil de fer". Notre but est de
décomposer ce texte en lignes, les lignes en mots ou sous mots et les
mots ou sous-mots en caractères. Puis, nous passons à
l'extraction des primitives.
L'extraction de primitives consiste à transformer le
caractère en un vecteur de primitives de taille fixe. Les primitives
doivent être discriminantes. Nous proposons, dans notre système,
la sélection des primitives en utilisant l'optimisation par les AGs.
Tout en effectuant cette sélection, il est important de maintenir ou
d'améliorer la performance du système de reconnaissance. Enfin,
nous clôturons par la phase de reconnaissance.
3.2 Justification de l'approche choisie
L'extraction des primitives est l'étape la plus
difficile dans un système de reconnaissance d'écriture.
L'ensemble des primitives sélectionnées doivent avoir un pouvoir
discriminant entre les formes de différentes classes, mais demeurent
presque les mêmes pour une même classe. L'extraction des primitives
est étroitement liée à la classification.
La reconnaissance du caractère passe d'abord par
l'analyse de la forme et l'extraction de ces traits caractéristiques,
qui seront exploitées pour son identification. A ce niveau, se pose le
problème de choix des traits caractéristiques, auquel nous
imposons de distinguer des formes proches mais différentes. Ces
caractéristiques doivent tolérer les variations normales du
caractère et être peut sensible à la variation
d'échelle. Ceci constitue un premier paradoxe dans la définition
des traits caractéristiques. Il existe une très grande
variété de caractéristiques mesurables sur des images.
Trop souvent, nous pensons que chaque caractéristique est importante
pour discriminer une forme d'une autre.
En se référant à l'état de l'art,
GYEONGHWANet SEKWANG [GS00] ont observé que la performance d'un
système de reconnaissance devient mauvaise et le temps de calcul
augmente à mesure que le nombre de primitives augmente. Dans certains
cas, ils existent quelques caractéristiques qui n'aideront pas à
discriminer les classes. Autrement dit, il existe des caractéristiques
redondantes ou non pertinentes. Ces caractéristiques seront inutiles
dans la classification de la forme d'où l'utilité d'effectuer la
sélection des primitives les plus pertinentes. Cette sélection a
parfois un impact considérable sur l'efficacité des
résultats de la classification. Les méthodes d'optimisation
peuvent être déterministes ou non déterministes. Les
méthodes déterministes sont, généralement,
efficaces lorsque l'évaluation de la fonction
40
|