CHAPITRE 3. CONTRIBUTIONS À LA RECONNAISSANCE
DES CARACTÈRES
ARABES IMPRIMÉS
sion de l'image en entrée en une image bitonale,
ensuite un sous module qui se charge de nettoyage de l'image, enfin cette
même image passera à un autre sous module qui se charge de la
squelettisation du texte. L'image obtenue va être segmenter en
caractères (graphèmes). Par la suite, le processus
d'apprentissage commence (figure-3.2).
FIGURE 3.2 - Structure de la phase d'apprentissage
Chaque lettre issue de la segmentation est
représentée sur la base de données d'apprentis-sage sous
quatre formes différentes (début, milieu, fin, isolée). Le
vecteur de primitive obtenu sera optimisé en utilusant les AGs.Une fois
la phase de sélection est terminée, l'apprentissage se lance.
En ce qui concerne le sous système de reconnaissance,
son objectif est la reconnaissance du texte : Nous avons en entrée une
image bruitée d'un texte imprimé qui sera nettoyé par un
processus de nettoyage comportant les mêmes modules cités
ci-dessus. Ensuite, l'image prétraitée sera envoyée vers
la segmentation. Une fois que nous avons eu une image segmentée,
l'extraction des primitives commence. Le vecteur obtenu, suite à la
sélection, va être reconnu par le réseau de neurone de type
PMC. Une fois le caractère est reconnu, nous passons à la
reconnaissance du sous-mots (mots), des lignes et enfin du texte. Le texte
reconnu passera au module du post-traitement afin de valider les mots en
solution et les évaluer. Si le vecteur est non reconnu, il sera
ajouté à la base d'apprentissage du réseau.
Par la suite, nous expliquerons en détail chaque
composant de notre système et son processus de fonctionnement.
3.3.2 Description détaillée
Notre idée, pour la reconnaissance, se focalise sur
l'ajout d'un module de sélection de primitives au modèle
classique de reconnaissance. Les étapes suivies lors de la
reconnaissance sont présentées dans la figure suivante :
|