CHAPITRE 3. CONTRIBUTIONS À LA RECONNAISSANCE
DES CARACTÈRES
ARABES IMPRIMÉS
3.3.2.3 Extraction des primitives
L'extraction des paramètres a pour objectif non
seulement la réduction de dimension de l'espace de
représentation, mais aussi l'amélioration de la classification
des formes à recon-naitre. Nous avons sélectionné des
paramètres pour le codage du segment de caractère. Ces
paramètres sont décrits ci-dessous.
- Technique de fenêtre glissante
: Le principal avantage de ce type des primitives est la
simplicité et l'efficacité [SKJ+09]. Ils nécessitent,
généralement, un seul passage à travers les pixels. Chaque
image du caractère est transformée en une séquence de
vecteurs de caractéristiques calculée à partir d'une
fenêtre glissante de taille N pixels. Dans notre cas, la fenêtre
d'analyse se déplace de gauche vers la droite et de hauts vers le
bas.
49
FIGURE 3.7 - Extraction de vecteurs de primitives avec des
fenêtres glissante: (a) horizontale et (b) verticale
La méthode de représentation mentionnée
précédemment est une représentation générale
et peut être appliquée sur n'importe quelle image. En particulier,
les caractères arabes ont des caractéristiques qui peuvent
être utilisées comme des descripteurs.
- Existence des boucles : Les
caractères arabes peuvent être classés en deux
catégories : Les caractères qui comprennent des boucles et des
autres qui ne les comprennent pas. L'existence des boucles dans certains
caractères dépend aussi de la position de ces derniers au sein
d'un sous-mot (initial, milieu, final, isolé). Par exemple, un "Meem"
dans sa position initiale et milieu comprend une boucle, tandis que dans sa
position finale et isolée ne la comprend pas. Les caractères qui
incluent les boucles sont énumérés en fonction de leurs
positions dans le tableau suivant :
|