CHAPITRE 1. LA RECONNAISSANCE OPTIQUE DES
CARACTÈRES
1.3.1 Prétraitement
L'objectif des prétraitements est de simplifier la
caractérisation de la forme (caractère, chiffre, mot) à
reconnaître soit en nettoyant l'image ou en diminuant la quantité
d'information à traiter. Le prétraitement est une technique qui
permet de préparer les données reçues à la phase de
segmentation. A ce stade, le problème de l'écriture arabe est
lié aux boucles. Ces boucles risquent d'être bouché ou
ouverte. Aussi bien, les points diacritiques peuvent être
éliminés suite à ces opérations grace à leur
confusion avec le bruit. Pour cette raison là, la plupart des travaux
éliminent les points diacritiques au début du traitement. Pour
identifier le caractère aprés identificartion de son corps, les
chercheurs utilisent un algorithme d'assemblage corps/points diacritiques. La
phase de prétraitement regroupe plusieurs techniques de nettoyage. Parmi
les opérations, généralement, utilisées nous citons
: la binarisation, la normalisation et la squelettisation.
FIGURE 1.8 - Résultat de certaines opérations de
prétraitement
1.3.1.1 Binarisation
La binarisation est la première étape importante
d'un système de reconnaissance. Elle consiste à séparer le
texte du fond qui n'est pas utile lors de la reconnaissance. Cette étape
permet de réduire l'espace mémoire et le temps de calcul. La
binarisation permet de passer d'une image aux niveaux de gris à une
image binaire composée des valeurs 0 et 1. En général,
nous utilisons un seuil de binarisation qui traduit la limite des contrastes
forts et faibles dans l'image.
12
|