CHAPITRE 3. CONTRIBUTIONS À LA RECONNAISSANCE
DES CARACTÈRES
ARABES IMPRIMÉS
de primitives. Le deuxième consite à minimiser
le taux d'erreu générerr lors de la classification. Alors, la
fonction d'adaptation est une combinaison des deux fonctions à
minimiser. Cette fonction est décrite par la formule
(3.1).Chaque chromosome de la population sera évalué par
cette dernière.
Fitness = Minimiser (á f1 +
o f2) (3.1)
Où f1 : Le taux d'erreur générer
lors de la classification;
f2 : Le rapport entre le nombre de primitives
sélectionnées du chromosome et le nombre de primitives total ;
á : Paramètre en fonction de la
normalisation ;
o : Paramètre en fonction de la
pondération.
Les deux paramètres á et o
sont fixés arbitrairement à 1000 et 1 en se basant sur les
travaux dans le domaine de reconnaissance des chiffres [Ben02]. La technique
utilisée pour trouver ces valeurs est la suivante :
á = c1.w1 et o =
c2.w2 (3.2)
Où ci : est le paramètre de normalisation
de l'objectif fi.
wi : est le paramètre de pondération de
l'objectif fi avec I wi = 1 Après remplacement de
á et o, l'équation (3.1) devient :
f = Minimiser
(c1.w1.f1 +
c2.w2.f2) (3.3)
Puisque w1 + w2 = 1, nous obtenons :
w1c1
f2 =
-w2c2
|
f
f1 + (3.4) w2c2
|
La pente de la fonction f2 est w1c1 w2c2.
Notre but est de minimiser la fonction d'adaptation alors la valeur de
cette pente doit être petite. L'objectif le plus important pour notre
problème est de diminuer le nombre des primitives, alors, la plus grande
importance est donnée à la fonction objective f2 au lieu
de f1. D'où le choix des valeurs de á et de
o est respectivement 1000 et 1. D'ou, les pondérations de
chacun des objectifs sont :
w1 = 0.3 et w2 = 0.7 (3.5)
53
CHAPITRE 3. CONTRIBUTIONS À LA RECONNAISSANCE
DES CARACTÈRES
ARABES IMPRIMÉS
3.3.2.5 Reconnaissance
Il est évident de passer par la phase d'apprentissage
avant la phase de reconnaissance. Dans cette phase, les segments de
caractères sont divisés en quatre ensembles en fonction de la
position d'un caractère segment (initiale, médiale, finale et
isolée). Ces segments sont issus de la phase de segmentation. La
distinction de la position des segments s'effectue manuellement. Cette
répartition a plusieurs avantages. Elle améliore le processus de
reconnaissance, car chaque segment est pré-classée par sa
position dans un sous-mot. cette modélisation nécessite une
grande capacité de stockage, mais cet inconvénient est
négligeable face à l'amélioration des performances du
système [Feh99]. Chaque segment de caractères est appris (puis
reconnu) à l'aide d'un réseau de neurone distinct, d'où
nous avons quatre réseaux de neurones (initiale, médial, final,
isolé) à former, pour être utilisées plus tard dans
le processus de reconnaissance.
La phase de reconnaissance passe par trois niveaux : la
reconnaissance des caractères, des sous-mots, des lignes et enfin du
texte.
- Reconnaissance des caractères :
Après la reconnaissance du corps de caractères, nous devons
passer à la phase d'assemblage corps/caractère. La reconnaissance
des signes diacritiques se réalise à la base des
caractéristiques géométriques extraites de chaque
diacritiques. Nous attribuions à chaque signe diacritique un code en
fonction des caractéristiques géométriques et sa position
par rapport à la ligne de base (au-dessus, au-dessous). Après que
chaque segment de caractère a été associé à
un signe diacritique, la cohérence de chaque combinaison est
vérifiée. Par exemple, un caractère " " ne peut pas
être associée avec un "deux points" diacritique, alors nous
pouvons conclure que le caractère à reconnaitre est " ", mais il
était mal classés. Cela peut être représenté
comme un automate comme le montre la figure suivante :
FIGURE 3.9 - Un automate utilisé pour corriger les signes
diacritiques de caractère "Waw" - Reconnaissance des sous
mots : Les caractères reconnus sont regroupés
pour
54
|