CHAPITRE 4. EXPÉRIMENTATION ET
ÉVALUATION
TABLE 4.4 - Caractéristiques des signes diacritiques
Diacritiques
|
Position
|
Les caractéristiques géométriques
|
Code Assignées
|
Acune signe
|
***
|
***
|
0
|
|
Au dessus de la ligne de base
|
un seul pixel
|
1
|
|
Au dessous de la ligne de base
|
Largeur égale à la hauteur
|
2
|
|
Au dessus de la ligne de base
|
La largeur est toujours
|
3
|
|
Au dessous de la ligne de base
|
supérieure à la hauteur
|
4
|
|
Au dessus de la ligne de base
|
Non reconnu directement
|
5
|
|
Au dessus de la ligne de base
|
La hauteur est plus grande ou égale à
la largeur
|
6
|
|
Au dessous de la ligne de base
|
une fourche peut exister
|
7
|
|
Au dessus de la ligne de base
|
La hauteur est plus grande ou égale à
la largeur
une fourche ne peut pas exister
|
8
|
Le code (0) est attribué aux segments de
caractères qui ne portent pas des signes diacritiques. Chaque
diacritique est associée à l'un des segments de caractères
classés en fonction des règles linguistiques (voir-3.3.2.5). Les
segments de caractères avec leurs signes diacritiques associés
sont regroupés pour reconstruire les sous-mots (figure-4.18) selon les
positions de ces segments dans l'image.
FIGURE 4.18 - Image du mot et le mots reconnu
CHAPITRE 4. EXPÉRIMENTATION ET
ÉVALUATION
Les sous-mots sont, ensuite, regroupés pour former les
lignes de texte. La figure-4.19 présente un exemple de reconnaissance
d'une ligne de texte.
FIGURE 4.19 - Image de la ligne et la ligne reconnue
L'évaluation du taux de reconnaissance de ce texte qui
contient 139 caractères dont 122 sont reconnus est de 87,76%.
FIGURE 4.20 - Image du texte et texte reconnu
4.3 Evaluation de notre système
Dans la phase de reconnaissance, nous avons utilisé des
images des textes de bonne qualité. Un taux global de 87.94% a
été enregistré. La variation de taux de reconnaissance par
caractère est illustré dan la figure-4.21.
FIGURE 4.21 - Variation du taux de reconnaissance par
caractères
72
73
|