Reconnaissance des caractères arabes imprimés par l'approche neuro-génétique.

( Télécharger le fichier original )
par Marwa AMARA
ECOLE NATIONALE DES SCIENCES DE L?INFORMATIQUE - Master 2012

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

CHAPITRE 4. EXPÉRIMENTATION ET ÉVALUATION

TABLE 4.4 - Caractéristiques des signes diacritiques

Diacritiques	Position	Les caractéristiques géométriques	Code Assignées
Acune signe	***	***	0
	Au dessus de la ligne de base	un seul pixel	1
	Au dessous de la ligne de base	Largeur égale à la hauteur	2
	Au dessus de la ligne de base	La largeur est toujours	3
	Au dessous de la ligne de base	supérieure à la hauteur	4
	Au dessus de la ligne de base	Non reconnu directement	5
	Au dessus de la ligne de base	La hauteur est plus grande ou égale à la largeur	6
	Au dessous de la ligne de base	une fourche peut exister	7
	Au dessus de la ligne de base	La hauteur est plus grande ou égale à la largeur une fourche ne peut pas exister	8

Le code (0) est attribué aux segments de caractères qui ne portent pas des signes diacritiques. Chaque diacritique est associée à l'un des segments de caractères classés en fonction des règles linguistiques (voir-3.3.2.5). Les segments de caractères avec leurs signes diacritiques associés sont regroupés pour reconstruire les sous-mots (figure-4.18) selon les positions de ces segments dans l'image.

FIGURE 4.18 - Image du mot et le mots reconnu

CHAPITRE 4. EXPÉRIMENTATION ET ÉVALUATION

Les sous-mots sont, ensuite, regroupés pour former les lignes de texte. La figure-4.19 présente un exemple de reconnaissance d'une ligne de texte.

FIGURE 4.19 - Image de la ligne et la ligne reconnue

L'évaluation du taux de reconnaissance de ce texte qui contient 139 caractères dont 122 sont reconnus est de 87,76%.

FIGURE 4.20 - Image du texte et texte reconnu

4.3 Evaluation de notre système

Dans la phase de reconnaissance, nous avons utilisé des images des textes de bonne qualité. Un taux global de 87.94% a été enregistré. La variation de taux de reconnaissance par caractère est illustré dan la figure-4.21.

FIGURE 4.21 - Variation du taux de reconnaissance par caractères

précédent sommaire suivant

Changeons ce systeme injuste, Soyez votre propre syndic

"L'imagination est plus importante que le savoir" Albert Einstein