WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Reconnaissance des caractères arabes imprimés par l'approche neuro-génétique.

( Télécharger le fichier original )
par Marwa AMARA
Ecole nationale des sciences de l'informatique - Master  2010
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

CHAPITRE 3. CONTRIBUTIONS À LA RECONNAISSANCE DES CARACTÈRES

ARABES IMPRIMÉS

de primitives. Le deuxième consite à minimiser le taux d'erreu générerr lors de la classification. Alors, la fonction d'adaptation est une combinaison des deux fonctions à minimiser. Cette fonction est décrite par la formule (3.1).Chaque chromosome de la population sera évalué par cette dernière.

Fitness = Minimiser (á f1 + o f2) (3.1)

f1 : Le taux d'erreur générer lors de la classification;

f2 : Le rapport entre le nombre de primitives sélectionnées du chromosome et le nombre de primitives total ;

á : Paramètre en fonction de la normalisation ;

o : Paramètre en fonction de la pondération.

Les deux paramètres á et o sont fixés arbitrairement à 1000 et 1 en se basant sur les travaux dans le domaine de reconnaissance des chiffres [Ben02]. La technique utilisée pour trouver ces valeurs est la suivante :

á = c1.w1 et o = c2.w2 (3.2)

ci : est le paramètre de normalisation de l'objectif fi.

wi : est le paramètre de pondération de l'objectif fi avec I wi = 1 Après remplacement de á et o, l'équation (3.1) devient :

f = Minimiser (c1.w1.f1 + c2.w2.f2) (3.3)

Puisque w1 + w2 = 1, nous obtenons :

w1c1

f2 =

-w2c2

f

f1 + (3.4)
w2c2

La pente de la fonction f2 est w1c1 w2c2. Notre but est de minimiser la fonction d'adaptation alors la valeur de cette pente doit être petite. L'objectif le plus important pour notre problème est de diminuer le nombre des primitives, alors, la plus grande importance est donnée à la fonction objective f2 au lieu de f1. D'où le choix des valeurs de á et de o est respectivement 1000 et 1. D'ou, les pondérations de chacun des objectifs sont :

w1 = 0.3 et w2 = 0.7 (3.5)

53

CHAPITRE 3. CONTRIBUTIONS À LA RECONNAISSANCE DES CARACTÈRES

ARABES IMPRIMÉS

3.3.2.5 Reconnaissance

Il est évident de passer par la phase d'apprentissage avant la phase de reconnaissance. Dans cette phase, les segments de caractères sont divisés en quatre ensembles en fonction de la position d'un caractère segment (initiale, médiale, finale et isolée). Ces segments sont issus de la phase de segmentation. La distinction de la position des segments s'effectue manuellement. Cette répartition a plusieurs avantages. Elle améliore le processus de reconnaissance, car chaque segment est pré-classée par sa position dans un sous-mot. cette modélisation nécessite une grande capacité de stockage, mais cet inconvénient est négligeable face à l'amélioration des performances du système [Feh99]. Chaque segment de caractères est appris (puis reconnu) à l'aide d'un réseau de neurone distinct, d'où nous avons quatre réseaux de neurones (initiale, médial, final, isolé) à former, pour être utilisées plus tard dans le processus de reconnaissance.

La phase de reconnaissance passe par trois niveaux : la reconnaissance des caractères, des sous-mots, des lignes et enfin du texte.

- Reconnaissance des caractères : Après la reconnaissance du corps de caractères, nous devons passer à la phase d'assemblage corps/caractère. La reconnaissance des signes diacritiques se réalise à la base des caractéristiques géométriques extraites de chaque diacritiques. Nous attribuions à chaque signe diacritique un code en fonction des caractéristiques géométriques et sa position par rapport à la ligne de base (au-dessus, au-dessous). Après que chaque segment de caractère a été associé à un signe diacritique, la cohérence de chaque combinaison est vérifiée. Par exemple, un caractère " " ne peut pas être associée avec un "deux points" diacritique, alors nous pouvons conclure que le caractère à reconnaitre est " ", mais il était mal classés. Cela peut être représenté comme un automate comme le montre la figure suivante :

FIGURE 3.9 - Un automate utilisé pour corriger les signes diacritiques de caractère "Waw" - Reconnaissance des sous mots : Les caractères reconnus sont regroupés pour

54

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Qui vit sans folie n'est pas si sage qu'il croit."   La Rochefoucault