WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Reconnaissance des caractères arabes imprimés par l'approche neuro-génétique.

( Télécharger le fichier original )
par Marwa AMARA
Ecole nationale des sciences de l'informatique - Master  2010
  

précédent sommaire suivant

Extinction Rebellion

CHAPITRE 4. EXPÉRIMENTATION ET ÉVALUATION

4.2.2 Segmentation

La phase de segmentation est composée de trois étapes : la segmentation en ligne, la séparation des mots (sous-mots) et des signes diacritiques et enfin la segmentation en caractères.

- Segmentation en lignes : Ce module accepte comme entrées la squelette du document texte issue de la squelettisation. Son but est de détecter les lignes dans l'image puis les séparer. La figure-15 présente le résultat de la phase de segmentation en ligne. La ligne bleu présente la ligne de base et la ligne rose présente la ligne de base supérieure.

FIGURE 4.3 - Segmentation en ligne

La destination des lignes séparées obtenues est la segmentation en mots (sou-mots).

- Segmentation en PAW : Ce sous module détecte toutes les formes connectées dans l'image des lignes. Il se charge de les classer en sous-mots et signes diacritiques. Les mots sont encadrés en vert et les signes diacritiques sont encadrés en rouge tel qu'il est présenté dans la figure suivante :

FIGURE 4.4 - Séparation des mots et détection des signes diacritiques

59

60

précédent sommaire suivant






Extinction Rebellion





Changeons ce systeme injuste, Soyez votre propre syndic





"Ceux qui rêvent de jour ont conscience de bien des choses qui échappent à ceux qui rêvent de nuit"   Edgar Allan Poe