WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Reconnaissance des caractères arabes imprimés par l'approche neuro-génétique.

( Télécharger le fichier original )
par Marwa AMARA
Ecole nationale des sciences de l'informatique - Master  2010
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

CHAPITRE 1. LA RECONNAISSANCE OPTIQUE DES CARACTÈRES

comporte d'autres caractères additionnels tels que et . SCHWARTZ, MAKHOUL et RAPHAEL [SLM+96] considèrent dans leur papier l'alphabet arabe comprenant 31 lettres au lieu de 29. En plus, le symbole Madda qui s'écrit uniquement sur le support du caractère Alef, fait apparaitre d'autres graphismes.

- L'arabe s'écrit de la droite vers la gauche. L'écriture est semi-cursive soit sous forme imprimée soit manuscrite. Chaque caractère a un point de connexion droite et/ou gauche avec la ligne de base. La ligne de base est détectable en examinant le profil horizontal de l'image du mot ou sous-mot. L'alphabet arabe est plus riche que son équivalent latin, la plupart des lettres changent de formes selon leur apparition au début, au milieu ou à la fin du mot.

8

FIGURE 1.2 - les quartres positions possibles du caractère " Hha"

- Un mot arabe peut être composé d'une ou plusieurs composantes connexes. Les caractères d'une même composante connexe peuvent être ligaturés horizontalement ou verticalement pour des raisons d'héstitique. Dans certaines fontes, nous pouvons aller jusqu'à quatre caractères ligaturés verticalement. Ceci rend la segmentation en caractères presque impossible. Pour des raisons de justification de texte ou d'esthétique, les ligatures horizontales peuvent être allongées en insérant entre les caractères une ou plusieurs élongations qui correspond aux symboles Matta . De même, les chevauchements verticaux peuvent se produire par l'intersection des composantes connexes pour quelques combinaisons de caractères. Les chevauchements et les ligatures dépendent de la fonte utilisée.

9

CHAPITRE 1. LA RECONNAISSANCE OPTIQUE DES CARACTÈRES

FIGURE 1.3 - Chevauchement et Ligature

- Dans un mot arabe, la plupart des caractères sont connectés les uns aux autres, excepté sept caractères qui ne peuvent pas être connectés à ceux qui les suivent. Alors, un mot arabe pourrait compter jusqu'à sept composantes connexes, chacune d'elles est appelée sous-mots.

FIGURE 1.4 - Les sept caractères qui ne se relient pas à leurs successeurs

- Les voyelles sont utilisées pour assurer la lecture d'un texte à haute voix sans erreurs de prononciation. Certains livres tels que le coran, la poésie et les livres d'apprentissage de la langue arabe utilisent les voyelles de manière systématique. L'existence de voyelle change le sens des mots. Les mêmes mots avec des voyelles peuvent être compris comme

verbe, nom ou adjectif. Par exemple, peut signifie "drapeau", "savoir" ou encore
"enseigner" selon sa voyellisation.

FIGURE 1.5 - Influence de la voyellisation sur le sens du mot

10

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"En amour, en art, en politique, il faut nous arranger pour que notre légèreté pèse lourd dans la balance."   Sacha Guitry