CHAPITRE 1. LA RECONNAISSANCE OPTIQUE DES
CARACTÈRES
comporte d'autres caractères additionnels tels que et .
SCHWARTZ, MAKHOUL et RAPHAEL [SLM+96] considèrent dans leur
papier l'alphabet arabe comprenant 31 lettres au lieu de 29. En plus, le
symbole Madda qui s'écrit uniquement sur le support du caractère
Alef, fait apparaitre d'autres graphismes.
- L'arabe s'écrit de la droite vers la gauche.
L'écriture est semi-cursive soit sous forme imprimée soit
manuscrite. Chaque caractère a un point de connexion droite et/ou gauche
avec la ligne de base. La ligne de base est détectable en examinant le
profil horizontal de l'image du mot ou sous-mot. L'alphabet arabe est plus
riche que son équivalent latin, la plupart des lettres changent de
formes selon leur apparition au début, au milieu ou à la fin du
mot.
8
FIGURE 1.2 - les quartres positions possibles du
caractère " Hha"
- Un mot arabe peut être composé d'une ou
plusieurs composantes connexes. Les caractères d'une même
composante connexe peuvent être ligaturés horizontalement ou
verticalement pour des raisons d'héstitique. Dans certaines fontes, nous
pouvons aller jusqu'à quatre caractères ligaturés
verticalement. Ceci rend la segmentation en caractères presque
impossible. Pour des raisons de justification de texte ou d'esthétique,
les ligatures horizontales peuvent être allongées en
insérant entre les caractères une ou plusieurs élongations
qui correspond aux symboles Matta . De même, les chevauchements verticaux
peuvent se produire par l'intersection des composantes connexes pour quelques
combinaisons de caractères. Les chevauchements et les ligatures
dépendent de la fonte utilisée.
9
CHAPITRE 1. LA RECONNAISSANCE OPTIQUE DES
CARACTÈRES
FIGURE 1.3 - Chevauchement et Ligature
- Dans un mot arabe, la plupart des caractères sont
connectés les uns aux autres, excepté sept caractères qui
ne peuvent pas être connectés à ceux qui les suivent.
Alors, un mot arabe pourrait compter jusqu'à sept composantes connexes,
chacune d'elles est appelée sous-mots.
FIGURE 1.4 - Les sept caractères qui ne se relient pas
à leurs successeurs
- Les voyelles sont utilisées pour assurer la lecture
d'un texte à haute voix sans erreurs de prononciation. Certains livres
tels que le coran, la poésie et les livres d'apprentissage de la langue
arabe utilisent les voyelles de manière systématique. L'existence
de voyelle change le sens des mots. Les mêmes mots avec des voyelles
peuvent être compris comme
verbe, nom ou adjectif. Par exemple, peut signifie "drapeau",
"savoir" ou encore "enseigner" selon sa voyellisation.
FIGURE 1.5 - Influence de la voyellisation sur le sens du
mot
10
|