Liste des tableaux
3.1
|
Existence de boucle dépendant de la position du
caractère
|
50
|
4.1
|
Choix de paramètres de l'algorithme
génétique
|
63
|
4.2
|
Paramètres finales de l'algorithme
génétique
|
67
|
4.3
|
Paramères des réseaux
|
69
|
4.4
|
Caractéristiques des signes diacritiques
|
71
|
4.5
|
Comparaison des résultats
|
73
|
A.1
|
Segments Initials
|
82
|
A.2
|
Segments Milieux
|
83
|
A.3
|
Segments finals
|
84
|
A.4
|
Segments isolés
|
85
|
B.1
|
Caractères utilisés pour l'apprentissage du
réseau de neurone
|
86
|
Introduction générale
L
A communication Homme-machine tend à limiter
l'intervention de l'être humain. Ceci
est possible par la conception et la réalisation de
machines capables d'écouter et de reconnaitre la parole, de lire les
documents et de manipuler correctement les caractères qui les composent.
La reconnaissance optique des caractères, connue sous la
dénomination anglaise OCR-Optical Character Recognition fait
partie du domaine de reconnaissance des formes. Ce domaine a fait l'objet de
multiples recherches. Son but est de traduire un document imprimé ou
manuscrit en fichier informatique apte à être manipulé par
le logiciel de traitement de texte.
La lecture des documents imprimés,
dactylographiés et même manuscrits, présente un grand
intérêt pour plusieurs domaines. Si l'ordinateur savait lire
couramment, il pourrait trier le courrier, traiter automatiquement les
chèques ou les factures et accéder à toutes les formes
d'information écrites dont l'existence commence par un papier.
Malgré les progrès réalisés sur le plan
matériel (tablette à digitaliser, crayon otique, etc.) et
logiciel (interface graphique, système conversationnel, etc.), le
processus de communication Homme-Machine reste lent et pénible. Par
conséquent, il constitue un obstacle pour tous les traitements
envisagés. Contrairement au latin, l'écriture arabe
présente des caractéristiques morphologiques complexes qui sont
l'origine de la défaillance des traitements. Les caractères
arabes s'écrivent de manière cursive. Ils sont ligaturés
horizontalement et parfois verticalement, ce qui complique la tâche de
segmentation.
La reconnaissance d'un caractère commence d'abord par
l'analyse de sa forme et l'extraction des traits caractéristiques dits
encore primitives qui seront exploitées pour son identification. A ce
niveau, les primitives peuvent être décrites comme un outil
permettant de distinguer un objet d'une classe d'un autre objet d'une autre
classe. Il est nécessaire de définir des primitives
significatives lors du développement d'un système de
reconnaissance. Les primitives sont définies par expérience ou
par intuition. Plusieurs primitives peuvent être extraites dont certaines
sont non pertinentes ou redondantes. La représentation des primi-
2
|