WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Reconnaissance des caractères arabes imprimés par l'approche neuro-génétique.

( Télécharger le fichier original )
par Marwa AMARA
ECOLE NATIONALE DES SCIENCES DE L?INFORMATIQUE - Master  2012
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

Liste des tableaux

3.1

Existence de boucle dépendant de la position du caractère

50

4.1

Choix de paramètres de l'algorithme génétique

63

4.2

Paramètres finales de l'algorithme génétique

67

4.3

Paramères des réseaux

69

4.4

Caractéristiques des signes diacritiques

71

4.5

Comparaison des résultats

73

A.1

Segments Initials

82

A.2

Segments Milieux

83

A.3

Segments finals

84

A.4

Segments isolés

85

B.1

Caractères utilisés pour l'apprentissage du réseau de neurone

86

Introduction générale

L

A communication Homme-machine tend à limiter l'intervention de l'être humain. Ceci

est possible par la conception et la réalisation de machines capables d'écouter et de
reconnaitre la parole, de lire les documents et de manipuler correctement les caractères qui les composent. La reconnaissance optique des caractères, connue sous la dénomination anglaise OCR-Optical Character Recognition fait partie du domaine de reconnaissance des formes. Ce domaine a fait l'objet de multiples recherches. Son but est de traduire un document imprimé ou manuscrit en fichier informatique apte à être manipulé par le logiciel de traitement de texte.

La lecture des documents imprimés, dactylographiés et même manuscrits, présente un grand intérêt pour plusieurs domaines. Si l'ordinateur savait lire couramment, il pourrait trier le courrier, traiter automatiquement les chèques ou les factures et accéder à toutes les formes d'information écrites dont l'existence commence par un papier. Malgré les progrès réalisés sur le plan matériel (tablette à digitaliser, crayon otique, etc.) et logiciel (interface graphique, système conversationnel, etc.), le processus de communication Homme-Machine reste lent et pénible. Par conséquent, il constitue un obstacle pour tous les traitements envisagés. Contrairement au latin, l'écriture arabe présente des caractéristiques morphologiques complexes qui sont l'origine de la défaillance des traitements. Les caractères arabes s'écrivent de manière cursive. Ils sont ligaturés horizontalement et parfois verticalement, ce qui complique la tâche de segmentation.

La reconnaissance d'un caractère commence d'abord par l'analyse de sa forme et l'extraction des traits caractéristiques dits encore primitives qui seront exploitées pour son identification. A ce niveau, les primitives peuvent être décrites comme un outil permettant de distinguer un objet d'une classe d'un autre objet d'une autre classe. Il est nécessaire de définir des primitives significatives lors du développement d'un système de reconnaissance. Les primitives sont définies par expérience ou par intuition. Plusieurs primitives peuvent être extraites dont certaines sont non pertinentes ou redondantes. La représentation des primi-

2

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"La première panacée d'une nation mal gouvernée est l'inflation monétaire, la seconde, c'est la guerre. Tous deux apportent une prospérité temporaire, tous deux apportent une ruine permanente. Mais tous deux sont le refuge des opportunistes politiques et économiques"   Hemingway