Chapitre1
La Reconnaissance Optique des Caractères
L
A reconnaissance de l'écriture relève du domaine
de reconnaissance des formes qui s'inté-
ressent aux formes des caractères. Depuis les
années 40, la reconnaissance des caractères a fait l'objet de
recherches très poussées. Les chercheurs ont
réalisé des travaux intenses qui ont donné lieu à
la publication de plusieurs articles portants sur la reconnaissance des
caractères.
Dans ce chapitre, nous rappelons certaines notions d'OCR
1en se référant aux différents travaux
réalisés sur ce sujet. Ensuite, nous présentons les
caractéristiques morphologiques de l'écriture arabe. Enfin, nous
exposons les aspects généraux de la reconnaissance optique de
l'écrit ainsi que les problèmes qui lui sont liés tout en
soulevant les problèmes rencontrés dans le domaine d'OCR
arabe.
1.1 Différents aspects de l'OCR
La reconnaissance optique des caractères est un
processus qui permet de convertir un texte écrit sur papier en format
numérique. Des aperçus historiques à propos des
méthodes de reconnaissance peuvent être trouvés à
[AY01, Man86, SFK96, Gov90, AM11]. La reconnaissance de l'écriture arabe
remonte aux années 80. Néanmoins, la majorité des travaux
ayant déjà été publiés ont été
axés sur les caractères latins puis appliqués tels quels
pour la reconnaissance de l'écriture arabe. Pour un tour d'horizon dans
le domaine de reconnaissance d'écriture arabe, nous citons les articles
[Bel95, AS95]. Quant à l'état de l'art dans le domaine de
reconnaissance hors ligne les aperçus dans [LV06, Ami97] sont à
consulter.
1. Optical Character Recognition
4
|