La reconnaissance optique de tableaux numerises : listes des étudiants inscrits de l'ISP/Bukavu( Télécharger le fichier original )par Richard ISHARA Institut Superieur Pedagogique - Licence 2010 |
III.3. LA RECONNAISSANCE HORS LIGNELa reconnaissance hors-ligne travaille sur un instantané d'encre numérique (sur une image). C'est le cas notamment de la reconnaissance optique de caractères mais égalemant de la reconnaissance des données scannées. Dans ce contexte, il est impossible de savoir comment ont été tracés les différents motifs. Il est seulement possible d'extraire des formes à partir de l'image, en s'appuyant sur les technologies de reconnaissance de forme. C'est le type de reconnaissance privilégié pour les traitements asynchrones, tels que la lecture de chèques bancaires ou le tri postal, la lecture des bordereaux... Cette reconnaissance en est beaucoup utilisé. Le présent travail ne fera pas la reconnaissance en temps réél, ne suivra pas le posé et le lèvé du stylet pour en savoir les coordonnées des pixels en fonction du temps,... il est alors utile d'éclairer que cette reconnaissance hors ligne être serait appliquée aux images qui proviendraient du logiciel du présent travail une fois la séparation des cellules effectuée. III.4. LA REEDITION DES DOCUMENTSComme nous l'avons signalé dans les chapitres précédents, il est vrai que lorsqu'on veut assurer des modifications sur les informations se trouvant sur des papiers, il est important de bien les rééditer à base d'un ordinateurs, afin soit de les diffuser ou de les utiliser ultérieurement. Si le doccument est disponible, on peut recourir à sa version éléctronique( si elle existe) pour pouvoir l'améliorer davantage. En l'absence de la version éléctronique, on peut reprendre la réedition au format éléctrnique, ce qui causera une perte de temps unitile surtout quand des rectifications nécessaires sont minimes. Un système de reconnaissance de document sera facile et on aura la facilité de conserver une copie d'archive en version éléctronique pour un usage ultérieur10(*). Bien avant de reconaitre un document il faut tout d'abord le scanner ; cépendant, au moment du scanning, des éventuels problèmes peuvent se poser. Voyons en quelques sorte comment les éviter. III.5. SCANNING NON INCLINE DES DONNEESLe moment crucial et déterminatif pour la reconnaissance des tableaux commence par le processus du scaning du document à reconnaitre grâce à un scanner(plus rarement appelé numériseur de document). C'est un périphérique informatique qui permet de transformer un document en une image numérique. Le document est soumis au balayage d'un rayon lumineux.. Pour cette tâche beaucoup de scanners existent et peuvent être de type diversifié. Nous allons illustrer deux de ces types pour bien viser le problème lié au scanning incliné des documents à reconnaitre optiquement. Le scanner peut être à plat,à défilement, à main, à diapositive, etc. Pour que l'humain reconnaisse une image percue par son oeil, il lui faut l'identifier soit par sa forme, sa couleur ou encore sa longeur ou sa surface. Il faut donc des détails structurels de la chose percue. Il faudra développer un algorithme consistant à identier les valeurs représentant ses couleurs, rendre l'image en noir et blan, retrouver le tableau proprement dit sur l'image et l'extraire, identifier le nombre de linges et de colonnes du tableau, détérminer et tirer les cellules. Bien anvant d'entammer ces étapes, il faut tout d'abord veiller à bien scanner le document. Il est dificile voire impossoble de scanner avec un scanner plat sans que le vent de glisse la feuille pour qu'elle s'incline meme si elle était bien droite horizontale, le scanner à defilement est le mieux adapté pour éviter tant peu que soit cette objection. En effet, Ce procédé est principalement utilisé dans le monde bureautique car il ne s'applique qu'aux documents sur feuille volante de grammage et de format standard. De ce fait le document passera horizontalement posible dans les machoires du scanner
(scanner à défilement,image de http://fr.wikipedia). Ces scanners évitent l'inclinaison de l'image qui serait due à la force de vent bascule de manière négligeable le document pour le type précédent. Beaucoup d'autres actuces pour rendre droite un objet sur une image sont possibles grâce aux disposotifs de la reconnaissance des formes. Ainsi, par l'alalyse discriminante linéaire(LDA)11(*) utilisant la transformation linéaire de Ficher et la projection des données d'une dimension d sur une ligne de dimension 1 (passant par l'origine), on peut parvenir à tourner une image selon un modèle. III.6. ALGORITHME DE LA ROT Nous devons garder à l'esprit qu'un algorithme est un langage de description des étapes de la résolution d'un problème. Il doit en son sein :
Un algorithme concerne la fourniture de la solution à un problème, sa première étape consiste donc à analyser le problème, c'est-à-dire en cerner les limites et le mettre en forme dans un langage descriptif, on parle généralement d'analyse pour décrire le processus par lequel le problème est formalisé. Le langage de description utilisé pour écrire le résultat de l'analyse est appelé algorithme. L'étape suivante consiste à traduire l'algorithme dans un langage de programmation spécifique, il s'agit de la phase de programmation13(*). Le problème que nous avons à résoudre dans ce cadre de ce trvail, nous allons suivre les étapes suivantes : 1° TRANSFORMATION DE L'IMAGE EN NIVEAU DE GRISLe traitement d'images en couleurs codées sur 24 bits donne à peu près 16,7 millions des différentes couleurs dont certaines se rapprochent du noir et d'autres du blanc. Les pixels d'une image en couleur étant colorés de différentes manières, les nombres écris dans ces pixels sont différents. Pour faciliter l'analyse et pour prêter l'image à une opération qui ne consistera à ne traiter que peu de valeurs et ainsi améliorer l' éfficacité dans les test des pixels, il faut tout d'abord rendre l'image en niveau de gris en trouvant pour chaque pixel la somme de ses trois valeurs et écrire la moyenne trouvée trois fois dans le même pixel. Cela a traduit l'image de couleur en noir et blanc. * 10 KYENDA SULIKA, reconnaissance dynamique des formules mathématiques, Mémoire DEA, 2005. * 11 http://www.iro.umontreal.ca/~meunier/IFT6141/ * 12 Olivier MOTOMOKE MONGA, Cours d'Algorithmique et Programmation, inédit, science etécole polytechnique, université libre de Bruxelles,2005. * 13 http://www.CommentCaMarche.net. |
|