La reconnaissance optique de tableaux numerises : listes des étudiants inscrits de l'ISP/Bukavu( Télécharger le fichier original )par Richard ISHARA Institut Superieur Pedagogique - Licence 2010 |
6. I.5. CHOIX ET INTERET DU SUJET1. Interet individuel Sachant que nous allons répondre tant soit peu à une question qui tracasse les hommes de la sciences quant ils veulent faciliter la réedition de leurs documents imprimés ou tapés à la machine, nous avons voulu de plus approfindir nos connaissances sur le traitement des images. Nous savons tout de même que la reconnaissance des formes est un domaine qui se forge la place dans le monde technologique actuelle, il nous a été d'une grande importance d'apprentissage des notions nécéssaires pour le développement de la reconnaissance des formes. 2.Interet scientifique Nous savons que l'imagerie est un domaine de l'informatique qui est très fréquentée et qui intéresse énormément des chercheurs, notre dessein pour l'aspect scientifique est de faciliter les institutions à pouvoir traiter avec plus d'efficacité et de rapidité les informations qui peuvent leur prendre plus de temps et de l'argent de traitement. 7. I.6. ETAT DE LA QUESTION1. YANG CAO, HENG LI et SHUHUA WANG : les deux premiers du Département de Bâtiment et Propriété Vraie à l'université de Polytechnique de Hong-Kong et le troisième de l'université laboratoire Clé de Nouvelle Technologie des Logiciels, Université Nanjing de CHINE. Ils ont traité le travail intitulé : AUTOMATIC RECOGNITION OF TABLES IN CONSTRUCTION TENDER DOCUMENTS. Le système qu'ils ont conçu en 2002, consiste en deux modules principaux pour la reconnaissance des documents( tender document) suivants: · modérateur du tableau et · lecteur du tableau. Le modérateur du tableau aide des utilisateurs pour construire des modèles de formulaire, et le lecteur du tableau reconnaît les entrée des tableaux provenant du modèle de base des données et régénère des tableaux électroniques. 2. RAHGOZAR M. A. aux etats-unis a présenté en 2000 en collaboration avec firmes suivantes : Xerox Architecture Center, Xerox Corporation, Webster New York, 800 Phillips Rd., 0128-30E, Webster et NY 14580; une Approche qui est Basée sur Le « DOCUMENT TABLE RECOGNITION BY GRAPH REWRITING » (PARADIGME DE RECRIRE DES GRAPHIQUES). En premier lieu, l'image du document est transformée dans une disposition graphique dont les noeuds et les bords représentent respectivement des entités du document et leurs corrélations. Ce graphique est réecrit par la suite et utilise un ensemble de règles conçues et basées sur la connaissance à priori du document ainsi que les conventions générales de formatage. Le graphique résultant fournit à la fois la logique et la disposition envisagées du contenu du document. 3. Serges SHABANI lusamaki dans son travail de fin ce cycle à l'ISP/Bukavu intitulé LA RECONNAISSANCE DES FORMES DANS LA CORRECTION DES QUESTIONS A CHOIX MULTIPLES en 2004 et MUGARUKA Ntabaza dans CORRECTION DES QUESTIONS A CHOIX MULTIPLE PAR RECONNAISSANCE DES FORMES de la même année traitent de la reconnaissance du doicument. Il est à noter que les assertions qu'ils ont considérées, pour être reconnues devaient être rangées ligne par lignes comme dans un tableau, dont la première colonne est celle des numéros ou les lettres des réponses et la deuxième, celle des réponses elles-mêmes. Ils ont consideré le rapport entre le nombre des pixels entre l'assertion choisie et la première assertion. Le resultat de ce rapport et la première assertion donne des éléments sur la prise de décision de l'assertion qui a été choisie ou cohée. 4. B. Gatos, D. Danatsas, I. Pratikakis et S. J. Perantonis, des chercheurs d'Athènes en Grèce, ont devéloppé en 2005, AUTOMATIC TABLE DETECTION IN DOCUMENT IMAGES ils ont d'abord recherché les courses du tracé noir horizontal et vertical pour détérminer les lignes et les ont estimé les lignes horizontale et verticale et l'amélioration de l'estimation de ces ligne en utilisant le déménagement des régions de l'image/text. Ces chercheurs sont alors partis à la détéction du tableau proprement par la détermination des intersections des lignes et la détection de la reconstruction du tableau. 5. Luiz Antonio Pereira Neves , Joao Marques de Carvalho et Jacques Facon ont travaillé sur la RECOGNITION OF DETERIORATED TABLE-FORM DOCUMENTS: A NEW APPROACH : dans cette approche, ils essaient de réprésenter dans la matrice des réels les différents coins du tableau. Une analyse du tableau des réels devrait être faite. Chaque intersection des voisins est comparée à la référence du voisinage du tableau de réjection, puis du tableau des réfus. Avec cette méthode on détérmine les segments et par conséquent les cellules du tableau par la connaissance facile des coins sxtrêmes du tableau. 6. AN EFFICIENT RECOGNITION AND DATA EXTRACTION METHOD FOR TABLE-FORM DOCUMENTS approche des japonais Lin Yu Tseng et Rung-Ching Chent du département de Mathématique appliqué de l'université national de Chung Hsing Taichung en Taiwan en 1996. selon eux, Il faut d'abord extraire tous les segments des lignes horizontales, les segments des lignes verticales ainsi que et les segments des lignes penchées ou obliques de l'image du document ; ensuite, l'assemblage et la reconstruction du document. il y a trois types des champs à savoir : le champs de nom, le champs des données et le champs mixte. Un champ mixte est une combinaison des champs de nom et de champs des données. L'inconvénient de cette méthode est que l'on parcours deux fois la même image pour extraire le tableau. |
|