La reconnaissance optique de tableaux numerises : listes des étudiants inscrits de l'ISP/Bukavu( Télécharger le fichier original )par Richard ISHARA Institut Superieur Pedagogique - Licence 2010 |
II.2. RECONNAISSANCE DE DOCUMENTS A TABLEAU-FOMULAIREDETERIORE: NOUVELLE APPROCHE( En anglais:RECOGNITION OFDETERIORATED TABLE-FORM DOCUMENTS: A NEW APPROACH ) Cette deuxième méthode de reconnaissance d'un tableau duquel nous voulons parler a été réalisée par Luiz Antonio Pereira Neves et Joao Marques de Carvalho et Jacques Facon7(*). Le premier et le deuxième sont de l'université UFCG :Universidade Federal de Campina Grande - Campina Grande, PB, et le troisième de l'université 2PUCPR :Pontifcia Universidade Catolica do Parana - Curitiba, PR, tous du Brésil Ces chercheurs ont développé une approche qui tient compte des tableaux qu'ils appellent détériorés. Ce sont des tableaux inclinés légèrement lors du scanning ou ceux qui présentent des coins vides ou traits qui ne sont pas finis (intersection des traits qui ne se touchent pas). la méthodologie concerne la découverte ou la détection des formes taleau-formulaire. Pour l'extraction réussie de la forme des cellules, on utilise les étapes suivantes : 1. Extraction de la structure physique ; 2. Extraction de la structure logique ; 3. Structure hiérarchique ; Le schéma suivant l'illustre L'EXTRACTION DE LA STRUCTURE PHYSIQUE Cette structure a trois phases qui sont détaillées comme suit :
Acquisition des formes du tableau formulaires et seuillage - Acquisition -Echelle de niveau de gris -Binarisation de l'image
Exemple d'un tableau détérioré La détection de l'angle d'inclinaison du tableau-formulaire et sa correction -La détection de l'angle d'inclinaison -La correction de l'angle d'inclinaison de l'angle : rotation de laisser passer avec interpolation bilinéaire
Tableau précédent roté -Chaque coin ciblé est représenté par un élément structurel -l'opération de l'érosion produit des images contenant uniquement des racines des coins correspondant aux éléments structurels utilisés Localisation de l'intersection des lignes et leur identification
Tous les coins types reconnus sont stockés dans un tableau des réels suivant :
Remarquez que tous les coins qui ne se touchent pas sont représentés par des zéros dans la matrice Tableau des réels. Si l'on construit une autre matrice constituée par les éléments de l'image et que l'on représente les traits par des chiffres différents de zéro et les zones vides par des zéros, on aura construit la matrice appelée tableau des réjections ou encore tableau des refus. L'EXTRACTION DE LA STRUCTURE LOGIQUE Elle peut être détaillée par trois phases suivantes:
- Analyse du tableau des réels - Chaque intersection des voisins est comparée à la référence du voisinage du tableau de réjection Détection de l'erreur systématique En comparant le voisinage du tableau des réels au voisinage des éléments du tableau de rejection on détecte des fausses intersections car, celles-ci seront représentées dans la matrice de réjection par une succession des zéros dans tous les coins. Le tableau de refus peut avoir la forme suivante :
Il y a erreur d'intersection si le tableau d'erreurs donne un résultat suivant : Si une mauvaise intersection est trouvée dans le tableau des réels suivant une ligne, cette ligne est prolongée jusqu'à l'intersection. Cette erreur est corrigée de nord, sud, est et ouest de l'erreur. Ces opérations sont représentées par les étapes suivantes : Analyse de l'erreur récursive et la correction Extraction des cellules des tableaux formulaires STRUCTURE HIERARCHIQUE Les erreurs corrigées, on a en fin un tableau interprétable facilement et dont les paramettres à savoir les lignes et les colonnes sont bien reconnues. Identification de la structure hiérarchique Les parties hierarchiques du document étant connues et l'extraction des cellules atant faite par l'analyse de sa forme grâce à l'interprétation de ses points des coins dans la structure hierarchique, il ne restera qu'à traiter les cellules individuellement et reconstruire le tableau après reconnaissance. * 7Luiz Antonio Pereira Neves , Joao Marques de Carvalho et Jacques Facon, Recognition of deteriorated table-form documents: a new approach, Brazil,2009. |
|