WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

La reconnaissance optique de tableaux numerises : listes des étudiants inscrits de l'ISP/Bukavu

( Télécharger le fichier original )
par Richard ISHARA
Institut Superieur Pedagogique - Licence 2010
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

II.2. RECONNAISSANCE DE DOCUMENTS A TABLEAU-FOMULAIRE

DETERIORE: NOUVELLE APPROCHE( En anglais:RECOGNITION OF

DETERIORATED TABLE-FORM DOCUMENTS: A NEW APPROACH )

Cette deuxième méthode de reconnaissance d'un tableau duquel nous voulons parler a été réalisée par Luiz Antonio Pereira Neves et Joao Marques de Carvalho et Jacques Facon7(*). Le premier et le deuxième sont de l'université UFCG :Universidade Federal de Campina Grande - Campina Grande, PB, et le troisième de l'université 2PUCPR :Pontifcia Universidade Catolica do Parana - Curitiba, PR, tous du Brésil

Ces chercheurs ont développé une approche qui tient compte des tableaux qu'ils appellent détériorés. Ce sont des tableaux inclinés légèrement lors du scanning ou ceux qui présentent des coins vides ou traits qui ne sont pas finis (intersection des traits qui ne se touchent pas).

la méthodologie concerne la découverte ou la détection des formes taleau-formulaire. Pour l'extraction réussie de la forme des cellules, on utilise les étapes suivantes :

1. Extraction de la structure physique ;

2. Extraction de la structure logique ;

3. Structure hiérarchique ;

Le schéma suivant l'illustre

L'EXTRACTION DE LA STRUCTURE PHYSIQUE  Cette structure a trois phases qui sont détaillées comme suit :

1. Acquisition des formes du tableau-formulaire et seuillage ;

2. La détection de l'angle d'inclinaison du tableau-formulaire et sa correction ;

3. Localisation de l'intersection des lignes et leur identification ;

Acquisition des formes du tableau formulaires et seuillage

- Acquisition

-Echelle de niveau de gris

-Binarisation de l'image

Exemple d'un tableau détérioré

La détection de l'angle d'inclinaison du tableau-formulaire et sa correction

-La détection de l'angle d'inclinaison 

-La correction de l'angle d'inclinaison de l'angle : rotation de laisser passer avec interpolation bilinéaire

Tableau précédent roté

-Chaque coin ciblé est représenté par un élément structurel

-l'opération de l'érosion produit des images contenant uniquement des racines des coins correspondant aux éléments structurels utilisés

Localisation de l'intersection des lignes et leur identification

Tous les coins types reconnus sont stockés dans un tableau des réels suivant :

Remarquez que tous les coins qui ne se touchent pas sont représentés par des zéros dans la matrice Tableau des réels. Si l'on construit une autre matrice constituée par les éléments de l'image et que l'on représente les traits par des chiffres différents de zéro et les zones vides par des zéros, on aura construit la matrice appelée tableau des réjections ou encore tableau des refus.

L'EXTRACTION DE LA STRUCTURE LOGIQUE  Elle peut être détaillée par trois phases suivantes:

1. Détection de l'erreur systématique;

2. Analyse de l'erreur récursive et la correction ;

3. Extraction des cellules des tableaux formulaires.

- Analyse du tableau des réels

- Chaque intersection des voisins est comparée à la référence du voisinage du tableau de réjection

Détection de l'erreur systématique

En comparant le voisinage du tableau des réels au voisinage des éléments du tableau de rejection on détecte des fausses intersections car, celles-ci seront représentées dans la matrice de réjection par une succession des zéros dans tous les coins.

Le tableau de refus peut avoir la forme suivante :

Il y a erreur d'intersection si le tableau d'erreurs donne un résultat suivant :

Si une mauvaise intersection est trouvée dans le tableau des réels suivant une ligne, cette ligne est prolongée jusqu'à l'intersection. Cette erreur est corrigée de nord, sud, est et ouest de l'erreur. Ces opérations sont représentées par les étapes suivantes :

Analyse de l'erreur récursive et la correction

Extraction des cellules des tableaux formulaires

STRUCTURE HIERARCHIQUE

Les erreurs corrigées, on a en fin un tableau interprétable facilement et dont les paramettres à savoir les lignes et les colonnes sont bien reconnues.

Identification de la structure hiérarchique

Les parties hierarchiques du document étant connues et l'extraction des cellules atant faite par l'analyse de sa forme grâce à l'interprétation de ses points des coins dans la structure hierarchique, il ne restera qu'à traiter les cellules individuellement et reconstruire le tableau après reconnaissance.

* 7Luiz Antonio Pereira Neves , Joao Marques de Carvalho et Jacques Facon, Recognition of deteriorated table-form documents: a new approach, Brazil,2009.

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Le don sans la technique n'est qu'une maladie"