WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

La reconnaissance optique de tableaux numerises : listes des étudiants inscrits de l'ISP/Bukavu

( Télécharger le fichier original )
par Richard ISHARA
Institut Superieur Pedagogique - Licence 2010
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

SIGLES ET ABREVIATIONS

1. ISP : Institut Supérieure Pédagogique ;

2. IG : Informatique de Gestion ;

3. BMP :Bitmap

4. PIXEL :Picture element

5. Ppp : Points Par Pouce ;

6. ROT :Reconnaissance Optique des Tableaux ;

7. ROC :Reconnaissance Optique des Caractères ;

8. ps :PostSscript ;

9. bat : batch ;

10. HTML : Hyper Text Markup Langage ;

11. JPEG : Joint Photographic Experts Group ;

12. http :HyperTexte Transport Protocol;

13. www :World Wide Web ;

14. SVM : Machine à Vecteurs de Support ;

15. DOS : Disc Operating System ;

16. GIF : Graphics Interchange Format

RESUME

La reconnaissance optique des données numériques trouvées dans des tableaux pose d'énormes problèmes de distinction des tracés du tableau et les données contenues dans les cellules de celui-ci.

Le présent travail examine les possibilités de séparer les tracés du tableau et le contenu qui peut être des chaines de caractères, et renvoie les éléments au programme de reconnaissance optique des caractères en des petites images.

Le programme ainsi conçu utilisera les méthodes de projection horizontale et verticale du tableau des pixels, la reconnaissance hors ligne et les astuces de voisinage des pixels.

Le résultat obtenu nous permet de confirmer avoir atteint nos objectifs, car, les images remises en retour peuvent être traitées par un logiciel de reconnaissance optique des caractères et le résultat peut être stocké dans un classeur usuel ou les bases des données.

Mots clés : Reconnaissance, Optique, T ableaux

ABSTRACT

Optical recognition of numeric datas founds in arrays has got problems of making distinction between arrays and their datas.

This research parper aims at examining possibilities of separating arrays and their conteint which can be strings of caracteres. It sends elements like images to the programm's optical recognition of caracteres.

There for, this programme will be using the horizontal and vertaical's projections, out of lines recognition's method and pixels which are in neighbourood amoung themselves.

Thus, as far as the images found in return which can be treated by optical recognition program of caracteres and its result can be stocked in the file or in the data base are concerned, we can confirm that we have attended the objective.

Key word: Recognition, Optical, T ables.

1. I. INTRODUCTION

2. I.1. PROBLEMATIQUE

Dans les pays qui envisagent le développement, l'histoire a une nécessité pour l'appréhension du présent et la préparation du futur.

En effet, Pour que l'on soit informé du passé, il faut apprendre l'histoire et cela à travers beaucoup de sources entre autres les documents écrits.

Parce que présent système aura besoin d'une information harchivée nécessaire du passé, il est important de coder les informations que nous avons en possession.  Néanmoins avec l'évolution de la technologie, le moyen le plus fiable et rapide pour protéger les informations s'avère être leur stockage dans des procédés informatiques.

L'informatique étant jeune par rapport à l'époque des machines mécaniques et améliorée du jour le jour, les informations se trouvant sur des documents tapées à la machine mécanique ou sur des documents imprimés longtemps plus tôt, et dont le format numériques est perdu sont appelées à être codées de nouveau et stockées dans des ordinateurs pour qu'elles soient, soit traitées ou soit consultées en vue d'une prise de décision ultérieure quelconque.

Il se pose alors un problème de temps, d'efforts et d'énergie pour la ressaisie de ces documents, car leur nombre est devenu de plus en plus croissant.

C'est pour ces raisons que des informaticiens se sont mis à mettre sur pieds des astuces qui servent non seulement à scanner des documents texte mais aussi de reconnaitre les caractères se trouvant sur les images optenues après scanning.

Pourtant, certains documents ont des données complexes, par exemple celles contenues dans des tableaux; alors que les programmes de ROC peinent à traiter les tableaux. De plus, leur vérification est difficile: ils contiennent de nombreux chiffres, souvent avec des espaces, points ou virgules, et il n'est pas aisé de décaler des cellules d'une ligne ou d'une colonne. Il leur faut un effort particulier de concentration et une rélecture obstinée et intense, une vérification soigneuse, et un bon contrôle de qualité1(*).

Le traitement de ces données par les programmes de reconnaissance optique des caractères dévient plus difficile en raison des traits, des lignes et des colonnes; mais quelques fois, la séparation des données qui se trouvent dans deux cellules consécutives.

De ce fait,

- La détérmination de la forme de tableau et la reconnaissance des lignes, des colonnes ainsi que des limites de cellules obtenues de ces dernières posant des difficultés importantes, la reconnaissance des lignes et des colonnes permettra-t-elle la reconnaissance du tableau tout entier ?

- les cellules du tableau numérisé et reconnues doivent être retournées individuellement dans des images bitmap propres ; quels sont les moyens qui seront mis sur base pour écrire les octets réprésentant ces cellules peuvent elles être utilisés ?

- pourquoi les images retournées en sortie, doivent-elles avoir des caractéristiques qui permettront la susceptibilité d'être reconnues sans difficulté par des logiciels de ROC ?

Telles sont les genres des questions auxquelles nous donnerons des réponses dans ce mémoire.

* 1. http://www.greenstone.org/.../charter.htm, valide le 16 octobre 2010.

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"I don't believe we shall ever have a good money again before we take the thing out of the hand of governments. We can't take it violently, out of the hands of governments, all we can do is by some sly roundabout way introduce something that they can't stop ..."   Friedrich Hayek (1899-1992) en 1984