Abstract
I
N this work we aim at developping a multifonts printed arabic
texts recognition system. the proposed approache is about the combination of
two techniques Feature selection and character recognition. The adopted
recognition method is based on a hybrid technique which consists of putting
together; the neural networks multilayer perceptron and the genetic algorithms.
One objective of this work is to propose a hybrid approach for the feature
selection. The choice of this technique is motivated by its success in the
recognition of digits. Indeed, the interest of this Neuro-Genetic model is the
fact that it is able to improve the discriminatory capacity of pure perceptron
multilayer.
Key words : Arabic character recognition ,
Feature selection, Perceptron multilayer, Genetic algorithm.
Table des matières
Introduction générale
1 La Reconnaissance Optique des
Caractères
1.1 Différents aspects de l'OCR
|
1
3
3
|
|
1.1.1
|
Type d'acquisition
|
4
|
|
|
1.1.1.1 Les systèmes en-lignes
|
5
|
|
|
1.1.1.2 Les systèmes hors-lignes
|
5
|
|
1.1.2
|
Approche de reconnaissance
|
6
|
|
|
1.1.2.1 Approche globale
|
6
|
|
|
1.1.2.2 Approche analytique
|
6
|
1.2
|
Caractéristiques de l'écriture arabe
|
7
|
1.3
|
Organisation d'un système de reconnaissance
|
10
|
|
1.3.1
|
Prétraitement
|
11
|
|
|
1.3.1.1 Binarisation
|
11
|
|
|
1.3.1.2 Lissage
|
12
|
|
|
1.3.1.3 Normalisation
|
12
|
|
|
1.3.1.4 Squelittisation
|
12
|
|
1.3.2
|
Segmentation
|
12
|
|
|
1.3.2.1 Segmentation en lignes
|
13
|
|
|
1.3.2.2 Segmentation en mots
|
13
|
|
|
1.3.2.3 Segmentation en caractère
|
14
|
|
1.3.3
|
Extraction des primitives
|
14
|
|
|
1.3.3.1 Primitives locales
|
14
|
|
|
1.3.3.2 Primitives globales
|
15
|
|
1.3.4
|
Apprentissage
|
15
|
|
|
1.3.4.1 Apprentissage Supervisé
|
15
|
|
|
TABLE DES MATIÈRES
|
|
|
1.3.4.2 Apprentissage Non Supervisé
1.3.5 Reconnaissance
1.3.5.1 Approche structurelle
1.3.5.2 Approche stochastique
1.3.5.3 Approche statistique
1.3.5.4 Les approches hybrides
1.3.6 Post-traitement
|
16
16
16
17
18
18
19
|
2
|
Fondements Théoriques
|
20
|
|
2.1
|
Le réseau perceptron multicouche
|
20
|
|
|
2.1.1 Le perceptron simple
|
21
|
|
|
2.1.2 Architecture d'un perceptron multicouche
|
23
|
|
|
2.1.3 Apprentissage d'un perceptron multicouches
|
25
|
|
2.2
|
Les algorithmes génétiques
|
27
|
|
|
2.2.1 Génération de la population initiale
|
28
|
|
|
2.2.2 Codage
|
29
|
|
|
2.2.3 Fonction d'évaluation
|
29
|
|
|
2.2.4 Sélection
|
30
|
|
|
2.2.5 Croisement
|
31
|
|
|
2.2.6 Mutation
|
32
|
|
|
2.2.7 Insertion
|
33
|
|
|
2.2.8 Critère d'arrêt
|
34
|
|
2.3
|
L'hybridation neuro-génétique
|
34
|
|
|
2.3.1 Système de OLIVEIRA
|
35
|
|
|
2.3.2 Système de KROUCHI et DJEBBAR
|
36
|
3
|
Contributions à la reconnaissance Des
caractères arabes imprimés
|
38
|
|
3.1
|
Position du problème
|
38
|
|
3.2
|
Justification de l'approche choisie
|
39
|
|
|
3.2.1 Les procédures de recherche
|
40
|
|
|
3.2.2 Les fonctions d'évaluation
|
41
|
|
3.3
|
Système proposé
|
42
|
|
|
3.3.1 Description générale
|
42
|
|
|
3.3.2 Description détaillée
|
43
|
|
|
3.3.2.1 Prétraitement
|
44
|
|
|
3.3.2.2 Segmentation
|
46
|
|
|
3.3.2.3 Extraction des primitives
|
49
|
|
|
|
ii
|
TABLE DES MATIÈRES
3.3.2.4 Sélection des primitives 51
3.3.2.5 Reconnaissance 53
3.3.2.6 Post traitement 54
4 Expérimentation et évaluation
56
4.1 Méthodes d'évaluation d'un OCR 56
4.1.1 Evaluation globale 57
4.1.2 Evaluation locale 57
4.2 Expérimentation 57
4.2.1 Prétraitement 58
4.2.2 Segmentation 59
4.2.3 Extraction des primitives 61
4.2.4 Sélection des primitives 63
4.2.5 Apprentissage 68
4.2.6 Reconnaissance 70
4.3 Evaluation de notre système 72
Conclusion et perspectives 73
Bibliographie 76
A Segments classés par leurs positions
81
B Description de la base 86
iii
|