ANNEXE A. SEGMENTS CLASSÉS PAR LEURS
POSITIONS
Codes assignés
Images des segments
Caractères possibles
11
Ignorer
Toutes autres formes sont ignorées
3
1
2
4
5
6
7
8
9
10
TABLE A.2 - Segments Milieux
83
84
ANNEXE A. SEGMENTS CLASSÉS PAR LEURS
POSITIONS
Codes assignés
Caractères possibles
Images des segments
7
4
3
1
2
5
6
8
10
3
11
12
13
14
TABLE A.3 - Segments finals
ANNEXE A. SEGMENTS CLASSÉS PAR LEURS
POSITIONS
1
Images des segments
Caractères possibles
16
Ignorer
Toutes autres formes sont ignorées
6
8
9
10
11
12
85
TABLE A.4 - Segments isolés
TABLE B.1 - Caractères utilisés
pour l'apprentissage du réseau de neurone
Annexe113
Description de la base
Dans tout système de reconnaissance de formes, il est
nécessaire d'avoir une base de données afin d'effectuer les
traitements nécessaire. Les documents utilisés sont de mise en
page simple. Ils ne contiennent pas des images. Les fontes des textes dans ces
documents sont : Arial et Time New Roman dans des tailles variantes entre 12 et
20. L'interligne est uniforme entre les paragraphes. Le style de la fonte est
soit normale soit gras. La figure-B.1 présente un aperçu sur base
utilisée :
FIGURE B.1 - Aperçu sur la base
Cette base contient 40 textes dont le nombre de
caractère vari d'un texte à l'autre. Elle est devisée en
deux sections : 30 pour l'apprentissage et 10 pour le test. Les
caractères utilisés pour l'apprentissage sont devisés
selon leurs positions dans le mot (tableau-B.1).
|
Caractères Isolés
|
Caractères Initials
|
Caractères Milieux
|
Caractère Finals
|
Nombre de segments
|
384
|
418
|
356
|
372
|
|