CHAPITRE 4. EXPÉRIMENTATION ET
ÉVALUATION
4.2.2 Segmentation
La phase de segmentation est composée de trois
étapes : la segmentation en ligne, la séparation des mots
(sous-mots) et des signes diacritiques et enfin la segmentation en
caractères.
- Segmentation en lignes : Ce module
accepte comme entrées la squelette du document texte issue de la
squelettisation. Son but est de détecter les lignes dans l'image puis
les séparer. La figure-15 présente le résultat de la phase
de segmentation en ligne. La ligne bleu présente la ligne de base et la
ligne rose présente la ligne de base supérieure.

FIGURE 4.3 - Segmentation en ligne
La destination des lignes séparées obtenues est
la segmentation en mots (sou-mots).
- Segmentation en PAW : Ce sous
module détecte toutes les formes connectées dans l'image des
lignes. Il se charge de les classer en sous-mots et signes diacritiques. Les
mots sont encadrés en vert et les signes diacritiques sont
encadrés en rouge tel qu'il est présenté dans la figure
suivante :

FIGURE 4.4 - Séparation des mots et détection des
signes diacritiques
59

60
|