1.3.2 Segmentation
Après l'étape de prétraitements, la
majorité des systèmes de reconnaissances se trouvent
confrontés au problème de la segmentation des entités
à reconnaitre. Dans le cas d'un document imprimé, la segmentation
s'effectue à différents niveaux. Elle peut s'attacher à la
localisation des blocs de lignes (les colonnes), des groupes de lignes (les
paragraphes), des lignes, des mots, des caractères et enfin des parties
de caractères. Chaque entité possède ses propres
caractéristiques. Généralement, la performance d'un
système de reconnaissance dépend essentiellement du taux de
réussite de la segmentation du mot en caractères. Ceci est vrai
pour la reconnaissance du texte cursif et en particulier dans le cas de
l'écriture arabe. Nous traiterons la phase de segmentation dans la
partie suivante.
13
|