CHAPITRE 1. LA RECONNAISSANCE OPTIQUE DES
CARACTÈRES
1.3.5.3 Approche statistique
Une forme est représentée par un vecteur de
paramètre. Une étude statistique effectuée sur l'ensemble
de ces vecteurs permet de les regrouper en classe. L'étude de
répartition des formes à reconnaitre dans un espace
métrique et la caractérisation statistique des classes permettent
de prendre une décision de reconnaissance. Cette décision est de
type plus fort probabilité d'appartenir à une classe. Une
étude détaillée sur les méthodes statistiques se
trouve dans [JDJ00]. Dans ce qui suit, nous décrivons trois
méthodes statistiques parmi les plus couramment utilisées.
- L'approche bayésienne : La
classification bayésienne consiste à calculer la
probabilité a posteriori de chaque classe de forme sur les
paramètres extraits, la probabilité conditionnelle du vecteur des
paramètres étant donnée la classe et la probabilité
à priori de chaque classe. Dans le domaine de reconnaissance des
caractères arabes, cette méthode a été
utilisée dans le travail de [TB07].
- La méthode de k plus proche voisin
: K plus proche voisin est une méthode de
raisonnement à partir des cas. Elle consiste à prendre des
décisions en recherchant des cas similaires déjà
résolus en mémoire. C'est l'une des méthodes les plus
simples. Etant donnée une base d'apprentissage d'images, pour classer un
nouveau cas, le classifieur KPPV6 cherche ces K plus proches voisins
et prédit la réponse la plus fréquente. Deux
paramètre sont utilisés par cette méthode : le nombre K et
la fonction de similarité. Cette méthode est utilisée dans
[Der09] pour la reconnaissance des chiffres imprimés.
- Les réseaux de neurones:
Les classifieur de type réseaux de neurones proviennent
d'une modélisation des neurones biologiques. Un neurone permet de
définir une fonction discriminante linéaire dans l'espace de
représentation des entrées. Les réseaux de neurones ont
connu un grand essor pour la reconnaissance de l'arabe. ILs sont
utilisés dans un nombre remarquable de travaux tels que [CBB01, Der09,
Tim01]. Nous viendrons sur les réseaux de neurones dans le
deuxième chapitre de cette mémoire.
1.3.5.4 Les approches hybrides
Dans [Feh99, Men08, Reb07], les chercheurs utilisent une
collaboration entre une approche statistique et une approche structurelle. Ces
systèmes opèrent sur deux niveaux : Le premier extrait puis
reconnaît les primitives des formes grâce à un classifieur
statistique. Le dexième
6. K plus proche voisin
19
|