CHAPITRE 4. EXPÉRIMENTATION ET
ÉVALUATION
Nous proposons de comparer nos résultats avec d'autres
travaux. En fait, le tableau-4.5 présente les valeurs des mesures des
taux de reconnaissance trouvées par ces systèmes.
TABLE 4.5 - Comparaison des résultats
Auteurs
|
Taux de reconnaissance
|
Classifieur
|
Notre Contribution, 2012
|
87.94%
|
PMC-AG
|
[KD07]
|
97,1%
|
PMC-AG
|
[OSB+02]
|
87.54%
|
PMC-AG
|
Le taux de reconnaissance de notre contribution parait faible
par rapport à celle de [KD07]. Cette lacune se justifie par le fait que
[KD07] utilise une base des chiffres de 0 à 9, au temps que, notre
système est apliqué sur l'écriture arabe qui se
caractérise par un vocabulaire large.
Aussi bien, la phase de post-traitement peut améliorer
le taux de reconaissance jusqu'au 10%. Nous ne sommes pas arrivés
à terminer cette phase qui peut avoir une grande influence sur le taux
de reconnaissance du système.
Conclusion
L'objectif principal de notre contrubition est de
sélectionner les primitives pertinentes dans un système de
reconnaissance des caractères arabes imprimés multifontes. Cet
objectif est aboutu car les résultats par les AGs sont satisfaisants. En
effet, le nombre de primitives a chuté de sept primitives, passant de 27
à 20.
L'évaluation de notre système de reconnaissance
proposé permet d'évaluer les performances de l'algorithme
utilisé, son efficacité ainsi que ses faiblesses. En plus de
pouvoir apprécier les résultats obtenus, cette évaluation
peut donner des indices sur les points à améliorer
ultérieurement. Plusieurs systèmes de reconnaissances tant
analytiques que globales sont élaborés. Toutefois, aucune de ces
approches de reconnaissance ne donne des résultats parfaits du fait de
la complexité du sujet. Le problème reste ouvert et de nouveaux
efforts sont à déployer pour améliorer les approches de
reconnaissance d'écriture arabe.
Conclusion et Perspectives
L
A revue de la littérature relative à la
reconnaissance d'écriture, dans le premier chapitre du
présent rapport, nous a permis de comprendre que
l'objectif visé par les système d'OCR est de diminuer
l'intervention de l'être humain. Parmi les problèmes qui peuvent
influencer sur la qualité d'un système de reconnaissance, le
choix de primitives qui caractérisent la forme à
reconnaître.
L'originalité de notre travail réside dans le
fait que le système de reconnaissance de texte arabe ne suit pas le
schéma classique qui consiste à segmenter les mots en
caractères, extraire les caractéristiques et faire la
classification. Notre approche part du fait que les primitives extraites ne
sont pas toujours fiable. En ce sens, notre système essaie d'adapter la
meilleure solution du problème en question. Pour se faire, nous
proposons une approche d'optimisation pour sélectionner les primitives
pertinentes.
Notre travail se situe dans le cadre de reconnaissance de
l'écriture arabe imprimé mul-tifonte. Nous avons
présenté une approche hybride pour la reconnaissance des
caractères arabes imprimés. Cette technique offre l'avantage de
sélectionner les primitives les plus représentatives, ce qui
améliore la qualité de reconnaissance. La sélection des
primitives est l'une des étapes les plus importantes dans un
système de reconnaissance. Elle a fait l'objet de recherche dans de
nombreuses disciplines. La sélection des primitives tends à
réduire le nombre de primitives en éliminant les primitives
redondantes du système de reconnaissance. Un second objectif de cette
sélection est de maintenir et/ou améliorer la performance du
classifieur utilisé par le système de reconnaissance.
De différentes études ont été
proposées dans la littérature pour la sélection de
primitives. Notre orientation s'est focalisée sur les algorithmes
génétiques. Une fois que nous avons déterminé les
paramètres de l'AG tels que : la taille de la population, le nombre de
génération et les méthodes de reproduction, la
séléction de primitives commence. Les paramètres de
l'algorithme génétique sont définis
expérimentalement.
Les résultats obtenus lors de la sélection de
primitives ont permis de réduire la complexité
75
Conclusion et Perspectives
du perceptron multicouche. Le nombre de primitives a
été réduit de 25% par rapport à l'ensemble extraits
du système de reconnaissance des caractères. Il est difficile
d'effectuer une comparaison objective et exhaustive entre la performance de
notre de système et celles d'autres systèmes publiés. En
effet, les ensembles de test sont différents et les mesures de
performance ne sont pas définies clairement. De plus, il n'est pas
possible de déterminer si les échantillons d'apprentissages et de
tests sont mutuellement exclusifs. De même, nous avons constaté
que le problème de sélection de primitives n'a pas
été traité.
L'effort requis pour la préparation d'un ensemble de
tests significatifs constitue en réalité un obstacle majeur pour
une expérimentation valable du point de vu statistique. Il est donc
nécessaire que les efforts concentrent dans l'élaboration d'une
base standard de l'écriture arabe qui pourrait servir dans
l'évaluation des différents systèmes de reconnaissance.
Comme perspectives, nous estimons qu'un post-traitement
lexical basé sur un dictionnaire peut encore améliorer le taux de
reconnaissance. Ceci à montrer son utilité dans plusieurs
systèmes de reconnaissances d'écritures arabes.
Autre perspective, sera d'effectuer une sélection en
utilisant les algorithmes génétiques itératifs non pas les
algorithmes génétiques simples.
|