CHAPITRE 4. EXPÉRIMENTATION ET
ÉVALUATION
4.1.1 Evaluation globale
Dans l'évaluation de boîte noire, un
système OCR est traité comme une unité indivisible. La
seule évaluation possible est de calculer le taux d'erreur ou le taux de
reconnaissance. Pour se faire, nous avons besoin de trouver les erreurs. Cela
revient à mesurer, par mise en correspondance entre les couples de
chaînes de références et de résultats, les ajouts,
les suppressions et les substitutions [BC06].
4.1.2 Evaluation locale
L'évaluation boîte blanche, caractérise la
performance de sous-modules individuels. La plupart des systèmes d'OCR
ont des sous-modules de détection et de correction d'inclinaison, la
page la segmentation, classification de zone, et l'extraction de texte.
L'évaluation boîte blanche n'est possible que si
l'évaluateur a accès à l'entrée et la sortie des
sous-modules du système de reconnaissance. Ainsi pour évaluation
de la segmentation, l'accès aux coordonnées des zones produites
par OCR est essentiel.
Tandis que l'évaluation de boîte noire ne
nécessite pas l'accès aux résultats intermédiaires,
elle ne fournit pas l'analyse de la performance au niveau sous-module. En
outre, les évaluations décrites dans la section-4.3 ne
déterminent que le taux de reconnaissance de système.
|