5.7 Comparaison de l'analyse quantitative manuelle et
de l'analyse quantitative donnée par l'illustrateur
Dans le tableau de la page suivante nous présentons la
comparaison de l'analyse quantitative manuelle que nous avons faite sur le
corpus Linux-Howto et l'analyse quantitative donnée par
l'analyseur.
Dans l'ensemble les connecteurs sont bien
désambigüisés, ce qui est normal car en dehors de aussi
et de alors, un simple pattern-matching suffit pour rendre
non-ambigu le sens d'un connecteur. En revanche, les résultats sont
mauvais pour alors, le système trouvant beaucoup plus de
relations de conséquence introduites par ce connecteur que ce qu'il en
est en réalité. Le connecteur ainsi quant à lui
est relativement bien désambigüisé.
En ce qui concerne les autres indices, le système a
tendance à sur- générer quelque peu des relations en
présence de l'indice ceci / cela et à avoir de bons
résultats autrement. Notons que le nombre de relations de
conséquence en présence d'un participe présent est faible
dans le corpus Linux-Howto et que les résultats en sont par
conséquent médiocres. Nous obtenons des résultats
très honorables sur le corpus La Recherche.
5.8 Conclusions
Notre analyseur reconnaît dans la plupart des cas la
présence de relations de conséquence et il obtient des
résultats relativement proches de l'analyse manuelle.
En revanche, il a une tendance sensible à
surgénérer dans certains
|
Autre indice
|
ceci / cela
|
ce qui
|
pt. pr.
|
analyse manuelle
|
26
|
20,5%
|
7
|
5,5%
|
2
|
1,6%
|
illustrateur
|
36
|
22,1%
|
7
|
4,3%
|
4
|
2,5%
|
Connecteur
|
ainsi alors ce faisant ce qui fait que dans ce cas donc par
conséquent pour cette raison
|
23
|
18,1%
|
11
|
8,7%
|
1
|
0,8%
|
3
|
2,4%
|
4
|
3,1%
|
42
|
33,0%
|
7
|
5,5%
|
1
|
0,8%
|
30
|
18,4%
|
27
|
16,6%
|
1
|
0,6%
|
3
|
1,8%
|
4
|
2,5%
|
42
|
25,8%
|
7
|
4,3%
|
1
|
0,6%
|
analyse manuelle
illustrateur
FIG. 5.2 - Comparaison analyse manuelle / analyse de
l'illustrateur
cas. Il nous faudra donc résoudre les problèmes
d'implémentation que nous avons soulevé (reconnaissance d'une
proposition complète, gestion des verbes efficients...) et affiner
l'analyse linguistique et le système informatique afin d'éviter
cette surgénération et de bien délimiter les propositions
que relient la relation de conséquence.
|