Projet de taxinomie des
connecteurs du français
pour le traitement
automatique : l'exemple
des consécutifs
Sébastien Druon
Mémoire de maîtrise de Sciences du Langage sous
la direction de M. Busquets Université Michel de Montaigne --
Bordeaux III
Remerciements
Je tiens avant tout à remercier M. Busquets pour avoir
bien voulu diriger mon mémoire, ainsi que pour son aide, ses conseils
judicieux, et particulièrement sa grande disponibilité tout au
long de l'année.
Je remercie aussi M. Lambert pour avoir accepté de
co-diriger ce travail.
Enfin, je tiens de même à remercier Nathalie
Faure, Benoit Ladune, Jean-Luc Bergey et tout particulièrement mon
père d'avoir consacré une partie de leur temps à la
relecture mon mémoire.
Table des matières
Table des matières i
Table des figures v
Liste des tableaux vi
Introduction 1
Le traitement automatique du langage 1
L'analyse du discours 2
Aperçu du mémoire 2
1 Les connecteurs 4
1.1 Qu'est-ce qu'un connecteur? 4
1.1.1 Définition 4
1.1.2 Problèmes de terminologie 5
1.2 Les connecteurs dans la grammaire traditionnelle 6
1.2.1 Les connecteurs: une classe non uniforme 6
1.2.2 Les problèmes de l'approche de la grammaire
tradi-
tionnelle 10
1.3 Niveaux d'analyse des connecteurs 12
1.3.1 Analyse syntaxique 12
1.3.2 Analyse sémantique vériconditionnelle 14
1.3.3 Sémantique vs. pragmatique 17
1.4 Cadre de description 19
2 Un modèle de la cohérence textuelle : la
RST de Mann et Thompson 21
2.1 Qu'est-ce qu'un texte cohérent? 21
2.1.1 Définition de la cohérence 21
2.1.2 Cohérence, cohésion et connexité
22
2.1.3 Déterminer la cohérence d'un texte 23
2.2 L'objet de la RST 24
2.3 Cohérence du texte: les relations rhétoriques
25
2.3.1 Unité élémentaire: le segment de
discours 25
2.3.2 Les relations rhétoriques 26
2.3.3 Définition et distinction des relations 27
2.3.4 Le nombre de relations 28
2.4 La nucléarité 28
2.4.1 Noyau 29
2.4.2 Satellite 30
2.5 Représentation graphique: les arbres
rhétoriques 30
2.5.1 Les schémas 31
2.5.2 Relations mononucléaires 31
2.5.3 Relations multinucléaires 32
2.5.4 Un exemple d'analyse 32
2.6 Quelques propriétés formelles de la RST 35
2.6.1 L'application de schémas 35
2.6.2 Justification de la structure arborescente de l'analyse
35
Table des matières
|
iii
|
|
|
2.6.3 RST comme grammaire indépendante du contexte .
.
|
37
|
|
2.7
|
Discussion
|
37
|
|
|
2.7.1 Le nombre de relations
|
38
|
|
|
2.7.2 Problème de la définition des relations
|
38
|
|
|
2.7.3 Les niveaux d'analyse
|
39
|
|
|
2.7.4 La prise en compte des intentions
|
40
|
|
2.8
|
RST et connecteurs
|
40
|
|
|
2.8.1 Connecteurs et structure du discours
|
40
|
|
|
2.8.2 Connecteurs comme prédicats
|
41
|
|
|
2.8.3 Problèmes
|
41
|
3
|
Étude de quelques connecteurs de
conséquence
|
43
|
|
3.1
|
Méthodologie
|
43
|
|
|
3.1.1 L'analyse de corpus
|
43
|
|
|
3.1.2 Le corpus Linux-Howto
|
44
|
|
|
3.1.3 Construire une taxinomie
|
44
|
|
3.2
|
La conséquence
|
49
|
|
|
3.2.1 La notion de conséquence
|
49
|
|
|
3.2.2 Les moyens d'exprimer la conséquence en
français . .
|
52
|
|
|
3.2.3 Les connecteurs de conséquence
|
53
|
|
3.3
|
Analyse de quelques connecteurs de conséquence
|
55
|
|
|
3.3.1 Conséquence et concomitance: donc
|
56
|
|
|
3.3.2 Conséquence et succession temporelle: alors
|
61
|
|
|
3.3.3 Conséquence pure : par conséquent
|
65
|
|
|
3.3.4 Conséquence factuelle: de sorte que
|
68
|
|
3.4
|
Proposition d'une taxinomie des connecteurs analysés. .
. .
|
71
|
3.4.1 Les traits motivés par l'analyse 72
3.4.2 Taxinomie des connecteurs consécutifs
étudiés . . . 74
3.5 Conclusions et problèmes 74
Conclusion 79
Bibliographie 82
A Statistiques 87
B Corpus de connecteurs du français 89
|