UNIVERSITE
DE TOULOUSE
LE
IRAIL
Approche exploratoire de
la relation de
conséquence: description
et implémentation
Sébastien Druon
Mémoire de DEA de Sciences du Langage sous la
direction de Mme Péry-Woodley Université Toulouse 2 -- Le
Mirail
Remerciements
Je remercie Marie-Paule Péry-Woodley pour avoir
accepté de diriger ce travail ainsi que pour le suivi qu'elle m'a
accordé tout au long de l'année et sa constante
amabilité.
Je tiens également à remercier Joan Busquets
pour la relecture de certaines parties et pour ses encouragements.
Enfin, je remercie aussi mes deux relecteurs qui ont
consacré une partie de leur temps aux dernières corrections de ce
mémoire: mon père et Céline Raynal.
Table des matières
Table des figures v
Liste des tableaux vi
Liste des algorithmes vii
Liste des définitions viii
Notations i
Introduction
1 Cadre global et méthodologie
1.1 LaRST
1.1.1 Les segments de discours
1.1.2 Les relations rhétoriques
1.1.3 Lanucléarité
1.1.4 Représentation graphique de la structure
rhétorique
1.2 Vers un analyseur rhétorique
1.2.1 L'approche pattern-matching
1.2.2 L'approche morpho-syntaxique
1.2.3 L'intégration de l'interface
sémantique-pragmatique
1.2.4 Applications: compréhension automatique de
textes
et résumé automatique
1.3 L'analyse de corpus
1.3.1 Une approche exploratoire
1.3.2 Corpus utilisés
1.3.3 Méthodologie
2 Préalables théoriques
2.1 La conséquence
2.1.1 Conséquence logique, effet, résultat
2.1.2 Spécification de la notion de conséquence
2.2 La relation de conséquence
2.2.1 Qu'est-ce qu'une relation de conséquence?
2.2.2 Verbes et relation de conséquence
2.2.3 Relations apparentées à la conséquence
2.2.4 Ordre des segments de la relation de conséquence .
2.2.5 Vers une définition de la relation de
conséquence. .
2.3 Conséquence et inférence
2.3.1 Pouvoir
2.3.2 Devoir
2.3.3 Devoir et pouvoir au conditionnel
2.3.4 Implications sur la relation de conséquence
2.4 Comment repérer un lien causal en discours
2.4.1 Les connaissances de sens commun
2.4.2 La propension à l'interprétation causale
2.4.3 Vers une autre stratégie
2.5 La classe aspectuelle
2.5.1 La taxinomie des éventualités de Vendler
2.5.2 État vs. événement
2.6 Le type deverbe
2.6.1 Les verbes relateurs
2.6.2 Les verbes factitifs et permissifs
2.6.3 Les verbes précisant l'effet produit
2.7 Conclusion
3 Les marqueurs spécifiques de la relation de
conséquence: les connecteurs
3.1 Les connecteurs comme marque spécifique de la
conséquence
3.2 Donc
3.3 Alors
3.3.1 Fonction phrastique
3.3.2 Alors que adversatif
3.3.3 Alors dans les conditionnelles
3.3.4 Alors temporel vs. alors
consécutif
3.3.5 Conditions interdisant l'interprétation
consécutive de
alors
3.4 Ainsi
3.4.1 Ainsique
3.4.2 Ainsi et les locutions apparentées
3.4.3 Conditions pour l'interprétation consécutive
de ainsi
3.5 Aussi
3.5.1 Fonction phrastique
3.5.2 Fonction discursive
3.5.3 Conditions pour l'interprétation consécutive
de aussi
3.6 Marques spécialisées
3.6.1 Conséquence pure: par conséquent
3.6.2 Connecteurs anaphoriques univoques
3.6.3 Reprise anaphorique de la raison
3.6.4 Récapitulation
3.7 Conclusion
4 Autres moyens de signaler une relation de
conséquence
4.1 Les connecteurs ne suffisent pas à déterminer
la structure
rhétorique d'un texte
4.2 Participe présent
4.2.1 Le gérondif
4.2.2 Incise et déterminative
4.2.3 Participe présent, cause et conséquence
4.2.4 Participe présent suivi d'un connecteur
4.2.5 Conditions d'emploi du participe présent dans
une
construction consécutive
4.3 Anaphore propositionnelle et conséquence
4.3.1 Les pronoms anaphoriques ceci et cela et
l'anaphore propositionnelle 4.3.2 Propositions introduites par ceci
et cela: élaboration
vs. conséquence
4.3.3 Récapitulation
4.4 La relative
4.4.1 Qui
4.4.2 Ce qui
4.5 Syllogisme
4.6 La juxtaposition et la coordination
4.7 Verbes modaux
4.8 Bilan
5 Implémentation
5.1 Les paramètres à prendre en compte pour
l'analyse de la
relation de conséquence
5.1.1 En présence d'un connecteur
5.1.2 En l'absence d'un connecteur
5.1.3 Avec l'un ou l'autre
5.1.4 Récapitulation
5.2 Préalables à l'analyse automatique de la
relation de conséquence: étiquetage morpho-syntaxique et
lemmatisation . .
5.2.1 Nécessité d'un étiquetage
morpho-syntaxique
5.2.2 Choix du système d'étiquetage
5.3 Choix du langage de programmation: PERL
5.4 Présentation du système
5.4.1 Repérage d'une proposition complète
5.4.2 Traitement des connecteurs
5.4.3 Traitement des autres indices
5.4.4 Présence d'un type de verbe particulier
5.5 Utilisation
5.5.1 En ligne de commande
5.5.2 Par navigateur
5.6 Problèmes à résoudre et fonctions
à implémenter
5.6.1 Éléments à implémenter
5.6.2 Problèmes d'implémentation à
résoudre
5.7 Comparaison de l'analyse quantitative manuelle et de
l'ana-
lyse quantitative donnée par l'illustrateur
5.8 Conclusions
Conclusion
Bibliographie
A Code source de l'illustrateur
Table des figures
1.1 Représentation graphique d'une relation
rhétorique
1.2 Analyse quantitative du corpus Howto-Linux-Text-Terminal
1.3 Méthodologie
2.1 Représentation graphique de la relation de
conséquence . . 2.2 Taxinomie des éventualités
d'après VENDLER (1967)
5.1 Exemple de sortie de l'illustrateur
5.2 Comparaison analyse manuelle / analyse de l'illustrateur.
Liste des tableaux
1 Les conventions utilisées i
2.1 Relations proches de la relation de conséquence chez
MANN
etTHOMPSON (1987)
2.2 Comparatif des relations apparentées à la
conséquence . .
3.1 Donc
3.2 Alors
3.3 Ainsi
3.4 Aussi
3.5 Les connecteurs univoques
4.1 Participe présent
4.2 Anaphore propositionnelle
4.3 Relative
4.4 Syllogisme
5.1 Contraintes utilisées
5.2 Fonctions de base de l'illustrateur
Liste des algorithmes
1 Algorithmes de repérage d'une proposition à
droite ou à gauche
de l'indice
2 Donc
3 Alors
4 Ainsi
5 Aussi
6 Connecteurs à placement libre
7 Connecteurs à placement fixe
8 Participe présent
9 Cequi
10 Cequi
11 Syllogisme
12 Verbe efficient
Liste des définitions
2.1 Effet
2.2 Conséquence logique
2.3 Résultat
2.4 Conséquence
2.5 Relation de conséquence (provisoire)
2.6 Relation de conséquence
2.7 Inférence
2.8 Causation (lien causal ou de causalité)
2.9 État
2.10 Processus
2.11Activité
2.12 Événement
2.13 Accomplissement
2.14 Achèvement
2.15 Éventualité
2.16État(2)
2.17 Événement (2)
3.1 Connecteur
Notations
Nous reprenons ici les symboles que nous utiliserons dans les
tableaux:
symbole signification
segment de discours de droite de la relation segment de
discours de droite de la relation
+ permis
++ obligatoire
- interdit
Place de l'indice dans une proposition: S V C
- début de proposition ( );
- entre le sujet et le verbe (
- immédiatement après le verbe ( );
- fin de proposition ( ).
;
TAB. 1 - Les conventions utilisées
Introduction
Le rapport de cause à conséquence peut
revêtir dans la langue des formes multiples. Pourtant, si l'on s'en tient
à la grammaire traditionnelle, on ne rattache à l'expression d'un
rapport de cause à effet que des conjonctions ou des adverbes. Or nous
sommes parti du constat que la grammaire traditionnelle, ainsi qu'une grande
partie de la littérature linguistique moderne traitant de la question ne
s'en tenait qu'à ces éléments lexicaux. Peu de travaux ont
eu pour but de mettre à jour les autres moyens qui existent en
français pour exprimer cette relation de conséquence.
Les marques classiques de la conséquence doivent
être complétées par des indices plus subtils et complexes
afin d'aboutir à une description plus exhaustive de la relation. Nous
proposons donc une approche exploratoire de la relation de conséquence
basée sur l'analyse de corpus: nous repérons dans un corpus
composé de textes scientifiques et de manuels informatiques toutes les
relations de conséquence que nous rencontrons, sans a priori sur la
façon (lexicale ou autre) de les exprimer. Avec cette approche, notre
objectif est de caractériser de façon aussi précise que
possible la relation de conséquence.
Cette approche exploratoire nous amène donc à
considérer plusieurs indices comme pertinents à son
étude:
- les marques spécifiques à l'expression de la
conséquence que sont
les connecteurs consécutifs (donc, alors, par
conséquent, si bien que), ces marques ayant fait l'objet dans la
littérature d'un certain nombre d'études;
- les constructions pouvant parfois participer à
l'expression de la conséquence comme certaines constructions
participiales (avec un participe présent), certaines relatives (les
relatives continuatives) ou encore certaines constructions anaphoriques
(anaphores propositionnelles). Dans ce cas il convient de déterminer les
conditions particulières qui nous font interpréter la relation
comme relation de conséquence (des restrictions sur ses arguments);
- les moyens favorisant l'interprétation
consécutive en l'absence de ces indices (et qui peuvent aussi être
utilisés en leur présence) : les éléments lexicaux
exprimant une modalité ou le type du verbe (à savoir s'il s'agit
par exemple d'un verbe efficient).
Nous essaierons donc d'obtenir un panorama le plus riche
possible des moyens d'expression de la relation de conséquence en
français en étudiant ses arguments de près.
Cette analyse s'est faite en deux étapes:
- premièrement, analyser la façon dont la
relation de conséquence est exprimée dans le corpus, afin de
rassembler les indices qui ont privilégié l'interprétation
conséquentielle;
- deuxièmement, valider ces indices par une recherche
automatique et recenser les cas où l'interprétation
conséquentielle est impossible en présence de ces indices. La
répétition de cette étape nous permet d'affiner ces
indices.
À l'aide de ces résultats, nous pouvons
circonscrire les différentes contraintes, qu'elles soient
positionnelles, syntaxiques ou encore sémantiques sur la relation de
conséquence et ainsi contribuer à l'analyse de la
structure des textes en étudiant un des liens logiques
qui font leur cohérence. Ces résultats nous permettront
également de construire un programme informatique permettant de
détecter automatiquement la présence de relations de
conséquence dans un texte.
Notre mémoire se divise en cinq chapitres.
Dans le premier chapitre, nous aborderons le cadre global dans
lequel se situe notre travail; nous présenterons donc la théorie
dans le cadre de laquelle il s'inscrit: la RST, puis la méthodologie que
nous avons adoptée afin de faire notre étude.
Dans un deuxième chapitre, nous ferons le point sur les
préalables théoriques indispensables à notre
étude.
Le troisième chapitre sera consacré aux marques
lexicales spécifiques
à l'expression de la relation conséquence:
connecteurs consécutifs.
Nous nous attarderons dans le quatrième chapitre sur
les indices autres que les connecteurs qui nous permettent
l'interprétation consécutive d'une relation rhétorique.
Nous récapitulerons dans le cinquième et dernier
chapitre les différents paramètres à prendre en compte
pour l'analyse de la relation de conséquence. Puis nous
présenterons l'illustrateur que nous avons implémenté en
utilisant les paramètres recueillis dans les chapitres
précédents et qui permet d'extraire automatiquement les relations
de conséquence d'un texte.
Chapitre 1
Cadre global et méthodologie
Comme nous l'avons évoqué dans l'introduction,
nous voyons la relation de conséquence comme un lien «logique»
qui structure le discours. Or il existe une théorie rencontrant un
certain succès dans le domaine de l'analyse du discours, la RST
(Rhetorical Structure Theory), qui permet de donner une représentation
d'un texte en tenant compte de ces liens logiques. C'est donc dans le cadre de
la RST que se situera notre étude.
Dans ce chapitre, après avoir brièvement
présenté la RST dans ses grandes lignes, nous exposerons nos
objectifs et la méthodologie que nous avons mise en place afin
d'étudier la relation de conséquence.
1.1 LaRST1
Nous allons dans cette section faire une brève
présentation de la RST et montrer en quoi l'étude de la relation
de conséquence s'inscrit dans une perspective plus globale de
description de la structure d'un texte dans ce cadre.
Dans leur article fondateur (MANN et THOMPSON (1987)), Mann et
Thompson posent les bases d'une théorie du discours: la RST ou
Rhetorical Structure Theory (théorie de la structure
rhétorique).
'Pour une présentation plus complète de la RST,
voir DRUON (2000) (en français), ou l'article fondateur de la
théorie MANN et THOMPSON (1987) (en anglais).
1. Cadre global et méthodologie
|
|
Cette théorie permet de décrire de façon
simple et intuitive la structure d'un texte narratif (non-dialogique). En
effet, cette théorie peu formalisée permet de représenter
la structure d'un texte de façon arborescente et récursive.
1.1.1 Les segments de discours
Une des idées de base de la RST est qu'un texte est
composé de segments de discours2, qui sont «
des intervalles linéaires de texte ininterrompu ». Un segment de
discours n'a donc pas de taille prédéfinie et il peut être
composé d'un ensemble de paragraphes (c'est à ce moment-là
un segment complexe) aussi bien que d'une proposition grammaticale (la
proposition est généralement un segment minimal). Un des
principes de la RST est qu'elle permet la récursivité,
c'est-à-dire qu'un segment de discours peut être
décomposé en segments de discours plus petits, et ce
jusqu'à l'obtention de segments de discours élémentaires
(généralement de l'ordre de la proposition3).
La RST permet aussi bien une analyse descendante, partant du
discours dans son entier et le décomposant en segments plus petits
jusqu'à obtention de segments minimaux qu'une analyse ascendante,
partant des segments minimaux, les rassemblant en segments plus gros et ainsi
de suite jusqu'à n'obtenir qu'un seul segment, le discours.
Nous adopterons l'approche ascendante qui est la seule
réalisable par un système informatique basé sur la
surface.
2Mann et Thompson emploient le terme text
spart.
3Nous considérerons pour l'instant la
proposition comme segment minimal, bien qu'on puisse considérer comme
segments de discours des unités plus petites, mais ce n'est pas le cas
pour l'expression de la conséquence.
1. Cadre global et méthodologie
|
|
1.1.2 Les relations rhétoriques
La RST est fondée sur une notion clé selon
laquelle on a une relation rhétorique qui unit deux ou plusieurs
segments de discours. Une relation rhétorique est une relation
étiquetée4 qui relie en général deux
segments de discours entre eux5, et qui détermine les
relations sémantiques et pragmatiques qu'ils entretiennent. L'exemple
suivant nous montre une relation de cause:
(1 .2) Vous devez taper beaucoup moins de caractères
à l'invite car l'in-
terpréteur de commandes bash tape à votre
place autant que possible.
Un fait important est qu'une relation rhétorique est
susceptible de pouvoir relier entre eux aussi bien de très grands
segments de discours (comme des paragraphes) que des segments minimaux. De
plus, une des propriétés de la RST étant la
récursivité, un segment de discours non- minimal contiendra des
segments de discours plus petits eux aussi reliés par une autre relation
rhétorique. Ceci permet de construire une représentation
arborescente du texte.
1.1.3 La nucléarité
Un autre concept fondamental est la notion de
nucléarité. En effet, dans une relation de discours, les deux
segments n'ont pas le même sta-
4MANN et THOMPSON (1987) proposent 26 relations de
base, comme par exemple les relations de moyen, de but, de cause,
d'élaboration ou encore de conséquence. Ce nombre de relations
n'est cependant pas fermé, Mann et Thompson laissant la
possibilité d'en créer de nouvelles si l'analyse le demande.
5Certaines relations peuvent relier plus de deux
segments entre eux. C'est le cas par exemple de la relation de séquence
qui relie les trois segments de l'exemple suivant:
(1.1) Le chasseur a chargé son fusil. Il a visé le
pigeon. Il l'a abattu.
1. Cadre global et méthodologie
tut6 : l'un est considéré comme plus
essentiel à la compréhension du texte -- on l'appelle le
noyau, noté -- et l'autre comme plus secondaire -- que l'on
nomme le satellite, . Une relation rhétorique est donc
asymétrique, puisqu'elle relie deux constituants d'inégale
importance.
Illustrons cette propriété par une relation de
conséquence:
(1.3) Le flux des octets de données dans le câble
entre deux ports
série est bidirectionnel, il y a donc deux flux (et deux
fils)
différents à considérer.
Notons qu'il n'est pas toujours évident de
décider du statut de noyau ou de satellite de chaque membre d'une
relation rhétorique. En effet, dans l'exemple précédent,
la RST considérera comme un satellite alors qu'intuitivement, on
considérerait plutôt que apporte l'information la plus importante.
Cela ne posera pas de problème pour notre analyse, car nous suivrons la
RST à la lettre et nous étiquetterons comme satellite la
conséquence de la relation de conséquence. Cela peut en revanche
poser des problèmes en aval par exemple dans un système de
résumé automatique sélectionnant les noyaux (information
importante) du texte, les noyaux n'apportant pas toujours l'information la plus
importante si on respecte littéralement la RST.
1.1.4 Représentation graphique de la structure
rhétorique
La structure rhétorique d'un texte peut être
représentée très facilement à l'aide
d'unités très simples appelées schémas. Un
schéma permet de représenter une relation rhétorique entre
deux segments de discours,
1. Cadre global et méthodologie
|
|
et il est composé:
- de lignes horizontales représentant les segments de
discours; - d'une ligne verticale marquant le noyau;
- d'une flèche reliant le satellite à son noyau,
indiquant le sens de la relation.
Relation Rhétorique
Noyau Satellite
|
FIG. 1.1 - Représentation graphique d'une relation
rhétorique
1.2 Vers un analyseur rhétorique
Notre objectif à travers l'étude de la relation
de conséquence est la construction d'un analyseur rhétorique du
français. En effet, cette relation fait partie d'un ensemble plus vaste
de relations comme nous venons de le voir à la section
précédente. Son étude constitue donc une brique dans la
réalisation d'un système capable de dériver
automatiquement la structure rhétorique d'un texte.
Un tel analyseur n'existe pas pour le moment pour le
français, mais deux systèmes ont été
récemment élaborés pour l'anglais, l'approche
adoptée par leurs deux concepteurs différant sensiblement l'une
de l'autre.
1.2.1 L'approche pattern-matching
Dans sa thèse (MARCU (1997)), Daniel Marcu propose de
dériver la structure rhétorique des textes à partir
d'indices fiables et faciles à repérer: les connecteurs. Pour
établir une relation rhétorique, le système de
1. Cadre global et méthodologie
|
|
Marcu fait donc une simple recherche de motifs dans les textes
(patternmatching) à l'aide d'expressions régulières, ce
qui lui permet de repérer les connecteurs et de voir leur contexte
immédiat afin de préciser quelque peu leur sens. Par exemple en
français, le résultat de la recherche de /Aussi, / est un
connecteur alors que celle de /aussi/ ne l'est pas. Cependant, même si
cela fonctionne pour aussi, un simple pattern-matching ne suffit en
général pas (nous le verrons au chapitre 3).
1.2.2 L'approche morpho-syntaxique
Simon Corston-Oliver (CORSTON-OLIVER (1998b)) quant à
lui propose de compléter la recherche de motifs par une analyse
morpho-syntaxique. En effet, certains éléments permettent
d'établir que l'on a une relation rhétorique particulière,
comme par exemple la présence d'un participe présent ou d'un
verbe au passif, chose que l'on ne peut chercher avec de simples expressions
régulières.
1.2.3 L'intégration de l'interface
sémantique-pragmatique
Nous proposons évidemment de tenir compte des
critères précédemment cités, mais aussi d'aller en
voir d'autres. Ces critères importants à envisager sont des
critères sémantiques et pragmatiques, comme l'aspect verbal, le
type de verbe (sémantique lexicale) ou les actes de langage en jeu
(pragmatique)7.
7Bien que le type d'acte de langage soit
très important dans certains cas pour déterminer à quelle
relation rhétorique on a affaire (c'est le cas pour la relation de
conséquence, voir DRUON (2000)), nous n'aurons pas le temps ici de
traiter de ce sujet.
1. Cadre global et méthodologie
1.2.4 Applications : compréhension automatique de
textes et résumé automatique
L'analyseur rhétorique construit, on peut envisager des
applications qui utilisent la représentation du texte conforme à
la RST qu'il donne en sortie.
Obtenir la structure rhétorique d'un texte ouvre la voie
à deux grands types d'applications:
- La compréhension automatique de textes / l'extraction
d'informations (voir JACKIEWICZ (1998)) : cet arbre rhétorique nous
permettrait d'avoir une vue d'ensemble sur la construction argumentative du
texte, et donc par exemple de sélectionner les passages importants comme
peuvent l'être les conclusions (ce que permet l'étude de la
relation de conséquence);
- Le résumé automatique (voir MARCU (1997)) :
obtenir la structure
rhétorique d'un texte est aussi très
intéressant. En effet, de par l'at-
tribution d'un statut informationnel plus important aux noyaux,
on
a une base solide pour le résumé automatique en
sélectionnant pré-
férentiellement les noyaux lors de la contraction du
texte.
En gardant cet objectif de compréhension ou de
résumé automatique, nous devrons chercher les conditions
permettant ou empêchant l'interprétation consécutive d'une
relation de discours, et ce à différents niveaux (orthographique,
syntaxique, sémantique.. .). C'est à partir de l'analyse de
corpus que nous y parviendrons.
1. Cadre global et méthodologie
|
|
1.3 L'analyse de corpus
1.3.1 Une approche exploratoire
Nous avions dans notre mémoire de maîtrise (DRUON
(2000)) fait un exposé du fonctionnement de quelques connecteurs
consécutifs du français. Or nous savions déjà (et
nous l'avions remarqué) que la relation de conséquence
était susceptible d'être exprimée autrement que par la
présence d'un connecteur. Notre objectif cette fois-ci était de
couvrir au moins en partie les moyens d'expression de la conséquence en
français. Nous essaierons donc de nous détacher des marques
lexicales que sont les connecteurs pour essayer de repérer l'ensemble
d'indices, plus complexe, qui permettent l'interprétation
consécutive.
Nous avons donc décidé d'aborder la question avec
une approche de corpus, une approche exploratoire.
Afin d'étudier la relation de conséquence, nous
avons parcouru nos corpus avec l'intention de repérer intuitivement
toutes les relations de conséquence qui s'y trouvaient. L'idée
était qu'à partir de ce premier repérage, on pouvait
déjà avoir une vue d'ensemble sur les moyens d'expression de la
relation de conséquence dans les textes procéduraux et
scientifiques (dont nos deux corpus sont respectivement constitués).
Cette première vue d'ensemble, et cela explique le côté
exploratoire de notre approche, est obtenue par une recherche dans le corpus,
donc sans a priori sur les moyens d'expression de la conséquence.
1.3.2 Corpus utilisés
1. Cadre global et méthodologie
|
|
disponibles sous format électronique:
- Des textes procéduraux, en fait un ensemble de quelques
manuels d'utilisation de Linux: les «howto»;
- Le texte d'une revue de type « revue de vulgarisation
scientifique »: le numéro 335 de La Recherche.
Après analyse manuelle, nous avons obtenu l'analyse
quantitative présentée en page suivante.
1.3.3 Méthodologie
Une fois les corpus choisis, nous avons mis en oeuvre cette
approche exploratoire en plusieurs étapes:
1. Nous commençons par l'annotation manuelle de la
relation de conséquence dans les corpus, en prenant bien soin de
délimiter ses arguments et de noter pour chaque relation trouvée
quel argument se trouve être la cause et lequel est la
conséquence. Ainsi, nous pouvons extraire du texte annoté toutes
les relations de conséquence des corpus, ce qui permet une analyse plus
rapide et facile;
2. À partir de cet ensemble d'extraits
présentant des relations de conséquence, nous obtenons
après analyse une première grille des indices permettant de
repérer une relation de conséquence (connecteurs, aspect, temps
des verbes...);
3. Afin d'affiner l'analyse, nous avons extrait
automatiquement des corpus ces indices8 avec leur contexte (les
propositions qui les entourent), ce qui permet de voir dans quel cas cet indice
n'induit pas une relation de conséquence;
8Nous nous sommes pour l'instant limité
à l'extraction d'indices facilement repérables correspondant
à des mots entiers (comme les connecteurs ou les verbes modaux
devoir et pouvoir), ou bien à des formes facilement
repérables par une expression régulière comme les
participes présents.
|
Autre indice
|
|
|
Aucun indice
|
ceci/cela ce qui
|
pt. pr.
|
|
et
|
juxt.
|
analysemanuelle
|
26 16,0%
|
7 4,3%
|
2 1,2%
|
17
|
10,4% 19
|
11,6%
|
total
|
|
21,5%
|
|
|
22%
|
|
|
ainsi
|
|
alors
|
ce faisant
|
Connecteur
ce q fait q dans ce cas
|
|
donc
|
par csq
|
pour cette r.
|
23
|
14,1%
|
11
|
6,7%
|
1 0,6%
|
3 1,8% 4 2,5%
|
42
|
25,8%
|
7 4,3%
|
1 0,6%
|
|
|
|
|
|
56,5%
|
|
|
|
|
analyse manuelle
total
FIG. 1.2 - Analyse quantitative du corpus
Howto-Linux-Text-Terminal
1. Cadre global et méthodologie
|
|
4. Une fois déterminées ces nouvelles contraintes
sur la relation, on peut à nouveau extraire automatiquement les indices
avec leur contexte, en tenant évidemment compte de ces contraintes;
5. On obtient ainsi (en combinant la grille des indices et
les contraintes sur ces indices obtenues par une analyse plus poussée)
une description précise des éléments que nous pouvons
utiliser pour repérer automatiquement dans un texte une relation de
conséquence.
Nous avons synthétisé cette méthodologie
dans la figure 1.3 présentée en page suivante.
Notre démarche est à rapprocher de la
méthode d'exploration contextuelle de l'équipe de Jean-Pierre
Desclés (voir à ce propos MINEL et al. (2001) et DESCLÉS
et al. (1997)). En effet, ils définissent la méthodologie de
l'exploration contextuelle comme suit (elle s'applique quelle que soit la
catégorie textuelle envisagée) :
1. Identifier l'information sémantique pertinente et ses
indicateurs linguistiques;
2. Identifier le segment de contexte C nécessaire pour
prendre en compte la polysémie;
3. Écrire les étapes procédurales pour
trouver les indices linguistiques pertinents en explorant le contexte C de
façon à résoudre les ambiguïtés.
DESCLÉS et al. (1997)
Nous aborderons donc notre étude dans le même
état d'esprit, en essayant tout d'abord de trouver des indices en
présence desquels il est possible d'avoir une relation de
conséquence puis nous les compléterons avec des règles sur
le contexte de ces indices.
Nous allons maintenant poser quelques préalables
théoriques qui nous paraissent indispensables à l'étude de
la conséquence.
1. Cadre global et méthodologie
|
|
texte brut
annotation manuelle du corpus
texte annoté
extraction des relations
ensemble de relations
analyse manuelle des arguments
grille d'analyse
Ensemble d'indices avec leur contexte
contraintes sur les indices
ANALYSE COMPLÈTE DE LA RELATION
extraction d'indices avec leur contexte
analyse de la conformité avec la relation
Légende
Texte
Opération manuelle
Opération automatique
FIG. 1.3 - Méthodologie
Chapitre 2
Préalables théoriques
Après avoir brièvement le cadre théorique
dans lequel se situe notre étude et la méthodologie que nous
avons adoptée afin de rendre compte des moyens d'expression de la
relation de conséquence, nous allons maintenant devoir
réfléchir sur la notion même de conséquence et poser
les bases théoriques indispensable à l'analyse des moyens
d'expression de la relation de conséquence.
Nous allons donc essayer de définir ce que nous
entendons par conséquence et relation de conséquence et
après avoir réfléchi à la manière dont nous
percevons un lien de cause à effet, nous préciserons les notions
d'aspect verbal et de verbe efficient, notions indispensables pour l'analyse
qui suivra.
2.1 La conséquence
Pour bien délimiter l'objet de notre étude, il
nous faut commencer par définir la notion de
«conséquence». Après avoir passé en revue les
notions proches, nous préciserons ce que nous entendons par
«conséquence» en limitant le terme au domaine du
raisonnement.
2.1.1 Conséquence logique, effet,
résultat
Certaines notions classiques correspondent en partie au sens
que nous attribuons à «conséquence» : il s'agit de
l'effet, du résultat et de la conséquence logique.
Définition 2.1 -- Effet: «Fait
réel, actualisé, conçu le plus généralement
dans sa relation avec un autre fait réel, considéré comme
sa cause. » AUROUX (1990), p. 753
L'effet est donc le pendant de la cause, et c'est en cela
qu'il se rapproche de la notion de conséquence que nous voulons
établir. En revanche, l'effet est uniquement perçu comme un fait
réel ce qui n'est pas le cas de la conséquence comme nous le
verrons par la suite.
En logique, on parle souvent de conséquence logique, qui
se rapproche de la notion de conséquence que nous voulons
définir:
Définition 2.2 -- Conséquence logique:
On dit que est la conséquence logique de si est
nécessairement vrai lorsque l'est.
Cette définition n'est pas convenable pour
définir la notion de conséquence en langage naturel du fait du
caractère nécessaire de la relation entre et . Cette
nécessité n'apparaît pas en langage naturel:
(2.1) Pierre est tombé donc il s'est fait mal.
En effet, le fait que Pierre tombe n'entraîne pas
nécessairement qu'il se fasse mal. La conséquence logique ne
correspond donc pas vraiment à la conséquence comme nous
l'entendons.
Nous allons maintenant aborder le concept de résultat
afin d'obtenir une définition de la conséquence.
Définition 2.3 -- Résultat: «
Point d'aboutissement, provisoire ou
définitif, d'un mouvement physique ou intellectuel. »
LABARRIÈRE (1990), p. 2260
C'est la définition de «résultat» qui
est la plus proche de celle que nous voulons donner à
«conséquence». En effet, l'effet est restreint
à un fait et la conséquence logique présente un
caractère nécessaire qui n'apparaît pas pour le
résultat.
2.1.2 Spéci~cation de la notion de
conséquence
À partir des définitions données dans la
section précédente, nous pouvons maintenant donner une
définition à conséquence. À la
lumière de ces définitions, nous limiterons la notion de
conséquence à celle de « conclusion d'un
raisonnement ». C'est donc un phénomène discursif qui ne
reflète pas forcément un lien de causalité dans le monde
extérieur. Par la suite, nous emploierons ce terme dans cette acception,
notre but étant de décrire la relation rhétorique de
conséquence, impliquant un raisonnement.
Définition 2.4 -- Conséquence: La
conséquence est la conclusion que le locuteur tire d'un raisonnement.
2.2 La relation de conséquence
Après avoir défini la notion de
conséquence et en nous appuyant sur cette définition,
nous allons circonscrire et définir ce qui fait l'objet de notre
mémoire: la relation de conséquence.
2.2.1 Qu'est-ce qu'une relation de conséquence?
2.2.1.1 Conséquence vs. relation de
conséquence
Il ne faut pas confondre conséquence et relation de
conséquence. En
éventualité. En revanche, la relation de
conséquence est, comme son nom l'indique, une relation, donc le lien
entre le point de départ de ce raisonnement et sa conséquence.
2.2.1.2 Définition préliminaire
Avant de détailler plus en profondeur la relation de
conséquence, nous allons en donner une définition provisoire, qui
nous permettra de travailler.
Définition 2.5 -- Relation de
conséquence (provisoire): La relation de conséquence est
une relation rhétorique1 unissant deux étapes d'un
raisonnement: le point de départ d'un raisonnement et sa conclusion.
2.2.2 Verbes et relation de conséquence
Observons l'exemple suivant:
(2.2) Les restrictions budgétaires des années 1980
ont engendré des
coupures massives d'abonnements.
(2.3) Ily a eu des restrictions budgétaires dans les
années 1980 donc
ily a eu des coupures massives d'abonnements.
Certains, comme GARCIA (1998), voient dans le lien causal
directement exprimé dans l'exemple 2.2 par le verbe engendrer
une relation de conséquence. Nous ne sommes pas de cet avis et nous
rejoignons le point de vue de Jackiewicz:
Les connecteurs2, au contraire des verbes,
«sont utilisés davantage pour étayer et justifier les propos
en tant que marqueurs d'acte de parole que pour créer un contenu
informatif
1Voir la section 1.1.
2Pour plus de précisions sur les connecteurs,
voir DRUON (2000) et le chapitre 3.
(causal) nouveau, en tant qu'opérateurs» bien
qu'«ils expriment la causalité» JACKIEWICZ (1998), p. 82
En effet, nous voyons dans les verbes comme
engendrer3 une façon de créer un contenu
causal nouveau, et non un moyen d'exprimer une relation
rhétorique4. Le locuteur établit un lien causal, mais
son raisonnement n'est pas marqué.
En revanche, ce type de verbe en association avec d'autres
indices peut tout à fait participer à l'établissement
d'une relation rhétorique, comme c'est le cas dans l'exemple suivant:
(2.4) Utilisez une petite échelle d' ohms sur un
ohmmètre pour que la
tension appliquée par l' ohmmètre soit faible .
Ceci réduira les dommages possibles sur les composants
sains.
De plus, considérer qu'un verbe puisse exprimer une
relation rhétorique nous obligerait à prendre en compte des
segments de discours minimaux plus petits que la proposition. À partir
de maintenant, nous considérerons donc que la relation de
conséquence est une relation qui relient des segments de taille au moins
égale à la proposition.
2.2.3 Relations apparentées à la
conséquence5
Nous avons présenté la relation de
conséquence comme une relation entre une cause et une
conséquence. On est parfois tenté de reconnaître comme
relation de conséquence des relations qui n'en sont pas, mais qui en
sont très proches, comme la cause, le but, la condition, la
manière
3Il s'agit en fait des verbes efficients, dont nous
parlerons à la section 2.6.
4D'après GALIOTOU (1999), l'exemple 2.2
implique qu'un agent participe au lien causal alors que dans l'exemple 2.3
c'est une raison. Cela revient à ce que nous disons : l'utilisation d'un
connecteur permet de marquer un acte de parole, de relier une raison à
sa conclusion, produit d'un raisonnement, ce qui n'est pas le cas avec le
verbe.
5Cette section est en partie inspirée de
NAZARENKO (2000). Se référer à cet ouvrage pour une vue
d'ensemble sur les moyens d'exprimer la causalité en français.
ou l'arrière-plan. Nous nous baserons sur les
définitions des relations données par MANN et THOMPSON (1987) que
nous présentons dans le tableau 2.16.
Relation
|
Noyau
|
Satellite
|
But
|
une situation cible
|
l'intention sous-jacente à la situation
|
Cause délibérée
|
une situation
|
une autre situation, cause de la première, du fait de
l'action délibérée de quelqu'un
|
Cause non délibérée
|
une situation
|
une autre situation, ayant provoqué la première,
mais pas du fait d'une action délibérée
|
Circonstance
|
texte exprimant les évé- nements ou
idées situés dans le cadre interprétatif
|
un cadre interprétatif temporel ou situationnel
|
Condition
|
action ou situation dont l'occurrence résulte de
l'occurrence de la situation conditionnante
|
la situation condition-
nante
|
Résultat délibéré
|
une situation
|
une autre situation, causée par celle-ci, du fait de
l'action délibérée de quelqu'un
|
Résultat non-délibéré
|
une situation
|
une autre situation provoquée par la première,
mais pas du fait d'une action délibérée
|
TAB. 2.1 - Relations proches de la relation de conséquence
chez MANN et THOMPSON (1987)
2.2.3.1 La relation de cause
La relation de cause est peut-être celle qui est la plus
proche de la relation de conséquence. Plus précisément,
elle est son pendant. La relation de cause présente effectivement une
relation entre une cause et une
6Ce que nous appelons relation de
conséquence figure chez MANN et THOMPSON (1987) sous le nom de
résultat, délibéré ou non
délibéré (distinction que nous ne marquerons pas).
conséquence, mais le point de vue est inversé:
en effet, en utilisant une relation de cause, on met plus l'accent sur la cause
que sur la conséquence. Dans la terminologie de Mann et Thompson, il y a
donc inversion du statut de noyau et de satellite entre ces deux relations (Le
noyau est la conséquence pour la relation de cause et la cause pour la
relation de conséquence) :
(2.5) Le texte est une forme limitée de graphique.
donc le terme
«terminal graphique» est quelquefois donné
à tous les terminaux texte
(2.6) Puisque le texte est une forme
limitée de graphique, le
terme «terminal graphique» est quelquefois donné
à tous les terminaux texte
(2.7) Le terme «terminal graphique» est quelquefois
donné à tous
les terminaux texte puisque le texte est une
forme limitée de
graphique,
La relation de cause est en quelque sorte le symétrique
de la relation de conséquence, le statut de noyau et de satellite
étant inversé entre ces deux relations (relation de cause dans
l'exemple 2.6 vs. relation de conséquence dans l'exemple 2.5) . En
revanche, on ne peut pas parler d'inversion de l'ordre de la relation parce que
l'ordre de la relation de cause est libre, au contraire de celui de la
conséquence qui est fixe (comparer les exemples 2.7 et 2.6).
Il faut remarquer que la distinction entre relation de cause
et relation de conséquence, bien qu'évidente si on utilise un
connecteur, n'est pas une distinction tranchée quand la relation n'est
pas marquée:
(2.8) Jean a vendu sa voiture. Il a des ennuis d'argent
(2.9) Jean a vendu sa voiture donc il a des
ennuis d'argent
(2.10) Jean a vendu sa voiture parce qu'il a des
ennuis d'argent
La relation de cause énonce donc un lien de
causalité, mais l'accent est mis sur la cause et non sur la
conséquence comme pour la relation de conséquence.
2.2.3.2 La relation de but
Le satellite d'une relation de but est présenté
comme résultant de la volonté de l'agent du noyau. De plus, le
satellite d'une relation de but n'indique pas une action réalisée
ou qui se réalisera, mais une volonté de faire une action. Ce
n'est pas le cas pour la conséquence, comme le montre l'exemple 2.12,
paraphrase de l'exemple 2.11 :
(2.11) On peut paramétrer le curseur pour
qu'il apparaisse
comme un rectangle.
(2.12) On peut paramétrer le curseur, donc
il apparaîtra comme
un rectangle.
La relation de but présente donc elle aussi une
conséquence, mais teintée d'intentionnalité. De plus,
le lien causal n'est que virtuel, il n'est pas encore réalisé:
on établit un lien causal qui est susceptible de se réaliser.
2.2.3.3 La relation de condition
La relation de condition met l'accent sur les conditions dans
lesquelles un événement peut avoir lieu. La grande
différence avec la relation de conséquence est que pour la
relation de conséquence, le noyau est actuel, alors qu'il est virtuel
pour la condition:
La relation de condition présente donc la
conséquence (forcément potentielle) d'une
éventualité7 (état ou événement)
virtuelle. On peut aussi interpréter la relation de condition comme
l'énoncé d'une loi alors que la relation de conséquence
est l'application de cette loi:
(2.14) Si on maintient une touche
enfoncée, alors celle-ci est «tapée»
de manière répétée.
(2.15) On maintient une touche enfoncée, donc
celle-ci est «tapée» de manière
répétée.
La relation de condition correspond bien ici à
l'énoncé d'une loi (maintien d'une touche
répétition du caractère), alors que la relation de
conséquence correspond à son application (on maintient la touche
enfoncée et cela a pour conséquence de répéter le
caractère).
On remarquera d'ailleurs un parallélisme entre condition
et certaines constructions que l'on pourrait prendre pour une
conséquence:
(2.16) Taper « cat mon_fichier > /dev/ttyS0 »
enverra le contenu du fichier mon_fichier sur COM1 (ttyS0).
La relation de condition présente relie donc la condition
de réalisation d'un événement à sa
conséquence potentielle.
2.2.3.4 La relation de circonstance
Le satellite de la relation de circonstance décrit les
circonstances dans lesquelles s'est déroulé le noyau (qui peut
être considéré comme la conséquence de ces
circonstances favorisantes) et non sa cause.
(2.17) Curieusement, c'est des autres galaxies que viendra
peut-être
la lumière. En effet, les trous noirs supermassifs que
l'on
7Sur les notions d'éventualité,
d'état et d'événement, voir la section 2.5.
commence à détecter au centre des galaxies proches
sont eux aussi en proie à une profonde asthénie.
On peut toujours considérer le noyau comme
conséquence du satellite. 2.2.3.5 La relation de manière
Dans une relation de manière8, on a toujours
la présence d'une conséquence dans un des deux segments de
discours, mais l'accent est mis sur la manière dont
l'événement cause s'est déroulé et non sur cet
événement comme dans la relation de cause.
(2.18) Joliot leur fait des reproches injustes, accusant
Goldschmidt, d'avoir organisé toute l'opération d'extraction du
premier milligramme de plutonium en son absence.
2.2.3.6 Comparaison de la relation de conséquence
avec ses relations apparentées
Dans le tableau suivant, nous reprenons ce que nous venons de
dire sur les relations apparentées à la relation de
conséquence pour bien voir ce qui distingue ces relations entre elles et
par conséquent bien distinguer la relation de
conséquence9 :
8La relation de manière, ni d'ailleurs une
relation proche, n'est pas mentionnée dans MANN et THOMPSON (1987).
9Selon les paramètres donnés dans le
tableau on ne peut pas distinguer la relation de but de la relation de
condition. Cependant, ces critères sont suffisants pour bien distinguer
la relation de conséquence des autres relations.
|
N
|
S
|
N actuel
|
S actuel
|
mobilité
|
Conséquence
|
cause
|
conséquence
|
+
|
+
|
-
|
Cause
|
conséquence
|
cause
|
+
|
+
|
+
|
But
|
cause
|
conséquence
|
-
|
-
|
+
|
Condition
|
cause
|
conséquence
|
-
|
-
|
+
|
Circonstance
|
conséquence
|
circonstance
|
+
|
+
|
?
|
Manière
|
conséquence
|
manière
|
+
|
+
|
+
|
TAB. 2.2 - Comparatif des relations apparentées à
la conséquence
2.2.4 Ordre des segments de la relation de
conséquence
Contrairement à la relation de cause, où l'ordre
des segments peut être libre (exemples 2.19 et 2.20), la relation de
conséquence a un ordre fixe: le noyau (présentant la cause) est
présenté en premier et il est suivi de son satellite
(présentant la conséquence) (exemples 2.21 et 2.22).
(2.19) Parce que Kevin pleure, Samantha le console.
(2.20) Samantha console Kevin parce qu'il pleure.
(2.21) Kevin pleure donc Samantha le console.
(2.22) * Donc Samantha console Kevin, il pleure.
Cela fonctionne aussi pour des relations
inférentielles, où l'on considère toujours que pour deux
segments de discours et entretenant une relation inférentielle de cause
à conséquence, on a toujours . Et cela même si
présente la cause de , dans ce cas on dit que la relation de
conséquence tient non pas entre deux éventualités, mais
entre deux énonciations.
La conséquence principale est que le noyau est toujours
placé avant le satellite dans le texte pour une relation de
conséquence. Dans la RST, la relation de conséquence sera donc
toujours représentée comme suit:
2. Préalables théoriques
|
|
Conséquence
Cause Conséquence
|
FIG. 2.1 - Représentation graphique de la relation de
conséquence
2.2.5 Vers une définition de la relation de
conséquence
Après les remarques faites dans les deux sections
précédentes (2.2.3 et 2.2.4) et en nous appuyant sur la
pré-définition donnée en 2.2.1, nous pouvons maintenant
essayer de compléter la définition de la relation de
conséquence.
Définition 2.6 -- Relation de conséquence:
Une relation de conséquence est une relation entre deux
segments de discours:
- le premier, le noyau, est toujours actuel et est une
éventualité qui constitue les prémisses d'un
raisonnement;
- le second, le satellite, est lui aussi toujours actuel et
présente la conclusion de ce raisonnement.
2.3 Conséquence et inférence
Nous allons dans cette section traiter du rapport
étroit qu'entretiennent conséquence, inférence et
modalité. Nous commencerons par donner la définition de
l'inférence, pour discuter ensuite quelques modes de réalisation
de l'inférence en français.
Définition 2.7 -- Inférence :
L'inférence consiste à poser à partir
d'éventualités données dans
l'expérience du sujet une éventualité non donnée,
résultat d'un raisonnement.
Le français a à sa disposition plusieurs
possibilités d'exprimer une inférence, parmi lesquelles les
verbes modaux épistémiques devoir et pou-
voir10. C'est ce que nous allons maintenant
examiner.
2.3.1 Pouvoir
Selon TAMOWSKI et DENDALE (1994), il existe en français
deux sortes de verbe pouvoir. Le premier est le pouvoir dit
«radical», qui exprime la permission (exemple 2.23), la
capacité ou la possibilité (exemple 2.24):
(2.23) Maintenant que tu as fait tes devoirs, tu peux aller
jouer. (2.24) Jean s'est musclé. Il peut maintenant soulever 100kg.
Le deuxième pouvoir est celui qui nous
intéressera, le pouvoir épistémique:
(2.25) Pierre n'est pas chez lui. Il peut être à la
bibliothèque.
Pouvoir épistémique exprime une
conclusion tirée à partir d'hypothèses, il a donc une
valeur inférentielle. De plus, il insiste sur la « disposition du
locuteur à admettre d'autres hypothèses que la sienne ».
C'est-à-dire que la conclusion retenue par le locuteur n'exclut pas
d'autres conclusions possibles.
2.3.2 Devoir
Le verbe devoir en français a deux significations
principales: une signification déontique et une signification
épistémique.
La signification déontique se rapporte à une
obligation:
(2.26) Rémi doit faire ses devoirs
'°Cette section se base en grande partie sur
les travaux de Patrick Dendale (DENDALE (1994), DENDALE (2000), TAMOWSKI et
DENDALE (1994) et DENDALE et ROSSARI (2000)) pour le français et STONE
(1994) pour l'anglais. Se reporter à ces articles pour plus de
détails sur la question.
Mais cette signification ne nous concerne pas ici. Nous nous
intéresserons en revanche à la signification
épistémique du verbe devoir qui est en rapport étroit avec
l'inférence:
(2.27) Claude a beaucoup travaillé. Il doit être
fatigué.
Selon DENDALE (1994), le verbe devoir dans sa
signification épistémique donne une valeur de probabilité,
de plus ou moins grande vraisemblance à une proposition. Le locuteur
utilise donc devoir quand il « fait une inférence à
partir de prémisses sur l'applicabilité desquelles il sait qu'il
a pu se tromper ».
Contrairement à pouvoir, avec qui le locuteur
laisse la porte ouverte à d'autres conclusions que la sienne, l'emploi
du verbe devoir épistémique implique que le locuteur ne
sélectionne qu'une seule conclusion à l'exclusion de toute autre,
mais sur laquelle il émet pourtant quelques réserves.
2.3.3 Devoir et pouvoir au conditionnel
Les modaux épistémiques devoir et
pouvoir peuvent aussi être employés au conditionnel. Dans
ce cas, ils acquièrent en plus de leur sens de base une valeur de
prédiction, ou de détachement du locuteur par rapport aux faits
qu'il rapporte (et donc par rapport à la conclusion qu'il en tire) :
(2.28) Pierre est malade. Il pourrait bien être absent.
(2.29) Cliquez sur le bouton «fermer». La fenêtre
devrait disparaître.
2.3.4 Implications sur la relation de
conséquence
d'inférence, on a souvent une relation de
conséquence. Ceci paraît logique car d'après la
définition de l'inférence, une inférence marque un
raisonnement et la relation de conséquence relie les prémisses
à la conclusion d'un raisonnement.
2.4 Comment repérer un lien causal en
discours
Nous venons de définir ce qu'est la relation de
conséquence. Or les critères à notre disposition pour
repérer une telle relation sont tout à fait subjectifs (lorsque
l'on parle de prémisse et de conclusion d'un raisonnement). Il faut donc
définir ce qui nous permet de détecter un lien de cause à
effet dans le discours.
Après avoir défini ce qu'est un lien causal,
nous allons nous demander comment nous faisons pour le repérer en lisant
un texte ou en écoutant un interlocuteur.
Définition 2.8 -- Causation (lien causal ou de
causalité): La causation est une relation entre
événements ou états dans le temps et l'espace. Elle est
basée sur l'idée de faire arriver les choses ou de les
empêcher d'arriver. est la cause de si la présence de
entraîne la présence de
, ou si l'absence de entraîne l'absence de .11
Nous parlons donc de lien de causalité ou lien
causal12 pour désigner le lien qui unit une cause à
son effet. Par exemple:
Pierre a chuté. Il s'est fait mal.
est la cause de , nous dirons donc qu'il existe un lien de
causalité entre et .
11Cette définition est tirée de ITKONEN
(1994).
12GALIOTOU (1999) utilise le terme de lien causal
dans le même sens que causation.
2.4.1 Les connaissances de sens commun
Selon certains auteurs, nous repérons un lien de cause
à effet grâce à des règles de causalité.
C'est le cas de MOESCHLER (1998) à qui nous avons emprunté
l'exemple qui suit13:
(2.30) Le verre de whisky est tombé. Il s'est
cassé.
Si nous interprétons la relation entre les deux
propositions de cet exemple comme une relation de conséquence, c'est
parce que nous avons connaissance (consciente ou non), ou du moins à
notre disposition, une loi causale qui nous permet de faire cette
interprétation. Ici c'est une loi causale du type tomber-casser qui nous
permet de voir une relation de conséquence entre le fait que le verre de
whisky est tombé et celui qu'il s'est cassé.
En admettant que notre interprétation des relations
causales se fasse à partir de nos connaissances du monde (en
l'occurrence de règles de causalité associant divers
événements), il devient très difficile de modéliser
le fonctionnement de la relation de conséquence. En effet, il faudrait
construire une base de données d'une grande partie des connaissances de
sens commun acquises par un être humain (la taille de cette base de
données dépend évidemment de la complexité du texte
et de l'étendue du domaine qu'il couvre). Et cette tâche n'est pas
actuellement à notre portée, et de toute façon
dépasse de loin le cadre de notre recherche.
Il existe cependant un projet principal visant à
modéliser nos connaissances de sens commun14 : le projet Cyc
initié dans les années 80 et toujours dirigé depuis par
Douglas Lenat (voir LENAT (1995) et COPE-
13Ce point de vue est aussi celui de ASHER (1993)
qui postule que l'on a par défaut une relation de narration entre deux
segments qui se suivent, mais si nos connaissances de sens commun nous
permettent de trouver une loi causale entre ces deux segments, alors la
relation sera interprétée comme une relation de résultat
par exemple.
141l existe également un autre projet, OpenMind
common sense (http: / /
www.
openmind.org/commonsense) auquel tout le monde peut participer.
LAND (1997)). Cette base de connaissances intègre aussi,
bien entendu, les connaissances causales que nous avons du monde, comme par
exemple (tiré de COPELAND (1997)):
(2.31) causal(there is water in the fuel the engine misfires)
Le problème est que ce projet est loin d'arriver à
son terme, la somme de
travail en jeu étant colossale et n'est pas utilisable par
un particulier.
C'est pourquoi nous voulons trouver des stratégies pour
éviter au maximum le recours à ces connaissances causales pour
déterminer la présence d'une relation de conséquence dans
un texte, et nous pensons pouvoir nous passer de lois causales dans une
majorité de cas. De plus, il ne semble pas suffisant de connaître
les liens causaux qui existent entre deux éventualités afin de
déterminer si nous nous trouvons face à une relation de
conséquence. Prenons par exemple un cas de déduction:
(2.32) Jean est moine: il est célibataire.
Dans ce cas-là, nous avons besoin de connaissances
encyclopédiques pour pouvoir interpréter la relation unissant les
deux énoncés «Jean est moine» et «il est
célibataire». Ici on extrait une propriété d'un cas
plus général, et l'interprétation de la relation comme
relation de conséquence ne repose pas sur une loi causale, mais sur une
relation d'un autre type, plus précisément une relation entre un
objet et une de ses propriétés (le fait d'être moine et une
de ses propriétés: le célibat).
2.4.2 La propension à l'interprétation
causale
Pendant que certains préfèrent une solution
privilégiant les lois causales comme mécanisme
d'interprétation d'une relation de conséquence, d'autres
prônent une solution radicalement opposée, ne faisant pas du tout
appel à d'éventuelles lois causales. C'est le cas de NAZARENKO
(2000),
45-48. En effet, d'après elle, nous avons naturellement
tendance à voir une relation causale entre deux événements
mis en relation dans le discours:
« Dès lors que deux situations ou deux
événements sont mis en relation par le discours, nous y voyons un
lien de cause à effet» NAZARENKO (2000)
Nazarenko prend donc là une position opposée
à celle d'ASHER (1993) qui veut que la relation entre deux segments de
discours soit tout d'abord interprétée comme une narration, soit
une simple succession temporelle de deux éventualités sans lien
causal particulier (voir à ce sujet la note 13 page ).
De plus, ce principe de propension à
l'interprétation causale semble beaucoup trop puissant car il permet de
tout interpréter causalement. Comme le montre l'exemple suivant,
l'existence d'un lien de causalité sous-jacent dans une relation
n'implique pas forcément une relation de cause ou de
conséquence:
(2.33) L'employée a été licenciée
quand on a découvert les malversations.
Nazarenko voit dans cet exemple une relation de cause
implicite, l'interprétant comme «L'employée a
été licenciée parce qu'on on a découvert les
malversations». Effectivement, il existe un lien de causalité entre
le licenciement et les malversations, mais il n'implique aucunement une
relation rhétorique de cause entre les deux. En effet,
l'établissement d'une relation de cause nécessiterait qu'un
raisonnement soit marqué ce qui n'est pas le cas.
Afin de pouvoir repérer une relation de
conséquence dans un texte, il va donc nous falloir délimiter plus
précisément ce qui nous permet de
l'interpréter comme telle et non pas se fier à
un principe trop général qui permettrait l'interprétation
consécutive de n'importe quel couple de propositions.
2.4.3 Vers une autre stratégie
Nous devrons donc adopter d'autres stratégies afin de
voir comment on peut repérer une relation de cause à effet. En
effet, il existe d'autres moyens pour interpréter une relation de
discours comme relation de conséquence que de faire à chaque fois
appel aux connaissances de sens commun. La solution de Nazarenko, quoi que
séduisante au premier abord, est beaucoup trop puissante car elle peut
permettre de tout interpréter causalement. De plus, la relation de
conséquence est une relation créée par le discours et elle
est relativement indépendante des lois du monde réel. Il est donc
légitime de chercher des indices de sa présence dans les textes
car ce n'est que là qu'elle est présente. Nous nous proposerons
donc dans les chapitres suivants de chercher d'autres moyen de repérer
une relation de conséquence en cherchant les indices linguistiques qui
nous permettent cette interprétation.
2.5 La classe aspectuelle
Il est très important de tenir compte de la classe
aspectuelle du verbe car elle constitue un indice qui peut faire basculer notre
interprétation d'une relation de discours vers une interprétation
consécutive15.
15Voir à ce propos le chapitre 4.
2.5.1 La taxinomie des éventualités de
Vendler
Afin de décrire les arguments de la relation de
conséquence, nous avons entre autre besoin de décrire la classe
aspectuelle des situations que décrivent ses arguments : un état,
un événement ou autres. . .16 Nous reprendrons donc la taxinomie
des éventualités proposée par VENDLER (1967).
Définition 2.9 -- État : Un
état est « la manière d'être d'une per-
sonne ou d'une chose, considérée dans ce qu'elle
a de durable » (REY et REY-DEBOVE (1993)). Un état dure donc dans
le temps, et ce de façon homogène. Dans l'exemple suivant, le
prédicat «est amoureuse» décrit un état de
Marie:
(2.34) Marie est amoureuse.
Définition 2.10 -- Processus: On parle de
processus quand un prédicat dénote une progression.
Définition 2.11 -- Activité : Une
activité est un processus dont la longueur est indéfinie, non
bornée dans le temps.
(2.35) L'homme marchait.
Définition 2.12 -- Événement:
Un événement est un processus non- homogène qui
culmine en un point du temps (il a une fin).
Définition 2.13 -- Accomplissement: Quand
un événement peut s'étendre sur une période de
temps, on parle alors d'accomplissement.
(2.36) Jean-Claude révisait son examen.
Définition 2.14 -- Achèvement: Un
événement ponctuel est appelé achèvement.
(2.37) Le piéton s'arrêta au feu rouge.
16Voir MOESCHLER (1999) reprenant VENDLER (1967).
Définition 2.15 -- Éventualité:
Nous utiliserons le terme
d'éventualité17 pour référer
aussi bien à l'aspect statique (état) que dynamique
(événement, activité ou processus) que peut revêtir
une situation.
Nous avons regroupé ces définitions dans une
taxinomie que nous avons empruntée à MOESCHLER (1999), et
complétée par des traits : voir la figure 2.2.
éventualités
états processus
activités événements
1- dynamique] 1+ dynamique]
1- borné] 1+ borné]
1- ponctuel]
1+ ponctuel]
accomplissements achèvements
FIG. 2.2 - Taxinomie des éventualités
d'après VENDLER (1967)
2.5.2 État vs. événement
Nous garderons simplement la distinction état vs.
événement qui nous semble suffisante pour décrire la
relation de conséquence. Nous nous intéresserons donc
principalement à la différence de trait I dynamique].
Nous garderons la définition de l'état
donnée plus haut et nous élargirons la définition d'un
événement à l'ensemble des processus.
Définition 2.16 -- État (2) : Un état est
une éventualité considérée
dans ce qu'elle a de statique, de durable.
Définition 2.17 -- Événement (2):
On parle d'événement pour une éventualité
ayant un trait progressif, non statique.
2.6 Le type de verbe
Le type de verbe est très important pour l'analyse de
la relation de conséquence. Nous verrons en effet par la suite (chapitre
4) que le fait de connaître le type du verbe dans une proposition est
indispensable à l'interprétation consécutive en
présence de certains indices.
Un type de verbe nous intéresse tout
particulièrement : les verbes décrits par JACKIEWICZ (1998),
p.96-110 sous le nom de verbes efficients. Ces verbes sont
appelés ainsi car ils ont la faculté d'exprimer l'action qui
produit un effet.
Jackiewicz distingue trois sous-types de verbes efficients:
- Les verbes relateurs;
- Les verbes factitifs et permissifs;
- Les verbes précisant l'effet produit.
2.6.1 Les verbes relateurs
Les verbes relateurs mettent en rapport deux situations. Il peut
s'agir par exemple du verbe provoquer ou du verbe
entraîner:
(2.38) Une faible demande en mémoire impliquait
des coûts réduits pour produire des moniteurs au
début des années 1980.
(2.39) Des pores apparaissent à la surface des membranes
cellulaires, entraînant la mort des cellules.
2. Préalables théoriques
2.6.2 Les verbes factitifs et permissifs
On parle de construction factitive pour les construction en
faire + Vinf et permissive pour les constructions en laisser +
Vinf:
(2.40) Les développements technologiques ont fait
surgir de nouvelles questions.
(2.41) L'article français le plus cité en chimie
sur la période laisse entrevoir une solution.
2.6.3 Les verbes précisant l'effet produit
Un certain nombre de verbes permettent de préciser l'effet
produit, comme par exemple augmenter ou faciliter:
(2.42) Cultiver sur une même parcelle des
variétés de riz différentes augmente la
résistance globale de la culture à certaines attaques
parasitaires.
(2.43) Le contexte financier, souvent fragile, de ces presses ne
facilite pas l'innovation.
2.7 Conclusion
Nous avons donné dans ce chapitre une vue d'ensemble
sur les préalables théoriques nécessaires à
l'étude de la relation de conséquence en français : nous
avons délimité ce qu'était notre objet d'étude, la
relation de conséquence, problématisé la recherche
d'indices nous permettant d'interpréter une relation rhétorique
comme relation de conséquence, et introduit certains paramètres
qui nous serviront pour l'analyse proprement dite de la relation.
Nous allons maintenant commencer par présenter des marques
caractéristiques de la relation de conséquence: les connecteurs
consécutifs.
Chapitre 3
Les marqueurs spécifiques de la
relation de conséquence : les
connecteurs
Nous allons dans ce chapitre étudier les connecteurs
consécutifs rencontrés dans nos corpus. Nous allons
préciser les contraintes qui font qu'un connecteur est
interprété en tant que tel et qu'il exprime la
conséquence. Nous nous attendons à rencontrer des contraintes
d'ordre ponctuationnel (la ponctuation qui entoure le connecteur peut modifier
son interprétation), positionnel (selon sa position dans
l'énoncé, un connecteur n'aura pas forcément le même
sens), syntaxiques (comme par exemple la présence d'un verbe à la
suite du connecteur), sémantique (l'aspect du verbe a des incidences sur
l'interprétation du connecteur) ou encore sur les actes de langage (les
propositions reliées par un connecteur ne pourront exprimer n'importe
quel acte de langage). Mais nous détaillerons ces contraintes plus tard
dans la section 5.1.
Nous allons commencer par définir rapidement la notion
de connecteur, puis nous étudierons les connecteurs rencontrés
dans les corpus La Recherche n 335 et Howto-Linux.
3. Les marqueurs spécifiques de la relation de
conséquence : les connecteurs
|
|
3.1 Les connecteurs comme marque spécifique de
la conséquence
Il existe un moyen en français (ainsi que dans beaucoup
d'autres langues) spécialisé dans le marquage des relations
rhétoriques (et par conséquent de la relation de
conséquence) : il s'agit des connecteurs. Les connecteurs sont des
éléments lexicaux (conjonctions de subordination et de
coordination, adverbes conjonctifs) qui permettent d'établir une
relation de discours. Ces éléments ont beaucoup été
étudiés dans la littérature (JAYEZ et ROSSARI (1998),
JAYEZ et ROSSARI (1997), ROSSARI et JAYEZ (1996), PIOT (1991), FORGET (1984)
entre autres en ce qui concerne les connecteurs consécutifs du
français).
Définition 3.1 -- Connecteur:
Élément lexical servant à relier deux
propositions mais ne jouant pas de rôle syntaxique dans la proposition
qu'il introduit.
Nous avions déjà étudié dans notre
mémoire de maîtrise (DRUON (2000)) un petit ensemble de
connecteurs consécutifs : donc, alors, par
conséquent et de sorte que. Nous en avions
étudié la distribution, ainsi que la possibilité ou non
pour ces connecteurs de marquer une inférence. Nous avions
déjà remarqué que tous les connecteurs consécutifs
n'étaient pas univoques. Par exemple, alors pouvait marquer
aussi bien une relation de conséquence qu'une simple succession
temporelle sans cette nuance consécutive, alors que d'autres
connecteurs, comme par conséquent n'autorisaient que
l'interprétation consécutive:
Nous allons maintenant nous intéresser de plus
près à ces marqueurs non univoques et essayer d'affiner
l'étude de leurs arguments et de leur placement au sein de la phrase
afin de déterminer les conditions dans lesquelles ils marquent une
relation de conséquence et celles où ils en
3. Les marqueurs spécifiques de la relation de
conséquence : les connecteurs
|
|
expriment une autre. Nous distinguerons de même les cas
où un élément lexical sera employé comme connecteur
de ceux où il a une fonction phrastique1. Cette
différence n'est pas du tout triviale à établir, et une
approche basée sur les expressions régulières comme celle
de MARCU (1997) est loin pouvoir distinguer à coup sûr entre
fonction phrastique et fonction discursive : il faut faire une analyse plus
profonde qu'une simple analyse de surface (nous aurons recours en plus de
l'approche de surface à une analyse syntaxique, voire même parfois
à la sémantique lexicale). De plus, nous allons élargir le
nombre de connecteurs étudiés afin de couvrir l'ensemble des
connecteurs rencontrés dans nos deux corpus. Nous rajouterons à
l'ensemble des connecteurs un certain nombre de locutions, dont il n'est en
général pas fait mention dans les études sur les
connecteurs, que nous avons rencontrées dans nos corpus. En effet, le
comportement de ce faisant, c'est la raison pour laquelle ou
bien encore ce qui fait que est très proche de celui des
connecteurs consécutifs traditionnels, et ces locutions répondent
bien à la définition d'un connecteur donnée plus haut.
3.2 Donc
Donc est le marqueur prototypique de la relation de
conséquence. Il semble être le plus employé (ce qui est
corroboré par l'étude de nos deux corpus, voir section 1.3.2).
Donc est un marqueur spécialisé et peu
équivoque2. Son sens premier est d'exprimer la
conséquence3:
1MARCU (1997) distingue la fonction
«phrastique» (sententialfunction) d'un connecteur, où
il ne joue pas le rôle de connecteur, mais porte sur un
élément de la phrase, de sa fonction «discursive»
où le connecteur est utilisé en tant que tel et joue un
rôle au niveau du discours.
2Cela vaut surtout pour l'écrit. Donc
a un nombre d'emplois beaucoup plus important à l'oral. Voir
à ce propos HYBERTIE (1996).
3Ce n'est pas le cas des autres connecteurs courants
comme alors, ainsi ou aussi qui
3. Les marqueurs spécifiques de la relation de
conséquence : les connecteurs
|
|
(3.1) Le flux des octets de données dans le câble
entre deux ports série
est bidirectionnel, il y a donc deux flux (et
deux fils) différents à considérer.
En revanche, donc a aussi une autre possibilité
d'emploi, dans laquelle il se rapproche très nettement du sens de
«au total» ou de «bilan :»4 :
(3.2) Par un heureux télescopage, s'affiche en couverture
de ce nu-
méro un article qui s'inscrit dans la lignée des
travaux fondamentaux de Frédéric Joliot-Curie. Loin, très
loin des applications à problèmes, les physiciens qui
étudient le noyau de l'atome s'interrogent: leur discipline serait-elle
à rebâtir? Dans les accélérateurs, s'accumulent en
effet des observations dérangeantes et, pour en rendre compte, le
modèle de comportement du noyau est de plus en plus complexe. Trop
complexe, affirment certains. La physique nucléaire attendrait
donc son Copernic!
Nous n'assimilons pas ce sens à un type d'expression de
la conséquence. En effet, donc exprime à ce
moment-là la fermeture d'une question, un bilan, ce qui n'est pas
à rapprocher de la conséquence. Précisons que le donc
de «bilan» relie comme le donc consécutif deux
segments de discours, mais que le premier est beaucoup plus grand dans le sens
de «bilan» (comparer l'exemple 3.36 avec l'exemple 3.2). De plus, le
donc de «bilan» se trouve généralement dans un
segment de discours placé en fin de paragraphe (ce qui est le cas de
l'exemple 3.2).
Les contraintes sur donc sont dans l'état actuel
des choses assez peu nombreuses5 6:
ont un sens de base autre que la conséquence et dont le
sens reste toujours teinté de ce sens de base.
4Ce sens, appelé «conclusif» par
HYBERTIE (1996) n'apparaît pas dans le corpus Linux Howto.
5Pour l'instant nous ne pouvons pas vraiment utiliser
directement les résultats de ce
3. Les marqueurs spécifiques de la relation de
conséquence : les connecteurs
|
|
|
conséquence
|
bilan
|
taille de
|
petit
|
grand
|
placement dans le paragraphe
|
libre
|
fin
|
TAB. 3.1-Donc
3.3 Alors
Alors est un connecteur assez polysémique et peut
recevoir plusieurs interprétations selon sa fonction et sa
distribution.
3.3.1 Fonction phrastique
Alors est tout d'abord un adverbe de temps
paraphrasable par «à ce moment-là», c'est donc un
adverbe temporel anaphorique qui fait référence à une
période de temps:
(3.3) Ce modèle reposait sur le fait que les plus anciens
Homo erectus
avaient été mis au jour en Afrique de l'Est et
que les plus récents se trouvaient en Asie et en Europe. Homo erectus
était alors une espèce largement
distribuée dans le temps et dans l'espace et était probablement
l'ancêtre des néandertaliens et, surtout des Homo sapiens sapiens
, c'est-à-dire nous-mêmes.
Lorsque alors est suivi d'un participe passé, il
ne peut avoir d'usage discursif, il s'agit d'un adverbe temporel:
(3.4) Pourtant, la forme «souris» de la protéine
du prion (PrP) était dé-
celable chez la moitié des animaux, résultat
alors jamais observé sur des souris asymptomatiques.
Alors peut aussi être précédé
de jusque en quel cas il est aussi adverbe temporel:
tableau, car il faut d'abord être capable de
déterminer la taille de .
6Pour une explication des conventions utilisées
dans les tableaux, voir le tableau 1 p. i.
3. Les marqueurs spécifiques de la relation de
conséquence : les connecteurs
|
|
(3.5) Une équipe européenne a identifié, par
chromatographie, un gaz
à fort effet de serre jusqu'alors
inconnu.
De même, si on note la présence d'un autre
connecteur introduisant la proposition où se trouve alors, il
ne peut avoir une fonction phrastique:
(3.6) Pourtant la température d' un atome isolé ne
signifie alors pas
grand-chose, et c'est là tout le paradoxe.
3.3.2 Alors que adversatif
Lorsque alors est suivi de que, c'est un
connecteur à part entière, qui peut avoir un sens adversatif
(exemple 3.7) ou temporel (exemple 3.8):
(3.7) Un véritable terminal couleur peut modifier la
couleur du texte et
du fond avec plusieurs couleurs différentes
alors qu'un terminal monochrome ne peut modifier que la
luminosité d'une couleur donnée.
(3.8) Le tournevis glisse du contact alors que
vous le poussez vers le
bas.
Dans ce cas l'expression de la conséquence n'est pas
possible et nous écarterons donc tous les cas où alors
sera suivi de que.
3.3.3 Alors dans les conditionnelles
Alors est très souvent employé en
combinaison avec si dans les conditionnelles en si... alors
(et avec quand dans le cas des conditionnelles en quand...
alors), relation apparentée à la relation de
conséquence (voir section 2.2.3), mais qui n'en est pas une:
3. Les marqueurs spécifiques de la relation de
conséquence : les connecteurs
|
|
(3.10) Quand l'écran est plein (page 1),
alors les données supplémentaires venant de
l'hôte vont sur la page 2.
Dans ce cas, alors ne note pas une relation de
conséquence. On devra donc écarter les couples de propositions
dont la deuxième est introduit par alors et la première
par si ou quand des couples de propositions pouvant accepter
une relation de conséquence.
3.3.4 Alors temporel vs. alors consécutif
Le sens premier de alors est de marquer une succession
temporelle, comme le montre l'exemple suivant:
(3.11) Les modes par blocs peuvent comprendre une
possibilité de formulaires où l'ordinateur hôte envoie un
formulaire au terminal. L'utilisateur le remplit alors et
envoie la touche envoi qui ne renvoie que les données du formulaire
à l'ordinateur hôte.
En plus de cet usage temporel, alors prend relativement
souvent une valeur consécutive7, comme c'est par exemple le
cas ici:
(3.12) Après cette période d'incubation, les
tsé-tsé entrent dans le compartiment des «infectantes»
: le parasite est alors transmis à chaque
piqûre.
La question qui se pose alors est de savoir ce qui nous permet
de différencier le alors temporel du alors
consécutif. Là où un simple patternmatching suffisait
pour écarter le alors des conditionnelles et alors que
d'une interprétation consécutive, il ne suffit plus pour
distinguer sens temporel de sens consécutif.
3. Les marqueurs spécifiques de la relation de
conséquence : les connecteurs
|
|
Selon HYBERTIE (1996), alors en début
d'énoncé est plus susceptible d'exprimer la conséquence,
mais nous n'avons pas pour le moment déterminé les conditions qui
permettent de distinguer bien nettement le sens consécutif du sens
temporel de alors. Cela d'autant plus que l'on n'observe pas un
découpage bien net entre les deux sens et qu'il est donc souvent
très difficile de distinguer le alors temporel du alors
consécutif, voire même parfois de alors adverbe
temporel.
Ce qui semble le plus simple est de dire que l'on
interprète consécutivement le connecteur alors lorsqu'il
y a un lien de causalité entre ses deux arguments. Comme nous l'avons
déjà dit, ce lien de causalité est très complexe
à établir (voir section 2.4) dans le cadre d'un analyseur
rhétorique automatique.
3.3.5 Conditions interdisant l'interprétation
consécutive de alors
Il est très difficile de distinguer le alors
temporel du alors consécutif (dans le tableau qui suit,
ils ont les mêmes conditions d'emploi), mais en revanche il est assez
facile de déterminer les conditions dans lesquelles on ne peut jamais
avoir de relation de conséquence en présence du connecteur
alors:
|
conséq.
|
temp.
|
cond.
|
advers.
|
phrast.
|
+que
|
-
|
-
|
-
|
++
|
-
|
quand/si+
|
-
|
-
|
++
|
-
|
-
|
autre connecteur
|
-
|
-
|
-
|
+
|
+
|
+ participe passé
|
-
|
-
|
-
|
-
|
+
|
TAB. 3.2-Alors
3. Les marqueurs spécifiques de la relation de
conséquence : les connecteurs
|
|
3.4 Ainsi
Rechercher les occurrences de ainsi et des locutions
qui lui sont apparentées (de cette manière, de cette
façon et de la sorte) ne suffit pas à
repérer une relation de conséquence : ce n'est pas le seul emploi
qui existe, et nous allons exposer les conditions qui permettent cette
interprétation.
3.4.1 Ainsique
Il est important d'étudier ainsi que afin de
bien le distinguer de ainsi. En effet, une simple recherche du
connecteur ainsi comme marque de la conséquence dans un texte
peut amener à retrouver des formes qui n'expriment pas la
conséquence. C'est le cas de ainsi que, dont nous allons donner
un aperçu de quelques emplois (son sens n'est jamais
consécutif).
Ainsi que peut être utilisé comme substitut
de la conjonction de coordination et dans son sens additif:
(3.13) La liste suivante fournit quelques liens dans cette
section, ainsi que des options de communication
supplémentaires positionnées uniquement sur le terminal.
Ainsi que peut aussi avoir un emploi rhétorique.
Dans ce cas, il est paraphrasable par comme et il exprime une
comparaison:
(3.14) Ainsi que l' indique le Dr Jean-Marie
Abgrall, «le recrutement d'un adepte passe par trois phases, à
partir desquelles l'adhésion va s'obtenir progressivement, en même
temps qu'apparaît une forme de dépendance intellectuelle et
affective. »
3. Les marqueurs spécifiques de la relation de
conséquence : les connecteurs
|
|
de recevoir une interprétation consécutive.
3.4.2 Ainsi et les locutions apparentées
Ainsi peut être employé de plusieurs
façons différentes et peut aussi bien exprimer une relation
rhétorique (conséquence ou manière) qu'avoir une fonction
phrastique. Nous allons présenter ces différents emplois dans ce
paragraphe ainsi que certaines locutions dont le fonctionnement est
identique.
3.4.2.1 Fonction phrastique
Ainsi n'a pas pour seule vocation d'exprimer une
relation de conséquence; sa vocation première est même
d'exprimer la manière de façon anaphorique. En effet, ainsi
reprend un élément du discours qui précède en
insistant sur la manière dont il s'est déroulé.
(3.15) On constate que la masse ainsi
délimitée reste de l'ordre de 2,9 106 M.
On observe deux cas où ainsi a une fonction
phrastique: lorsque ainsi est sous la dépendance d'un verbe, en
position de complément d'objet direct8 (exemple 3.16), ou
lorsque ainsi joue le rôle d'un complément circonstanciel
de manière (exemple 3.17):
(3.16) Une des raisons possibles de faire ainsi
est d'économiser les factures de téléphone quand
les tarifs ne sont pas symétriques.
(3.17) Souvenez-vous que d'autoriser tout le monde à
monter des disques ainsi est un trou de
sécurité béant, si cela vous préoccupe.
3. Les marqueurs spécifiques de la relation de
conséquence : les connecteurs
|
|
Certaines locutions peuvent jouer le même rôle
anaphorique que ainsi. C'est le cas de de cette
manière, de cette façon et de la sorte. La
paraphrase avec ces locutions peut donc servir de test pour différencier
les usages où ainsi a une fonction phrastique de ceux où
il a une fonction discursive:
(3.18) Souvenez-vous que d'autoriser tout le monde à
monter des disques {de cette manière, de cette façon, de
la sorte} est un trou de sécurité béant, si cela
vous préoccupe.
3.4.2.2 Fonction discursive
Lorsqu'il est placé en tête de proposition,
ainsi est quasiment toujours interprété comme connecteur
consécutif.
Les cas où il ne peut s'agir d'une relation de
conséquence sont les suivants:
- lorsque ainsi est suivi de que, comme nous
l'avons vu à la section 3.4.1;
- et lorsque ainsi est suivi d'un participe
passé. Dans ce cas il exprime la manière:
(3.19) Ainsi chauffée, la matière
se transforme en plasma.
Dans tous les autres cas, ainsi en tête de
proposition jouera le rôle de connecteur consécutif, devenant une
marque facile à repérer:
(3.20) Un terminal texte est souvent relié au port
série de l'ordinateur par l'intermédiaire d'un long câble.
Ainsi, un terminal peut se situer à une distance assez
grande de son ordinateur hôte.
3. Les marqueurs spécifiques de la relation de
conséquence : les connecteurs
|
|
couples d'énoncés suivants sont reliés par
la même relation rhétorique de conséquence:
(3.21) Un terminal est relié au port série.
Ainsi, il peut se situer à distance.
(3.22) Un terminal est relié au port série. Il peut
ainsi se situer à distance.
Quand il n'est pas placé en tête de phrase,
ainsi doit se situer juste après le verbe pour exprimer la
conséquence.
Dans ce dernier cas, ainsi ne doit pas faire partie
d'une proposition comportant déjà un autre connecteur, car il a
alors une valeur de circonstanciel de manière:
(3.23) Les meilleures résolutions utilisées dans
les études de ce type sont de l'ordre d'une centaine de
kilomètres mais on ne peut simuler ainsi
que quelques années d'évolution du climat.
Ici la présence du connecteur mais comme
introduction de la proposition où se situe ainsi empêche
son interprétation consécutive.
3.4.3 Conditions pour l'interprétation
consécutive de ainsi
On interprète donc ainsi
consécutivement dans deux cas: s'il est placé en
début de proposition après une pause forte ou s'il se trouve
immédiatement après le verbe de la proposition où il se
situe, proposition ne devant pas être introduite par un autre
connecteur.
3. Les marqueurs spécifiques de la relation de
conséquence : les connecteurs
|
|
|
discursif
|
phrastique
|
conséquence
|
comparaison
|
manière
|
additif
|
+que
|
-
|
++
|
-
|
++
|
anaphore propositionnelle
|
++
|
-
|
-
|
-
|
présence d'un autre conn.
|
-
|
-
|
+
|
+
|
place
|
|
|
|
|
suivi d'un participe passé
|
-
|
-
|
+
|
+
|
TAB. 3.3-Ainsi
3.5 Aussi
3.5.1 Fonction phrastique
Aussi a deux fonctions phrastiques principales: -
l'adjonction; dans ce cas il est employé seul:
(3.24) Les plus anciens, datés de 3555 avant J.-C, sont
aussi les plus anciens que l'on connaisse.
- la comparaison lorsque aussi est employé
corrélativement au pronom que:
(3.25) Le comportement mécanique d'objets aussi
courants que des fruits ou des légumes n'avait
encore jamais été modélisé rigoureusement.
Nous allons voir qu'il n'est pas difficile de distinguer ces
emplois phrastiques de l'emploi discursif de aussi en observant
simplement son environnement syntaxique immédiat.
3.5.2 Fonction discursive
Même si ce n'est pas dans la majorité des cas,
aussi a également une fonction discursive. Il acquiert alors
une valeur consécutive à laquelle est mêlée la
valeur d'adjonction qu'il a comme adverbe9.
9Pour plus de détails sur la valeur de
aussi consécutif, voir HYBERTIE (1996).
3. Les marqueurs spécifiques de la relation de
conséquence : les connecteurs
|
|
Aussi ne peut avoir de fonction discursive que
lorsqu'il est placé en début de proposition. Ainsi placé,
il ne peut d'ailleurs avoir d'autre fonction qu'une fonction discursive, celle
d'exprimer la conséquence.
On observe deux types de constructions pouvant marquer la
conséquence : soit aussi est placé en début de
proposition et la proposition qu'il introduit comporte une inversion du sujet
(exemple 3.26), soit aussi est suivi d'une virgule et dans ce cas il
n'y a pas d'inversion du sujet (exemple 3.27):
(3.26) La contribution de l'Atlantique nord est d'environ un
milliard de tonnes, celle du Pacifique nord est mineure, mais celle de
l'océan Austral restait à préciser. Pourtant cet
océan occupe 20 % de la superficie de l'océan mondial,
aussi devenait-il urgent de s'y intéresser.
(3.27) À cette jonction de l'histoire intervient une
nouvelle catégorie d'acteurs : les centres de recherche publics. Eux
aussi éditent des revues savantes et eux aussi font face à des
difficultés financières. Aussi, l'idée de
vendre leurs revues aux éditeurs commerciaux leur apparut de plus en
plus séduisante.
3.5.3 Conditions pour l'interprétation
consécutive de aussi
Il est assez facile de repérer dans un texte quand
aussi est employé comme connecteur consécutif, comme
nous le montre le tableau suivant:
|
conséquence
|
phrastique
|
place dans
|
|
|
environnement ortho.
|
- (1) /. Aussi, (2)
|
-
|
inversion du sujet
|
++ (1) / - (2)
|
-
|
TAB. 3.4-Aussi
3. Les marqueurs spécifiques de la relation de
conséquence : les connecteurs
|
|
3.6 Marques spécialisées
En dehors des connecteurs que nous venons d'étudier,
qui peuvent avoir une fonction phrastique et une fonction discursive, voire la
possibilité d'exprimer plusieurs relations rhétoriques
différentes selon le contexte, il existe cependant des connecteurs
totalement univoques10 qui n'ont pour rôle que de marquer une
relation de conséquence. Le plus utilisé d'entre eux est par
conséquent, mais il en existe bien d'autres que nous allons
énumérer dans cette section.
3.6.1 Conséquence pure : par conséquent
Le connecteur par conséquent est le seul qui
soit complètement univoque, et donc sans problème
d'interprétation. En effet, il ne peut recevoir d'autre
interprétation qu'une interprétation consécutive:
(3.28) Malheureusement, les terminaux graphiques couleur pour
Linux (X Window) avec des communications à grande vitesse est un
marché de niche avec des prix élevés, et par
conséquent dans ce cas les économies en coût de
matériel, s'il y en a, seront faibles.
Cela entraîne qu'à chaque fois que l'on rencontre ce
connecteur, on a une relation de conséquence, sans condition
supplémentaire.
3.6.2 Connecteurs anaphoriques univoques
Un certain nombre de connecteurs reprennent anaphoriquement le
contenu de la (ou des) proposition(s) qui précède(nt) et sont
totalement univoques quant à la relation rhétorique qu'ils
expriment11.
'°En fait, seul par conséquent
est totalement univoque, les autres pouvant avoir une fonction phrastique.
Mais une simple contrainte sur le positionnement résout
immédiatement l'ambiguïté.
''Modulo une contrainte de placement pour certains.
3. Les marqueurs spécifiques de la relation de
conséquence : les connecteurs 3.6.2.1 Ce qui fait
que
Ce qui fait que ne doit pas être placé en
début de phrase pour introduire une relation de conséquence
(3.29) RJ48 possède un taquet supplémentaire
ce qui fait qu'une fiche RJ48 ne rentrera pas dans une prise
RJ45.
(3.30) Ce qui fait qu'une fiche RJ48 ne
rentrera pas dans une prise RJ45, c'est que RJ48 possède un taquet
supplémentaire.
En effet, nous avons une relation de conséquence en
3.29, où ce qui fait que n'est pas placé en début
de phrase, alors qu'en 3.30, il ne s'agit pas d'une relation de
conséquence.
3.6.2.2 De ce fait
On peut exprimer une relation de conséquence à
l'aide de de ce fait:
(3.31) Par exemple, la proportion de repas de sang pris sur
les humains n'est pas intégrée dans les SIG. Or ce terme
intervient au carré dans les équations donnant la vitesse de
propagation de la maladie! De ce fait, et contrairement
à une idée triviale, ce paramètre est beaucoup plus
important que la densité des tsé-tsé.
Il peut exister des cas où de ce fait se
trouve dans une position où il n'est pas du tout un connecteur comme
dans l'exemple suivant, bien que nous n'ayons pas rencontré le cas en
corpus:
(3.32) Je ne suis pas au courant de ce fait.
3. Les marqueurs spécifiques de la relation de
conséquence : les connecteurs
|
|
3.6.2.3 Ce faisant
Ce faisant a une liberté de placement assez
grande, car il peut se placer aussi bien en tête de proposition (exemple
3.34) qu'en milieu de proposition (exemple 3.33) et même en incise
(exemple 3.35):
(3.33) C'est comme si on avait branché un terminal de
type A sur un port série et ensuite positionné TERM sur le type
B, déclarant ce faisant que le terminal est de type
B.
(3.34) En assemblant des fils et des anneaux conducteurs,
cette équipe a fabriqué une structure où les lois
physiques qui régissent la propagation de micro-ondes sont partiellement
inversées. Ce faisant, ils ouvrent la voie à la
fabrication de dispositifs inédits.
(3.35) Ceux-ci se troquent au détour de contacts
personnalisés et de liens privilégiés qu'entretiennent
entre eux divers laboratoires, équipes et chercheurs et, ce
faisant, perpétuent l'esprit originel de la République
des lettres.
3.6.2.4 Dans ce cas
Dans ce cas exprime la conséquence lorsqu'il
est situé en début de phrase (exemple 3.36) alors que quand il
est placé librement, il a une fonction phrastique (exemple 3.37):
(3.36) Certains terminaux possèdent une option de
configuration pour informer le terminal qu'aucune imprimante n'est
présente. Dans ce cas le terminal ignorera toute
commande qui redirigerait la sortie vers l'imprimante.
(3.37) Nous sommes seuls dans ce cas.
3. Les marqueurs spécifiques de la relation de
conséquence : les connecteurs
|
|
3.6.3 Reprise anaphorique de la raison
Nous avons rencontré trois connecteurs : pour cette
raison (exemple 3.38), c'est pourquoi (exemple 3.40) et c'est
la raison pour laquelle (exemple 3.39) qui ont pour particularité
de reprendre anaphoriquement une raison. En cela, ils permettent d'introduire
la conclusion d'une relation de conséquence.
(3.38) Il risque d'y avoir des problèmes si vous
n'allumez pas le terminal en premier (voyez «getty se relance trop
rapidement»). Pour cette raison, on devrait utiliser
«stty clocal» qui est la valeur par défaut.
(3.39) Le répertoire /bin dispose lui aussi de droits
d'accès: cf. «Droits d'accès aux répertoires»
pour plus d'informations. C'est la raison pour laquelle vous
ne pouvez pas effacer le fichier /bin/ls à moins d'être root.
(3.40) Dans les métaux, qui contiennent des charges
électriques «libres» de se déplacer, la
perméabilité magnétique reste positive, mais la
permittivité électrique est négative pour les
fréquences inférieures à un seuil, nommé
«fréquence de résonance plasma». Les ondes
électromagnétiques ne peuvent alors pas s'y propager.
C'est pourquoi les ultraviolets traversent les métaux,
tandis que la lumière visible ou les ondes hertziennes, dont les
fréquences sont beaucoup plus petites, se réfléchissent
à la surface.
Il existe une contrainte de placement forte sur ces
connecteurs: ils doivent se placer en début de phrase (après une
marque de ponctuation forte). S'ils se trouvent dans une autre position, ils
n'auront pas un sens consécutif comme on le voit ici:
3. Les marqueurs spécifiques de la relation de
conséquence : les connecteurs
|
|
(3.41) Ce qui m'échappe, c'est la raison pour
laquelle être une personne potentielle conférerait un
droit spécial de vivre.
(3.42) Dès les années 1960 on suggéra que
les trous noirs supermassifs pouvaient être à la source de
l'incomparable puissance des noyaux actifs de galaxies pour cette
raison.
3.6.4 Récapitulation
Nous avons regroupé tous les connecteurs
consécutifs «univoques» dans le tableau suivant:
|
environnement ortho.
|
place dans
|
par conséquent
|
-
|
|
ce qui fait que
|
[, | Ø] x
|
|
decefait
|
-
|
|
ce faisant
|
-
|
|
dans ce cas
|
. X
|
|
reprise de la raison
|
. X
|
|
TAB. 3.5 - Les connecteurs univoques
3.7 Conclusion
Avec ce que nous venons de voir dans ce chapitre, nous avons
pu nous apercevoir que les connecteurs dans leur grande majorité, bien
que présentés comme marques univoques d'une relation
rhétorique, ne sont pas toujours univoques. Mieux encore, il est parfois
très difficile de distinguer entre différents sens d'un
même connecteur, mais on peut dans une grande partie des cas lever les
ambigüités en observant de plus près l'environnement et les
arguments du connecteur.
Maintenant que nous avons vu les moyens
«classiques», ou du moins classiquement cités, d'exprimer la
relation de conséquence, nous allons
3. Les marqueurs spécifiques de la relation de
conséquence : les connecteurs
|
|
nous attarder sur les autres moyens de le faire qui sont à
notre disposition.
Chapitre 4
Autres moyens de signaler une
relation de conséquence
Il existe un certain nombre d'études concernant les
connecteurs de conséquence du français (voir en particulier
ROSSARI et JAYEZ (1996), JAYEZ et ROSSARI (1997), HYBERTIE (1996) ou encore
FORGET (1984)), mais la question des autres moyens de marquer la
conséquence n'a -- à notre connaissance -- pas encore
été étudiée. Nous allons donc, après avoir
justifié la nécessité d'aborder les moyens de marquer une
relation de conséquence autres que les connecteurs, étudier
quelques indices qui nous permettent de repérer une relation de
conséquence, notamment le participe présent, la relative ou
encore l'anaphore propositionnelle.
4.1 Les connecteurs ne suffisent pas à
déterminer la structure rhétorique d'un texte
Pour construire automatiquement à l'aide d'un
système informatique la structure rhétorique d'un texte, on peut
se baser sur la recherche d'indices de ces relations. Les indices
privilégiés d'une relation rhétorique sont les connecteurs
(voir chapitre 3), qui nous viennent en premier à l'esprit. Il est
possible d'élaborer un système ne reposant que sur ces connec-
4. Autres moyens de signaler une relation de
conséquence
|
|
teurs, comme le fait par exemple Daniel Marcu dans MARCU
(1997). Mais il se pose à ce moment-là un problème: il est
impossible d'obtenir une analyse rhétorique complète d'un texte
(bien que Marcu estime que cela est suffisant pour les buts qu'il s'est
assignés, autrement dit le résumé automatique). En effet,
il existe bien d'autres moyens de marquer une relation rhétorique que
les connecteurs', et il faut évidemment prendre en compte ces autres
moyens pour s'approcher le plus possible d'une représentation
rhétorique complète d'un texte.
Nous nous attacherons particulièrement aux moyens
purement linguistiques, hormis les connecteurs, qui nous permettent
d'interpréter la relation qui relie un couple de segments de discours
comme une relation consécutive, bien que d'autres mécanismes
puissent parfois entrer en jeu, comme l'appel à nos connaissances de
sens commun et aux lois causales (voir section 2.4). Il nous semble en effet
qu'il est moins coûteux pour un système informatique de se baser
sur une analyse linguistique fine plutôt que de faire appel à des
connaissances extra-linguistiques, difficiles à appréhender et
à modéliser, et beaucoup trop nombreuses à prendre en
compte.
Contrairement aux cas où l'on est en présence de
marques lexicales d'une relation rhétorique, les connecteurs, qu'il
suffit de repérer pour connaître la relation rhétorique
qu'ils expriment, on doit en l'absence de connecteurs prendre en compte un
nombre de contraintes beaucoup plus important et faire une analyse beaucoup
plus fine afin de repérer une telle relation.
Contrairement aux connecteurs qui sont utilisés pour
marquer une
1Il semble que la fréquence d'emploi des
connecteurs varie selon le genre discursif (journalistique, technique,
juridique) : les textes juridiques emploient les connecteurs en nombre afin
d'éviter au maximum les écarts d'interprétation, alors que
le style journalistique est lui plutôt caractérisé par un
emploi très réduit des connecteurs, favorisant plutôt la
fluidité du style.
4. Autres moyens de signaler une relation de
conséquence
|
|
relation rhétorique, les autres façons de
marquer une relation de conséquence ne sont pas aussi simples à
repérer. En effet, c'est un ensemble d'éléments qui vont
nous permettre de faire une interprétation consécutive d'un
couple de propositions. Nous rechercherons donc maintenant la présence
d'indices; indices, qui, en combinaison avec d'autres indices et seulement
à ce moment-là permettent l'interprétation
consécutive.
Nous commencerons donc par un moyen utilisé assez
fréquemment pour marquer la conséquence: le participe
présent.
4.2 Participe présent
Le participe présent peut en français exprimer une
relation de conséquence, bien que d'autres relations puissent être
exprimées grâce à lui2.
L'exemple suivant montre un cas d'expression de la
conséquence à l'aide d'un participe présent:
(4.1) La bombe atomique est venue augmenter la confusion
générale à l'égard de la Science, portant
cette confusion jusque chez les savants eux-mêmes.
Partant de ce constat, il va nous falloir trouver les
conditions dans lesquelles l'usage d'un participe présent permet ou non
l'interprétation consécutive. Pour ce faire, nous allons
étudier l'environnement du participe présent dans les cas
où il n'exprime pas une relation de conséquence et nous en
déduirons dans quel cas il peut l'exprimer.
2L'anglais quant à lui fait un usage
intensif du participe présent en -ing pour exprimer la
conséquence. Le participe présent est dans cette langue plus
univoque qu'en français (voir CORSTON-OLIVER (1998b)).
4. Autres moyens de signaler une relation de
conséquence
|
|
4.2.1 Le gérondif
Le participe présent n'est pas à confondre avec
le gérondif, qui est une construction constituée du pronom en
suivi d'un participe présent. Le gérondif ne peut pas
marquer la conséquence: les relations rhétoriques qu'il est
susceptible d'exprimer sont les relations de cause (exemple 4.2) et de
manière (exemple 4.3) :
(4.2) En transfectant son gène, les
chercheurs ont laissé la glycopro-
téine s'exprimer dans des cellules
endothéliales.
(4.3) Tuez ensuite l'ancien getty en utilisant
la touche k dans «top».
Nous pouvons donc exclure très simplement les
participes présents faisant partie d'un gérondif de l'expression
de la conséquence en éliminant les cas où le participe est
précédé du pronom en.
4.2.2 Incise et déterminative
Après avoir exclu de l'expression de la
conséquence les gérondifs, nous allons maintenant nous pencher
sur deux constructions impliquant un participe présent, mais qui
n'expriment pas une relation de conséquence: les incises et les
déterminatives.
L'exemple suivant montre une proposition comprenant un participe
présent qui est en incise:
(4.4) Trois articles, émanant de deux
groupes de recherche, suggèrent que ce serait notre galaxie qui
prendrait la première place.
Nous ne pouvons pas y voir une relation de conséquence:
l'incise vient simplement ajouter une information supplémentaire sur un
groupe nominal, en l'occurrence elle vient préciser la nature des trois
articles. L'incise ne peut pas marquer une relation de conséquence parce
qu'elle ne peut
4. Autres moyens de signaler une relation de
conséquence
|
|
déjà pas marquer une relation rhétorique.
En effet, elle vient compléter un groupe nominal et n'est pas en
relation avec une autre proposition (une relation rhétorique est une
relation entre deux propositions, ou du moins entre deux
éventualités que le GN n'exprime pas ici).
L'autre construction qui n'est pas susceptible d'exprimer la
conséquence est la déterminative3:
(4.6) Le terminal ressemble à une fenêtre
donnant sur l'ordinateur.
Nous avons le même genre de problématique que
pour l'incise avec la déterminative: elle n'exprime pas une relation
rhétorique. La déterminative est facile à repérer
car elle n'est jamais séparée du groupe nominal qu'elle
complète par une marque de ponctuation, et à chaque fois que l'on
rencontre un participe présent suivant immédiatement un groupe
nominal (sans ponctuation intermédiaire), il s'agira d'une
déterminative.
En observant ces deux constructions, on peut préciser
un peu plus les conditions dans lesquelles on peut interpréter
consécutivement une construction comprenant un participe présent.
Le fait qu'un participe présent n'étant pas
précédé d'une marque de ponctuation exprime toujours une
déterminative nous indique que le participe présent devra
toujours être précédé d'une marque de ponctuation.
Dans le cas où le participe présent est
précédé d'une marque de ponctuation, il faudra
repérer les cas d'incise pour les exclure. Quoi qu'il en soit, les deux
arguments de la relation de conséquence devront être des
propositions complètes.
3Nous appelons cette construction
déterminative en référence aux relatives
déterminatives. En effet, cette construction est paraphrasable par une
relative déterminative:
(4.5) Le terminal ressemble à une fenêtre qui donne
sur l'ordinateur.
4. Autres moyens de signaler une relation de
conséquence
|
|
4.2.3 Participe présent, cause et
conséquence
Comme nous venons de le voir, un participe présent qui
se trouve dans une incise ou dans une déterminative n'est pas
susceptible d'exprimer la conséquence.
Dans les autres cas, le participe présent peut marquer
la conséquence, mais est aussi susceptible de dénoter une
relation de cause. Nous allons donc voir ce qui permet de différencier
les deux usages.
Le premier critère est la position: un participe
présent situé en début de phrase (après un point)
ne peut marquer la conséquence:
(4.7) Poussant plus loin l'investigation, les
chercheurs ont trouvé des
traces de réplication du prion et de
neurodégénérations spongiformes.
Les critères que nous venons d'exposer doivent encore
être affinés, car si on les respecte, on peut toujours avoir aussi
bien une relation de cause qu'une relation de conséquence. Nous
compléterons ces critères par des contraintes de deux ordres: une
contrainte positionnelle et une contrainte sémantique.
Nous allons commencer par la contrainte positionnelle. En
effet, le participe présent doit être placé
immédiatement après la virgule pour que l'on ait une relation de
conséquence:
(4.8) Le SCI projeta donc en pleine lumière une collection
de revues
qui, jusque-là, n'était jamais apparue autrement
que fragmentée, chaque élément appartenant
à une spécialité ou discipline
particulière.
(4.9) Au-dessus d'une certaine intensité, des pores
apparaissent à la
surface des membranes cellulaires, entraînant
la mort des cellules.
4. Autres moyens de signaler une relation de
conséquence
|
|
L'exemple 4.8 exprime effectivement la cause alors que l'exemple
4.9, où le participe suit immédiatement la virgule, exprime la
conséquence.
Cette contrainte positionnelle doit encore être
complétée par une contrainte sémantique sur le verbe au
participe présent pour bien distinguer les cas
où l'on peut exprimer la conséquence à
l'aide d'un participe présent. En effet, le verbe au participe
présent ne doit jamais exprimer un état:
(4.10) Nous y observons des hommes morphologiquement proches
de ceux présents en Afrique de l'Est il y a 1,8 million d'années,
vivant dans un environnement et parmi une faune similaires.
Ici nous avons une relation d'élaboration, et non de
conséquence.
Il reste donc le cas où le participe présent
précédé d'une virgule exprime un
événement:
(4.11) Lorsque le légume est encore frais,
l'économe glisse facilement, enlevant une
épaisseur régulière de peau.
Nous avons maintenant bien circonscrit les conditions
nécessaires pour que l'on interprète consécutivement une
construction comprenant un participe présent : le participe
présent doit se situer après une virgule le séparant d'une
proposition complète. De plus, il doit exprimer un
événement et ne pas se trouver en incise.
4.2.4 Participe présent suivi d'un connecteur
Le participe présent exprimant la conséquence
est très fréquemment accompagné d'un connecteur
«anaphorique», comme ainsi, ou cefaisant, qui lui
est postposé:
(4.12) C'est comme si on avait branché un terminal de
type A sur un port série et ensuite positionné TERM sur le type
B, déclarant ce faisant que le terminal est de type
B.
4. Autres moyens de signaler une relation de
conséquence
|
|
(4.13) Les messages du système peuvent aussi être
écrits directement à l'adresse matérielle de la console,
court-circuitant ainsi /dev/tty0.
(4.14) On rapporte souvent cette valeur à l'effectif
des populations humaines, obtenant ainsi le paramètre
«RVH» (pour Rapport des effectifs de Vecteurs sur les effectifs
Humains)
Dans ce cas précis, l'interprétation est totalement
univoque, autant du point de vue du participe présent que de
ainsi.
4.2.5 Conditions d'emploi du participe présent dans
une construction consécutive
Nous avons réuni dans le tableau suivant les conditions
dans lesquelles un participe présent peut participer à
l'établissement d'une relation de conséquence:
|
conséquence
|
élaboration
|
moyen
|
cause
|
verbe de
|
changement d'état
|
état
|
libre
|
libre
|
env. ortho.
|
, XXXant
|
, XXXant
|
libre
|
libre
|
gérondif
|
-
|
-
|
++
|
+
|
p.pr.dans
|
-
|
-
|
+
|
+
|
p.pr.dans
|
++
|
++
|
+
|
+
|
conn. cons.
|
+
|
-
|
-
|
-
|
TAB. 4.1 - Participe présent
4.3 Anaphore propositionnelle et conséquence
Certains procédés jouent un rôle dans
l'expression de la conséquence. C'est le cas de l'anaphore
propositionnelle. Les pronoms ceci et cela expriment souvent
une anaphore propositionnelle, et c'est donc en recherchant leur
présence qu'on a des chances de trouver une relation de
4. Autres moyens de signaler une relation de
conséquence
|
|
conséquence. Il va donc falloir trouver les indices
supplémentaires qui permettent cette interprétation en
présence des pronoms ceci ou cela.
4.3.1 Les pronoms anaphoriques ceci et cela et l'anaphore
propositionnelle
Les pronoms anaphoriques ceci et cela sont
employés pour reprendre un élément déjà
posé dans le discours, en général un groupe nominal:
(4.15) Mais d'un autre côté je ne vois pas vraiment
pourquoi cela / ceci nous gêne.
Cependant, il existe une autre possibilité d'emploi de
ces pronoms ana- phoriques, l'anaphore ne portant pas alors sur un groupe
nominal, mais sur une proposition entière. On parle alors d'anaphore
propositionnelle:
(4.16) Plus ils sont soûls, plus le nombre de
configurations qu'ils donnent à voir à leur commandant est
élevé. Cela fait pour le moins
désordre...
Dans ce cas dans nos corpus4, le pronom anaphorique
sera toujours placé en début de proposition,
séparée par une marque de ponctuation de la proposition qui la
précède.
Or il se trouve que quand ils expriment une anaphore
propositionnelle, les pronoms ceci et cela5
acquièrent un rôle discursif que nous allons étudier.
4C'est le cas dans nos corpus, mais on peut
très bien imaginer le cas où ceci / cela est
précédé d'un adverbial:
(4.17) Plus ils sont soûls, plus le nombre de
configurations qu'ils donnent à voir à
leur commandant est élevé. Évidemment
cela fait pour le moins désordre...
5Il existe d'autres moyens de marquer une anaphore
propositionnelle, comme par exemple un adjectif démonstratif suivi d'un
groupe nominal:
(4.18) Plongés dans ce potentiel, tous les autres
nucléons subissent cette déforma-
tion, et leurs orbitales réagissent en se déformant
à leur tour. Cette réaction peut amplifier le
phénomène de déformation spontanée.
4. Autres moyens de signaler une relation de
conséquence
4.3.2 Propositions introduites par ceci et cela :
élaboration vs. conséquence
En tant que marqueurs d'anaphore propositionnelle, ceci
et cela sont des indices d'une relation rhétorique
lorsqu'ils sont placés en début de proposition. Mais cette
relation n'est pas toujours la même : elle peut être une entre
relation de la conséquence ou une simple élaboration (au sens de
MANN et THOMPSON (1987)).
Précisons que ces pronoms anaphoriques peuvent entrer
dans une construction exprimant la condition, lorsque la proposition
précédente est introduite par si ou quand:
(4.19) Si le démarrage ne
réussit pas, ceci ne sera d'aucun utilité.
(4.20) Quand on la met sur Meta, cela
en fait une touche Meta qui positionne le bit de haut rang sur chaque
octet.
Il est donc facile d'écarter ces constructions lors d'une
recherche automatique.
De toute façon, ceci et cela ne
peuvent exprimer l'anaphore propositionnelle que s'ils sont
précédés d'une marque de ponctuation forte (point ou
point-virgule).
Quand elle est précédée d'une marque de
ponctuation forte, une proposition introduite par ceci ou cela
exprime généralement une relation d'élaboration
(4.21) ou, c'est ce qui nous intéresse, une relation de
conséquence (4.22):
(4.21) Il peut paramétrer le temps de fonctionnement du
port après sa fermeture. Cela est nécessaire
à des vitesses basses de 1200 et moins.
Dans ce cas, l'interpération consécutive est
également possible. Cependant, nous en resterons pour le moment aux
pronoms démonstratifs ceci et cela, la
problématique de l'anaphore propositionnelle étant bien trop
vaste.
4. Autres moyens de signaler une relation de
conséquence
|
|
(4.22) Vous pouvez essayer de taper soit «reset»
soit «setterm -reset». Ceci enverra la chaîne
de ré-initialisation à partir de l'entrée du terminal dans
la base terminfo.
Il semble que ce qui nous permet de distinguer entre
conséquence et élaboration est contenu dans la sémantique
du verbe.
En effet, en présence d'un verbe d'état comme
dans l'exemple 4.21 la seule interprétation possible est
l'élaboration. En revanche, en présence d'un verbe efficient
comme dans l'exemple 4.22 l'interprétation sera consécutive.
C'est donc la position du pronom anaphorique dans la
proposition et la sémantique du verbe de cette proposition qui nous
permet de déterminer les conditions dans lesquelles une relation de
conséquence peut être exprimée en présence de
ceci et cela.
4.3.3 Récapitulation
Lorsqu'on rencontre une proposition introduite par ceci
ou cela, on a des chances de se trouver dans un cas de figure
où une relation rhétorique est exprimée. Nous
récapitulons donc dans le tableau suivant quels indices
supplémentaires permettent une interprétation
consécutive:
|
conséquence
|
condition
|
phrastique
|
|
changement d'état
|
libre
|
libre
|
env. ortho.
|
[.; :] (ceci | cela)
|
, (ceci | cela)
|
libre
|
si ou quand dans
|
-
|
++
|
+
|
TAB. 4.2 - Anaphore propositionnelle
4.4 La relative
4. Autres moyens de signaler une relation de
conséquence
|
|
surtout est utilisée: les relatives continuatives et les
relatives dont l'antécédent est un pronom relatif anaphorique de
la proposition qui précède.
4.4.1 Qui
On peut exprimer une relation de conséquence à
l'aide d'une relative d'un type particulier, la relative continuative, comme le
montre l'exemple suivant:
(4.23) Vous pouvez essayer de lui envoyer un signal 9 à
partir de top qui devrait le forcer à
s'arrêter.
Par une paraphrase avec donc, on voit bien la valeur
consécutive que prend la relative:
(4.24) Vous pouvez essayer de lui envoyer un signal 9 à
partir de top. Cela devrait donc le forcer
à s'arrêter.
(4.25) Il ne quittera vraisemblablement la tête du
classement que frappé par la limite d'âge de 2 ans, qui
le fera sortir de la base de données Hot Papers.
Les relations de conséquence marquées par une
relative continuative sont très rares (seulement deux occurrences dans
nos corpus), il nous a donc été difficile de déterminer
des critères permettant leur interprétation consécutive.
De plus, il nous semble que cette forme est simplement compatible avec
l'expression de la conséquence plutôt qu'un moyen d'exprimer cette
relation rhétorique. En revanche, un autre type de relative justifie
plus qu'on la considère comme moyen d'expression de la
conséquence: les relatives introduites par ce qui.
4.4.2 Ce qui
Les relatives introduites par ce qui permettent
l'expression de la conséquence:
(4.26) Compter le nombre d'articles plutôt que leur
qualité incite à produire des textes saucissonnés et
contribue à augmenter le nombre de revues, ce qui
accentue la crise actuelle.
En fait, ces relatives ont comme antécédent le
pronom ce qui reprend anaphoriquement la proposition qui
précède. On peut à ce propos faire un parallèle
avec les propositions introduites par cela ou ceci, avec
lesquelles elles sont complètement interchangeables, comme le montre
l'exemple suivant paraphrasant l'exemple 4.26:
(4.27) Compter le nombre d'articles plutôt que leur
qualité incite à produire des textes saucissonnés et
contribue à augmenter le nombre de revues. Ceci / cela
accentue la crise actuelle.
De même, si elle est placée en début de
phrase après un point, une proposition introduite par ce qui se
substituera à un groupe nominal:
(4.28) Ce qui se passe
généralement est que ce qui est tapé au clavier est
envoyé directement à l'ordinateur hôte uniquement qui en
retour renvoie au terminal chaque caractère qu'il reçoit.
La partie anaphorique, le pronom ce, doit reprendre la
proposition qui précède et non constituer un
«substitut» nominal:
(4.29) Une routine fait une vérification pour
déterminer ce qui vient de se passer.
(4.30) Tout ce qui a été
tapé à toute vitesse est exécuté.
(4.31) Il s'agit d'un mâle, ce qui
n'est pas particulièrement un atout, alors qu'il reste
aujourd'hui quatre mâles et une seule femelle dans cette population.
La seule possibilité de placement de ce qui
est donc après une virgule en début de proposition. De plus,
le verbe de cette proposition ne doit pas être un verbe d'état
sans quoi on n'aurait plus une relation de conséquence:
(4.32) On peut utiliser stty pour configurer le comportement
de ce terminal, ce qui comprend l'arrêt de tout ou
partie de cette fonctionnalité.
Voici donc un tableau reprenant les conditions dans lesquelles on
peut avoir une relation de conséquence en présence de ce
qui:
|
conséquence
|
elaboration
|
phrastique
|
verbe de
|
changement d'état
|
état
|
libre
|
env. ortho.
|
, ce qui
|
, ce qui
|
[A,] ce qui
|
incise
|
-
|
+
|
-
|
TAB. 4.3 - Relative
4.5 Syllogisme
On rencontre régulièrement dans les textes des
raisonnements en trois temps, que l'on appelle classiquement syllogismes.
Le cas le plus typique de syllogisme est de la forme or donc ,
comme le montre ce grand classique:
(4.33) Tous les hommes sont mortels. Or Socrate
est un homme. Donc Socrate est mortel.
Dans ce cas, la conséquence est marquée de
façon explicite par le connecteur donc, mais il arrive souvent
qu'elle ne soit pas marquée. À ce moment-là, seul le
or reste:
(4.34) Au-dessus d'une certaine intensité, des pores
apparaissent à la surface des membranes cellulaires, entraînant la
mort des cellules et ce, d'autant plus facilement que celles-ci sont grosses.
Or les cellules souches sont très petites: un choix
judicieux de l'intensité permet de les épargner.
La conclusion du syllogisme est séparée de la
proposition marquée par or par deux points ou par un point.
On peut donc facilement circonscrire les triplets de
propositions exprimant un syllogisme en repérant la marque lexicale
or6, ce qui nous permet de délimiter simplement la
relation de conséquence qui lui correspond.
Cependant toutes les constructions avec or n'expriment
pas un syllogisme, bien qu'il semble que ce soit généralement le
cas:
(4.35) Les tsé-tsé mâles et femelles
«susceptibles» s'infectent en piquant un malade. Or
il faut environ vingt jours pour que le parasite atteigne les glandes
salivaires de la mouche. C'est un temps relativement long pour un vecteur qui a
une durée de vie moyenne de un mois!
Il nous restera donc à trouver les indices qui permettent
de distinguer un or amenant une conséquence d'un or
qui n'en amène pas.
Il existe aussi quelques constructions proches de celles
impliquant la présence de or, comme par exemple des
constructions en « toutefois : »:
4. Autres moyens de signaler une relation de
conséquence
|
|
(4.36) Faute d'informations, les modélisations
supposent habituellement que la structure est analogue à celle que l'on
observe après un certain temps de croissance.
Toutefois, les premières observations microscopiques
directes révèlent que ce n'est pas toujours vrai [.. .]. Il
faudra sans doute réviser quelques modèles.
Les contraintes pour l'interprétation consécutive
dans le cas d'un syllogisme sont donc très simples:
conséquence
+ `or' +
TAB. 4.4 - Syllogisme
4.6 La juxtaposition et la coordination
La relation de conséquence peut être
exprimée alors qu'aucun des indices que nous avons établis dans
ce chapitre et le chapitre précédent ne sont présents.
Après avoir étudié ces constructions où l'on peut
repérer des indices, nous allons maintenant brièvement parler des
autres cas où une relation de conséquence peut être
exprimée: la coordination avec la conjonction de coordination et
et la simple juxtaposition de deux phrases.
En présence d'une simple juxtaposition, on peut tout
à fait avoir une relation de conséquence:
(4.37) Les claviers pour diverses marques et modèles de
terminaux ne sont pas toujours interchangeables. On obtient parfois un clavier
«incompatible» qui fonctionne en partie sur un terminal.
4. Autres moyens de signaler une relation de
conséquence
|
|
(4.38) La mémoire vidéo à
l'intérieur du terminal peut ne pas retenir les deux sessions et
vous pouvez avoir besoin de rafraîchir l'écran en
basculant sur l'autre session
Nous ne creuserons pour l'instant pas plus avant ces cas de
juxtaposition et ce coordination: en effet, il nous semble indispensable
d'avoir recours à des connaissances extra-linguistiques afin de pouvoir
interprêter la relation entre deux segments de discours comme relation de
conséquence.
4.7 Verbes modaux
Il existe un moyen d'exprimer l'inférence en
français, moyen que nous avons aperçu à la section 2.3 :
l'utilisation de verbes modaux. Le fait qu'une inférence soit
marquée à l'aide de ces verbes modaux permet de renforcer
l'interprétation consécutive quels que soient les indices
repérés. Et même dans le cas où aucun indice n'est
présent, ils permettent d'assigner une forte probabilité d'avoir
une relation de conséquence entre un couple de propositions dont la
deuxième est un verbe modal.
Commençons par le verbe pouvoir. Il peut aider
l'interprétation consécutive, comme on le voit dans l'exemple
suivant où les deux propositions qui entrent dans la composition d'une
relation de conséquence sont simplement coordonnées par
et:
(4.39) La mémoire vidéo à
l'intérieur du terminal peut ne pas retenir les deux sessions et vous
pouvez avoir besoin de rafraîchir l'écran en
basculant sur l'autre session.
Le verbe devoir dans son usage modal a la même
propriété, celle de nous diriger un peu plus vers une
interprétation consécutive:
4. Autres moyens de signaler une relation de
conséquence
|
|
Les modaux devoir et pouvoir peuvent
également être utiles pour désambigüiser un connecteur
équivoque comme alors, qui dans l'exemple suivant ne peut
être interprêté temporellement:
(4.41) Le second embranchement comporte une série de
branches avec des Homo sapiens «archaïques», puis l'homme
moderne et la lignée néandertalienne. Tout cet ensemble de
branches pourrait alors être nommé Homo
sapiens.
Comme nous l'avons vu à la section 2.3, les verbes
modaux ne sont pas toujours modaux et il existe un grand nombre de cas
où ils n'expriment pas une inférence. Nous n'avons pas le temps
dans ce mémoire d'aller plus avant pour trouver les conditions qui
permettent d'interpréter de façon inférentielle ces
verbes, mais nous sommes conscient qu'il sera important par la suite de les
prendre en compte.
4.8 Bilan
Ce chapitre nous a montré qu'il existe d'autres moyens
d'exprimer la conséquence que les connecteurs. Il s'agit alors d'un
système complexe d'indices qui interagissent entre eux, mais que l'on
peut réunir afin de pouvoir faire une analyse automatique de la relation
de conséquence.
Nous devrons donc réunir tous ces indices ainsi que les
contraintes sur les connecteurs consécutifs pour pouvoir
implémenter un programme de reconnaissance automatique de la relation de
conséquence. C'est ce que nous allons présenter dans le chapitre
suivant.
Chapitre 5
Implémentation
Les résultats obtenus grâce à l'analyse de
corpus étaient dès le départ destinés à
être utilisés dans un système de repérage
automatique de la relation de conséquence.
Nous proposons donc ici de décrire le fonctionnement de
l'illustrateur implémentant les éléments
déterminants pour l'interprétation consécutive que nous
aurons préalablement réunis dans la première section de ce
chapitre.
5.1 Les paramètres à prendre en compte
pour l'analyse de la relation de conséquence
Dans notre mémoire de maîtrise (DRUON (2000)),
nous nous étions attardé sur une façon de marquer une
relation de conséquence: l'usage de connecteurs consécutifs, dont
nous avons étudié quelques spécimens. Mais, nous l'avions
déjà signalé, il existe d'autres moyens d'exprimer la
conséquence en français, même si ce n'est pas
exprimé lexicalement comme c'est le cas quand on utilise un
connecteur.
Nous allons maintenant envisager les différents points
qu'il est important d'analyser pour dégager ce qui permet de discriminer
dans un texte une relation de conséquence.
5.1.1 En présence d'un connecteur
L'élément le plus facile à repérer
pour analyser la relation de conséquence sont les connecteurs. Les
connecteurs n'étant pas tous totalement univoques, il est
nécessaire d'ajouter quelques contraintes pour désambigüiser
leur usage.
5.1.1.1 Contrainte positionnelle
Selon la position qu'il occupe dans la proposition, un
connecteur est susceptible d'avoir un sens différent, ou une fonction
phrastique plutôt que discursive:
(5.1) Tu ne m'en a pas parlé. De ce fait,
je ne suis pas au courant.
(5.2) Tu ne m'en as pas parlé. Je ne suis pas au courant
de ce fait.
Ici, la position de de ce fait dans
l'énoncé lui donne un sens différent: placé en
début de phrase (exemple 5.1), c'est un connecteur de
conséquence, alors que placé ailleurs dans
l'énoncé, il occupe une fonction syntaxique dans la phrase
(exemple 5.2).
5.1.1.2 Environnement immédiat
Deux types de contraintes sont à chercher dans
l'environnement immédiat du connecteur:
- La ponctuation qui l'entoure;
- Des mots qui sont susceptibles de l'entourer.
Le premier cas, l'observation de la ponctuation environnante,
permet d'occulter les emplois non-consécutifs de dans ce cas
par exemple. En effet, dans ce cas ne peut être susceptible
d'introduire une relation de conséquence que lorsqu'il est
précédé d'un point:
(5.3) Certains terminaux possèdent une option de
configuration pour
informer le terminal qu'aucune imprimante n'est
présente. Dans ce cas le terminal ignorera toute
commande qui redirigerait la sortie vers l'imprimante.
Le second cas nous permet d'écarter toutes les
occurrences de alors ou de ainsi suivies de la conjonction
que qui dans ce cas n'expriment pas la conséquence:
(5.4) La liste suivante fournit quelques liens dans cette
section, ainsi
que des options de communication
supplémentaires positionnées uniquement sur le terminal.
(5.5) MS Windows utilise ANSI alors qu'Internet
utilise souvent Latin-
1.
5.1.1.3 Contrainte syntaxique
Il existe aussi des contraintes syntaxiques, comme par exemple
l'inversion du sujet après aussi pour qu'il reçoive une
interprétation consécutive:
(5.6) La contribution de l'Atlantique nord est d'environ un
milliard de
tonnes, celle du Pacifique nord est mineure, mais celle de
l'océan Austral restait à préciser. Pourtant cet
océan occupe 20 % de la superficie de l'océan mondial,
aussi devenait-il urgent de s'y intéresser.
5.1.2 En l'absence d'un connecteur
dice en présence duquel il est possible de trouver une
relation de conséquence, et cette indice associé à
d'autres facteurs permettra l'interprétation consécutive.
5.1.2.1 Repérage d'un indice
Le repérage d'un indice de la relation de
conséquence, comme par exemple un participe présent, ne pose pas
plus de problème que celui d'un connecteur. Un simple pattern-matching
suffit.
5.1.2.2 Contrainte positionnelle
Tout comme pour les connecteurs, les indices peuvent ne
participer à l'expression de la conséquence que lorsqu'ils sont
dans une certaine position.
Par exemple, un participe présent devra toujours
être placé en début de proposition et pas en début
de phrase, auquel cas on ne pourrait avoir une relation de
conséquence:
(5.7) Poussant plus loin l'investigation, les
chercheurs ont trouvé des
traces de réplication du prion et de
neurodégénérations spongiformes.
5.1.2.3 Contrainte sur l'aspect et le type du verbe
Une nouvelle contrainte qu'on n'avait pas rencontrée
avec les connecteurs est la contrainte sur l'aspect et le type du verbe qui
permet de distinguer la plupart du temps entre relation de conséquence
(exemple 5.9) et relation d'élaboration (exemple 5.8):
rapide de la bibliothèque de Princeton du projet
Tulip.
(5.9) Dans les modèles les plus courants, la
résolution est plutôt de
l'ordre de quelques centaines de kilomètres. Cela
permet de comptabiliser les dépressions et de les
classer en fonction de leur intensité.
5.1.3 Avec l'un ou l'autre
Certains éléments dans l'entourage de l'indice
(que ce soit un connecteur ou autre) permettent parfois de déterminer le
choix de l'interprétation consécutive. C'est par exemple le cas
des marques de l'inférence comme les verbes modaux qui permettent
souvent de donner une inteprétation consécutive là on on
pourrait hésiter (voir à ce sujet la section 4.7).
5.1.4 Récapitulation
Nous récapitulons dans le tableau suivant les grands types
de contraintes sur les indices selon leur type:
|
avec connecteur
|
sans connecteur
|
Contrainte positionnelle
|
+
|
+
|
Environnement immédiat
|
+
|
-
|
Aspect / type du verbe
|
-
|
+
|
Présence d'un modal
|
+
|
+
|
TAB. 5.1 - Contraintes utilisées
5.2 Préalables à l'analyse automatique
de la relation de conséquence: étiquetage morpho-syntaxique et
lemmatisation
5.2.1 Nécessité d'un étiquetage
morpho-syntaxique
Avant de pouvoir réaliser l'analyse de la relation de
conséquence proprement dite, le texte d'entrée du système
doit être étiqueté et lemmatisé. Cet
étiquetage est nécessaire pour plusieurs raisons:
- Éviter une grande partie de la tâche de
segmentation
- Pouvoir éliminer facilement certains cas. Par
exemple, dans les cas où alors fait partie d'une conjonction de
subordination, il est étiqueté en tant que tel:
alors CON sub part1
(5.10)
que CON sub part2
- Repérer la présence d'un verbe pour
délimiter une proposition
5.2.2 Choix du système d'étiquetage
Afin de réaliser l'opération d'étiquetage
morpho-syntaxique, nous avons choisi d'utiliser TreeTagger, un
étiqueteur réalisé à l'IMS de
Stuttgart1
Il est disponible en plusieurs langues, notamment le
français. Cet étiqueteur est libre de droits et parmi les plus
efficaces des étiqueteurs non-commerciaux. Il est disponible
gratuitement au téléchargement à l'adresse suivante:
http://www.ims.uni-stuttgart.de/projekte/TreeTagger/
DecisionTreeTagger . html
'Voir SCHMID (1994) pour le principe.
De plus, nous utilisons un lemmatiseur qui reconnaît le
jeu d'étiquettes de TreeTagger, ce qui fait que l'association des deux
est intéressante.
Ce lemmatiseur, Flemm, est un programme PERL
développé à l'université de Nancy 2 par Fiammetta
Namer, et il permet de lemmatiser les mots d'un textes à partir du jeu
d'étiquettes de TreeTagger.
Une page de présentation avec une courte
présentation de son fonctionnement est disponible à:
http://www.univ-nancy2.fr/pers/namer/Telecharger_Flemm.htm
5.3 Choix du langage de programmation: PERL
Pour implémenter notre système, il nous fallait
choisir un langage de programmation.
Nous avons opté pour PERL, qui nous semblait le plus
adapté:
- C'est un langage qui permet d'obtenir rapidement un
illustrateur;
- La tâche de traitement textuel que nous avons à
réaliser est gran-
dement facilitée et simplifiée en utilisant ce
langage qui permet une
gestion des chaînes de caractères sans obstacle et
implémente les
expressions régulières;
- Il est simple de créer une interface graphique
conviviale et de faire une démonstration sur Internet à l'aide
des extensions CGI du langage et d'un navigateur.
5.4 Présentation du système
Le repérage d'une relation de conséquence ne se
passera pas de la même manière selon qu'elle est introduite par un
connecteur ou que d'autres indices sont utilisés. Néanmoins, la
délimitation des arguments
de la relation passe souvent par le repérage d'une
proposition.
Nous présentons dans cette section les algorithmes qui
sont à la base de notre système. Il faut préciser que nous
avons essayé de les simplifier au maximum afin d'en faciliter la
compréhension, ce qui fait que la cohérence n'est pas toujours
respectée. De plus, l'implémentation des algorithmes est souvent
plus complexe que les algorithmes en question2.
signification
Nous présentons dans le tableau suivant les fonctions
de base de l'illustrateur que nous utiliserons dans les algorithmes
présentés par la suite : fonction
prop_G
prop_G (argument) prop_D
prop_D (argument) rel_csq(a, b)
la proposition à gauche de l'indice
la proposition à gauche de l'argument
la proposition à droite de l'indice
la proposition à droite de l'argument
affichage de la relation de conséquence entre a et b
TAB. 5.2 - Fonctions de base de l'illustrateur
5.4.1 Repérage d'une proposition
complète
Nous considérons pour les besoins de notre programme, et
cela est
évidemment sur-simplifié, qu'une proposition est un
ensemble de mots: - situés entre l'indice que l'on traite (connecteur ou
autre) et une
marque de ponctuation forte
- qui contient un verbe
Nous définissons ici les algorithmes à la base des
fonction du tableau 5.2:
2Par exemple, la façon de délimiter
la proposition dans laquelle se trouve un connecteur comme donc qui
est libre de placement n'est pas précisée. On précise
seulement qu'on cherche la proposition dans l'algorithme.
Algorithme 1 Algorithmes de repérage
d'une proposition à droite ou à gauche de l'indice
sub prop_G (argument)
chercher une marque de ponctua-
tion forte à gauche de l'argument
si il y a un verbe entre cette marque et l'argument retourner
selection
fsi
fin
sub prop_D (argument)
chercher une marque de ponctua-
tion forte à droite de l'argument
si il y a un verbe entre l'argument et cette marque retourner
selection
fsi
fin
sub prop_D
prop_D (indice)
f s ub
5.4.2 Traitement des connecteurs
5.4.2.1 Donc
Repérer les relations de conséquence introduites
par donc ne pose pas de problème particulier, le seul
problème étant la bonne délimitation des propositions qui
l'entourent (problème réglé par l'algorithme de
délimitation des propositions):
Algorithme 2 Donc
sub donc
chercher "donc"
rel_csq (prop_G, prop_D) fsub
5.4.2.2 Alors
tion:
Algorithme 3 Alors
sub alors chercher "alors"
si "alors" n'est pas une partie de conjonction de
subordination
si "quand" ou "si" n'introduisent pas prop_G rel_csq (prop_G,
prop_D)
fsi
fsi
fs ub
5.4.2.3 Ainsi
Ainsi doit être distingué de ainsi que
et ne pas être suivi d'un participe passé:
Algorithme 4 Ainsi
sub ainsi chercher "ainsi"
si "ainsi" n'est pas une partie de conjonction de
subordination
si "ainsi" n'est pas suivi d'un participe passé si "ainsi"
est situé en début de phrase rel_csq (prop_G, prop_D)
fs i
fsi
fsi
fs ub
5.4.2.4 Aussi
Le traitement de aussi est assez simple : il suffit
de rechercher sa présence après un point et de voir s'il est
suivi d'une virgule ou d'une inversion du sujet et du verbe.
Algorithme 5 Aussi
sub aussi
chercher "aussi" précédé d'un point
si la forme qui suit est un verbe et celle d'après
un tiret
ou la forme qui suit est une virgule
alors
rel_csq (prop_G, prop_D)
fsi
fs ub
5.4.2.5 Connecteurs «univoques» dont le
placement n'a pas d'im-
portance
Il s'agit des connecteurs par conséquent et
ce faisant qui expriment toujours la conséquence quel que soit
l'endroit où ils se trouvent.
Algorithme 6 Connecteurs à placement
libre
sub conn _libre
chercher le connecteur voulu rel_csq (prop_G, prop_D)
fsub
5.4.2.6 Connecteurs «univoques» à
placement fixe
D'autres connecteurs, comme de ce fait, ce qui
fait que ou pour cette raison ont toujours un sens
consécutif, mais à la condition qu'ils soient placés
à une place particulière dans la phrase (la recherche d'une
marque de ponctuation suffit pour ce faire).
Algorithme 7 Connecteurs à placement
fixe
sub conn_fixe
chercher le connecteur voulu pré-
cédé de la marque de ponctuation voulue rel_csq
(prop_G, prop_D)
fsub
5.4.3 Traitement des autres indices
Les autres indices requièrent que l'on aille chercher
autre chose que le simple environnement orthographique ou le fait que la
proposition soit complète à gauche. En effet, la combinaison de
ces indices associés avec un type de verbe particulier permet
l'expression de la conséquence3.
5.4.3.1 Participe présent
Le participe présent doit être
précédé d'une virgule et être efficient ou
être suivi d'un connecteur particulier pour que l'expression de la
conséquence soit possible:
Algorithme 8 Participe présent
sub part_pres
chercher un participe présent précédé
d'une virgule si il est suivi d'un connecteur
{ainsi, ce faisant, de ce fait} alors
si verbe _changement_etat (participe présent) alors
relation _de _consequence
fsi
fsi
fsub
5.4.3.2 Ce qui
Ce qui suit à peu près les mêmes
règles sauf qu'il n'y a pas d'intervention de connecteurs possible:
5.4.3.3 Ceci / cela
Contrairement à ce qui, ceci ou cela
doivent être précédés d'une marque de
ponctuation forte. Sinon c'est toujours l'association avec un verbe ef-
3Ce n'est pas le cas du syllogisme qui lui requiert
de trouver une marque du syllogisme et d'aller chercher deux propositions
à gauche au lieu d'une pour les marques normales.
Algorithme 9 Ce qui
sub cequi
chercher une occurrence de "ce qui" précédée
d'une
virgule
si la prop_G est complète alors
si verbe_changement_etat (verbe de prop_D) alors rel_csq (prop_G,
prop_D)
fsi
fsi
fsub
ficient qui crée l'interprétation
consécutive:
Algorithme 10 Ce qui
sub cecicela
chercher uneoccurrence de "ceci" ou "cela"
précédée
d'une marque de ponctuation forte
si prop_G est complète alors
si verbe_changement_etat (verbe de prop_D) alors rel_csq (prop_G,
prop_D)
fsi
fsi
fsub
5.4.3.4 Syllogisme
Voici l'algorithme permettant de repérer simplement un
syllogisme et de délimiter les arguments de la relation de
conséquence qu'il implique:
Algorithme 11 Syllogisme
sub syllogisme
chercher une occurrence de "or"
rel_csq(prop_G + prop_D, prop_D(prop_D)) fsub
5.4.4 Présence d'un type de verbe particulier
Nous avons manuellement créé une liste de verbes
efficients et de verbes causatifs. Cette liste est loin d'être exhaustive
et ne reflète pour l'instant que les besoins que nous avons eu pour nos
corpus.
Pour créer une liste plus exhaustive, il faudra
«entraîner» l'illustrateur avec d'autres corpus, les plus
variés possibles et rajouter à la liste chaque nouveau verbe du
type voulu qui apparaît. Cela devrait par la suite permettre d'obtenir
des résultats satisfaisants : un bon taux de reconnaissance de la
relation de conséquence en présence d'un indice comme ceci
/ cela par exemple accompagné de ce type de verbe.
Algorithme 12 Verbe efficient
sub verbe _changement _etat (verbe)
si lemme du verbe appartient à la liste des verbes
efficients alors
retourner vrai
fsi
fs ub
5.5 Utilisation
En ligne de commande tout comme par l'intermédiaire
d'un navigateur, notre illustrateur est très simple à utiliser,
car il prend juste un fichier en entrée et affiche ou sauvegarde dans un
fichier l'ensemble des relations de conséquence trouvées.
5.5.1 En ligne de commande
Notre illustrateur ne peut fonctionner seul et
nécessite que le fichier qu'on lui donne à traiter soit
déjà étiqueté et lemmatisé à l'aide
de TreeTagger et de Flemm:
# tree-tagger-french nom_de_fichier_texte >nom_de_fi
chier_tagge
# f lemm --entree nom_de_fichier_tagge --sortie nom _de _fichier
_lemmatise --tagger TreeTagger
Une fois le fichier correctement taggé et
lemmatisé, nous pouvons lancer notre programme:
# perl
csq.pl nom _de _fichier _lemmatise
Le programme affiche à l'écran les relations de
conséquence qu'il a trouvées accompagnées de statistiques
concernant les moyens employés pour exprimer cette relation dans le
texte donné en entrée. Nous allons maintenant montrer un exemple
de sortie du programme:
5.5.2 Par navigateur
Nous avons rendu disponible une version de notre illustrateur
utilisable en ligne sur internet à l'adresse suivante:
http://druon.free.fr/csq
Il suffit de suivre les instructions (choisir un fichier, puis
attendre que les résultats s'affichent à l'écran).
5.6 Problèmes à résoudre et
fonctions à implémenter
Il reste un certain tâches à accomplir afin
d'obtenir un analyseur plus performant, et ces tâches sont de deux
ordres:
- soit nous n'avons pas eu le temps de tenir compte de certains
éléments évoqués dans les chapitres 3 et 4;
5. Implémentation
|
|
[]
[cse L' examen au microscope électro-
nique confirme la
présence de manganèse sur l' électrode au
carbone : cse] [csq l' électrode contenant du manga-
nèse s' est
{ donc } partiellement dissoute. csq]
[]
[cse La modification brutale du mode d'alimentation de
la tsé-
tsé peut aussi intervenir. cse] [csq { Ainsi },
dans les années 1980, il a été
observé dans un village
congolais (Congo Brazzaville) que la proportion de repas de sang
pris sur les humains pas-
sait de 5% à 50%
après une épizootie de peste porcine ayant
décimé 96%
du cheptel. csq]
[]
Ainsi 54 33.13%
Ce qui 8 4.91%
Ceci / cela 4 2.45%
Donc 74 45.40%
Part. Prés. 23 14.11%
TOTAL 163 100.00%
|
FIG. 5.1 - Exemple de sortie de l'illustrateur
- soit l'implémentation pose des problèmes
supplémentaires qui n'étaient pas apparus dans l'analyse.
5.6.1 Éléments à
implémenter
Nous n'avons pas tenu compte dans l'analyseur des verbes
modaux. Il faudra donc dans une prochaine version intégrer leur
recherche afin de rendre plus efficace encore l'analyseur.
De plus, nous ne tenons pas non plus compte de segments plus
grands que la proposition. L'illustrateur ne fait la recherche que de relations
de conséquence qui relient deux propositions. Il faudra dans l'avenir
tenir compte des segments plus grands.
5.6.2 Problèmes d'implémentation à
résoudre
Il nous reste plusieurs points à résoudre, en
particulier les points suivants:
- Notre algorithme de reconnaissance de propositions
complètes reste
très simpliste, et il nécessiterait d'être
grandement amélioré;
- La reconnaissance des verbes efficients est soumise à
apprentissage pour chaque nouveau texte. Il faudra donc faire un apprentissage
sur un nombre de corpus important pour obtenir un ensemble plus exhaustif de ce
type de verbes;
- De plus, la reconnaissance des verbes efficients est plus
complexe qu'un simple pattern-matching. En effet, une même forme peut
avoir deux sens différents et il serait opportun de pouvoir distinguer
ces sens différents pour ne pas obtenir de faux résultats;
- Il arrive parfois que plusieurs connecteurs ou indices
puissent apparaître ensemble, ce qui fausse l'analyse quantitative, le
système
comptant deux relations de conséquence au lieu d'une.
5.7 Comparaison de l'analyse quantitative manuelle et
de l'analyse quantitative donnée par l'illustrateur
Dans le tableau de la page suivante nous présentons la
comparaison de l'analyse quantitative manuelle que nous avons faite sur le
corpus Linux-Howto et l'analyse quantitative donnée par
l'analyseur.
Dans l'ensemble les connecteurs sont bien
désambigüisés, ce qui est normal car en dehors de aussi
et de alors, un simple pattern-matching suffit pour rendre
non-ambigu le sens d'un connecteur. En revanche, les résultats sont
mauvais pour alors, le système trouvant beaucoup plus de
relations de conséquence introduites par ce connecteur que ce qu'il en
est en réalité. Le connecteur ainsi quant à lui
est relativement bien désambigüisé.
En ce qui concerne les autres indices, le système a
tendance à sur- générer quelque peu des relations en
présence de l'indice ceci / cela et à avoir de bons
résultats autrement. Notons que le nombre de relations de
conséquence en présence d'un participe présent est faible
dans le corpus Linux-Howto et que les résultats en sont par
conséquent médiocres. Nous obtenons des résultats
très honorables sur le corpus La Recherche.
5.8 Conclusions
Notre analyseur reconnaît dans la plupart des cas la
présence de relations de conséquence et il obtient des
résultats relativement proches de l'analyse manuelle.
En revanche, il a une tendance sensible à
surgénérer dans certains
|
Autre indice
|
ceci / cela
|
ce qui
|
pt. pr.
|
analyse manuelle
|
26
|
20,5%
|
7
|
5,5%
|
2
|
1,6%
|
illustrateur
|
36
|
22,1%
|
7
|
4,3%
|
4
|
2,5%
|
Connecteur
|
ainsi alors ce faisant ce qui fait que dans ce cas donc par
conséquent pour cette raison
|
23
|
18,1%
|
11
|
8,7%
|
1
|
0,8%
|
3
|
2,4%
|
4
|
3,1%
|
42
|
33,0%
|
7
|
5,5%
|
1
|
0,8%
|
30
|
18,4%
|
27
|
16,6%
|
1
|
0,6%
|
3
|
1,8%
|
4
|
2,5%
|
42
|
25,8%
|
7
|
4,3%
|
1
|
0,6%
|
analyse manuelle
illustrateur
FIG. 5.2 - Comparaison analyse manuelle / analyse de
l'illustrateur
cas. Il nous faudra donc résoudre les problèmes
d'implémentation que nous avons soulevé (reconnaissance d'une
proposition complète, gestion des verbes efficients...) et affiner
l'analyse linguistique et le système informatique afin d'éviter
cette surgénération et de bien délimiter les propositions
que relient la relation de conséquence.
Conclusion
Dans notre mémoire de maîtrise, nous nous
étions attardé sur un moyen d'exprimer une relation de
conséquence : les connecteurs, dont nous avions étudié le
comportement de quelques spécimens sélectionnés a priori.
Partant du constat qu'il existait d'autres moyens d'exprimer une relation
rhétorique que ces connecteurs, nous avons mis en place une
méthode exploratoire permettant de cerner les moyens d'expression de la
relation de conséquence dans un corpus. Le fait qu'il existe
également des relations proches de la relation de conséquence et
avec lesquelles on peut parfois confondre cette dernière nous a
amené à définir précisément les notions de
conséquence et de relation de conséquence. Cette étape de
définition s'est avérée nécessaire pour l'approche
de corpus que nous avons adoptée, notre objet d'étude devant
être cerné au mieux avant son analyse en corpus.
Sur ces bases nous avons pu caractériser
linguistiquement la réalisation de cette relation, en remarquant que de
nombreuses marques n'étaient pas répertoriées ni
citées dans la littérature. De plus nous avons montré
qu'il était nécessaire d'envisager les indices de la relation de
conséquence (que ce soient les connecteurs ou d'autres indices comme le
participe présent) dans leur contexte afin caractériser
pleinement les conditions de l'interprétation consécutive.
Nous nous sommes donc éloigné d'une approche
strictement lexicale
de la relation de conséquence, perçue à
travers les connecteurs comme seuls marqueurs de la relation, pour aller vers
une approche prenant en compte des informations plus variées. Cette
évolution nous est apparue nécessaire car se contenter de
détecter les connecteurs ne permet ni de détecter à coup
sûr une relation de conséquence, ni de couvrir l'ensemble des
relations de conséquence d'un texte. Nous avons donc identifié
des indices en présence desquels on peut avoir une relation de
conséquence et nous avons circonscrit un certain nombre de contraintes
supplémentaires qui permettent ou qui empêchent
l'interprétation consécutive en leur présence.
Grâce aux résultats obtenus par notre approche
exploratoire en corpus, nous avons pu implémenter une première
ébauche d'analyseur automatique de la relation de conséquence qui
donne des résultats intéressants.
Bien que notre approche de la relation de conséquence en
corpus nous ait permis de couvrir une partie plus importante des moyens
d'expression de la relation de conséquence que là où
nous nous étions arrêté dans notre mémoire de
maîtrise, certaines questions restent encore ouvertes: - Nous avons
étudié la relation dans deux corpus, un manuel tech- nique et
une revue de vulgarisation scientifique. Les résultats obte- nus sont
donc propres aux corpus et il faudrait étendre cette
étude à d'autres genres discursifs (textes littéraires,
juridiques, journalis- tiques) afin d'avoir un panorama plus complet de la
mise en texte de la relation, en utilisant par exemple notre analyseur sur
ces textes; - Partant du constat que certaines constructions anaphoriques
(ana- phore propositionnelle) sont souvent un indice en présence
duquel on rencontre une relation de conséquence, et que certains
connec- teurs (comme ainsi) ont également une valeur
anaphorique, il serait
intéressant de préciser les liens entre anaphore
propositionnelle et relation de conséquence.
- Il faudra envisager le rapport étroit
qu'entretiennent inférence et conséquence : dans un premier temps
établir précisément ce qui permet d'exprimer une
inférence et dans un second temps rassembler les conditions permettant
l'interprétation consécutive en présence de cette
inférence;
- Les temps verbaux semblent également jouer un
rôle dans l'expression de la relation de conséquence. Nous n'avons
pas eu le temps d'explorer cette voie mais elle semble riche;
- Il nous faudra continuer de tester dans un système
informatique amélioré les résultats obtenus, ce qui nous
permettra d'affiner encore plus l'analyse;
- En plus de l'analyse linguistique, il serait
intéressant de rajouter un module statistique permettant
d'améliorer les résultats de notre ébauche d'analyseur.
En conclusion, notre objectif est d'obtenir une
caractérisation encore plus complète et précise des moyens
d'expression de la relation de conséquence afin de pouvoir
intégrer ces résultats dans un analyseur rhétorique
automatique du français.
Bibliographie
«La recherche ». mai 2000.
AMSILI, P. et ROSSARI, C. (1998). « Tense and connective
constraints on the expression of causality ».
ASHER, N. (1993). Reference to abstract objects in
discourse. Kluwer Academic Publishers, Amsterdam.
AUROUX, S. (1990). « Effet ». In AUROUX, S.
(Éd.), Encyclopédie philosophique universelle. II Les notions
philosophiques. PUF.
CHARAUD EAU, P. (1992). Grammaire du sens et de
l'expression. Hachette, Paris.
COPELAND, J. (1997). «CYC : A Case Study in Ontological
Engineering ». Electronic Journal of Analytic Philosophy, 5.
http://www.alanturing.net/pages/pub/cyc/cyc.pdf.
CORSTON-OLIVER, S. (1998a). « Beyond string matching and
cue phrases: improving efficiency and coverage in discourse analysis ». In
HOVY, E. et RADEV, D. (Éds.), Papersfrom the 1998 spring symposium
of theAAAI, pages 9-15, Menlo Park. AAAI Press.
CORSTON-OLIVER, S. (1998b). Computing representations of
discourse structure. PhD Thesis, Université de Californie
à Santa Barbara.
DANLOS, L. (1988). « Connecteurs et relations causales
». Langue Française, 77 :92-127.
DENDALE, P. (1994). « Devoir
épistémique, marqueur modal ou évidentiel? ».
Langue française, 102 :24-40.
DENDALE, P. (2000). « Devoir
épistémique à l'indicatif et au conditionnel:
inférence ou prédiction? ». In ENGLEBERT, A. et ET AL.
(Éds.), Actes du XII Congrès international de linguistique et
de philologie romanes, Bruxelles. 23-29 juillet 1998.
DENDALE, P. et ROSSARI, C. (2000). « Abduction et
déduction, inférence et évidentialité. Le cas de
devoir et de donc ». In Colloque international La
médiation, marquages en langue et en discours.
DESCLÉS, J.-P., CARTIER, E., JACKIEWICZ, A., et MINEL,
J.-L. (1997). « Textual processing and contextual exploration method
». In Actes de Context 97, Rio de Janeiro.
DRUON, S. (2000). « Projet de taxinomie des connecteurs du
français pour le traitement automatique: l'exemple des
consécutifs ». Mémoire de maîtrise, Université
Bordeaux III.
http://druon.free.fr/travaux/druon2000.pdf.
DUBOIS, J., GIACOMO, M., GUESPIN, L., MARCELLESI, C.,
MARCELLESI, J.-B., et MÉVEL, J.-P. (Éds.) (1994).
Dictionnaire de linguistique et des sciences du langage. Larousse,
Paris.
FORGET, D. (1984). « Quelques particularités des
connecteurs de consé-
cutivité: essai polyphonique ». Semantikos,
pages 17-39.
FRASER, B. (1999). « What are dicourse markers? ».
Journal of pragmatics, 31(7) :931-952.
GALIOTOU, E. (1999). Modélisation de la
causalité à partir de l'analyse des phénomènes
temporels dans les langues naturelles: application au grec moderne. PhD
Thesis, Université Paris 13.
GARCIA, D. (1998). « Exploitation, pour
l'élaboration de requêtes de fiiltrage de textes, des
connaissances causales détectées par COATIS ». In Actes
de RIFRA '98, Sfax, Tunisie.
HYBERTIE, C. (1993). Étude des marqueurs de
consécution en français contemporain. Thèse de
doctorat, Université Paris III.
HYBERTIE, C. (1996). La conséquence en
français. Ophrys, Paris.
ITKONEN, E. (1994). « Causation ». InASHER, R.
(Éd.), TheEncyclopaedia of Language and Linguistics. Pergamon
Press.
JACKIEWICZ, A. (1998). L'expression de la causalité
dans les textes. Contribution au filtrage sémantique par une
méthode informatique d'exploration contextuelle. Thèse de
doctorat, Université Paris 4.
JAYEZ, J. et ROSSARI, C. (1997). « Connecteurs de
conséquence et portée sémantique ». Cahiers de
linguistique française, 19 :233-265.
http://worldserver2.oleane.com/jjayez/clf19.ps.gz.
JAYEZ, J. et ROSSARI, C. (1998). « Pragmatic connectives
as predicates. The case of inferential connectives ». In
Predicativeforms in natural language and in lexical knowledge bases.
Kluwer Academic Publishers, Dordrecht.
http://worldserver2.oleane.com/jjayez/klu.ps.gz.
KNOTT, A. (1996). A data-driven methodology for motivating a
set of
coherence relations. PhD Thesis, Université
d'Edimbourg.
http://www.cs.otago.ac.nz/staffpriv/alik/papers/
thesis .ps .gz.
KOZLOWSKA-HEUCHIN, R. (1996). Étude comparée
des connecteurs en français et en polonais. Thèse de
doctorat, Université Paris VII.
LABARRIÈRE, P.-J. (1990). « Résultat». In
AUROUX, S. (Éd.), Encyclopédie philosophique universelle. II
Les notions philosophiques. PUF.
LENAT, D. (1995). « CYC : A large-scale investment in
knowledge infrastructure ». Communications of the ACM, 38(11)
:33-38.
http://riss.keris.or.kr:8080/pubs/citations/journals/
cacm/1995-38-11/%p33-lenat/.
MANN, W. C. et THOMPSON, S. A. (1987). «Rhetorical
structure theory: a theory of text organisation ». ISI Reprint Series ISI
/ RS-87-190, Information Sciences Institute.
MARCU, D. (1997). The rhetoricalparsing, summarization,
andgeneration of natural langage texts. PhD Thesis, Université de
Toronto.
http://www.isi.edu/marcu/papers/phd-thesis.ps.gz.
MINEL, J.-L., DESCLÉS, J.-P., CARTIER, E., CRISPINO,
G., BEN HAZEZ, S., et JACKIEWICZ, A. (2001). «Résumé
automatique par filtrage d'informations dans les textes. Présentation de
la plateforme FilText ». Technique et Science informatiques,
3.
http://www.lalic.paris4.sorbonne.fr/\~minel/fichiers/
TSI .pdf.
MOESCHLER, J. (1998). « Ordre temporel, causalité
et relations de discours: une approche pragmatique ». In VOGELEER, S.,
BORILLO, A., VETTERS, C., et VUILLAUME, M. (Éds.), Temps et
discours. BCILL, Louvain la Neuve.
MOESCHLER, J. et REBOUL, A. (1994). Dictionnaire
encyclopédique de pragmatique. Seuil.
NAZARENKO, A. (2000). La cause et son expression en
français. Ophrys.
PIOT, M. (1991). « Quelques problèmes
inédits de constructions avec des conjonctions
«Conséquentielles» ». Lingvisticæ
Investigationes, 15(2) :285-303.
PLANTIN, C. (1990). Essais sur l'argumentation.
Kimé, Paris.
REY, A. et REY-DEBOVE, J. (Éds.) (1993). Le Nouveau
Petit Robert. Dictionnaires Le Robert, Paris.
ROSSARI, C. (1999). « Les relations de discours avec ou sans
connecteurs ». Cahiers de linguistique française.
ROSSARI, C. (2001). « Les relations de discours: approches
rhétoriques, approches pragmatiques et approches sémantiques
». Verbum.
ROSSARI, C. et JAYEZ, J. (1996). « Donc et les
consécutifs. Des systèmes de contraintes différentielles
». Lingvisticæ Investigationes, XX(1) :117-143.
SCHMID, H. (1994). « Probabilistic part-of-speech tagging
using decision trees ». In International Conference on New Methods in
Language Processing.
http://www.ims-stuttgart.de/ftp/pub/corpora/
tree-tagger1 . ps . gz.
STONE, M. (1994). « The reference argument ofepistemic
must». In Actes deICWS 1, pages 117-143.
http://www.cs.rutgers.edu/\~mdstone/pubs/iwcs94.pdf.
TAMOWSKI, L. et DENDALE, P. (1994). « Pouvoir : un
marqueur d'évidentialité ». Langue
Française, 102 :41-55.
VENDLER, Z. (1967). Linguistics inphilosophy. Cornell
University Press, Ithaca (NY).
Annexe A
# !/usr/bin/perl -w
## ##
# # # #
################################################################ #
#
# Extraction automatique de la relation de conséquence
#
# #
# (c) 2001 Sébastien Duon #
#
# ################################################################
# # # #
## ##
# variables globales
my (@forme, @type, @lemme, @v_etat, @v_changt_etat, %stats) ; my
$nbInd = 0;
# fonction principale : préparation des fichiers et
appel des fonctions de recherche
sub main()
{
my $total=0;
die "Utilisation :\nperl
csq.pl nom _de _fichier _lemmatise.lem
[>relations_de_conséquence.txt]\n" if ($#ARGV<0) ; $ARGV[0]=~
/^(.*)\.(.*?)$/;
$fic = $1 ;
open SRC, "./lib/verbes-etat.lst" or die "Pas de fichier de
verbes d'état\n"; @v_etat=<SRC>;
chop @v_etat;
close SRC;
open SRC, "./lib/verbes-changt-etat.lst" or
die "Pas de fichier de verbes de changement d'état\n";
@v_changt_etat=<SRC>;
chop @v_changt_etat; close SRC;
open LOG, ">$fic.log"; open VER, ">$fic.ver";
open SRC, $ARGV[0] or die "Il faut spécifier un nom de
fichier valide...\n";
print STDERR "Traitement du fichier $ARGV[0]\n"; print STDERR
"Préparation du document.. .\n";
my $i=0 ;
while (<SRC>)
{
($forme[$i], $type[$i], $lemme[$i]) = split '\t' ;
$i++;
}
splice @tmp;
close SRC;
print STDERR "Recherche des indices... " ;
# Connecteurs
donc() ; ainsi() ; aussi() ; alors() ; parcons() ; decefait()
;
cefaisant() ;
ceqfq() ; danscecas() ;
pourcr() ; cestpq() ; cestlrpl() ;
# Autres indices
ppres() ; cequi() ; cecicela() ;
syllo() ;
close VER; close LOG;
# affichage des statistiques stats() ;
}
sub stats()
{
my $total=0; my $totalA=0; my $totalC=0; my $lenmax=0; #
calcul du nombre total de marques et de l'étiquette la plus longue
foreach $key (sort(keys %statsC))
{
$totalC+=$statsC{$key};
$lenmax=($lenmax>length($key)) ?$lenmax length($key);
}
foreach $key (sort(keys %statsA))
{
$totalA+=$statsA{$key};
$lenmax=($lenmax>length($key)) ?$lenmax length($key);
$total = $totalA + $totalC;
die "Aucune statistique possible\n" if ($total==0) ; #
définition du format du tableau
$format = "@".'<' x ($lenmax+1) .
"@>>>@>>>>>>%";
eval "format STDERR =\n$format\n".'$nom, $nb, $prc'."\n.\n";
# impression du tableau
print STDERR "\n\nStatistiques :\n"; print STDERR
"\nConnecteurs\n";
print STDERR "-" x length($format),"\n"; foreach $key (sort(keys
%statsC))
{
$nom=$key;
$nb=$statsC{$key} ;
$prc=sprintf("%.2f", $statsC{$key}/$total*100); write STDERR;
}
print STDERR "-" x length($format),"\n";
($nom, $nb, $prc) = ("TOTAL", $totalC, sprintf("%.2f",
$totalC/$total*100)); write STDERR;
print STDERR "\nAutres\n";
print STDERR "-" x length($format),"\n";
foreach $key (sort(keys %statsA))
{
$nom=$key;
$nb=$statsA{$key} ;
$prc=sprintf("%.2f", $statsA{$key}/$total*100);
write STDERR;
}
print STDERR "-" x length($format),"\n";
($nom, $nb, $prc) = ("TOTAL", $totalA, sprintf("%.2f",
$totalA/$total*100)); write STDERR;
print STDERR "\n", "=" x length($format),"\n";
($nom, $nb, $prc) = ("TOTAL GENERAL", $total, "100.00"); write
STDERR;
}
################# ## Connecteurs ## #################
# Donc
sub donc()
{
my $place;
my @out;
for ($i=0; $i<=$#forme; $i++)
{
if ($forme[$i] = ~ /^donc$/i)
{
if ($ttt=trouvedir("(PON |CONc)", $i, -1))
{
if (($forme[$ttt] eq ".") && trouve("NOM",trouve ("VER",
$ttt, $i),$i)) {
push @out, csq(pointG($ttt), $ttt, $i, $i, pointD($i)) ;
else
{
push @out, csq(pointG($ttt-2), $ttt, $i, $i, pointD($i)) ;
}
}
}
}
titre("Donc", \@out) ;
}
# Ainsi
sub ainsi()
{
my $place;
my @out;
for ($i=0; $i<=$#forme; $i++)
{
if ($forme[$i] = ~ /ainsi/i)
{
if ($type[$i] !~/CON sub/)
{
if ($forme[$i] eq "Ainsi")
{
if ($type[$i+1] = ~ /VER\(pper\)/)
{
print LOG "! ! ! [ainsi +ppassé] ", join " ",
@forme[&pointG($i)..&pointD($i)], "\n--\n";
}
else
{
push @out, csq(pointG($i-2), $i-1, $i, $i, pointD($i)) ;
}
}
else
{
if (propG($i))
{
push @out, csq(pointG(pointG($i-2)-2), pointG($i-1)-1, $i, $i,
pointD($i)) ;
}
else
{
push @out, csq(pointG(pointG($i-2)-2), pointG($i-1)-1, $i, $i,
pointD($i)) ;
}
}
} else
{
print LOG "! ! ! [ainsi que] ", join " ",
@forme[&pointG($i)..&pointD($i)], "\n--\n";
}
}
}
titre("Ainsi", \@out) ;
}
# Alors
sub alors() {
my $place; my @out;
for ($i=0; $i<=$#forme; $i++)
{
if ($forme[$i] = ~ /alors/i)
{
if ($type[$i] !~/CON sub/)
{
$place=$i;
while ($forme[$place--] ne "."){}
while ($place++<$i &&
!(
($forme[$place] = ~ /^(si|quand)$/i) ||
($forme[$place] = ~ /[Ss]\'/ && $forme[$place+1] eq
"il")
)
){}
if ($place==$i+1)
{
if ($ttt=trouvedir("(PON |CONc)", $i, -1))
{
if (($forme[$ttt] eq ".") && trouve("NOM",trouve ("VER",
$ttt, $i),$i))
{
push @out, csq(pointG($ttt), $ttt, $i, $i, pointD($i)) ;
} else
{
push @out, csq(pointG($ttt-2), $ttt, $i, $i, pointD($i)) ;
}
}
} else
{
print LOG "! ! ! [".lc($forme[$place])."... alors] ", join "
",
@forme[$place. .&pointD($i)], "\n--\n";
}
}
else
{
print LOG "! ! ! [alors que] ", join " ",
@forme[&pointG($i)..&pointD($i)], "\n--\n";
}
}
}
titre("Alors", \@out) ;
}
# Aussi
sub aussi(){
my $place;
my @out;
for ($i=0; $i<=$#forme; $i++)
{
if (($forme[$i] = ~ /[Aa]ussi/ && $type[$i+1] = ~ /VER/
&& $forme[$i+2] =~ /-/) || ($forme[$i] = ~ /[Aa]ussi/ &&
$forme[$i-1] =~ /\./ && $forme[$i+1] = ~ /,/))
{
if ($type[$i-1] = ~ /PONsep/)
{
push @out, csq(pointG($i-2), $i-1, $i, $i, pointD($i)) ;
} else
{
push @out, csq(pointG($i), $i-1, $i, $i, pointD($i)) ;
titre("Aussi", \@out) ;
}
# Par conséquent
sub parcons()
{
my @out;
for ($i=0; $i<=$#forme; $i++)
{
if ($forme[$i] = ~ /par/i && $forme[$i+1] eq
"conséquent")
{
if ($ttt=trouvedir("(PON |CONc)", $i, -1))
{
if (($forme[$ttt] eq ".") && trouve("NOM",trouve ("VER",
$ttt, $i),$i))
{
push @out, csq(pointG($ttt), $ttt, $i, $i+1, pointD($i)) ;
}
else
{
push @out, csq(pointG($ttt-2), $ttt, $i, $i+1, pointD($i)) ;
}
}
}
}
titre("Par conséquent", \@out) ;
}
# De ce fait
sub decefait()
{
my @out;
for ($i=0; $i<=$#forme; $i++)
{
if ($forme[$i] = ~ /de/i && $forme[$i+1] eq "ce"
&& $forme[$i+2] eq "fait") {
if ($ttt=trouvedir("(PON |CONc)", $i, -1)) {
if (($forme[$ttt] eq ".") && trouve("NOM",trouve ("VER",
$ttt, $i),$i))
{
push @out, csq(pointG($ttt), $ttt, $i, $i+2, pointD($i)) ;
}
else
{
push @out, csq(pointG($ttt-2), $ttt, $i, $i+2, pointD($i)) ;
}
}
}
}
titre("De ce fait", \@out) ;
}
# Ce faisant
sub cefaisant()
{
my @out;
for ($i=0; $i<=$#forme; $i++) {
if ($forme[$i] = ~ /ce/i && $forme[$i+1] eq "faisant")
{
if ($ttt=trouvedir("(PON |CONc)", $i, -1))
{
if (($forme[$ttt] eq ".") && trouve("NOM",trouve ("VER",
$ttt, $i),$i))
{
push @out, csq(pointG($ttt-1), $ttt, $i, $i+1, pointD($i)) ;
} else
{
push @out, csq(pointG($ttt-2), $ttt, $i, $i+1, pointD($i)) ;
}
}
}
}
titre("Ce faisant", \@out) ;
}
# Ce qui fait que
sub ceqfq()
{
my @out;
for ($i=0; $i<=$#forme; $i++)
{
if ($forme[$i] = ~ /ce/i && $forme[$i+1] eq "qui"
&& $forme[$i+2] eq "fait" && $forme[$i+3] = ~
/^qu./)
{
if ($type[$i-1] =~/PON comma/)
{
push @out, csq(pointG($i), $i-1, $i, $i+3, pointD($i)) ;
}
elsif ($type[$i-1] !~/PON/)
{
push @out, csq(pointG(pointG($i-2)-1), $i-1, $i, $i+3,
pointD($i)) ;
}
}
}
titre("Ce qui fait que", \@out) ;
}
# Dans ce cas
sub danscecas()
{
my @out;
for ($i=0; $i<=$#forme; $i++) {
if ($forme[$i] = ~ /dans/i && $forme[$i+1] eq "ce"
&& $forme[$i+2] eq "cas")
{
if ($type[$i-1] =~/PONsep/) {
push @out, csq(pointG($i-2), $i-1, $i, $i, pointD($i)) ;
}
}
}
titre("Dans ce cas", \@out) ;
}
# Pour cette raison sub pourcr()
{
my @out;
for ($i=0; $i<=$#forme; $i++) {
if ($forme[$i] = ~ /pour/i && $forme[$i+1] eq "cette"
&&
$forme[$i+2] eq "raison")
{
if ($type[$i-1] =~/PONsep/) {
push @out, csq(pointG($i-2), $i-1, $i, $i, pointD($i)) ;
}
}
}
titre("Pour cette raison", \@out) ;
}
# C'est pourquoi
sub cestpq()
{
my @out;
for ($i=0; $i<=$#forme; $i++) {
if ($forme[$i] = ~ /c'/i && $forme[$i+1] eq "est"
&& $forme[$i+2] eq "pourquoi") {
if ($type[$i-1] =~/PONsep/) {
push @out, csq(pointG($i-2), $i-1, $i, $i, pointD($i)) ;
}
}
}
titre("C'est pourquoi", \@out) ;
}
# C'est la raison pour laquelle
sub cestlrpl()
{
my @out;
for ($i=0; $i<=$#forme; $i++)
{
if ($forme[$i] = ~ /c'/i && $forme[$i+1] eq "est"
&& $forme[$i+2] eq "la" && $forme[$i+3] eq "raison" &&
$forme[$i+4] eq "pour" &&
$forme[$i+5] eq "laquelle")
{
if ($type[$i-1] =~/PONsep/)
{
push @out, csq(pointG($i-2), $i-1, $i, $i, pointD($i)) ;
}
}
}
titre("C'est la raison pour laquelle", \@out) ;
}
#################### ## Autres indices
## ####################
# Ceci et cela
sub cecicela()
{
my @out;
for ($i=0; $i<=$#forme; $i++)
if ($type[$i-1] = ~ /PONsep/ && $forme[$i] = ~
/^(ceci|cela)$/i)
{
if (propD($i))
{
if (vcsq($tmp=trouvedir ("VER", $i, 1, \@type)))
{
push @out, csq(pointG(pointG($i)-2), $i-1, $i, $i, pointD($i))
;
} else
{
print LOG sprintf ("[cecicela -ce]%s\n--\n", join " ",
@forme[pointG(pointG($i)-2)..pointD($i)]);
}
}
else
{
print LOG sprintf (" ! ! ! [cecicela pnc] %s\n--\n",
(join " ", @forme[pointG($i)..pointD($i)]));
}
}
}
titre("Ceci / cela", \@out, 1);
}
# Ce qui
sub cequi()
{
my @out;
for ($i=0; $i<=$#forme; $i++)
{
if ($type[$i-1] = ~ /PONco/ && $forme[$i] = ~
/^ce$/i &&
$forme[$i+1] = ~ /^qui$/)
{
if (propG($i))
{
if (vcsq(trouvedir ("VER", $i, 1, \@type)))
{
push @out, csq(pointG($i), $i-1, $i, $i+1, pointD($i)) ;
} else
{
print LOG sprintf ("[ce qui -ce]%s\n--\n", join "
", @forme[pointG(pointG($i)-2)..pointD($i)]);
}
}
else
{
print LOG sprintf (" ! ! ! [ce qui pnc] %s\n--\n",
}
(join " ", @forme[pointG($i)..pointD($i)]));
}
}
titre("Ce qui", \@out, 1);
}
# Syllogisme sub syllo()
{
my $place; my @out;
for ($i=0; $i<=$#forme; $i++)
{
if ($forme[$i] = ~ /^or$/i)
{
print STDERR ("\x8" x length $nbInd) .++$nbInd; push @out,
sprintf ("%s\n",
bcse().
join ("",@forme[&pointG(&pointG($i)-2)..$i-1]). marque
($forme[$i]).
join ("", @forme[$i+1..($tmp=&pointD($i))]). ecse()."
".bcsq().
join ("", @forme[$tmp+1..&pointD($tmp+1)]). ecsq()) ;
}
}
titre("Syllogisme", \@out, 1);
}
# Participe présent
sub ppres()
{
my $place;
my @out;
my $ok;
for ($i=0; $i<=$#forme; $i++)
{
if ($forme[$i] eq "," && $type[$i+1] =~
/VER\(ppre\)/)
{
if ($forme[$i+2] eq "ainsi" ||
$forme[$i+4] eq "fait" ||
$forme[$i+3] eq "faisant")
{
push @out, csq(propG($i), $i, $i+1, $i+1, pointD($i)) ;
}
else {
$ok=0;
foreach $j (@v_etat)
{
if ($lemme[$i+1] = ~ $j)
{
$ok=1;
}
}
if ($ok==0)
{
if ($pcmp=propG($i))
{
if (vcsq($i+1))
{
push @out, csq($pcmp, $i, $i+1, $i+1, pointD($i)) ;
} else
{
}
print LOG sprintf (" ! ! ! [ppres -ce] %s\n--\n", (join " ",
@forme[pointG($i)..pointD($i)]));
print LOG sprintf (" ! ! ! [ppres pnc] %s\n--\n",
(join " ", @forme[pointG($i)..pointD($i)]));
}
}
else
{
print LOG sprintf(" ! ! ! [ppres etat] %s\n--\n",
}
}
(join " ", @forme[pointG($i)..pointD($i)]))
}
}
titre("Part. Prés.", \@out, 1);
}
########################################## ## Routines de
recherche et d'affichage ## ##########################################
# recherche d'un type d'élément lexical entre deux
bornes
sub trouve($$$)
{
# trouve ($chaine, $debut, $fin)
for ($bcl=$ _[1] ;$bcl <=$_[2] ;$bcl++)
{
if ($type[$bcl]=~/$_[0]/)
{
return $bcl;
}
}
return 0;
}
# recherche d'un type d'élément lexical dans un
direction
sub trouvedir($$$)
{
my $place=$_[1] ;
while ($type[$place+=$ _[2]] !~ /$_[0]/) {}
return $place;
}
# recherche d'une proposition complète à droite
sub propD($)
{
my $place=$_[0] ;
while ($type[$place++] !~ /PON sep/){}
if(trouve("VER\\(", $_[0], $place)){return $_[0]} else {return
0}
}
# recherche d'une proposition complète à gauche
sub propG($)
{
my $place=$ _[0] ;
while ($type[$place--] !~ /PON sep/ && $forme[$place] ne
"("){} if(trouve("VER\\(", $place+2, $ _[0])){return $place+2} else {return
0}
}
# recherche d'un point à droite sub pointD($)
my $place=$_[0] ;
while ($type[$place++] !~ /PON sep/){}
return $place-1;
}
# recherche d'un point à gauche
sub pointG($)
{
my $place=$_[0] ;
while ($type[$place--] !~ /PON sep/){}
return $place+2;
}
# définition des balises de la relation de
conséquence
sub bcse()
{
return "[cse " ;
}
sub ecse()
{
return " cse]";
}
sub bcsq()
{
return "[csq " ;
}
sub ecsq()
{
return " csq]";
}
sub marque($)
{
return " { $_[0] } " ;
}
# fonctuion d'affichage de la relation extraite sub csq($$$$)
{
print STDERR ("\x8" x length $nbInd) .++$nbInd;
return
sprintf ("%s\n",
bcse().
join ("",@forme[$_[0]..$_[1]]).
ecse()." ".bcsq().
join ("",@forme[$_[1]+1..$_[2]-1]). marque (join ("",
@forme[$_[2]..$_[3]])). join ("", @forme[$_[3]+1..$_[4]]). ecsq()) ;
}
# affichage du nom de la relation et mise à jour des
statistiques sub titre($$)
{
my $marq="$_[0] (".($#{$_[1]}+1).")";
print "\n";
print "-" x length $marq; print "\n$marq\n";
print "-" x length $marq;
print "\n\n@{$ _[1] }" ;
if (defined($_[2]))
{
$statsA{$_[0] }=$#{$_[1] }+1;
} else
{
$statsC{$_[0] }=$#{$_[1] }+1;
}
}
# recherche d'un verbe efficient sub vcsq($)
{
print VER "$lemme[$_[0]]";
foreach $j (@v_changt_etat)
{
return 1 if ($lemme[$_[0]] = ~ /^$j/)
}
}
# execution du programme main() ;
|