2.6 Quelques propriétés formelles de la
RST
2.6.1 L'application de schémas
Selon Mann et Thompson, « l'analyse structurelle d'un
texte est une série d'applications de schémas » devant
respecter les 4 conditions exposées dans la figure ci-dessous.
1. complétude : une application de
schéma (la racine) englobe la totalité du texte.
2. connectivité : tout segment (sauf la
racine) doit être:
- soit une unité minimale
- soit un constituant d'un autre application de
schéma.
3. unicité: pour chaque application de
schéma, un nouvel ensemble de segments doit être
utilisé.
4. adjacence : l'ensemble des segments d'un
schéma constitue un segment plus grand.
|
FIG. 2.6 - Conditions de l'application de
schémas (d'après MANN et THOMPSON (1987))
2.6.2 Justi~cation de la structure arborescente de
l'analyse
Ces conditions ne font en fait que justifier la structure
arborescente de l'analyse structurelle, chaque condition correspondant à
une propriété
a b
formelle d'un arbre'0 :
1. La complétude correspond à la
condition de la racine unique, un arbre n'admettant qu'une seule racine''.
2. La connectivité permet de justifier la
récursivité'2. En effet on considère un segment
de discours:
- soit comme une unité minimale insécable
(vocabulaire terminal) pouvant être décomposée en un
nouveau sous-ensemble de segments de discours.
- soit comme une unité découpable (vocabulaire
non-terminal)'3.
3. L'unicité (et l'adjacence qui dit
la même chose), elle, fait appel à la condition
d'exclusivité'4 : l'utilisation d'un nouvel ensemble de
schémas interdit d'avoir à la fois des relations de dominance et
de précédence entre les noyaux et les satellites.
10Il s'agit en fait d'un arbre ordonné; nous
utiliserons tout au long de notre travail le terme « arbre ».
11Condition de la racine unique :
« dans chaque arbre de structure de constituants bien
formé ily a exactement un noeud qui domine chaque noeud ». PARTEE
et al. (1993) 12Tout arbre peut être construit
récursivement.
13
Soit : VT = {si, nj}: ensemble des unités
insécable
VN = {S, N}: ensemble des unités découpables /
étiquette
14Condition d'exclusivité:
« Dans un arbre de structure de constituant bien formé
quelconque, étant donné deux noeuds x et y,
x et y ont une relation de précédence
P, c'est-à-dire que soit (x, y) E P, soit (y, x) E P si et
seulement si x et y n'ont pas une relation de dominance
D, c'est-à-dire que ni (x, y) E D, ni (y, x) E D ». PARTEE
et al. (1993)
2.6.3 RST comme grammaire indépendante du
contexte
On peut considérer la RST comme une grammaire de
Chomsky de type 2 ou grammaire indépendante du contexte. En effet on
remarque que la plupart du temps, on ne rencontre que des relations impliquant
un noyau seul et un satellite seul15. Dans ce cas la structure du
discours a la forme d'un arbre binaire (car les relations ne tiennent qu'entre
deux éléments), très simple à mettre en oeuvre en
informatique. Cependant, l'arbre doit obéir à un certain nombre
de contraintes:
- la présence d'un noyau est obligatoire et il ne peut
apparaître seul - une suite de noyaux dans un segment de discours ne peut
être accompagnée de satellites
- si on a un noyau accompagné de satellites, on ne peut
avoir de noyau supplémentaire
- on peut donc avoir soit une suite de noyaux, soit un noyau
accompagné de satellites
|