III.1.3 Echelle
d'hétéro-évaluation
L'évaluation perceptive de la qualité de la voix
a été définie par Wirz en 1995 (in De Bodt, 1996) comme
<< les procédures qui font appel à l'habileté du
clinicien sans dépendre d'une évaluation standardisée ou
de mesures instrumentales »66. Le principe est
d'évaluer, uniquement à l'oreille, la quantité de
dysphonie dans une voix. C'est la méthode d'évaluation vocale la
plus couramment employée en clinique.
Lorsqu'on souhaite utiliser une échelle
d'évaluation perceptive de la voix dans le cadre d'une recherche, il est
nécessaire de constituer un jury d'écoute. On fait alors appel
à des praticiens aguerris à l'écoute des voix
pathologiques pour porter des jugements qualitatifs, généralement
de manière chiffrée. Le jugement s'effectue le plus souvent en
comparaison de << standards internes » ou << prototypes »
de ce qu'est une voix normale67. Le principal problème
réside dans le fait qu'il existe une multitude de termes pour
définir les qualités et les altérations de la voix et que
leurs définitions sont relativement aléatoires.
65 Giovanni, A., p229, Op. cit. p36.
66 Ibid., pp69-104.
67 Ibid., p83.
Paramètres décrivant la voix en suédois
et leur équivalent approximatif en anglais et en français
68
Par ailleurs, l'oreille est facilement dupée et est
soumise « aux variations psychologiques, à l'attention, à la
fatigue, d'où l'intérêt de recourir aussi à des
instruments de mesures subjectives et objectives de la voix
»69.
III.1.3.1 GRBAS
L'échelle d'évaluation perceptive dont
l'utilisation est recommandée par le GREL (Groupe Européen de
Recherche sur le Larynx) est le GRBAS d'Hirano. Le nombre d'auteurs et de
chercheurs faisant référence, ou utilisant, cette échelle
est trop important pour pouvoir tous les citer ici. L'évaluateur doit
donner à chaque voix une note comprise entre 0 et 3, et ce pour chacun
des critères de l'échelle qui suivent:
-G : Grade : Cela correspond à une évaluation
générale, globale de
la qualité de la voix
-R : Roughness : Il s'agit d'évaluer la raucité
de la voix et toutes les altérations du timbre (éraillures,
craquements, ...). R cote l'impression d'irrégularité de la
vibration des cordes vocales
-B : Breathiness : C'est la composante de souffle dans la
voix. Ici est cotée l'impression que produisent les voix dites
voilées ou soufflées. Cette caractéristique est
directement liée à la présence d'une fuite d'air lors de
la phonation. Sarfati J. parle de « bruit d'écoulement
aérien »70.
68 Giovanni, A., p71, Op. cit. p36.
69 Estienne Fr. et Piérart B., p225, Op. cit. p36.
70 Sarfati J. (1998), Soigner la voix, Marseille: Solal,
p20.
-A : Asthenicity : « Asthénie » en
français signifie « faible ». Une voix «
asthénique » est donc une voix qui semble manquer d'énergie,
de puissance et apparaît comme hypotone, faible et peu intense.
D'après Estienne, le critère A est lié à une
intensité faible et/ou au manque d'harmoniques aigus.
-S : Strain : Plus ou moins opposé à
l'asthénie, on observe ici le forçage vocal, l'hypertonie, en
évaluant la sensation d'un effort important et d'une tension musculaire
excessive lors de la production vocale.
Le ou les évaluateurs donnent une note pour chaque
paramètre sachant que:
-0 est considéré comme la normalité (sans
pour autant parler de
perfection absolue)
-1 correspond à une déviance
légère
-2 à une déviance modérée
-3 à une altération sévère
III.1.3.2 D'autres échelles
Par ailleurs, il existe d'autres échelles dont le
Hammarberg Scheme de Hammarberg ou le VPAS (Vocal Profil Analysis Scheme) de
Laver. Ces échelles ont plus de niveaux d'observation que le GRBAS mais
les temps de passation nécessaires sont environ trois fois
supérieurs à ceux du GRBAS.
Selon Joana Révis71, la pertinence des
résultats obtenus avec n'importe quelle échelle dépend du
contrôle de chaque étape, du matériau phonétique
choisi, de la qualité de l'auditeur, du repérage des biais
créés par les incertitudes méthodologiques, ... En effet,
Kreiman a montré en 1993 qu'aucune des multiples échelles n'avait
démontré sa supériorité pour mesurer la
qualité de la voix. « Sur toutes les études analysées
par Kreiman, les niveaux de reproductibilité et de fiabilité
variaient de 18% à 100% selon les auteurs avec des protocoles et des
méthodes d'analyse statistique si variés que toute conclusion est
impossible. »72. Au contraire, selon Woizard, l'utilisation de
telles échelles est très pertinente73.
71 Giovanni, A., pp67-105, Op. cit. p36.
72 Ibid., p80.
73 Woisard-Bassols V. (2000), « Bilan clinique de la
voix », Encyclopédie Médico-chirurgicale, Paris:
Editions scientifiques et médicales Elsevier.
III.2 Représentations de la voix par
des
mesures objectives
L'analyse objective de la voix a été rendue
possible grâce au développement de technologies variées
mais surtout grâce à l'avènement de l'outil informatique.
Dans cette perspective, différents logiciels permettent aujourd'hui une
analyse et une représentation des différents paramètres
vocaux. L'écueil majeur, pour nous, est que rares sont les logiciels
créés pour l'orthophonie (Vocalab, EVA, ...). Cependant, quelques
autres logiciels peuvent être détournés de leur utilisation
initiale et se révéler utiles à cette profession, tant en
clinique qu'en recherche.
Praat est un logiciel d'analyse de la parole
développé à l'Institut des Sciences Phonétiques de
l'Université d'Amsterdam par P. BOERSMA et D. WEENINK. Il est
téléchargeable gratuitement et des mises à jour
fréquentes sont disponibles. Praat permet d'obtenir de multiples
informations sur la voix: formants, spectres instantanés,
intensité, hauteur, ... qui intéressent au premier chef les
phonéticiens. Néanmoins, nous verrons que son utilisation en
clinique orthophonique peut se révéler très
pertinente.74
Nous allons maintenant décrire les différentes
représentations du signal vocal, en commençant par la plus simple
d'entre elles, pour ensuite détailler des méthodes de
représentation donnant un aperçu plus global des qualités
et défauts d'une voix.
III.2.1 Chronogramme
L'enveloppe d'un son, ou chronogramme, représente
l'énergie acoustique, c'est-à-dire l'intensité en fonction
du temps. Cette enveloppe se décompose en quatre parties: l'attaque, le
déclin, le maintien et la sortie.
Amplitude
0
0 1 2 3 4 5 6
Temps (s)
Schéma de l'enveloppe d'un son dans Praat
75
74 Cf Annexe 4.
75 Roublot P. (2003), Analyse subjective et objective de
la voix avant et après bloc interscalénique du plexus brachial,
Implications pratiques dans la prise en charge post-opératoire des
patients anesthésiés, Mémoire d'Orthophonie,
Université Henri Poincaré, Nancy 1, p118.
L'attaque marque une augmentation rapide de l'amplitude.
Le temps de déclin suit l'attaque et correspond à
une diminution de l'intensité qui suit immédiatement
l'attaque.
Le maintien, aussi appelé << sustain > en
anglais, est la partie la plus stable de la production vocale.
La sortie ou la chute, << release > en anglais, est le
temps de décroissance finale de l'amplitude du son.
Schéma de l'enveloppe d'un son
Le choix de la partie de signal à analyser peut donc
influer grandement sur les résultats de l'analyse d'un son et il faudra
se souvenir de ce paramètre lors de la partie pratique.
III.2.2 La représentation
périodique
En zoomant sur une partie de l'enveloppe d'un son dans
Praat76, on peut observer les périodes de ce son, leur
régularité et leur complexité.
Copie d'un chronogramme de Praat, détails de la partie
stable d'un /a/
Les périodes sont le résultat des
déplacements de zones de pression qui produisent une onde sonore. En
effet, les sons résultent de vibrations de l'air. Sous une excitation
mécanique (produite par un instrument de musique ou une personne qui
parle), l'air se met à vibrer. Une molécule reçoit alors
une impulsion qui la met en mouvement dans une direction donnée. La
molécule rencontre d'autres molécules qu'elle pousse, ce qui
forme une zone de compression. La matière traversée par l'onde
acoustique est alors le siège de compressions et de dépressions
successives, plus ou moins périodiques. Ce phénomène
crée une onde progressive longitudinale. Une onde acoustique est donc le
résultat d'un mouvement qui transporte de l'énergie.
76 Cf Annexe 4.
L'ébranlement de l'air produit par un son « pur
», comme celui du diapason, est un phénomène oscillant
périodique qui est représenté par une fonction
sinusoïdale. Ce phénomène étant cyclique, on peut le
représenter par un point qui se déplace sur un cercle avec une
vitesse uniforme. Lorsque le cercle est entièrement décrit,
c'est-à-dire lorsque le point a parcouru un angle de 2pi, cela
correspond à une période (T).
La fréquence est le nombre de fois que le
phénomène se reproduit de manière identique, en une
seconde. Elle s'exprime en Hertz (Hz). Une fréquence de 100Hz correspond
donc à 100 oscillations par seconde. Du point de vue de la
psychoacoustique, la fréquence correspond à la sensation de
hauteur. Ainsi un son de 600Hz est plus aigu qu'un son émis à une
hauteur de 300Hz.
Jusqu'ici, nous n'avons abordé que les sons « purs
». Or, rares sont les sons purs dans notre environnement sonore quotidien
car la plupart des sons que nous percevons sont dits « complexes ».
Un son complexe, comme la voix, est composé d'une fréquence
fondamentale (F0) sur laquelle se superposent des harmoniques (et des
transitoires). Les harmoniques sont des multiples entiers de la
fréquence fondamentale. La voix est donc le résultat de
l'addition des fréquences de F0 et de ses harmoniques et la
période ainsi obtenue est donc identique à celle de la F0.
Addition de sinusoïdes de différentes
fréquences 77
77 Baken R. J., Orlikoff R. F. (2000), Clinical measurement
of speech and voice, second edition, Delmar: Singular Thomson Learning,
p228.
Enfin, les bruits, tels que les consonnes occlusives, sont des
sons non périodiques: leur spectre fréquentiel est discontinu au
cours du temps. Il n'y a donc pas de rapport multiplicatif avec la
fréquence fondamentale.
III.2.3 Spectrogrammes
Un spectrogramme est une représentation acoustique d'un
signal sonore. Le tracé d'un spectrogramme indique les fréquences
d'un signal sonore en fonction du temps. L'intensité des
différentes fréquences du spectre est donnée par le
degré de noirceur du tracé des harmoniques.
Ce type de représentation est classiquement
employé par les phonéticiens pour définir les traits
caractéristiques des voyelles, des consonnes, des
phénomènes de co-articulation, ... Un spectrogramme permet
également d'étudier la richesse d'un timbre en harmoniques. On
remarque ainsi que la multitude de termes permettant de caractériser le
timbre d'une voix correspond à des réalités physiques
contrastées.78
III.2.4 Phonétogrammes
Réaliser un phonétogramme revient à
cartographier « les possibilités fonctionnelles du larynx en tant
qu'instrument vocal »79. C'est une représentation
graphique des intensités maximales et minimales (entre 40 et
120dB80) pour chaque hauteur tonale de toute l'étendue de la
voix émise sur un /a/. Il permet d'apprécier l'étendue, la
tessiture et l'intensité de la voix d'un sujet. Il donne donc une image
de la dynamique vocale. Cependant, le manque de standardisation de la
méthode de passation (voyelle employée, échauffement ou
non, moment de la journée, temps d'émission de la voyelle,
degré d'aperture buccale, ...) et le principe même de cette mesure
en font plus un outil d'évaluation des performances vocales qu'une
mesure de la fonction laryngée.81
78 Cf chap. III.4 Timbre.
79 Estienne Fr., p41, Op. cit. p30.
80 Estienne Fr. et Piérart B., p235, Op. cit. p36.
81 Ibid., p235.
Phonétogramme normal
|