Memoire Online - A propos d'une analyse objective de la voix de 40 sujets présentant des troubles musculo-squelettiques

Dans un petit village de la montagne, il y a un pauvre cordonnier, tout vieux et tout cassé. Les villageois lui apportent des chaussures à réparer. Mais il ne travaille pas vite. Tous les soirs, il mange tout seul, bien tristement.

Près de lui, la grosse horloge fait: tic tac, tic tac. Le pauvre vieux, tout découragé, s'endort ...

< Rangeons les étagères, réparons les souliers, recousons le linge », dit Tic.

< Préparons un gâteau, mettons du gui au plafond, changeons ces vieux rideaux », ajoute Tac.

Praat à l'avantage de disposer d'un enregistreur (ce qui évite d'avoir recours à des logiciels comme Audacity et exclut tous les soucis liés à la lecture des formats de fichiers et aux transferts de données). Pour y avoir accès:

Une fenêtre << SoundRecord > s'ouvre alors. Vérifier que << Sampling frequency > est positionné sur 44100Hz, branchez un microphone puis cliquer sur << Record > pour démarrer l'enregistrement. Pour stopper l'enregistrement, cliquer sur << Stop >. Enfin, pour sauvegarder l'échantillon vocal ainsi obtenu dans un fichier, le nommer (<< Name >) puis cliquer sur << Save to list >.

Pour visualiser le signal sonore, deux possibilités: - read / open long sound file

-enregistrer et sauvegarder un son (cf I_Enregistrer un son). Le fichier apparaît alors dans << praat objects > et il suffit de cliquer sur << view > pour obtenir le spectrogramme correspondant.

Sur la partie supérieure de la fenêtre s'affiche l'onde sonore ( aussi appelée fenêtre du signal acoustique ou enveloppe du son) et sur la partie inférieure s'affiche le spectrogramme (également appelée fenêtre d'analyse). L'axe des abscisses (horizontal) représente le temps sur les deux représentation du son. Ainsi, les deux

parties de la fenêtre seront concernées, que l'on zoome ou que l'on fasse défiler.

Un spectrogramme indique les fréquences d'un son. Praat est pré-réglé pour afficher les fréquences de 0 à 4000 Hertz (Hz) ce qui suffit généralement pour analyser les voix de personnes très dysphoniques. Cependant pour des voix normales, il est conseillé d'afficher le spectrogramme sur une plus large bande fréquentielle, à savoir de 0 à 8000 Hz.

-window length: permet de passer d'un spectrogramme à bandes larges représentant le signal sonore par bandes de 260Hz (0,005s.) à un spectrogramme à bandes étroites de 43Hz (0,03s.). C'est le spectrogramme à bandes étroites qui est préconisé dans le cadre de l'analyse vocale.

-dynamic range: indique l'intensité maximale à laquelle le son sera analysé. Il est conseillé d'augmenter la paramétrage par défaut et de passer de 50 à 70dB pour plus de sécurité (voire à 90 ou 100dB lorsque vous désirez analyser la voix d'appel d'une personne sans dysphonie).

Pour connaître la fréquence d'une harmonique à un temps donné, il suffit de cliquer à l'endroit désiré sur le spectrogramme et ces indications apparaîtrons aux extrémités de la croix rouge (c'est l'un des moyens pour déterminer les formants fréquentiels des voyelles lors d'une analyse phonétique).

- spectrum / paint visible spectrogram: le spectrogramme apparaîtra alors dans une nouvelle fenêtre « praat picture » et c'est depuis cette fenêtre que vous pourrez imprimer le spectrogramme, ou l'insérer dans un autre document.

Pitch signifie hauteur. Praat permet en effet de récolter diverses informations concernant la hauteur de la voix.

- pitch / show picth: une ligne bleue se dessine sur le spectrogramme ainsi que trois nombres, en bleu également, indiquant la hauteur de la voix. C'est le nombre du milieu qui nous intéresse le plus. En effet, il donne la hauteur de la voix à un instant précis (en cliquant sur le spectrogramme), ou sur une plage de sélection. Les nombres s'affichant en haut et en bas à droite correspondent aux bornes, inférieure et supérieure, formant un intervalle à l'intérieur duquel praat recherchera les différentes données relatives à la hauteur. Il peut être intéressant de modifier leurs valeurs pour plus de précision:

	borne inférieure	borne supérieure
standard	75 Hz	500 Hz
homme	75 Hz	300 Hz
femme	100 Hz	500 Hz
enfant	200 Hz	500 Hz
voix d'homme très abîmée	50 Hz	200 Hz

-pitch / pitch settings ( veiller à ce que l'unité « unit » soit le Herz, et à ce que la méthode d'analyse soit « cross-correlation »).

Dans le menu « pitch », Praat met à disposition de l'utilisateur quatre informations qui sont susceptibles d'intéresser l'orthophoniste. Pour y avoir accès, sélectionner la partie du spectrogramme voulue puis:

-pitch listing: liste de la hauteur calculée toutes les x secondes (selon le paramètrage effectué)

-get pitch: moyenne de la hauteur au sein de la sélection -get minimum pitch: hauteur minimum de la sélection

Enfin, pour imprimer la courbe des hauteurs d'une voix ou l'insérer dans un fichier quelconque, il faut cliquer sur < draw visible pitch... > dans le menu < pitch >. Les étapes suivantes étant les mêmes que pour l'impression d'un spectrogramme nous ne les détaillerons pas ici.

L'analyse habituelle de la hauteur contient un < éclaireur >, qui effectue automatiquement un lissage des différentes hauteur locales. Pour avoir accès aux informations que fournit l'analyse de la hauteur à court terme, Praat désactive cet éclaireur. Les réglages à effectuer ici sont les mêmes que ceux décrits précédemment. Pour avoir accès aux informations qui vont suivre (< fraction of locally unvoiced frames >, < jitter > et < shimmer >) il est nécessaire de:

-sélectionner < Show pulses > dans le menu < Pulses > -puis il faut sélectionner la partie du signal à analyser

La fenêtre < Praat Info > s'ouvre alors et détaille toutes les informations concernant la hauteur:

-pulses: nombre de cycles vibratoires, nombre de périodes, durée moyenne d'une période et la déviation standard de la durée des périodes

-harmonicity of the voice part only: un chiffre très inférieur à 20dB est considéré comme pathologique (harmonicity to noise ratio).

-jitter (local): il correspond au jitter ratio de la littérature. C'est la moyenne de toutes les différences entre les durées de deux périodes consécutives, divisée par la durée moyenne d'une période du signal. Le résultat est donc un rapport, exprimé ici en pourcentage. Selon le manuel de Praat, le seuil normal/pathologique de ce critère est fixé à 1,04%.

-jitter (local, absolute) ou jitta: il correspond au jitter absolu dans la littérature. C'est la moyenne des différences (en valeur absolue) entre les durées de deux périodes consécutives du signal. Le seuil normal/pathologique est de 83,2.

-jitter (rap): il correspond au RAP ou au FPQ dans la littérature. Comme le jitter ratio, le RAP mesure les perturbations à court terme de la fréquence fondamentale. Ici, on compare la durée de chaque période Ti non pas à celle de la période suivante (Ti+1), mais à la moyenne de 3 périodes successives T-1, T et T+1, ce qui a théoriquement pour effet d'atténuer les variations volontaires de la fréquence vocale, comme le trémolo, par exemple. Dans les faits, le jitter ratio et le RAP sont des mesures à peu près équivalentes. Le RAP est également exprimé en pourcentage. Le seuil normal/pathologique est fixé à 0,68%.

-jitter (ppq5): c'est la moyenne de la différence (en valeur absolue) entre la durée d'une période et la durée moyenne des 4 périodes les plus proches, divisée par la durée moyenne d'une période du signal. Exprimé en pourcentage, le seuil normal/pathologique du ppq5 est de 0,840%.

Cela correspond à la fraction de discontinuité dans l'accolement des cordes vocales. Pour une voix normale, le résultat « Fraction of locally unvoiced frames >, ou « Voice break >, doit être égal à 0 (l'accolement des cordes vocales sur une voyelle tenue étant normalement continu). Toute valeur différente de 0 pourra donc être considérée comme pathologique.

-intensity / show intensity: une courbe jaune se dessine sur le spectrogramme ainsi que trois nombres, en vert, indiquant l'intensité de la voix. C'est le nombre du milieu qui nous intéresse le plus. En effet, il donne l'intensité de la voix à un instant précis (en cliquant sur le spectrogramme), ou bien sur une plage de sélection. Les nombres s'affichant en haut et en bas à droite correspondent aux bornes inférieure et supérieure, formant un intervalle à l'intérieur duquel praat recherchera les différentes intensités. Les bornes standard sont 50dB et 100dB.

Il est important de définir ces bornes en fonction de la voix que l'on veut analyser au risque de ne pas pouvoir visualiser l'intensité. Pour définir ces bornes:

-intensity / intensity settings (c'est également dans << Intensity settings » qu'il faut cocher la case << substract mean pressure », normalement déjà prédéfinie par Praat, qui permet de supprimer les bruits de fond du calcul de l'intensité).

Par ailleurs, il est toujours possible, comme dans le menu << Pitch », de connaître les intensités moyenne, minimale et maximale d'une sélection en cliquant respectivement sur << Get intensity », << Get minimum intensity » et << Get maximum intensity » dans le menu << Intensity ».

Parfois, il peut être plus judicieux de rechercher l'intensité médiane au lieu de l'intensité moyenne. Pour ce faire, changer la méthode de calcul dans << averaging method » dans << Intensity settings ». Cliquer sur << Intensity listing » pour obtenir le relevé de l'intensité toutes les 0,010666 secondes.

Enfin, pour imprimer la courbe des intensités d'une voix ou l'insérer dans un fichier quelconque, cliquer sur << draw visible intensity contour... » dans le menu << intensity ». Les étapes suivantes étant les mêmes que pour l'impression d'un spectrogramme nous ne les détaillerons pas ici.

-shimmer (local): on mesure ici les perturbations à court terme de l'amplitude du signal sonore. Pour ce faire, on divise la moyenne des différences (en valeur absolue) entre l'amplitude maximale de deux périodes successives, par la moyenne des amplitudes maximales de chaque période. Le seuil normal/pathologique est fixé à 3,81 %.

-shimmer (local, dB): C'est la moyenne des différences (en valeur absolue logarithme10), entre l'amplitude maximale de deux périodes consécutives, multipliée par 20. Cette méthode de calcul présente l'avantage de limiter les effets des variations de F0 (tremor, vibrato, ...) sur le shimmer. La valeur déterminant le seuil normal/pathologique est 0,350dB.

-shimmer (apq11): il s'agit également d'une mesure des perturbations à court terme de l'amplitude du signal. Sur le même principe que le jitter RAP, il s'agit d'atténuer les effets des modulations volontaires d'intensité en comparant l'amplitude maximale de chaque période Ti à l'amplitude moyenne des pics des périodes Ti-5 à Ti+5, soit 11 périodes. Le seuil normal/pathologique est fixé à 3,07%.

A propos d'une analyse objective de la voix de 40 sujets présentant des troubles musculo-squelettiques

Annexe 2: VHI 10

Annexe 3: Texte