WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

A propos d'une analyse objective de la voix de 40 sujets présentant des troubles musculo-squelettiques

( Télécharger le fichier original )
par Marion VIENNOT
UHP Nancy - Certificat de Capacité d'Orthophonie 2010
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

Annexe 2: VHI 10

Annexe 3: Texte

Grand-mère raconte

Dans un petit village de la montagne, il y a un pauvre cordonnier, tout vieux et tout cassé. Les villageois lui apportent des chaussures à réparer. Mais il ne travaille pas vite. Tous les soirs, il mange tout seul, bien tristement.

Ce soir, il a devant lui, un gros tas de souliers et de guêtres à recoudre.

< Jamais je ne pourrai les réparer. Je suis trop âgé et trop malade... »

Près de lui, la grosse horloge fait: tic tac, tic tac. Le pauvre vieux, tout découragé, s'endort ...

Aussitôt, l'horloge s'ouvre, et deux petits lutins sautent sur le plancher:

l'un s'appelle Tic

l'autre s'appelle Tac.

< Rangeons les étagères, réparons les souliers, recousons le linge », dit Tic.

< Préparons un gâteau, mettons du gui au plafond, changeons ces vieux rideaux », ajoute Tac.

Minuit sonne! Les deux vaillants petits lutins rentrent dans la pendule.

Le lendemain, le pauvre cordonnier s'éveille:

< O joie! Qui a préparé ce bon gâteau? Qui donc a rangé la maison? »

< Tic tac! Tic tac! », dit la vieille horloge.

Annexe 4 : Paramétrages de Praat SOMMAIRE

I Enregistrer un son

II Visualiser une voix

III Paramétrer le spectrogramme à bandes larges/étroites

IV Hauteur

1 Hauteur lissée

2 Pulses

3 Jitter

V Voicing: Fraction of locally unvoiced frames

VI Intensité

1 Visualiser l'intensité

2 Shimmer

I Enregistrer un son

Praat à l'avantage de disposer d'un enregistreur (ce qui évite d'avoir recours à des logiciels comme Audacity et exclut tous les soucis liés à la lecture des formats de fichiers et aux transferts de données). Pour y avoir accès:

-fenêtre << Praat Objects >: New / record stereo sound

Une fenêtre << SoundRecord > s'ouvre alors. Vérifier que << Sampling frequency > est positionné sur 44100Hz, branchez un microphone puis cliquer sur << Record > pour démarrer l'enregistrement. Pour stopper l'enregistrement, cliquer sur << Stop >. Enfin, pour sauvegarder l'échantillon vocal ainsi obtenu dans un fichier, le nommer (<< Name >) puis cliquer sur << Save to list >.

II Visualiser une voix

Pour visualiser le signal sonore, deux possibilités: - read / open long sound file

-enregistrer et sauvegarder un son (cf I_Enregistrer un son). Le fichier apparaît alors dans << praat objects > et il suffit de cliquer sur << view > pour obtenir le spectrogramme correspondant.

Sur la partie supérieure de la fenêtre s'affiche l'onde sonore ( aussi appelée fenêtre du signal acoustique ou enveloppe du son) et sur la partie inférieure s'affiche le spectrogramme (également appelée fenêtre d'analyse). L'axe des abscisses (horizontal) représente le temps sur les deux représentation du son. Ainsi, les deux

parties de la fenêtre seront concernées, que l'on zoome ou que l'on fasse défiler.

III Paramétrer le spectrogramme à bandes larges/étroites

Un spectrogramme indique les fréquences d'un son. Praat est pré-réglé pour afficher les fréquences de 0 à 4000 Hertz (Hz) ce qui suffit généralement pour analyser les voix de personnes très dysphoniques. Cependant pour des voix normales, il est conseillé d'afficher le spectrogramme sur une plus large bande fréquentielle, à savoir de 0 à 8000 Hz.

Dans spectrum / spectrogram settings: -view range: 0,0 to 8000,0 Hz

-window length: permet de passer d'un spectrogramme à bandes larges représentant le signal sonore par bandes de 260Hz (0,005s.) à un spectrogramme à bandes étroites de 43Hz (0,03s.). C'est le spectrogramme à bandes étroites qui est préconisé dans le cadre de l'analyse vocale.

-dynamic range: indique l'intensité maximale à laquelle le son sera analysé. Il est conseillé d'augmenter la paramétrage par défaut et de passer de 50 à 70dB pour plus de sécurité (voire à 90 ou 100dB lorsque vous désirez analyser la voix d'appel d'une personne sans dysphonie).

Pour connaître la fréquence d'une harmonique à un temps donné, il suffit de cliquer à l'endroit désiré sur le spectrogramme et ces indications apparaîtrons aux extrémités de la croix rouge (c'est l'un des moyens pour déterminer les formants fréquentiels des voyelles lors d'une analyse phonétique).

Enfin, pour imprimer un spectrogramme ou l'insérer dans un fichier quelconque:

- spectrum / paint visible spectrogram: le spectrogramme apparaîtra alors dans une nouvelle fenêtre « praat picture » et c'est depuis cette fenêtre que vous pourrez imprimer le spectrogramme, ou l'insérer dans un autre document.

IV Hauteur

IV.1 Hauteur lissée

Pitch signifie hauteur. Praat permet en effet de récolter diverses informations concernant la hauteur de la voix.

Pour visualiser la courbe de la hauteur d'une voix:

- pitch / show picth: une ligne bleue se dessine sur le spectrogramme ainsi que trois nombres, en bleu également, indiquant la hauteur de la voix. C'est le nombre du milieu qui nous intéresse le plus. En effet, il donne la hauteur de la voix à un instant précis (en cliquant sur le spectrogramme), ou sur une plage de sélection. Les nombres s'affichant en haut et en bas à droite correspondent aux bornes, inférieure et supérieure, formant un intervalle à l'intérieur duquel praat recherchera les différentes données relatives à la hauteur. Il peut être intéressant de modifier leurs valeurs pour plus de précision:

 

borne inférieure

borne supérieure

standard

75 Hz

500 Hz

homme

75 Hz

300 Hz

femme

100 Hz

500 Hz

enfant

200 Hz

500 Hz

voix d'homme très abîmée

50 Hz

200 Hz

Pour effectuer les réglages ayant trait à la hauteur:

-pitch / pitch settings ( veiller à ce que l'unité « unit » soit le Herz, et à ce que la méthode d'analyse soit « cross-correlation »).

Dans le menu « pitch », Praat met à disposition de l'utilisateur quatre informations qui sont susceptibles d'intéresser l'orthophoniste. Pour y avoir accès, sélectionner la partie du spectrogramme voulue puis:

-pitch listing: liste de la hauteur calculée toutes les x secondes (selon le paramètrage effectué)

-get pitch: moyenne de la hauteur au sein de la sélection -get minimum pitch: hauteur minimum de la sélection

-get maximum pitch: hauteur maximum de la sélection.

Enfin, pour imprimer la courbe des hauteurs d'une voix ou l'insérer dans un fichier quelconque, il faut cliquer sur < draw visible pitch... > dans le menu < pitch >. Les étapes suivantes étant les mêmes que pour l'impression d'un spectrogramme nous ne les détaillerons pas ici.

IV.2 Pulses

L'analyse habituelle de la hauteur contient un < éclaireur >, qui effectue automatiquement un lissage des différentes hauteur locales. Pour avoir accès aux informations que fournit l'analyse de la hauteur à court terme, Praat désactive cet éclaireur. Les réglages à effectuer ici sont les mêmes que ceux décrits précédemment. Pour avoir accès aux informations qui vont suivre (< fraction of locally unvoiced frames >, < jitter > et < shimmer >) il est nécessaire de:

-sélectionner < Show pulses > dans le menu < Pulses > -puis il faut sélectionner la partie du signal à analyser

-et enfin cliquer sur < Voice report > toujours dans le menu

< Pulses >.

La fenêtre < Praat Info > s'ouvre alors et détaille toutes les informations concernant la hauteur:

-pitch: hauteur

-pulses: nombre de cycles vibratoires, nombre de périodes, durée moyenne d'une période et la déviation standard de la durée des périodes

-voicing: cf IV_3 Voicing -jitter: cf IV_4 Jitter

-shimmer: cf IV_5 Shimmer

-harmonicity of the voice part only: un chiffre très inférieur à 20dB est considéré comme pathologique (harmonicity to noise ratio).

IV.3 Jitter

Pour calculer les différents jitter cf IV_2 Pulses

-jitter (local): il correspond au jitter ratio de la littérature. C'est la moyenne de toutes les différences entre les durées de deux périodes consécutives, divisée par la durée moyenne d'une période du signal. Le résultat est donc un rapport, exprimé ici en pourcentage. Selon le manuel de Praat, le seuil normal/pathologique de ce critère est fixé à 1,04%.

-jitter (local, absolute) ou jitta: il correspond au jitter absolu dans la littérature. C'est la moyenne des différences (en valeur absolue) entre les durées de deux périodes consécutives du signal. Le seuil normal/pathologique est de 83,2.

-jitter (rap): il correspond au RAP ou au FPQ dans la littérature. Comme le jitter ratio, le RAP mesure les perturbations à court terme de la fréquence fondamentale. Ici, on compare la durée de chaque période Ti non pas à celle de la période suivante (Ti+1), mais à la moyenne de 3 périodes successives T-1, T et T+1, ce qui a théoriquement pour effet d'atténuer les variations volontaires de la fréquence vocale, comme le trémolo, par exemple. Dans les faits, le jitter ratio et le RAP sont des mesures à peu près équivalentes. Le RAP est également exprimé en pourcentage. Le seuil normal/pathologique est fixé à 0,68%.

-jitter (ppq5): c'est la moyenne de la différence (en valeur absolue) entre la durée d'une période et la durée moyenne des 4 périodes les plus proches, divisée par la durée moyenne d'une période du signal. Exprimé en pourcentage, le seuil normal/pathologique du ppq5 est de 0,840%.

-jitter (ddp): Il est égal à trois fois le RAP.

V Voicing: Fraction of locally unvoiced frames

Cela correspond à la fraction de discontinuité dans l'accolement des cordes vocales. Pour une voix normale, le résultat « Fraction of locally unvoiced frames >, ou « Voice break >, doit être égal à 0 (l'accolement des cordes vocales sur une voyelle tenue étant normalement continu). Toute valeur différente de 0 pourra donc être considérée comme pathologique.

VI Intensité

VI.1 Visualiser l'intensité

-intensity / show intensity: une courbe jaune se dessine sur le spectrogramme ainsi que trois nombres, en vert, indiquant l'intensité de la voix. C'est le nombre du milieu qui nous intéresse le plus. En effet, il donne l'intensité de la voix à un instant précis (en cliquant sur le spectrogramme), ou bien sur une plage de sélection. Les nombres s'affichant en haut et en bas à droite correspondent aux bornes inférieure et supérieure, formant un intervalle à l'intérieur duquel praat recherchera les différentes intensités. Les bornes standard sont 50dB et 100dB.

Il est important de définir ces bornes en fonction de la voix que l'on veut analyser au risque de ne pas pouvoir visualiser l'intensité. Pour définir ces bornes:

-intensity / intensity settings (c'est également dans << Intensity settings » qu'il faut cocher la case << substract mean pressure », normalement déjà prédéfinie par Praat, qui permet de supprimer les bruits de fond du calcul de l'intensité).

Par ailleurs, il est toujours possible, comme dans le menu << Pitch », de connaître les intensités moyenne, minimale et maximale d'une sélection en cliquant respectivement sur << Get intensity », << Get minimum intensity » et << Get maximum intensity » dans le menu << Intensity ».

Parfois, il peut être plus judicieux de rechercher l'intensité médiane au lieu de l'intensité moyenne. Pour ce faire, changer la méthode de calcul dans << averaging method » dans << Intensity settings ». Cliquer sur << Intensity listing » pour obtenir le relevé de l'intensité toutes les 0,010666 secondes.

Enfin, pour imprimer la courbe des intensités d'une voix ou l'insérer dans un fichier quelconque, cliquer sur << draw visible intensity contour... » dans le menu << intensity ». Les étapes suivantes étant les mêmes que pour l'impression d'un spectrogramme nous ne les détaillerons pas ici.

VI.2 Shimmer

Pour calculer les différents shimmer cf IV_2 Pulses

-shimmer (local): on mesure ici les perturbations à court terme de l'amplitude du signal sonore. Pour ce faire, on divise la moyenne des différences (en valeur absolue) entre l'amplitude maximale de deux périodes successives, par la moyenne des amplitudes maximales de chaque période. Le seuil normal/pathologique est fixé à 3,81 %.

-shimmer (local, dB): C'est la moyenne des différences (en valeur absolue logarithme10), entre l'amplitude maximale de deux périodes consécutives, multipliée par 20. Cette méthode de calcul présente l'avantage de limiter les effets des variations de F0 (tremor, vibrato, ...) sur le shimmer. La valeur déterminant le seuil normal/pathologique est 0,350dB.

-shimmer (apq11): il s'agit également d'une mesure des perturbations à court terme de l'amplitude du signal. Sur le même principe que le jitter RAP, il s'agit d'atténuer les effets des modulations volontaires d'intensité en comparant l'amplitude maximale de chaque période Ti à l'amplitude moyenne des pics des périodes Ti-5 à Ti+5, soit 11 périodes. Le seuil normal/pathologique est fixé à 3,07%.

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Il faudrait pour le bonheur des états que les philosophes fussent roi ou que les rois fussent philosophes"   Platon