III/ Le codage temporel
La résolution temporelle est une
propriété majeure de la perception auditive, dans la mesure
où la plupart des sons naturels que nous cherchons à percevoir,
tels que la parole ou la musique, évoluent dans le temps. Le timbre, la
hauteur tonale, la localisation de sources sonores sont autant de
propriétés des objets sonores pouvant être comprises sur la
base de mécanismes temporels. La résolution temporelle est
doublement importante dans la mesure où, très souvent, le bruit
masquant en provenance de l'environnement varie en fonction du temps. En lien
étroit avec la capacité de démasquage de l'oreille,
l'analyse primitive des scènes auditives utilise la cohérence des
fluctuations temporelles des composantes sonores afin d'organiser ces
dernières en entités sonores ou flux auditifs (Bregman, 1990). Le
décodage acoustico-phonétique, l'organisation perceptive de
l'environnement sonore et la perception des qualités des sons telles que
la hauteur, le timbre ou le rythme dépendent donc étroitement de
notre capacité à résoudre des variations temporelles
fines.
a- intégration temporelle
L'intégration temporelle mesure le temps au cours duquel,
le système auditif intègre l'énergie qu'il
reçoit.
Les stimuli de longue durée sont perçus à +
faible intensité a que ceux de plus courte durée. La durée
de stimulation à partir de laquelle le seuil ne change plus est
appelée 'temps d'intégration temporelle' (TIT). Les sujets
normo-entendants ont des TIT de 100 à 200 ms et paraissent
intégrer la puissance du
stimulus. Quand la durée du stimulus est diminuée
de moitié, la puissance du stimulus doit être doublée pour
garder le signal à son seuil.
La figure 65 indique les seuils en fonction de la durée du
stimulus pour des sujets implantés cochléaires et pour des
normo-entendants (Shannon, 1983).Les fonctions sont semblables.
CI Tem oral Inte ration 22 Curve Avera e
20
o
-0 15
L
10
L
-1i 5
O
cn 0
|
|
10 100 1000
Signal Durotion (ms)
Figure 65 Fonction
d'intégration temporelle chez des sujets implantés
cochléaires. La ligne pleine correspond à celle obtenue
classiquement chez les normo-entendants (Shannon, 1983)).
Nous avons étudié l'intégration
temporelle chez sujets implantés cochléaires Digisonic,à
différents niveaux de sonie. Nous avons mesuré les fonctions de
sonie par mesure catégorielle avec des trains d'impulsions de
différentes durées (107, 215 et 430 ms). 12 patients ont
été testés sur une électrode apicale à
différentes fréquences de stimulation (75, 150, 300 et 600
Hz).
Les résultats, représentés figure 66,
montrent des décroissances de la sonie en fonction de la durée de
stimulation. Par contre la forme de la fonction de sonie est invariante. Une
analyse statistique par Anova à deux facteurs et mesures
répétées montre effectivement des différences de la
fonction de sonie en fonction de la durée d'impulsion. Par contre les
niveaux très faible et faible ne dépendandent pas de la
durée.
YN
W.
Meg
120
100
40
20
Figure 66 : mesure de la fonction
de sonie par mesure catégorielle chez 12 sujets
implantés cochléaires en fonction de la durée du train
d'impulsion.
b- résolution temporelle par le 'gap
test'
La méthode dite de `gap test' mesure l'aptitude
à détecter une brève interruption dans un stimulus
continu. En général plus le stimulus est intense, plus le seuil
de détection de l'interruption est cours. Les sujets implantés
cochléaires ont les mêmes performances que les sujets
mormo-entendants (Moore et al, 1988).
Gap Detection as c Funcflon of Lou
Figure 67 : Résolution
temporelle avec le gap test en fonction du niveau de sonie, d'après
Shannon 1983
Mesure de la résolution temporelle par le 'Gap
test'
Nous avons évalué la résolution
temporelle (gap) sur une électrode apicale pour deux fréquences
de stimulation (300 et 1000 Hz) à 4 niveaux d'intensité de
stimulation (10, 30, 70, 90 % de la dynamique).
Comme le montre la figure 68, l'expérience consiste
à enlever des impulsions (de 0 à 20) au milieu d'un train de 200
impulsions (0.66 seconde pour la fréquence 300 Hz, 0.20 seconde pour la
fréquence 1000 Hz) et de demander au sujet testé s'il
perçoit un son ou deux sons. Le gap est présent de manière
aléatoire (p=50%) et toujours égal à un multiple de la
période de stimulation. En effet un gap d'une durée ne
correspondant pas à un multiple de la période pourrait être
détecté par déphasage entre les deux trains d'impulsions.
On commence avec 20 impulsions supprimées, puis on diminue en fonction
de la réponse du sujet, jusqu'à ce que l'on converge vers un
nombre d'impulsions enlevées à la limite de la perception du gap.
La technique utilisée pour converger vers la valeur limite est une
procédure 2 IFC (décrite pour la mesure du dl). On transcrit
ensuite le nombre d'impulsions en millisecondes (x3.3 pour f=300 Hz, x1 pour
f=1000 Hz).
dT (= k / F)
Figure 68 : protocole de la
mesure de résolution temporelle (gap test). K est le nombre
d'impulsions enlevées. F est la fréquence de stimulation du
train de 200 impulsions.
La figure 69 représente l'évolution de la
résolution temporelle en fonction des niveaux de stimulation (en
pourcentage de la dynamique) pour deux fréquences de stimulation (300 et
1000 Hz). La forme des courbes est de type exponentiel décroissant. Les
meilleurs seuils sont obtenus à des intensités de stimulations
fortes. Ces résultats sont comparables a ceux obtenus avec d'autres
systèmes d'implant cochléaire (Shannon, 1983, 1989). Ils sont
aussi comparables à ceux obtenus chez les normoentendants (Moore et
Glasberg, 1988). Le gap semble être stable à partir de 30 % de la
dynamique. Les capacités de résolution temporelle des sujets
porteurs d'implant cochléaire sont les mêmes que celles des sujets
normo-entendants. Les 5 sujets testés peuvent percevoir l'absence d'une
impulsion dans un train de 200 impulsions à 300 Hz pour des
intensités de stimulation de 70 et/ou 90 % de la dynamique.
L'analyse par Anova montre une dépendance du gap au
pourcentage de la dynamique (p<0.001) et une indépendance à la
fréquence de stimulation. Le seuil à 10 % de la dynamique est
différent des seuils à 30, 70, 90 % de la dynamique. Cela peut
facilement s'expliquer physiologiquement. En effet, à faible niveau
d'intensité perçue, le nombre de fibres recrutées et la
synchronisation des fibres sont plus
faibles. La période réfractaire du groupe de
neurone est plus longue et la synchronisation moins importante. La
résolution temporelle est par conséquent moins bonne. La
résolution temporelle ne semble pas être dépendante de la
fréquence de stimulation. Par contre, on peut constater que les deux
patients qui ont les meilleures résolutions temporelles sont les deux
meilleurs patients.
100% 0%
25% 50% 75%
0% 25% 50% 75%
25
7i 20
E
15
a. <
0 io
5
0
I- · · 1000 Hz - Il- 300 Hz
|
V
|
|
|
|
· ,
|
|
V
|
V
|
|
4.
· . .,
|
|
|
|
|
|
tir
|
|
z
t
-*
25% 50% 75% 100%
o
100% 0%
4....
5
4
3
2
25
20
15
10
5
· - 1000 Hz - · - 300
Hz'
- 4- 1000 Hz - - 300 Hz
s.
· -
- - - ·
Patient 1 : 35 % Patient 2 : 90 %
12
|
I- · · 1000 - ·- 300 Hz
I
|
|
- - 1000 Hz - 300 Hz
|
|
|
|
|
10
|
a-- ss
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4
|
|
|
|
|
|
Y · · · ·
|
- - -
·
|
--
|
|
|
|
|
|
|
· "
|
|
0
|
|
|
|
|
|
Patient 3 : 30 %
4 1..-
|
1000 Hz - ·- 300 Hz
|
|
|
|
|
|
.
|
,
|
|
|
|
|
6.
|
· · ,
|
.
|
|
|
|
|
|
|
|
75% 100%
25 20 15 10 5 0
70 60 1/7 50
· 40
· 30
20 10
0
0%
25% 50% 75% 100% 0% 25% 50% 75% 100% 0% 25%
50%
Patient 4 : 60 % Patient 5 : 80 % Moyenne : 59
%
Figure 69 : Résolution
temporelle (Gap en ms) sur 5 sujets porteurs de l'implant Digisonic en
fonction de différents pourcentages de la dynamique (10, 30, 70, 90)
pour des fréquences de stimulation de 300 et 1000 Hz sur une
électrode apicale. Les flèches indiquent des limites de la mesure
(vers le haut : cela correspond à une valeur sous estimée ;
vers le bas cela correspond à une valeur sur estimée).
Pour chaque sujet testé, on a indiqué ses performances sans
lecture labiale sur une liste de mots triphonémique de Lafon.
La résolution temporelle étant très
déterminante pour la reconnaissance de la parole chez le sujet porteur
de l'implant cochléaire (Cazal et al, 1991, 1994), la question est de
savoir s'il faut supprimer la première partie de la dynamique pour coder
l'information pour ne garder que la partie 30-100 % de la dynamique ? Cette
question parait intéressante à élucider car elle
permettrait peut-être d'améliorer les performances des sujets
porteurs d'implant cochléaire pour des niveaux acoustiques faibles. Une
étude plus exhaustive sur l'influence de la partie de la dynamique
électrique utilisée sur les performances parait donc
intéressante.
c- Les modulations en amplitude
L'organisation perceptive de l'environnement sonore, la
perception du timbre des sons et l'intelligibilité de la parole
dépendent étroitement de la capacité du système
auditif à résoudre les variations temporelles lentes de
l'amplitude des sons, i.e., l'enveloppe temporelle des sons.
Les caractéristiques acoustiques de l'enveloppe, telles
que l'intensité, le temps de montée, le temps de descente, et la
fréquence de fluctuation déterminent respectivement les
sensations de force, d'attaque, de chute, de rugosité et de tempo. La
forme de l'enveloppe temporelle est également impliquée dans la
perception du timbre et dans les processus de reconnaissance d'objets
sonores.
La mesure de la sensibilité auditive d'un patient aux
fluctuations est directement reliée à l'acuité (ou la
résolution) temporelle du système auditif. Une description plus
complète de la résolution temporelle du système auditif
peut être réalisée en mesurant la fonction de transfert de
modulation temporelle (TMTF, pour Temporal Modulation Transfer Function). Dans
ce test psychoacoustique (Viemeister, 1979), les stimuli sont des bruits large
bande modulés sinusoïdalement en amplitude à une
fréquence donnée. La TMTF relie la performance de
déduction de la modulation d'amplitude à la fréquence de
modulation. La performance (ou le seuil) de détection de la modulation
d'amplitude, mesurée en décibels (20 log(m)), correspond à
la plus petite profondeur de la modulation d'amplitude, m, permettant de juste
discriminer un bruit non modulé. Les TMTFs obtenues par Viemeister
(1979) présentent une caractéristique passe- bas : la performance
de détection est constante jusqu'à environ 8 Hz. Elle se
réduit de 3dB à environ 50 Hz, puis elle décroît de
manière monotone de 3-4 dB/octave (on parle de 'pente
d'atténuation') jusqu'à approximativement 800 Hz. .30
-25 -20
-10
-5
2 8 16 32 64 125 250 500 1000 2000 9000"0
Figure 70 : Fonction de transfert
de modulation d'amplitude (TMTF) mesurées chez quatre sujets.
La porteuse est un bruit large bande. D'après Viemeister,
1979,
Bien que la résolution en fréquence et en
intensité chez le sujet porteur d'un implant cochléaire est
très appauvrie en comparaison à celles du normo-entendant, elle
est suffisante pour coder les modulations (Shannon, 1991 ; Cazal et al, 1994).
Cela s'explique principalement par la très bonne résolution
temporelle précédemment décrite des sujets porteurs d'un
implant cochléaire (Shannon, 1983, 1989 ; Cazal et al, 1991). Les TMTFs
obtenues chez des patients porteurs d'un implant cochléaire (Shannon,
1992) sont également similaires à celles obtenues chez des sujets
normo-entendants (Shannon, 1992 ;
E
cf) -
o
VV
E
o
u
C1
Nucleus Average (N= 7)
iou
ciulation Frequency (Hz)
Ineraid Average (N= 10)
Kohlrausch, 1993).
Figure 71: mesure de la fonction de transfert
de modulation d'amplitude chez sujets implantés cochléaires
(Inaired ou Nucleus) comparé au
normo- entendant, d'après Shannon
1992
Des travaux (Shannon et al, 1995) ont montré la
possibilité de coder la parole avec des indices d'enveloppe du signal ;
les résultats sont fonction du nombre de canaux fréquentiels
utilisés, mais aussi des fonction de compression entrée sortie
(Fu et al, 1998).
Enveloppe et compression
|