III/ Intérêt de l'extraction de pics et du
rehaussement spectral
Sur le système Digisonic, il est possible d'activer
l'ensemble des canaux du sujet implanté à chaque trame de
stimulation. L'objectif est de montrer qu'une partie des informations peut
être inutile, voire même perturbante pour la discrimination
phonétique.
al Extraction de pics
A chaque trame de stimulation, l'implant cochléaire
Digisonic® peut activer de 1 à 15 électrodes. Le
choix du nombre maximum de canaux ouverts par trame ne sert qu'à ajuster
la sensation de sonie (plus le nombre de canaux ouverts est important, plus le
niveau de sonie est élevé).
L'objectif de cette partie est d'étudier l'effet du
nombre de canaux activés sur la reconnaissance. Stimuler seulement x
canaux sur quinze, ceux correspondant aux plus grandes énergies de la
trame, équivaut à extraire l'information émergente du
signal.
Figure 29 : Exemple du principe
d'extraction de pics (5 pics par cycle)
Nous avons comparé les distances statistiques entre
différents groupes de voyelles (/a/, /i/, /u/, /3/). Le protocole
expérimental est très proche des études II/a/ et II/b/. 10
locuteurs (5 hommes et 5 femmes) ont prononcé 24 fois chaque voyelle (en
contexte «c'est» voyelle «à ça»)
dans un ordre aléatoire. Chaque voyelle est transmise, via un haut
parleur, à l'implant cochléaire Digisonic®.
L'implant cochléaire a une répartition fréquentielle en
échelle Bark (Calliope, 1989) et est en mode 'N' avec 15 canaux actifs
par trame. La carte d'acquisition du Digigram®,
connectée à la sortie de l'antenne de l'implant, numérise
et enregistre sur PC chaque voyelle. Le PC génère 15 fichiers
différents par voyelle
segmentée. Ils correspondent à une simulation du
mode 'N' avec 1 à 15 canaux actifs par trame. La figure 30 illustre un
exemple des modifications de l'électrodogramme induite par le nombre de
canaux par trame.
Chaque voyelle est décomposée en un vecteur
à 15 dimensions correspondant chacune à une moyenne en
énergie de 20 trames. Dans chaque condition, la distance statistique
entre les voyelles est mesurée. Les résultats montrent que la
séparation des différentes voyelles dépend du nombre de
canaux actifs par trame et des voyelles à séparer. Deux canaux
actifs par trame correspondent au réglage le plus efficace en moyenne
pour séparer au mieux les groupes de voyelles. Les distances
statistiques se dégradent lorsque l'on utilise trop de canaux actifs par
trame.
Canaux actifs
|
/a/-/i/
|
la/-/u/
|
la/-131
|
/i/-/u/
|
/u/-131
|
/i/-131
|
Moyenne
|
1
|
7.7
|
11.0
|
8.0
|
6.2
|
8.5
|
78.7
|
13.6
|
2
|
24.9
|
32.8
|
9.5
|
14.7
|
7.5
|
31.8
|
17.9
|
3
|
11.9
|
14.5
|
9.5
|
19.1
|
8.8
|
41.6
|
14.8
|
4
|
10.1.
|
12.4
|
9.3
|
12.8
|
9.2
|
54.0
|
14.1
|
5
|
13.7
|
11.8
|
8.7
|
11.8
|
12.0
|
34.2
|
13.8
|
6
|
12.4
|
9.5
|
7.8
|
13.5
|
10.9
|
49.4
|
13.7
|
7
|
14.0
|
10.9
|
6.1
|
15.1
|
7.0
|
32.1
|
12.0
|
8
|
16.2
|
12.5
|
6.7
|
14.8
|
6.3
|
26.8
|
12.4
|
9
|
15.4
|
12.8
|
6.7
|
14.3
|
6.3
|
25.1
|
11.9
|
10
|
15.3
|
13.2
|
6.4
|
14.0
|
6.3
|
24.3
|
11.7
|
11
|
15.4
|
14.1
|
6.6
|
14.0
|
6.4
|
24.0
|
11.9
|
12
|
15.7
|
14.4
|
6.6
|
14.0
|
6.4
|
24.0
|
12.0
|
13
|
15.9
|
14.4
|
6.6
|
14.0
|
6.4
|
24.0
|
12.0
|
14
|
16.0
|
14.5
|
6.5
|
14.0
|
6.4
|
24.0
|
12.0
|
15
|
16.0
|
14.5
|
6.5
|
14.0
|
6.4
|
24.0
|
12.0
|
Tableau Ill: Distances
statistiques en fonction du nombre de canaux actifs et du couple de voyelles
à séparer.
· -111-1.1
-111111111111111111111111111111111111111111111111111111 111111111
III .111111.
·
III 111111111111111111111
Il 11 11
· Hutii 11..1
11111111111111111111111111111111111111111111111111111101111111111111HiiIIIH-............-............---
· I 11111111111111111111 .111 111-111.-1111- III 111 1
·
. 1111111111111111111111111--
-11.-111-111 1111111 ·.11.
1111111111111111111111111111,-.1......
. -11
·
· .11 11111111 I ·
· · .111.11 1.111 1111 11111 1111111111 1111 111.
1111 11111 1111 11111 ·III III' I
·
· -111mill
111t.111..1...1111111111111111111111111111111111111111111111111111111111111111111111111111111111111.
· -111-1111-11
111-11-111111111111111111111-11111.11111111-1111
1111-111111111111111111111111-111 1111111111-.1111111 1
·
10
· ..11i11
11.11-1--111-111-11111-1--111-...11111-.111.1111
111. 1111 .11111111. 111--11
...11111111111111111111111111111111111111,111..1111111111111111-11111111111111111111111111111111111111111
111111111-1111-1111.11.....--
111111111 in
1111.11111111111111111111111111111111111111.....--
.....111.-111 .1111 Illii-11111.1111110 ·.
n0.11111111-
Figure 30: Electrodogramme d'un
/3/ avec 1 (gauche), 2 (milieu), 5 (droit) canaux actifs par trame.
b/ Rehaussement spectral
Les résultats précédents montrent que 2
canaux actifs par trame correspondent à la meilleure séparation
des voyelles. Pour le patient implanté, cela ne semble pas exploitable
car avec ce type de stimulation, la sonie est faible et la voix, par la
pauvreté de l'information, n'est pas 'naturelle' et semble
saccadée.
Afin d'augmenter le nombre de canaux actifs et
d'améliorer le rapport signal sur bruit, nous avons voulu étudier
les avantages d'une technique de rehaussement spectral.
Rehaussement spectral
Afin de faire ressortir les pics d'énergie de certains
canaux, on utilise un algorithme qui va atténuer les canaux adjacents
des maxima. Le nombre de maxima étudiés est de 1 à 15,
l'atténuation de 0 à 95% par pas de 5 %. 300 configurations de
réglage sont donc envisagées. Un exemple figure 31, permet de
mieux comprendre ce principe de rehaussement.
I
Figure 31: Exemple de
rehaussement. Signal d'origine (Gauche); Atténuation de 20 % avec 3
Maxima (droite).
Tout comme l'étude sur l'extraction de pics, nous
utilisons les voyelles /a/, /i/, /u/, /3/ prononcées 24 fois chacune par
10 locuteurs, puis segmentées et modifiées par le PC via
l'implant cochléaire Digisonic® et le
Digigram®. Les distances statistiques entre chaque couple de
voyelles sont ensuite calculées pour toutes les configurations (300
simulations de réglages différents).
Le tableau IV, est un résumé des résultats
(2100 distances statistiques calculées). Seules les meilleures
configurations y sont représentées.
|
nombre de maxima / cycle
|
Atténuation
|
Distance statistique
|
/a/-/i/
|
7
|
20 %
|
42.0
|
la/-/u/
|
7
|
15 %
|
34.5
|
/a/43/
|
4
|
20 %
|
46.6
|
/i/-/u/
|
4
|
15 %
|
80.3
|
/i/-131
|
3
|
35 %
|
83.3
|
/u/-131
|
5
|
35 %
|
41.6
|
Moyenne
|
4
|
15 %
|
18.0
|
|
Tableau IV: Meilleures distances
statistiques en fonction des voyelles, du nombre de maxima et de
l'atténuation
Les distances statistiques indiquées dans le tableau
IV sont plus grandes que celles obtenues avec la technique d'extraction de
pics, ce qui indique une meilleure différentiation entre les voyelles
concernées. De plus le nombre de maxima choisis est compatible avec le
confort du sujet implanté (niveau de sonie et fluidité de la voix
perçue par le patient). Ce type de traitement semble donc
intéressant à étudier pour la discrimination des voyelles
chez le sujet implanté cochléaire.
|