TRAVAIL
EXPERIMENTAL
Résumé.
Dans ce travail on compare la reconnaissance acoustique de
sujets porteurs d'implant cochléaire avec des modèles construits
sur les caractères électriques de l'excitation. Il s'agit de
repérer les éléments qui peuvent expliquer les
performances des patients à l'étage acoustique. Au total, 255
modèles ont été construits, modèles qui sont
basés sur une métrique euclidienne et sur une logique floue. Les
meilleurs résultats ont été obtenus avec la logique
floue.
Quatre patients et dix locuteurs ont participé à
cette étude; ils ont prononcé des listes de 48 items basés
sur les voyelles /i/, /u/, /a/ et /e/, prises en ordre aléatoire.
Les résultats montrent que l'importance du premier
formant ( amplitude et position ), est habituellement sous-estimée et
que les logiques de reconnaissance varient avec le patient. Ces
résultats sont importants pour orienter le réglage des
machines.
Abstract.
In this study a comparison betwen the acoustic recognition
made par subjects fitted with a cochlear implant and the performances of models
constructed on the electrical features of the excitating pulses is performed.
The aim is the determination of elements able to provide an explanation on how
the recognition is made by patients at the acoustical stage. Altogether, 255
models where constructed; they were base upon an euclidian metric or a fuzzy
logic.
Four patients and 10 speakers collaborated to this experiment.
Best resuits were obtained with the fuzzy logic; 48-item lists were spoken,
based on vowels /i/, /u/, /a/ and /da/ arranged in a random order.
Results show that the importance of the first formant (
amplitude and electrode number ) is usually under estimated, and that
recognition strategies depend on the patient. This point is important for the
setting of the speech processor.
A/ Introduction.
La question sur le choix de la stratégie de codage des
Implants Cochléaires (I.C.), reste une question ouverte. Les
constructeurs développent de plus en plus des émetteurs qui
réalisent un traitement du signal ouvert permettant aux équipes
de tester les stratégies qui leur paraissent les meilleures.
Plusieurs types de traitements de signal existent, mais aucun
n'est parfaitement efficace. Cela pousserait à dire que PI. C. peut
être encore plus performant.
De plus, les réglages de l'I.C. ne sont pas
optimisés, car ils se font de manière subjective, avec
l'expérience du praticien et du technicien.
De ces deux problèmes plusieurs questions se posent.
- Est-ce que les informations transmises au patient par l'I.C.
sont bien toutes décryptées?.
- Est-ce qu'au moins les informations, que l'on croit
principales sont utilisées par le
patient?
- Est-ce que la stratégie est bien adaptée au
patient?
Très peu d'études se sont penchées sur se
problème qui nous parait pourtant primordial.
Pour arriver à répondre à ces questions,
il faudrait pouvoir modéliser l'écoute du patient en fonction des
données que lui envoi C'est ce que nous avons essayé de faire en
testant des modèles d'audition du patient.
L'idée a été de comparer la
reconnaissance du patient avec celle d'un ordinateur qui va prendre plus ou
moins de paramètres. Le modèle qui approchera le mieux à
l'écoute du patient sera le modèle ou l'erreur est minimale. Il
sera appelé le 'modèle semblable'. ( cf figure 1 ).
Patient
Comparaison
Erreur
Signal Acoustique
Reco. par Ordinateur
C.I
C.I
Acquisition
Figure 1 : Principe de l'étude.
Les paramètres que l'on va prendre pour la
modélisation vont être ceux contenus dans l'impulsion
électrique envoyée sur l'électrode. ( cf figure 2 ).
. Le numéro d'électrode. ( F ).
. L'amplitude de l'impulsion. ( A ).
. La durée de l'impulsion. ( T ).
. L'énergie de l'impulsion. (E = A x T ).
Durée (T)
N° de l'électrode
Amplitude
(A)
·./
Energie (E=AxT)
Figure 2 : Les 4 paramètres d'une impulsion
électrique.
Pour limiter le nombre de modèles, on va utiliser la
stratégie FOF1F2. On aura donc deux impulsions par période du
fondamental, une pour le premier formant, une autre pour le deuxième
formant. On aura donc 8 paramètres à étudier, F1 Al Tl El
F2 A2 T2 E2, ce qui nous fait 28 possibilités. Comme la
possibilité 0 ne nous intéresse pas, nous allons avoir 255
modèles de reconnaissance à comparer avec la compréhension
du patient.
|