WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Importance des paramètres du codage pour la reconnaissance des voyelles chez les patients implantés cochléaires

( Télécharger le fichier original )
par Stéphane GALLEGO
Université Lyon I - DEA 1994
  

Disponible en mode multipage

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

DIPLOME D'ETUDES APPROFONDIES DE GENIE

BIOLOGIQUE ET MEDICAL

ANNEE 1994

OPTION 1 : Traitement du signal.

IMPORTANCE DES PARAMETRES DU CODAGE

POUR LA RECONNAISSANCE DE VOYELLES

CHEZ LES PATIENTS IMPLANTES COCHLEAIRES

MEMOIRE DE RECHERCHE :

Stéphane GALLEGO

Jury : Professeur

Professeur Professeur Professeur Docteur

Monsieur Professeur Madame Monsieur Docteur

CLECHET COLLET COLLOMBEL DEMONGEOT DEPEURSINGE DITTMAR GOUTTE MAGNIN PERNIER RUSCH

Directeur de recherche : Professeur Christian BERGER-VACHON

Laboratoire Audition et Voix
Pavillon U - O.R.L.
Pr. A. MORGON - Pr. L. COLLET
U.R.A. CNRS 1447
Hôpital Edouard HERRIOT

Je tiens à remercier toutes les personnes qui m'ont aidées à mener à bien la réalisation de ce DEA.

Je voudrais plus particulièrement réserver cette partie du mémoire à mon maître de stage, le professeur Berger Vachon qui s'est montrer, très actif pour la mise au point et la correction du travail, et aussi très humain et sympathique.

Je tiens aussi à remercier,

le professeur A. Morgon, chef du service d'ORL, pour m'avoir accepté dans son pavillon. le professeur L. Collet, directeur du laboratoire, pour m'avoir accueilli dans son unité.

M. Garoscio, A.M. Jonas et J.M.Chanal ainsi que le docteur E. Truy pour le temps et leur gentillesse qu'ils m'ont offerts.

I. Garnier pour notre mise en commun de certains schémas pour le rapport. toute l'équipe du pavillon U pour la bonne ambiance qu'il y règne.

CURRICULUM VITAE

Etat civil:

GALLEGO Stéphane

29 rue Louis Guerin 69100 VILLEURBANNE 78.94.60.62.

Né le 21/10/71 à Givors (Rhône) Lafayette

38790 Diemoz

74.59.01.78.

Formation:

1991-1993 : Maîtrise de Sciences et Techniques de Génie Biologique et Médical à

l'Université Claude Bernard Lyon I.

1989-1991 : DUT de Génie Electrique et Informatique Industrielle option

Automatismes et Systèmes à l'Université Claude Bernard Lyon I (IUT B).

1989 : Bac C au Lycée Léonard de Vinci. (Villefontaine : Isère).

Stages:

Juillet 1993 : Stage de fin d'étude de Maîtrise de Sciences et Techniques dans le

laboratoire d'Audition et Voix du pavillon ORL à l'Hôpital Edouard Herriot de Lyon.

Sujet: Comparaison élémentaire de la reconnaissance automatique des voyelles avec celle des implantés cochléaires.

Juillet 1992 : Stage de fin de première année de Maîtrise de Sciences et Techniques

dans le laboratoire d'Audition et Voix du pavillon U à l'Hôpital Edouard Herriot de Lyon. Sujet: Détection acoustique de l'insuffisance vélaire chez les enfants.

Mai et Juin 1991 : Stage de fin d'étude de DUT de Génie Electrique chez ELEC4.

Sujet: Elaboration de programmes en Turbo Pascal. ( Pour la saisie des dépenses du parc automobile afin de distribuer les coûts pour les différents chantiers ; Elaboration d'une schématèque pour la réalisation de plans d'armoires électriques.)

Publications et communications:

C. Berger Vachon S. Gallégo A. Morgon E. Truy.

Importance of the coding cues for the descrimination of cochlear implants signais.

2nd international cochlear implant, speech & hearing symposium. Melbourne 24-28 octobre 1994. (Soumis aussi aux annales de St Louis.)

S. Gallégo E. Perrin C. Berger Vachon L. Collet E. Truy

Recognition of vowels by cochlear implants using a fuzzy logic.

International AMSE conference.(Association for the Advancement of Modelling and Simulation techniques in Entreprises). Lyon 4-6 Juillet 1994.

SOMMAIRE

PARTIE BIBLIOGRAPHIQUE 7

A/ Rappels sur l'audition. 8

1/Audition normale. 8

a/ Anatomie. 8

b/ Physiologie. 10

2/ Les types de surdités et leurs caractéristiques. 11

B/ La Phonation. 12

1/ la phonation en général. 12

2/ Les voyelles. 13

a/ Description. 13

b/ Moyens d'exploration. 13

cl De la synthèse vocale à l'implant cochléaire. 15

C/ Implants cochléaires. 16

1/ Introduction. 16

2/ Principe. 17

3/ Patients. 19

al Sélection. 19

b/ Suivi. 20

4/ L'implant Nucleus. 20

a/ Stratégies de codages. 20

b/ Réglages. 22

D/ Etudes. 23

1/ Evolution du Nucleus. 23

2/ Sur le traitement du signal hors laboratoire. 23

3/ Travaux du Laboratoire. 24

E/ Méthodes mathématiques. 24

1/ Principe de reconnaissance automatique de voyelles. 24

2/ La métrique euclidienne. 25

3/ Logiques floues. 25

4/ Distance de Hamming. 26

REFERENCES BIBLIOGRAPHIQUES 27

PUBLICATIONS. 28

LIVRES ET RAPPORTS. 31

TRAVAIL EXPERIMENTAL 32

Résumé. 33

Abstract. 33

A/ Introduction. 34

B/ Matériel et méthodes. 35

1/ Station de travail. 35

a/ Station d'enregistrement. 35

b/ Station de réglage de l'implant cochléaire. 36

cl Station d'acquisition des paramètres de l'implant. 36

d/ Station ILS. 38

2/ Matériel phonétique. 38

3/ Patients. 39

4/ Stratégies de reconnaissance. 41

a/ Méthode euclidienne. 42

b/ Logique floue. 43

cl Distance entre matrices. 44

5/ Synoptique général de l'étude. 45

C/ Résultats. 46

1/ Paramètres regroupés. 46

2/ Singletons, doublets, triplets et quadruplets. 47

3/ Analyse acoustique des voyelles. 50

DISCUSSION 53

CONCLUSION 59

ANNEXES 61

PARTIE

BIBLIOGRAPHIQUE

A/ Rappels sur l'audition.

1/ Audition normale.

a/ Anatomie. [3 8,9]

Figure 1 : Coupe de l'appareil auditif humain.

(1) Pavillon

a) Conduit auditif externe

(g) Tympan

(3) Oreille moyenne

® Cochlée

e Canaux semi-ciculaires

· Nerf facial

m Nerf auditif

e Cavité de l'oreille moyenne

J Trompe d'Eustache.

Oreille externe.

anaOreille moyenne.

(

Oreille interne.

L'appareil auditif peut se décomposer en trois parties bien distinctes. ( cf figure 1 ).

. L'oreille externe, constituée par le pavillon et le conduit auditif externe (25 mm de longueur), elle se termine au niveau du tympan.

. L'oreille moyenne qui peut se résumer par trois éléments importants.

. La caisse du tympan, cavité étanche remplie d'air qui comprend la chaîne ossiculaire. Cette dernière, formée de trois osselets, le marteau, l'enclume et l'étrier, relie le tympan à la fenêtre ovale.

. La trompe d'Eustache, située en avant de la caisse tympanique, est un conduit fibro-cartilagineux qui fait communiquer l'oreille moyenne avec le rhino-pharynx afin d'équilibrer les pressions intra et extra oreille moyenne.

. Les cellules mastoïdiennes, situées en arrière, sont des cavités remplies d'air qui prolongent la caisse du tympan dans l'apophyse mastoïde.

Figure a:

· Carmaux

semi-circulaires Fenètre ovale

· Fenètre ronde

Limaçon

Figure c:

0 Rampe tympanique Rampe vestibulaire

Canal cochleaire

4 Organe de Corti

· Cellules ciliées

Nerf auditif

· Membrane de Reissner
Membrane basilaire

Figure 2 : Schémas généraux de l'oreille interne.

. L'oreille interne, plus communément appelé labyrinthe, est une structure complexe, remplie de liquide, composée de cavités osseuses formant le labyrinthe osseux à l'intérieur duquel se trouvent des structures membraneuses formant le labyrinthe membraneux. Celle-ci peut se décomposer en 2 parties. ( cf figure 2 ).

. Le vestibule, constitué de la cavité centrale de l'oreille interne, est l'organe qui gère l'équilibre. Les trois canaux semi-circulaires qui s'ouvrent sur les faces supérieures et postérieures du vestibule.

. La cochlée, située en avant du vestibule, constitue l'organe de l'audition. Elle est formée d'un tube spiralé autour d'un axe osseux. Ce tube est divisé en deux par la lame spirale, ce qui délimite la rampe tympanique et la rampe vestibulaire. Entre ces deux rampes se trouve le canal cochléaire. Il est séparé par la membrane basilaire et la membrane de Reissner.

Sur cette membrane basilaire repose l'organe de Corti constitué des cellules ciliées externes et internes.

Les informations nerveuses sont véhiculées par le nerf auditif. Celui-ci est formé par la réunion de fibres nerveuses cochléaires et vestibulaires. Il prend naissance dans le ganglion de Corti, chemine dans le conduit auditif interne pour arriver jusqu'au tronc cérébral, puis au niveau du bulbe rachidien.

b/ Physiologie.

L'audition commence lorsque les ondes sonores, captées par le pavillon de l'oreille, pénètrent dans le conduit auditif externe et vont être dirigées vers la membrane du tympan. Celle- ci va se mettre à vibrer aux fréquences contenues dans l'onde acoustique.

En réalité, la partie externe de l'oreille ne joue qu'un rôle mineur dans l'audition. Elle n'a que pour but de capter le son.

En vibrant, le tympan va déplacer la chaîne d'osselets. Le marteau attaché au tympan reçoit les vibrations sonores qui poursuivent leur chemin vers l'oreille interne par l'enclume et l'étrier attaché à la fenêtre ovale.

L'oreille moyenne à quatre objectifs:

. Elle amplifie l'onde acoustique, pour se faire elle va utiliser le phénomène de 'levier', qui consiste à réduire les surfaces tout en conservant la même force.(La surface de la fenêtre ovale est trente fois inférieure à celle du tympan ; on a donc une amplification par 30 de la pression. Il existe en plus un phénomène d'amplification par résonance cavitaire de l'oreille moyenne.

. Elle protège l'oreille interne pour des ondes acoustiques supérieures à 80 dB en utilisant le reflex stapédien, mécanisme qui consiste à réduire l'amplification de la chaîne ossiculaire.

. Elle transforme une onde acoustique en force mécanique, ce qui va permettre de réaliser une interface 0.E / 0.I.( milieu gazeux / milieu liquide) sans perte d'énergie.

. Elle joue le rôle d'un filtre passe-haut du premier ordre.

La force exercée par l'étrier sur la fenêtre ovale est convertie en onde de pression hydraulique, car la cochlée est remplie d'un liquide. Cette nouvelle onde traverse rapidement les rampes vestibulaires et tympaniques pour passer autour de la membrane basilaire. Cette membrane basilaire, qui est le support de l'organe de Corti, ( découvert par Alfonso Corti en 1850), va se déformer à des endroits spécifiques aux fréquences de l'onde acoustique. ( théorie formulée par Ludwig Ferdinand Von Helmoltz à la fin du XIXème siècle. ). [49]

En se déformant, les cellules ciliées de l'organe de Corti vont émettre des potentiels évoqués (P.A.) qui vont se propager sur le nerf auditif et vont être interprétés par le cerveau comme des sons.

Sur le long de la membrane basilaire reposent 3500 cellules ciliées, ce qui permet une bonne discrimination fréquentielle de l'onde acoustique, les fréquences hautes se trouvant vers la base, les basses vers l'apex. La bande de fréquence que peut discriminer l'oreille humaine est de 20 à 20000 Hz. ( Le principe général fut formulé par Georges Von Békésy qui l'étudia sur des oreilles d'éléphant dans les années 1940. Il eut le prix Nobel pour ses travaux en 1961). [49]

2/ Les types de surdités et leurs caractéristiques.

Il existe deux grands types de surdités, les surdités transmission et les surdités de perception. Chacune d'elle a ses caractéristiques. [281

. La surdité de transmission correspond à une altération de l'oreille externe et/ou de l'oreille moyenne. Elle se traduit par une perte d'énergie d'environ 55 à 60 dB. Les ondes acoustiques ne se transmettent plus par voie aérienne mais par voie osseuse.

Leurs principales causes sont:

. Obturation du conduit auditif externe.

. Destruction ou malformation du tympan ou de la chaîne ossiculaire.

. La surdité de perception correspond à une altération de l'oreille interne ou/et du nerf auditif. ( surdité de perception endo- ou rétro-cochléaire.). Elle se traduit par des pertes d'énergies en conduction aérienne et osseuse. Elles peuvent provenir, d'une malformation, d'un traumatisme ou d'un virus.

Il peut arriver que des patients aient les deux types de surdités, on appelle cela une surdité mixte. A titre d'exemple et d'explication les graphiques ci-dessous montrent les audiogrammes de différentes personnes. ( cf figure 3 ).

125

250

500

1000

2000

4000

8000

125 250 500 1000 2000 4000 8000

Fréquence

·

Audiométrie chez un sujet normal

Intensité en dB

20 40 60 80 100


·

Intensité en dB

125

500

250

1000

8000

500

250

125

1000

2000

4000

8000

Seuil de conduction osseuse. o- - - - -0 Seuil de conduction osseuse.

Figure 3 : Audiogramme normal et des différents types de surdité.

B/ La Phonation.

1/ La phonation en général. [40]

Epiglotte

Bande
ventriculaire

Corde vocale

Glotte

Figure 5 :Section du larynx.

Voile

Pharynx
·
Epiglotte

OEsophage

Glotte

Trachée

Figure 4 : Appareil phonatoire humain

La parole humaine est produite par le système phonatoire schématisé ci-dessus figure 4 et 5. Elle peut être modélisée par un tuyau acoustique à section variable, déterminé à une extrémité par la glotte, ( partie du larynx comprise entre les cordes vocales ), et l'autre par les lèvres. Sa longueur est voisine de 17 centimètres. Sa section est constamment déformée lors de la phonation ; elle peut varier de 0 à 20 cm2. Le conduit nasal, d'une longueur d'environ 12 cm, constitue un trajet auxiliaire pour la transmission de la voix. Le couplage acoustique entre les deux conduits est contrôlé par le voile. ( le voile est ouvert pour les sons nasalisés, fermé pour les sons non nasalisés).

12

Figure 6 :Signal glottal filtré par le conduit vocal.(T0 = 1/F0 )

La source d'excitation provient d'un mouvement d'air du a une contraction des muscles thoraciques et abdominaux. En passant dans le conduit vocal, qui possède des cavités résonnantes variables, l'air va créer des sons. Ces cavités résonantes vont amplifier le son à des fréquences appelées formants. Les deux principaux formants proviennent du Larynx et de la cavité buccale. Pour certains sons, les cordes vocales situées dans la glotte vont vibrer et créer une fréquence basse appelée fondamental ou pitch, comprise entre 80 et 500 Hz, ( à la fréquence F0.) ; ceux-ci portent le nom de sons voisées. ( cf figure 6 ).

La bande passante de la phonation est adaptée à l'audition car elle est comprise entre 80 et 15000 Hz, bandes de fréquences centrales de l'audition

C'est grâce à la phonation que l'homme a pu communiquer et élaborer des langages plus ou moins évolués. Ceux-ci sont composés de phonèmes qui regroupés forment les mots. La langue française en comprend 36.

Il existe deux grands types de phonèmes, les consonnes et les voyelles.

Contrairement aux voyelles les consonnes sont des phonèmes de transition, instables et brefs ( environ 50 ms), qui en général introduisent une voyelle.

2/ Les voyelles. [47]

a/ Description.

Les voyelles peuvent se différencier des autres phonèmes par plusieurs caractéristiques:

. Elles sont toutes voisées ; le signal acoustique résultant contient donc un fondamental à la fréquence de vibration des cordes vocales.

. Les nombre et les amplitudes des harmoniques du fondamental caractérisent le timbre de la voix.

. La durée des voyelles est variable, mais toujours supérieur à 100 ms.

. Elles sont pratiquement identifiées avec seulement la valeur des deux premiers formants. ( cf figure 8 ).

b/ Moyens d'exploration.

A

F1

F2

F 3

F2

[3000

.),
·

' I -,' g. ,-)----,

(._........f., t 7',/ È /1

..."

2000 - / ' ./.."-- I NI

f U /te -----.<

, ..--- ..-


·-,-,11....., UN ...----7,-`E ,

t

. t ',..f- ....- I ....' --.`

. i,

1000 I OU ,' ..."--`, (KN.,...-'...nrrese '/ A :

......,/ 0 ! )e....--
·
·,-/- t ,/

/ : ' ON: s''

t , t

..._,

0 F1

200 400 600 800

Longueur du pharynx

Figure 7 : Formants dans un spectre Figure 8 : F 1 et F2 des voyelles Françaises.

Les voyelles ont été les premiers phonèmes étudiés car ils sont facilement différenciables et peuvent être tenus durant une durée supérieure à la seconde.

Delattre a pu, avec un spectrographe, déterminer toutes les voyelles.(1948). Il a réussi à y extraire les deux premiers formants.

Sa méthode était assez primaire mais performante pour son époque. Maintenant que les ordinateurs ont une puissance de calcul très élevé, jusqu'à plusieurs dizaines de Gigaflop ( Milliard de calculs sur nombres à virgules flottantes par seconde.), on peut facilement utiliser des algorithmes gourmands en calculs pour la détection de formants. Les méthodes classiques sont les suivantes:

. Analyse prédictive. On prend une partie du signal échantillonné ( N échantillons.) puis on fait une transformé en Z des données. Le fondamental ainsi que les formants seront le module des couples de racines de l'équation suivante :

N

EaK.Z-K =1

K=1

. Détection par le cepstre. Le cespstre est une transformé qui à la particularité d'éliminer les harmoniques du signal. Le signal temporel acoustique devient une série de pics pour lesquels chaque sommet correspondent à la période du fondamental ou d'un formant. Il est en fait calculé par sa T.F. du Log du module de la TF. ( TF :transformée de Fourier).

C(t) = TF (Log(ITF (s(t))i))

.Détection par analyse de synthèse. C'est une méthode itérative qui permet de synthétiser un signal et de le faire rapprocher le plus possible de celui à étudier en modifiant les valeurs du fondamental, du timbre et des formants.

. Détection par passage à zéro. On fait une étude statistique des passages à 0 du signal et on en ressort FO et les formants.

. Détection par maximum du spectre. On recherche les harmoniques de FO de plus grande énergie. Ceux-ci correspondent à peu près aux formants. C'est une méthode assez rapide.

La détermination des phonèmes peut aussi se faire en découpant le spectre en plusieurs bandes. E. Leip à montrer que le nombre minimale 'de tranches de spectre' pour pouvoir discriminer les phonèmes les uns des autres était de huit. ( pour une bande de fréquence comprise entre 0 et 4 kHz. ).

cl De la synthèse vocale à l'implant cochléaire.[43]

Les premières études sur les machines parlantes remontent à la fin du XVIII ème siècle. Celles-ci étaient purement mécaniques, elles comportaient des résonateurs acoustiques dont la forme ressemblait au conduit vocal. Le fondamental était créé par une lame métallique vibrante. ( 1779 : Kratzemstein, 1791: Von Kempelen ). Le schéma qui suit est celui de la machine de Riez 1937, il est fortement inspiré des machines précédantes.

Dents Bouche

Voile Pharynx

Figure 10 :Machine parlante de Riez 1937.( Inspiré de Kratzemstein et Kempelen)

Actuellement plusieurs procédés sont utilisés pour synthétiser la parole. . Par phonèmes préenregistrés.

. Par prédiction. ( c'est le plus simple et le moins coûteux.) . Par simulation du conduit vocal.

. Par formant.

. Par canaux.

Circuit
antiformant
N.

N

--1 N 2 1--).

31

 

Source I vocale

Fi F2 F3

F41-+

Circuit de
correction

IAmPIi F

H

H. P

B1 B2 B3


·

131 --+ 132 B3

Source
de bruit

FI -- F2 F 3

Figure 11 : Vocodeur à formant

ANALYSEUR

Filtres Détecteurs Filtres passe-bande passe-bas

1-1200-3001-- G -s- 0-50 --1'

I --

SYNTHÉTISEUR

Modulateurs filtres

passe-bande

300 45012--

2900
3400

Commu-

tateur

t t

Générateur Générateur

d'impulsions de bruit

Figure 12 : Vocodeur à canaux

Les deux derniers méritent d'être plus développés car ils sont la base de se que l'on va appeler les oreilles bioniques. En effets ces deux principes vont être utilisés pour permettre à un sourd de perception de pouvoir discriminer, en théorie, tous les phonèmes, donc de pouvoir comprendre la parole.

C/ Implants cochléaires.

1/ Introduction.

L'implant cochléaire est une prothèse auditive qui va permettre de redonner une audition partielle à des patients qui ont une surdité de perception profonde ou totale.[33,34]

Son principe est basé sur un système qui va remplacer l'organe de Corti en stimulant directement le nerf auditif. ( stimulation électrique).

Ce principe aura, pour le patient, plusieurs avantages.

Tout d'abord, il ne sera plus isolé du monde extérieur puisqu'il pourra entendre des bruits tel que, la sonnerie de l'entrée, un enfant qui l'appelle, ...

De plus, il pourra, avec une rééducation orthophonique et la lecture labiale, comprendre une conversation orale.

Enfin, il pourra s'entendre, ce qui lui permettra de retrouver une voix compréhensible par les autres. La boucle audio-phonatoire sera présente.[5]

j.

Tous ces avantages lui permettront de palier leur ancien handicap. Le rôle de l'implant cochléaire ( I.C. ) est donc très important, mais sa conception est ambitieuse. Pour un peu d'histoire, il est bon de connaître quelques dates d'évolution ces machines bioniques.

. 1957 : Première étude publiée sur la stimulation électrique du nerf acoustique chez l'humain par Charles Eyries. ( France.)[14]

. 1961: Première implantation d'I.C. multiélectrode intracochléaire. ( W.F. House.) . 1973: Première implantation en France par CH. Chouard.

. 1976: Premier prototype Nucleus (WSP) par G. Clark. ( Australie )

Actuellement l'implantation cochléaire est devenue une thérapetique chère mais classique. Les qualités de ces appareils sont arrivées à un tel point de performance que pour certains patients, en plus de comprendre les dialogues sans lecture labiale, ils peuvent répondre au téléphone, écouter de la musique....

2/ Principe.

La plupart des I.C. sont basés sur le même principe ; Ils peuvent se décomposer en deux parties bien distinctes. ( cf figure 13 et 14 ).

. La partie externe.

Elle traite le signal acoustique afin d'y extraire le principal et de l'envoyer, par modulation d'amplitude, à la partie interne.

Elle est composée, d'un microphone, d'une partie analogique qui va prétaiter le signal, d'un Convertisseur Numérique Analogique, d'un processeur spécialisé pour le traitement du signal, d'un encodeur et d'un modulateur qui vont permettre d'envoyer les signaux à la partie interne.

Une antenne émettrice et une antenne réceptrice vont jouer le rôle d'interface entre les deux parties.

. La partie interne.

Elle est totalement implantée dans l'organisme du patient, ce qui permet de ne pas altérer la barrière immunitaire qu'est la peau. Elle est principalement composée d'un décodeur qui va envoyer les impulsions électriques sur les électrodes. A chaque électrode, on fait correspondre une bande de fréquence.

Figure 13 : Synoptique général d'un I.C.

Partie externe

Electrodes implantées

Cep.

Partie interne

Figure 14 : Schéma de principe d'un implant.

Il existe deux grandes stratégies de traitement de signal. [2] ( cf figure 15 ).

. Les premières consistent à calculer l'énergie qui se trouve dans la bande de fréquence que couvre chaque électrode et stimuler toutes les électrodes proportionnellement à leur énergie correspondante. Cette méthode est utilisée par la société française Digisonic pour le I.C. DX10.[1]

. L'autre méthode consiste à détecter les plus hauts pics d'énergie pour les bandes de fréquences considérées, ce qui correspond approximativement aux formants, et à stimuler seulement les électrodes correspondant aux fréquences mises en jeux. Cette méthode est utilisée par les implants de Nucleus. ( Australie ) ; elle s'appuie sur les propriétés de la voix..

mare.

6 spectral peaks

"4111111e PES

 
 
 
 
 

Power

lidilli

Spectrum lai

11111111

II

 

II

1111RM

0 as

0

-20 dB

NCL

-40 dB

5 kHz

Ail bands above NCL

u

LI

If

11

TP

tp 1.1m.

71,

2ème méthode lère méthode

Figure 15 : Stratégies de codage[12]

3/ Patients.

al Sélection.

Avant d'être implantés les patients doivent subir différents bilans. [4,10,19,22,25,29,30,35]

. Bilan Audiométriques ; On lui fait un bilan audiométrique tonale ( sons purs.) et

vocale (voix).

. Bilan Otologique ; On visualise l'état du tympan.

. PEA auditif ; Ce test permet une objectivité vis à vis du patient. ( il est surtout utilisé pour les enfants.)

Ces trois premiers tests vont permettre de déterminer le type de surdité. S'il s'agit bien d'une surdité de perception profonde ou totale, nous effectuons les tests suivants.

. Bilan radiologique ; On réalise un scanner ou une IRM de l'oreille pour visualiser l'état morphologique de la cochlée.

. Bilan électrique ; Ce test consiste à stimuler électriquement la fenêtre ronde afin d'aprécier les restes neurologiques du nerf auditif. Pour se faire, on introduit une électrode jusqu'à la fenêtre ronde, puis on envoie une stimulation électrique qui va provoquer des potentiels d'actions plus ou moins forts.

Tous ces tests vont permettre de voir si le sujet est physiologiquement apte à recevoir l'I.C. De ce premier stade, va suivre une série de tests psychologiques et sociologiques du patient.

. Bilan psychologique ; Le psychologue va étudier le patient et en fonction de sa motivation, de son Q.I., de son milieu de vie, ..., et il va émettre un avis plus ou moins favorable pour la pose de l'I.C.

. Bilan orthophonique. L'orthophoniste va étudier la lecture labiale, son langage, son niveau de communication, ..., et va émettre un avis plus ou moins favorable pour la pose de l'I.0

Si tous les tests se sont montrés concluants et que les crédits pour l'achat de l'I.C. sont débloqués ( environ 150,000 Fs H.T.), nous pouvons alors implanter le patient.

b/ Suivi.

Trois ou quatre semaines après son opération, le patient va commencer un travail de longue haleine qui demande beaucoup de temps et de concentration. Il devra intégrer cérébralement un nouveau mode de transcriptage acoustique.

Pour se faire, il devra travailler avec un orthophoniste au cours de séances de rééducation phonétique. Il devra aussi aller régulièrement faire vérifier son I.C., en réglant tout une série de paramètres, car ses restes neuroniques auditifs évolus dans le temps.

4/ L'implant Nucleus.

a/ Stratégies de codages.

L'I.C. Nucleus est né en 1976. Il est le premier à avoir été créé en collaboration avec une étude sur la voix.[7,8] Son traitement de signal est basé sur l'extraction de formant cadencé à la fréquence du fondamental. ( PES : Pitch Extracted Sampler). [6]

L'implant cochléaire va traiter le signal vocal et va en ressortir le fondamental et les formants (1 à 6) par la méthode d'extraction de pics sur le spectre. ( cf figure 16 ).

Amplitude

FO
( Cadenceur )

FI

IF2

22 21 20 11.11 19 II.- MI 3 MI 2 1

Fréquence

électrodes

Figure 16 : Méthode d'extraction de formants et du fondamental.

Une fois que l'implant aura détecté le fondamental ( FO ) ainsi que les formants du signal acoustique, il va envoyer à la partie interne sous forme codé, à la cadence du fondamental, les numéros d'électrodes qui correspondent ainsi que son amplitude et sa durée.

Remarque: Pour les sons non voisés, ce qui correspond à une absence de F0, l'implant va choisir arbitrairement un F0.

Impulsion codant F1

A

électrode
n° F 1

-A

Période du fondamental

Figure 17 : impulsions électriques envoyées le long de la cochlée.

La partie interne de l'implant va alors décoder le signal et envoyer sur l'électrode, correspondant à la bande de fréquence qui caractérise le formant, un signal électrique biphasique du type ci-dessous. ( cf figure 17 ).

b/ Réglages.

Cet implant cochléaire comporte 22 électrodes toutes multiparamètrables.

. On peut ainsi faire varier les niveaux de stimulation électrique afin de s'adapter au patient. ( seuil de détection et seuil maximum des niveaux de courant pour chaque électrode. Activation ou désactivation des électrodes. ).

. On peut faire varier les bandes de fréquences propres à chaque électrode.

Electrode

Fmin

Fmax

Amin

Amax

Active

20

280

400

90

115

oui

19

400

500

90

135

oui

18

500

600

80

150

oui

17

600

700

65

155

oui

16

700

800

60

160

oui

15

800

900

70

155

oui

14

900

1000

65

155

oui

13

1000

1122

105

160

oui

12

1122

1259

105

155

oui

11

1259

1414

90

165

oui

10

1414

1587

100

175

oui

9

1587

1781

95

185

oui

8

1781

2000

95

175

oui

7

 
 
 
 
 

6

2000

2244

80

180

oui

5

2244

2519

75

159

oui

4

2519

2828

75

195

oui

3

2828

3174

50

170

oui

2

3174

3563

70

165

oui

1

3563

4000

50

170

oui

Figure 18 : exemple de tableau de réglages de seuils, fréquences et électrodes actives. La stimulation électrique peut aussi se faire de différentes méthodes: ( figure 19 ).

3

2 MI

2

3

Bipolaire
(3P)

Bipolaire+1
(BP+1)

Bipolaire+2
(BP+2)

3 IIIIII271 1

Figure 19 : Les différents types des stimulations ( exemple : stimulation de l'électrode n° 19.)

D/ Etudes.

Plusieurs études ont été faites sur les différentes méthodes de traitement de signal, ce qui a permis de faire progresser les I.C..

1/ Evolution du Nucleus.

Les premiers Nucleus ont été implantés dans le monde au début des années 80. Le WSP ( 1978) [18] et WSP II ( 1983 ), premiers de leur génération ne pouvaient qu'envoyer le deuxième formant à la fréquence du fondamental. ( stratégie FOF2. ). Alors que le WSP III ( 1985 ), pouvait comme ces prédécesseurs utiliser la stratégie FOF2 mais aussi la FOF1F2. Ces implants faisaient du traitement de signal dans une bande de fréquence de [0,4000] Hz.

En 1989 Nucleus innove et crée le MSP [31], celui-ci est parfaitement compatible avec le WSP; il envoie en plus de F1 et de F2 des informations dans les 'hautes fréquences' et sa bande passante va de 0 à 6 kHz.

Actuellement le SPEAK (1992) ou spectra22 (1994) traite jusqu'à 6 formants dans une gamme 0-10kHz..

Toutes ces innovations sont étudiées dans le laboratoire du Pr. Clark à Melbourne.

2/ Sur traitement du signal hors laboratoire.

En plus, des constructeurs d'implants, plusieurs laboratoires travaillent sur les stratégies de codage de l'I.C..

. W.H. Doering : Il a étudié le traitement de signal du WSP III et il a montré qu'il y avait une différence entre les formants acoustiques et ceux calculés par le Nucleus. ( Fl est surestimé, F2 est sous-estimé.). Les distances formantiques sont néanmoins maintenues, cela permet donc une discrimination théorique des phonèmes. ( Son étude était basée sur des voyelles allemandes ).[16]

. N. Dillier : Son équipe a fait plusieurs études sur les comparaisons de stratégies de codages et de traitement de signal de différents I.C..[11,13,15]

Il a notamment fait des comparaisons de performances entre les différentes stratégies de TDS avec différents processeurs ( DSP ).

Il a aussi fait une comparaison avec des stratégies qui diffèrent sur leur bande passante, 0-4kHz, 0-8kHz. Il en ressort que les stratégies qui utilisent des larges bandes passantes, 0-8kHZ, conduisent à de meilleurs résultats.

. C. Boex : Elle a fait des comparaisons entre deux stratégies de codage ( C.A. et C.I. S. ). Elle a montré que la nouvelle stratégie CIS qui était réalisée par un nouveau processeur Motorola était beaucoup plus performant.[37]

3/ Travaux du Laboratoire.

Le traitement de signal qu'utilise les I.C. a souvent été abordé dans notre laboratoire et tout particulièrement par trois chercheurs.

. B. Djedou : Il a consacré une thèse sur l'étude de l'implant Chorimac. Il a montré qu'augmenter le nombre d'électrodes n'était pas la solution pour améliorer les performances de l'I.C. mais que l'extraction des paramètres les plus significatifs de la parole semblait être plus bénéfique.[2,3]

. G. Collet : Lors de son stage de DEA (1991-1992), elle a évalué le codage des voyelles par l'I.C. Nucleus. Elle a montré pour une patiente, que la discrimination des voyelles n'était pas totalement expliquée par les formants.[39]

. M. Maillot : Lors de son stage de DEA (1992-1993), a constaté, comme W.H. Doering, qu'il y avait une différence entre les formants acoustiques et ceux transcrits par l'I.C. Nucleus. De plus il a étudié les modes BP, BP+1, BP+2, BP+3 et a montré que le mode BP+1 était le plus performant. Il a aussi fait, en collaboration avec S. Garnier et S. Gallégo une comparaison élémentaire entre la reconnaissance de voyelles par le signal acoustique et le patient. [24,42,46]

E/ Méthodes mathématiques.

1/ Principe de reconnaissance automatique de voyelles.[48]

Pour réaliser une reconnaissance de voyelles, il existe un grand nombre de méthodes, mais toutes sont basées sur le même principe.

La voyelle est définie par un nombre N de variables.

On possède deux types de groupes de voyelles.

. Un groupe pour lequel on a la connaissance des voyelles et de ces paramètres. Celui-ci va nous permettre d'établir les références.

. Un autre groupe, à reconnaître, pour lequel on ne connait pas les voyelles mais on a ses paramètres.

Le premier groupe va nous permettre d'établir, dans un espace particulier, les sous- ensembles spécifiques à chaque type de voyelle. La reconnaissance s'opèrera en comparant la voyelle inconnue avec les différents sous-ensembles. Le sous-ensemble qui sera le plus proche sera donc celui de la voyelle reconnue.

2/ La métriques euclidienne.[41,48]

Cette méthode consiste considère les N paramètres, qui définissent un objet, dans un espace vectoriel à N dimensions.

Pour avoir une notion de ressemblance entre deux objets A et B, on utilise la distance euclidienne.

Si A a pour coordonnées (ai , a2 ,
·
·
· ,aN) et B (bi,b2 ,
·
·
· , bN), la distance euclidienne entre A et B est:

dAB =

i=1

Plus la distance est petite, plus A est ressemblant de B et inversement.

Souvent, avant de raisonner dans l'espace euclidien, on centre et norme les données. Cela permet de donner le même poids à chaque dimension, quelle que soit son unité.

On fait donc un changement de variable tel que:

(ai --ai)

Ai=

Ecart_typei

(bi -bi)

e=

Ecart_Cpei

3/ Logiques floues.[41,43,44,45]

La théorie des sous-ensembles flous permet de considérer une apartenance à un ensemble d'une autre façon que binaire. Elle postule, par similitude avec le raisonnement humain, qu'une décision est prise qu'après avoir considéré un ensemble d'éléments. Chaque argument apporte sa pierre au raisonnement, avec un poids plus ou moins important, et la décision finale tient compte de tous les éléments. En effet, avec cette logique, on peut avoir un élément qui appartient à un ensemble à 80 %.

Il faut pour cela, définir des règles d'appartenace.

Par exemple considérons trois sous ensembles A, B, C.définis par une variable et établissons la règle suivante figure 20.

Figure 20 : règle d'apartenance à un ensemble.

On peut dire C(x)=(0.6,0.4,0). ( pourcentage d'apartenance à respectivement A, B, C pour la valeur x; Car A(x)=0.6, Car B(x)=0.4, Car C(x)=0.).

4/ Distance de Hamming

La distance de hamming est souvent utilisée pour comparer deux matrices. Soit A, et B deux matrices de dimension n x m.

all

a12

...

aln

a21

a22

...

a2n

...

 

...

 

ami

am2

...

amn

bll

b12

....

bin

b21

b22

....

b2n

 
 
 

...

bm 1

bm2

....

bmn

n m

pE E , i; - 1=11=1 dH= n m
E E 4;1 + Ibul)

Cette distance est comprise entre [0,1] ; plus elle se raproche de 0 plus le deux matrices se ressemblent et reciproquement..

1

REFERENCE S

BIBLIOGRAPHIQUES

PUBLICATION.

[1] M. Beliaeff P. Dubus J.M. Leveau J.C. Repetto P. Vincent.
Sound signal processing and stimulation of the digisonic DX10 15-channel cochlear implant. Advances in cochlear implants Ed. Hochmair-Desoyer E.S. Hochmair.

Proceding of the 3rd International Cochlear Implant Conference Innsbruck 1993 198-203.

[2] C. Berger Vachon J. Caelen B. Djedou.

Traitement du signal de parole, évaluation d'une prothèse cochléaire. ITBM 1990 vol n°11 2, 140-153.

[3] C. Berger Vachon L. Collet B. Djedou A. Morgon.
Model for understanding the influence of some parameters in cochlear implantation. Oto. Rhinol. & Laryng. 1992 vol. no 101 1, 42-45.

[4] C. Berger Vachon L. Collet A. Morgon.

Détermination d'un modèle optimisé d'audiogramme en relation avec des propriétés physiologiques de l'audition. Annales des Télécommunication à paraître.

[5] C. Berger Vachon F. Plante I. Kauffman L. Collet.
Anomalies de la phonation des voyelles en contexe chez l'enfant sourd francais. ITMB. 1992 Vol. 13 n°2 168-182.

[6] P.J. Blamey R.C. Dowell A.M. Brown G.M. Clark.

Vowel and consonant recognition of cochlear implant patients using formant-estimating speech processors. J. Acoust. 1987 82, 48-57.

[7] P.J. Blamey R.C. Dowell Y.C. Tong A.M. Browm S.M. Luscombe G.M. Clark.
Speech processing studies using an acoustic model of multiple-channel cochlear implant. J. Acoust. Soc. Mn. 1984 76, 104-110.

[8] P.J. Blamey L.F.A. Martin G.M. Clark.

A comparison of three speech coding strategies using an acoustic model of a cochlear implant. J. Acoust. Soc. Mn. 1985 77, 209-217.

[9] M.C. Botte S. McAdams.

Organisation perceptive dans l'audition.

Les cahiers de l'audition. 1992 Vol 5 n°97 22-26.

[10] C.H. Chouard C. Fugain B. Meyer F. Chabolle.
Etude des variations du son fondamental laryngé après implantation cochléaire. Oto-Laryng. 1988 105, 249-252.

[11] N. Dillier.

Speech processing for cochlear implants: future analog and digital techniques. Cochlear implant Acquisition and contreversies. Ed. Bernard Fraysse. 1989. 33-42.

[12] N. Dillier H. Beigli T. Spillmann
Digital speech processing for cochlear implants. ORL. 1992 54, 299-307.

[13] N. Dillier W. Lai H. Begli.

A high spectral transmission coding strtegy for a multi-electrode cochlear implant. Advances in cochlear implants Ed. Hochmair-Desoyer E.S. Hochmair

Proceding of the 3rd International Cochlear Implant Conference Innsbruck 1993 152-157..

[14] A. Djourno Ch. Eyriès B. Vallencien.

De l'excitation électrique du nerf cochléaire chez l'homme, par induction à distance, à l'aide d'un micro-bobinage inclus à demeure.

C.R. Soc. Biol. 1957 Vol n°151 423-425.

[15] R.A. Dobie N. Dillier.

Some aspects of temporal coding for single-channel electrical stimulation of the cochlea. Hearing Research 1985 18, 41-45.

[16] W.H. Doering L. Schneider.

Electrical vs. acoustical speech patterns of germait phonemes using the nucleus CI-system. Cochlear implant Acquisition and contreversies. Ed. Bernard Fraysse. 1989. 243-253.

[17] M.F. Dorman L. Smith M. Smith J. Parkin.
The coding of vowel identity by patients who use the ineraid cochlear implant. J. Acoust. Soc. Am. 1992 Vol. n° 92 6, 3428-3431.

[18] R.0 Dowell L.F.A. Martin Y.C. Tong G.M. Clark P.M. Seligman J.F Patrick.
A 12-consonant confusion study on a multiple-channel cochlear implantpatient.

J. Speech & Hearing Research. 1982 Vol. n° 15 509-516.

[19] B. Frachet T. Van Den Abeele.

A propos des explorations fonctionnelles chez les sujets implantés. Revue de laryngologie. 1991 Vol. 112 463-466.

[20] M. Gersdorff L. Derue R. Sneppe D. Dutilleux
Reflexions concernant l'implant cochléaire chez l'enfant.

Bull. Audiophonol Univ. Franche Comté 1987 Vol 3 n° 5 503-522.

C. Authom F. Detollenaere.

 

[21] H. Hosoi S. Imaizumi K. Murata F. Ohta.

Hearing aid evaluation using psychoacoustical proximity between japanese monosyllables. Audiology. 1989 28, 171-178.

[22] S. Leder J.B. Spitzer C. Flevaris-Phillips F. Richardson P. Milner J. C.
Kirchner.

Innovative Approches to selection of adult cochlear implant candidates.

J. of Reabilitation of the deaf. 1987 Vol. n° 21 2, 27-33.

[23] E. Loeb W. White M. Merzenich.
Spatial Cross-Correlation.

A proposed mechanism for acoustic pitch perception. Biol. Cybern. 1983 47, 149-163.

[24] M. Maillot C. Berger-Vachon

E. Truy A. Morgon

 

Overlap of vowel clusters trough a nucleus cochlear implant.

Advances in cochlear implants Ed. Hochmair-Desoyer E.S. Hochmair.

Proceding of the 3rd International Cochlear Implant Conference Innsbruck 1993 260-265.

[25] L. Mens J. Brokx.

Audiometrical Thresholds and electrical stimulation of cochlear implant candidates; some futher results. Cochlear implant Acquisition and contreversies. Ed. Bernard Fraysse. 1989. 147-151.

[26] H.E. MidderA.F. van Olphen A. Bosman G.F. Smoorenburg.

Phoneme recognition by deaf individuals using the multichannel nucleus cochlear implant. Acta Otolaryngol. 1992 112, 946-955.

[27] Y. Ormezzano C. Deleurme E. Vormes B. Frachet.
Le traitement du signal dans l'implant contour.

Oto-Laryng. 1990 107, 457-461.

[28] P. Pialoux C.H. Chouard P. Mac Leod.

Premier cours international sur l'implant à multi-électrodes.

Cahier de l'ORL,de C.C.F. & d'audiophon. 1979 tome 14 n° 5, 6, 7.

[29] G. Rance F.W. Rickards R.C. Dowell L.T. Cohen G.M. Clark.

Steady-state evoked potentials (SSEPs); an objective measure of residual hearing in young cochlear implant candidates.

Advances in cochlear implants Ed. Hochmair-Desoyer E.S. Hochmair.

Proceding of the 3rd International Cochlear Implant Conference Innsbruck 1993 71-74.

[30] R.M. Ryan.

Acute round window stimulation for cochlear implant assessment.

Cochlear implant Acquisition and contreversies. Ed. Bernard Fraysse. 1989. 161-172.

[31] M.W. Skinner L.K. Holden T.A. Holden R.C. Dowell P.M. Seligman J.A. Brimacombe
A.L. Beiter.

Performance of postlinguistically deaf adults with the wearable speech processor (WSPIII) and mini speech processor (MSP) of nucleus multi-electrode cochlea r implant.

Ear and Hearing 1991 Vol n° 12 1, 3-23.

[32] I. Terr A. Sfogliano L. Rilley.

Effects of stimulation by cochlear implant on the cochlear nerve. Laryngoscope 99. 1989 1171-1174.

[33] R.S. Tyler.

Cochlear implants and the deaf culture. Am. J. Audiol. 1993 2(1), 26-32.

[34] R.S. Tyler.

Future directions for cochlear implants. JSLPA. 1992 Vol. n° 16 2, 151-164.

[35] M. Valvoda J. Betka J. Skrivan J. Hruby J. Picka T. Tichy
Preoperative assessment of cochlear implant candidates.

Cochlear implant Acquisition and contreversies. Ed. Bernard Fraysse. 1989. 153-159.

[36] B. Virole B. Azema C. Deleurme.

Données cliniques pour un modèle de la perception phonétique au travers des implants cochléaires. Cahiers de l'audition 1991 Vol. n° 5 3, 12-19.

LIVRES ET RAPPORTS.

[37] C. Boëx.

Stratégies de codage des sons pour implants cochléaires. Rapport de DEA GBM . Lyon 1992.

[38] C. Cabrol. W. Kahle H. Leonhardt W. Platzer.
Organes de l'audition et l'équilibre.

Anatomie Ed. Flamarion-medecine-sciences.

[39] G. Collet.

Evaluation du codage des voyelles par un implant cochléaire le Nucleus. Rapport de DEA GBM . Lyon 1992.

[40] G. Cornut.

La voix.

Ed.Que sais-je? 1983.

[41] E. Diday J. Lemaire
éléments d'analyse de données. Ed. Dunod 1982.

J. Pouget F. Testu.

 

[42] S. Gallego S. Garnier.

Etude de stratégies de reconnaissance de voyelles en utilisant l'implant cochléaire Nucléus. MST GBM 2ème année Lyon 1993.

[43] J. Guibert.

La parole compréhension et synthèse par ordinateurs. Ed. Puf 1979.

[44] A. Kaufmann.

Introduction à la théorie des sous-ensembles flous à l'usage des ingénieurs. Ed. Masson Tome I et III 1975.

[45] A. Kaufmann Les logiques humaines et artificielles.

Ed Hermes 1988.

[46] M. Maillot.

Etude du mode de stimulation de l'implant cochléaire Nucléus. Rapport de DEA d'Acoustique. Lyon 1993.

[47] B. Malmberg. La phonétique.

Ed.Que sais-je? 1993.

[48] G. Sebestyen.

Decision-making processes in patern recognition. Ed. Mc Millan 1962.

[49] S.S. Stevens F. Warshofsky. Le son et l'audition.

Collection lit 1965.

TRAVAIL

EXPERIMENTAL

Résumé.

Dans ce travail on compare la reconnaissance acoustique de sujets porteurs d'implant cochléaire avec des modèles construits sur les caractères électriques de l'excitation. Il s'agit de repérer les éléments qui peuvent expliquer les performances des patients à l'étage acoustique. Au total, 255 modèles ont été construits, modèles qui sont basés sur une métrique euclidienne et sur une logique floue. Les meilleurs résultats ont été obtenus avec la logique floue.

Quatre patients et dix locuteurs ont participé à cette étude; ils ont prononcé des listes de 48 items basés sur les voyelles /i/, /u/, /a/ et /e/, prises en ordre aléatoire.

Les résultats montrent que l'importance du premier formant ( amplitude et position ), est habituellement sous-estimée et que les logiques de reconnaissance varient avec le patient. Ces résultats sont importants pour orienter le réglage des machines.

Abstract.

In this study a comparison betwen the acoustic recognition made par subjects fitted with a cochlear implant and the performances of models constructed on the electrical features of the excitating pulses is performed. The aim is the determination of elements able to provide an explanation on how the recognition is made by patients at the acoustical stage. Altogether, 255 models where constructed; they were base upon an euclidian metric or a fuzzy logic.

Four patients and 10 speakers collaborated to this experiment. Best resuits were obtained with the fuzzy logic; 48-item lists were spoken, based on vowels /i/, /u/, /a/ and /da/ arranged in a random order.

Results show that the importance of the first formant ( amplitude and electrode number ) is usually under estimated, and that recognition strategies depend on the patient. This point is important for the setting of the speech processor.

A/ Introduction.

La question sur le choix de la stratégie de codage des Implants Cochléaires (I.C.), reste une question ouverte. Les constructeurs développent de plus en plus des émetteurs qui réalisent un traitement du signal ouvert permettant aux équipes de tester les stratégies qui leur paraissent les meilleures.

Plusieurs types de traitements de signal existent, mais aucun n'est parfaitement efficace. Cela pousserait à dire que PI. C. peut être encore plus performant.

De plus, les réglages de l'I.C. ne sont pas optimisés, car ils se font de manière subjective, avec l'expérience du praticien et du technicien.

De ces deux problèmes plusieurs questions se posent.

- Est-ce que les informations transmises au patient par l'I.C. sont bien toutes décryptées?.

- Est-ce qu'au moins les informations, que l'on croit principales sont utilisées par le

patient?

- Est-ce que la stratégie est bien adaptée au patient?

Très peu d'études se sont penchées sur se problème qui nous parait pourtant primordial.

Pour arriver à répondre à ces questions, il faudrait pouvoir modéliser l'écoute du patient en fonction des données que lui envoi C'est ce que nous avons essayé de faire en testant des modèles d'audition du patient.

L'idée a été de comparer la reconnaissance du patient avec celle d'un ordinateur qui va prendre plus ou moins de paramètres. Le modèle qui approchera le mieux à l'écoute du patient sera le modèle ou l'erreur est minimale. Il sera appelé le 'modèle semblable'. ( cf figure 1 ).

Patient

Comparaison

Erreur

Signal
Acoustique

Reco. par Ordinateur

C.I

C.I

Acquisition

Figure 1 : Principe de l'étude.

Les paramètres que l'on va prendre pour la modélisation vont être ceux contenus dans l'impulsion électrique envoyée sur l'électrode. ( cf figure 2 ).

. Le numéro d'électrode. ( F ).

. L'amplitude de l'impulsion. ( A ).

. La durée de l'impulsion. ( T ).

. L'énergie de l'impulsion. (E = A x T ).

Durée (T)

N° de l'électrode

Amplitude

(A)


·./

Energie (E=AxT)

Figure 2 : Les 4 paramètres d'une impulsion électrique.

Pour limiter le nombre de modèles, on va utiliser la stratégie FOF1F2. On aura donc deux impulsions par période du fondamental, une pour le premier formant, une autre pour le deuxième formant. On aura donc 8 paramètres à étudier, F1 Al Tl El F2 A2 T2 E2, ce qui nous fait 28 possibilités. Comme la possibilité 0 ne nous intéresse pas, nous allons avoir 255 modèles de reconnaissance à comparer avec la compréhension du patient.

B/ Matériel et méthodes.

1/ Station de travail.

a/ Station d'enregistrement.

Pour les enregistrements, nous disposons d'un magnétophone Revox à bande ainsi qu'un microphone haute fidélité.

Tous les enregistrements se font en chambre sourde pour réduire au maximum le bruit de

fond.

Toutes les personnes qui vont être enregistrées n'ont pas de problèmes de phonation.

Tous les enregistrements se feront à 30 cm du microphone avec environ la même intensité de voix. Cela est nécessaire pour notre étude car il faut une dynamique du signal à peu près constante. ( cf figure 3 ).

Figure 3 : Protocole d'enregistrement.

11

b/ Station de réglage de l'implant cochléaire.

Pour notre étude, nous allons utiliser un implant cochléaire MPEAK de Nucleus. Celui-ci sera programmé en mode BP+1 et stratégie FOF1F2.

Pour pouvoir régler les dynamiques de l'implant en fonction des restes neuroniques auditifs des patients, nous disposons d'une station informatisée. ( cf figure 4 ).

Figure 4 : Synoptique du réglage de l'implant.

Le praticien va régler électrode par électrode les seuils de confort ( min, max.) afin d'optimiser la dynamique des impulsions électriques. Il va aussi régler les bandes de fréquences propres à chaque électrode, ceci afin d'obtenir une compréhension maximale. Ce type de réglage est très subjectif car il fait intervenir le patient et le praticien.

cl Station d'acquisition des paramètres de l'implant.

Pour pouvoir acquérir les paramètres de l'implant, nous disposons d'une interface développée par J. Genin. Celle-ci est pilotée par un processeur TMS25 de Texas Instrument. Pour pouvoir gérer cette carte nous disposons de plusieurs couches de programmes. ( cf figure 5 ).

..

f \

,,..,....... --___


·

...

....------

Ili

_

. .

..

..

. . .

 
 
 

. . . . . . . .

 

.

1S 36

 
 

' lit_

TO

1

2

3

4

5

6

7

8

9

10

11

12

13

14

iS

16

18
20

HUMER° D

ELECTRODE

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

..

 
 
 
 
 
 
 
 
 

wer_re

 
 
 
 
 

=.*

 
 
 
 

17

 
 
 
 
 
 

kk`

om

 
 

eee eem e-rd

 
 

eeteeeekiMeee»M»eMee,Meee

 
 

C'est /i/ X ça

Figure 5 : Synoptique de la station d'acquisition de l'implant cochléaire.

lekEE

efflffl

. Un programme en assembleur Texas Instrument qui va permettre la gestion interne de la carte et de la connexion sur câble parallèle.

. Un programme en assembleur x86 chargé de s'occuper du port parallèle sur lequel est branchée la carte.

. Un programme en Turbo Pascal qui va analyser les données et faire une interface graphique pour permettre de segmenter les impulsions. ( cf annexe p 65-68 ).

Pour l'acquisition du signal, on envoit une stimulation acoustique, à l'aide d'un haut parleur, sur l'I.C. La carte Genin va capter les impulsions transmises par l'implant puis les envoyer sur le port parallèle. Le programme final en Turbo pascal va permettre de visualiser les électrodes activées en fonction de leur énergie ( rectangle plus ou moins grand.) ainsi que l'énergie totale. Ces données peuvent ensuite être segmentées.

d/ Station voix ILS.

Cette station voix nous a permis de segmenter toutes les voyelles afin de voir si d'un point de vue acoustique elles étaient différenciables.

Cette station se compose principalement d'un Revox, d'un filtre anti-repliement (FAR) 4kHz , d'une carte d'acquisition 12 bits à 10 kHz et d'un ordinateur comportant le logiciel ILS (interactive laboratory system.). Le logiciel permet d'extraire les formants ainsi que leur bande passante et amplitude. ( cf figure 6 ).

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

é
· ea (e))

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Figure 6 : Synoptique de la station ILS.

2/ Matériel phonétique.

On va utiliser pour notre étude les voyelles caractéristiques du triangle vocalique. On va prendre les trois extrémités, /a/, /i/, /u/ et une voyelle neutre, le /W. ( cf figure 7 ).

Ces voyelles devront être prononcées douze fois par liste par souci de significativité, ce qui conduit à 48 voyelles par liste. Toutes celles-ci devront être lues dans un ordre aléatoire. ( cf annexe p 62-63 ).

Le protocole va comporter deux listes par locuteur, une liste d'apprentissage et une de reconnaissance et comporter 10 locuteurs ( 5 femmes, 5 hommes ).

Cela nous donne un enregistrement de 12*4*2* 10 = 960 voyelles. On a donc 960 voyelles a segmenter par patient et avec ILS.

2ème Formant

2500 2000 1500 1000 500

/i/ /u/

/a/

100 200 300 400 500 600

700
800

1 er Formant

Figure 7 : Triangle vocalique. ( Delattre 1948 ).

3/ Patients.

Notre étude va comporter quatre patients. Il compose un groupe assez hétérogène du point de vue performance. ( CO, AM, BA, LA )

Tableau récapitulatif des patients.

Patient

sexe

Age

sourd profond
depuis

étiologie de la surdité

Nb d'heures de port
par jour

CO

M

46 ans

5 ans

neurologique

16 h

AM

F

12 ans

3 ans

évolutive

16 h

BA

F

40 ans

38 ans

médicamenteuse

15 h

LA

F

32 ans

4 ans

inconnue

16 h

Les tableaux qui vont suivre correspondent aux réglages des patients. Nous pouvons y voir un nombre d'électrodes actives varier entre 5 et 22 et des dynamiques ( seuil max- seuil min ) très fluctuantes.

Ces réglages sont assez importants car ils sont à la base de la discussion de notre étude.

Réglages des patients.

Bandes de fréquences du patient AM en fonction
du numéro d'électrode:

Electrode

Fmin

Fmax

Amin

Amax

Active

20

280

400

90

115

oui

19

400

500

90

135

oui

18

500

600

80

150

oui

17

600

700

65

155

oui

16

700

800

60

160

oui

15

800

900

70

155

oui

14

900

1000

65

155

oui

13

1000

1122

105

160

oui

12

1122

1259

105

155

oui

11

1259

1414

90

165

oui

10

1414

1587

100

175

oui

9

1587

1781

95

185

oui

8

1781

2000

95

175

oui

7

 
 
 
 
 

6

2000

2244

80

180

oui

5

2244

2519

75

159

oui

4

2519

2828

75

195

oui

3

2828

3174

50

170

oui

2

3174

3563

70

165

oui

1

3563

4000

50

170

oui

Bandes de fréquences du patient BA en fonction
du numero d'électrode:

Electrode

Fmin

Fmax

Amin

Amax

Active

20

280

300

109

152

oui

19

300

416

96

145

oui

18

416

532

76

138

oui

17

532

648

77

146

oui

16

648

764

72

154

oui

15

764

880

86

163

oui

14

880

996

98

175

oui

13

996

1112

103

195

oui

12

1112

1232

134

209

oui

11

1232

1366

142

222

oui

10

1366

1515

146

220

oui

9

1515

1680

154

225

oui

8

1680

1862

146

206

oui

7

1862

2065

127

187

oui

6

2065

2290

124

184

oui

5

2290

2538

128

188

oui

4

2538

2815

127

183

oui

3

2815

3001

132

189

oui

2

3001

3200

132

199

oui

1

3200

4000

124

190

oui

Bandes de fréquences du patient CO en fonction
du numero d'électrode:

Electrode

Fmin

Fmax

Amin

Amax

Active

20

280

400

27

92

oui

19

400

500

88

168

oui

18

500

600

76

167

oui

17

600

700

78

155

oui

16

700

800

58

155

oui

15

800

900

62

155

oui

14

900

1000

62

161

oui

13

1000

1112

70

176

oui

12

1112

1237

70

180

oui

11

1237

1377

70

180

oui

10

1377

1531

59

170

oui

9

1531

1704

50

166

oui

8

1704

1896

56

156

oui

7

1896

2109

46

156

oui

6

2109

2346

64

146

oui

5

2346

2611

56

150

oui

4

2611

2904

52

154

oui

3

2904

3231

60

162

oui

2

3231

3595

46

160

oui

1

3595

4000

68

150

oui

Bandes de fréquences du patient LA en fonction
du numero d'électrode:

Electrode

Fmin

Fmax

Amin

Amax

Active

20

280

400

131

168

oui

19

400

1000

138

205

oui

18

 

---

---

---

non

17

1000

1587

176

232

oui

16

1587

2519

134

162

oui

15

2519

4000

111

140

oui

14

---

---

---

---

non

13

---

---

---

---

non

12

---

---

---

---

non

11

---

---

---

---

non

10

---

---

---

---

non

9

---

---

---

---

non

8

 

---

---

---

non

7

---

---

---

---

non

6

---

---

---

---

non

5

---

---

---

---

non

4

---

---

---

---

non

3

---

---

---

---

non

2

 

---

---

---

non

1

---

---

---

---

non

PATIENT

Figure 8 : Protocole de reconnaissance des patients.

Une fois que les réglages de l'implant sont effectués, on demande au patient d'écouter les bandes avec le protocole suivant. ( cf figure 8 ).

On leur propose d'abord d'écouter la liste d'apprentissage tout en montrant de quelle voyelle il s'agit. Puis on leur fait écouter la liste de reconnaissance en leur demandant de cocher les voyelles qu'ils ont cru reconnaître. ( pour chaque locuteur )

On obtient alors des matrices de reconnaissance par locuteur et par patient. ( cf Annexe p 64 et exemple ci-dessous.).

Exemple: patient CO, locuteur Gar.

PAT

A

I

U

 

A

5

0

4

3

I

0

10

1

1

U

0

0

12

0

E

1

0

1

10

4/ Stratégies de reconnaissance.

Les deux premières méthodes vont permettre de faire la reconnaissance de voyelles automatique pour les 255 modèles pour chaque locuteur (10) et chaque patient (4). Ces reconnaissances vont être sous forme de matrices similaires à celles des patients.

Exemple: Mode F2F1, patient CO, locuteur Gar par méthode euclidienne.

CALC

A

I

U

E

A

6

0

0

6

I

0

12

0

0

U

0

0

11

1

E

0

0

0

12

La troisième méthode va permettre de comparer les matrices de reconnaissances par patient et par ordinateur.

al Méthode euclidienne.

Avant de calculer des distances euclidiennes on va faire une normalisation des données. Nous allons pour cela procéder de la manière suivante.

Méthode de normalisation.

On veut faire une étude avec plusieurs grandeurs Fl, F2, Al, A2, Ti, T2, El, E2.

Comme ces données n'ont pas toutes les mêmes dimensions il faudra trouver un moyen pour pouvoir les comparer.

La méthode classique qui consiste à centrer réduire ne peut pas être envisageable car plusieurs de ces paramètres sont de même nature mais n'ont pas le même effet sur le patient.

(ex: Un signal émis sur le même numéro d'électrode ayant la même amplitude n'aurait pas la même importance si il est émis en tant que 1 er formant qu'en tant que deuxième formant alors que le patient aurait la même sensation.De même qu'une variation du premier formant entre l'électrode 17 à 21 aurait le même poids qu'une oscillation du 2ème formant entre l'électrode 4 à 17 alors que le patient utilise le même moyen de discrimination de l'électrode.)

Il faudrait donc trouver un moyen qui va nous permettre de regrouper les données de même nature.

La méthode que nous avons envisagée est de prendre les domaines de variation,de l'amplitude,de l'électrode,..,et de tout ramener à la même échelle.(0 à 1)

Cela nous permet donc de pouvoir faire une étude avec tous ces paramètres en tenant compte de ce que ressent le patient, ce qui est fondamental pour notre étude.

Distance euclidienne.

La méthode consiste a prendre les barycentres des sous-ensembles de voyelles dans la liste d'apprentissage et de calculer les quatre distances euclidiennes pour chaque voyelle contenue dans la liste de reconnaissance. Les voyelles seront attribuées à la classe la plus proche.

Ces calculs seront effectués pour les 255 modèles construits par locuteur et par patient. Nous ne pouvons pas regrouper les données des locuteurs car cela doit correspondre au protocole du patient. ( apprentissage de la voix du locuteur puis reconnaissance ).

La formule pour le calcul de distance euclidienne de la voyelle x par rapport au barycentre du sous-ensemble v est.

N

D(x,v)=17 1.1E(X; -V1)2

1=1

b/ Logique floue.

Apprentissage.

On se sert des listes d'apprentissage comme base de données pour créer notre règle.

Pour les 48 voyelles de chaque liste d'apprentissage on a les valeurs des 8 paramètres associés.(F1 Al Ti El F2 A2 T2 E2).

On sépare ses données en 4 grandes familles la/, /u/, /9/ :

Pour chaque niveau de chaque paramètre on calcule le score de chaque voyelle.(exemple : pour F1=20 on a 2 /V, 3 /9/, 4 /ai, 5 /u/). ( cf figure 9 ).

a(F1I=20)-(2/14); a(F1E=20)=(3/14);

a(F1A=20)=(4/14); a(FlU=20)=(5/14);

Classes

/a/ /i/ /u/ le/

Valleurs

pour 1 paramètre

1 1a 1i 1u le

, ei,:::::.:. \-k.v,:wie
·§"O

.: . ..: :-.-

-
·:' . g.e....:;:me.
`...

-.:...

, ....`,1 ...-,k.....k.. .,.... \ ..e. .

.'sz.:.:-....` N..\.,

t\---\; \ -%

, \ . -..
·:....,\,....

..:e«...-:k..... :-.. ::::::-..«...-e- \......4....-,..s: .>:e
·..::. -.:.

32 32a 32i 32u 32e

 

Figure 9 : exemple de mise en forme des données.

Reconnaissance:

On prend une voyelle X de la liste de reconnaissance.

exemple: on veut calculer la reconnaissance de voyelle avec le protocole FIAI T2. On calcul ota=a(F1A=x)+a(AlA=x)+OE(T2A=x),ai, au, ae.

La lettre x sera reconnue comme un y avec ay qui correspond à la probabilité la plus

grande.

Remarque:

Si la valeur x n'existe pas dans la liste d'apprentissage on calcul les distances des la voyelle X, par rapport aux barycentres de la/, /u/, /43/ de la liste de reconnaissance, appelé respectivement da, di, de, du et on calcule saa(..A=x)=da/somme(d).

Prenons par exemple les données suivantes pour le modèle Fl. ( cf figure 10 ).

F1 /a/. 17(2), 18(9), 19(1). F1 /i/. 21(12). F1 /u/. 21(12) F1 /e/ 19(7), 20(4), 21(1).

Apartenance au sous-ensemble

A A E I,U

13 15 16 17 18 19 20 21 n° électrode

Figure 10 : Etablissement de la règle d'appartenance.

Remarque : Dans l'exemple on n'a pas pris en compte les calculs des distances euclidiennes pour les électrodes 1 à 15 pour ne pas compliquer le dessin.

cl Distance entre matrices.

La distance de Hamming va être calculée entre la matrice de reconnaissance des modèles et celle donnée par le patient de la manière suivante.

100 4 4

Erreur = -- E E

48

L'erreur va être comprise entre 0 et 200.

Exemple: Mode F2F1, patient CO, locuteur Gar.

Ordinateur. Modèle Patient

CALC

A

I

U

E

A

6

0

0

6

I

0

12

0

0

U

0

0

11

1

E

0

0

0

12

PAT

A

I

U

E

A

5

0

4

3

I

0

10

1

1

U

0

0

12

0

E

1

0

1

10

La distance de Hamming qui représente l erreur est 37.5

J]

ENREGISTREMENT DES LISTES D'APPRENTISSAGE ET RECONNAISSANCE

5/ Synoptique général de l'étude.

 
 

ELABORATION DES MATRICES DE RECONNAISSANCE
PAR LE PATIENT

AQUISITION DES PARAMETRES PAR ORDINATEUR ET CALCUL DES MATRICES DE RECONNAISANCE

 
 
 
 
 
 
 
 
 
 

COMPARAISON DES MATRICES DE RECONNAISSANCE
PATIENT / ORDINATEUR PAR LE COEFFICIENT DE HAMMING

Figure 11 : synoptique de l'étude.

Les différentes phases de notre étude sont représentées sur la figure 11.

C/ Résultats.

Compte tenu du nombre de résultats assez conséquent, 256*10*4*2 = 20480 comparaisons de matrices, nous n'avons pas pu tout représenter dans ce rapport bien qu'ils aient été saisis sous word sous windows. ( cf annexe.p 68-71.).

Les données les plus représentatives et les plus synthétisées ont été indiquées dans cette

partie.

1/ Paramètres regroupés.

On a fait une moyenne sur tous les locuteurs et tous les modèles ou intervenait chaque paramètres. ( une case représente 10* 128 = 1280 valeurs ; pour les sommes ou il y en a 8 fois plus. ).

Les données correspondent donc à la moyenne de la distance de Hamming de chaque paramètre par patient en utilisant dans le premier tableau la méthode de reconnaissance euclidienne et le deuxième la méthode de reconnaissance floue.

1er paramètre 2ème paramètre n 3ème paramètre

Patient

 

I Méthode F2

 

A2

E2

T2

Fl

Al

El

Ti

E

AM

 

Euclide

,;:i

..ell

109

106

 

102

125

106

100

105

BA

 

Euclide

116

 

116

'"::'

. ' e

10 0

114

i 120

113

114

96

,.,::-.7::
100 , ,

115

96

CO

 

Euclide

.

 

100

 

LA

 

Euclide

105

 

108

105

 

105

115

105

 

106

Patient

Methode

F2

A2

E2

T2

Fl

Al

El

Tl ' E

AM

Fuzzy

79

83

 

79
93

98

82
94

In I::

79
93

80
94

BA

Fuzzy

94

94

::::: `.."''''

CO

Fuzzy

 

81

82

84

 

78

81

84

80

LA t,

Fuzzy

90

88

87

 

87

88

87

« mi*

:ee::: de:

87

Tableau I et II : Distances moyennes de Hamming de chaque paramètre groupé par patient

Ce tableau montre la moyenne des distances de Hamming après regroupement par sexe du locuteur et paramètres en utilisant les deux méthodes de reconnaissances..

ler paramètre

2ème paramètre El 3ème paramètre

Locuteurs

Methode

F2

A2

E2

T2

 

F 1

 

Al

 
 

El

T1

E

Feminin

Euclide

 

107

101

 
 


·

 

116

 
 

103

101

103

Fuzzy

.,

84
110

107

81

".

 

es

83
121

 
 
 
 

81

Masculin

Euclide

.,

'

108

....,

105

107
90

108
90

Fuzzy

-

90

108

104

90

 

90

 

'

118

Total

Euclide

104

106

Fuzzy

85

87

:

85

 

85

 

86

 
 

' '

85

85

Tableau III : Distances moyennes de Hamming de chaque paramètre après regroupement par sexe
des locuteurs

2/ singletons, doublets, triplets et quadruplets.

Les tableaux qui suivent indiquent les six meilleurs modèles, lorsqu'un, deux, trois et quatre paramètres sont considérés, pour chaque patient.

Meilleurs paramètres simo es sin letons .

Patient

ter

2ème

3ème

4ème

Sème 1 6ème

AM

T2

F2

Ti

F 1

A2

Al

BA

Ti

T2

A2

Fl

F2

Al

CO

F2

A2

F1

Al

Ti

T2

LA

T2

Fl

Tl

Al

A2

F2

Meilleurs doub ets.

Patient

ter

2ème

3ème

4ème

Sème

6ème

AM

T2T1

T2F 1

F2T1

F2T2

F1F2

A2T2

BA

A2T1

A2T2

A2A1

A1T1

T2A1

T1T2

CO

F2F 1

F2A1

F2A2

F2T1

F2T2

FIAI

LA

A2T2

T2A1

A1T1

T2T1

A2T1

FIAI

Meilleurs triplets.

Patient

1 ter

2ème

3ème

4ème

Sème

6ème

AM

T2A1 T 1

A2T2T1

T2F 1 T 1

A2T2F1

T2F1A1

F2T2T 1

BA

A2A1 T 1

T2A1 T 1

A2T2T1

A2T2A1

A2F1T1

A2F1A1

CO

F2A2F 1

F2F1A1

F2A2A1

F2T2F 1

F2E2F 1

F2F 1 Tl

LA

A2T2A1

FIAI Tl

A2T2F1

T2F1A1

A2F1T1

T2A1T1

Meilleurs quadruplets:

Patient

1 st

2ème

3rd

4th

5th

6th

AM

A2T2A1 T 1

A2T2F1T1

T2F1A1T1

F2T2A1 T 1

F2A2T2T 1

A2T2F1A1

BA

A2T2A1 T 1

A2F2A1 T 1

A2T2F1T1

A2T2F1A1

F2A2T2A1

T2F 1 Al Tl

CO

F2A2F1A1

F2F 1A1T 1

F2 T2F1A1

F2A2F1T1

F2A2T2A1

F2A2T2A1

LA

A2T2F1A1

E2A2A2T1

A2T2A1T1

E2A2F1T1

A2F1A1T1

T2F1A1T1

Tableau IV(a)

Meilleurs paramètres.

Patient

ler

2ème

3ème

4ème

Sème

6ème

AM

El

Tl

E2

F2

Fl

T2

BA

El

E2

Ti

T2

F2

A2

CO

F2

A2

El

Al

E2

Fl

LA

T2

Ti

E2

El

F2

Al

Meilleurs doublets.

Patient

ler

2ème

3ème

4ème

Sème

6ème

AM

F1E1

E2F1

E1T1

E2T1

F2F1

T2F1

BA

E1T1

A1E1

E2A1

A2E2

E2T1

T2E1

CO

F2F1

F2A1

F2E1

F2A2

A2A1

A1E1

LA

E1T1

A2T2

E2T2

A2T1

E2T1

E2F1

Meilleurs triplets.

Patient

1 ler

2ème

3ème

4ème

Sème

6ème

AM

F2F1E1

F2E2F1

E2T2F1

A2E2F1

T2F1E1

E2F1A1

BA

A2E2T2

T2E1T1

A2T2E1

A2E2E1

F2A2E1

A2T2T1

CO

F2F1A1

F2A2F1

F2E2F1

F2F1E1

F2A1E1

F2E1T1

LA

A2T2T1

E2T2T1

T2E1T1

A2E1T1

A2T2E1

A2E2T1

Meilleurs quaduplets:

Patient

1 1 st

2ème

3rd

4th

5th

6th

AM

A2T2F1E1

A2E2T2E1

F2E2F1T1

F2E2T2F1

F2F1E1T1

T2F1A1E1

BA

F2A2A1E1

A2T2A1E1

A2E2T2A1

E2T2E1T1

A2E2E1T1

A2E2T2E1

CO

F2A2F1A1

F2F1A1T1

F2T2F1E1

F2E2F1T1

F2E2F1A1

F2F1E1T1

LA

A2T2E 1 T 1

T2A1E1 Tl

E2T2A1 T 1

A2E2T2T1

E2F 1A1 T 1

A2F2F 1 T 1

Tableau IV(b)

Tableau W : Les six meilleurs singletons, paires, triplets et quadruplets pour approximer la
reconnaissance du patient.
(a : Euclide, b : Flou)

3/ analyse acoustique des voyelles.

En parallèle avec l'étude sur l'implant, nous avons segmenté et fait une étude cepstrale sur les 960 voyelles pour voir si elles étaient différenciables acoustiquement. Ce travail a été réalisé sur la station voix ILS. Celle-ci nous a permis de numériser les signaux à une fréquence d'échantillonnage de 10 kHz puis d'appliquer une routine qui va extraire les deux premiers formants (F), leur amplitude (A), leur bande passante (BP) et leur énergie (E).

On a pu ainsi calculer pour chacun des groupes de voyelles (240 par groupe) la moyenne et l'ecart type de chaque paramètre.

240

Ex

Moyenne : )7. = i=1

240

 
 

120

Ecart type : r = E (x-x)

i=1

lettre

variable

moyenne

ec. type

A

F1

667

105

A

F2

1237

152

A

BP1

194

117

A

BP2

257

146

A

Al

78

6

A

A2

76

5

A

E 1

72

40

A

E2

93

48

lettre

variable

moyenne

ec. type

U

F1

307

35

U

F2

808

147

U

BP1

94

61

U

BP2

215

117

U

Al

72

5

U

A2

61

5

U

E1

28

14

U

E2

78

53

lettre

variable

moyenne

ec. type

I

Fl

282

28

I

F2

1992

257

I

BP1

54

30

I

BP2

377

337

I

Al

69

4

I

A2

59

10

I

E1

18

10

I

E2

93

75

lettre

variable

moyenne

ec. type

E

Fl

467

80

E

F2

1406

194

E

BP1

81

50

E

BP2

237

176

E

Al

78

5

E

A2

71

6

E

El

37

24

E

E2

82

53

On peut signaler que les résultats de F1, F2 sont similaires avec la littérature.

Voyelle

Fl

F2

A

667

1237

I

282

1992

U

307

808

E

467

1406

51

Figure 13 : Représentation des voyelles dans l'espace Al A2.

661 979 1296 1614 1931 2249 2567 2884 F2

1

254

T.' 1.7-D

Figure 12 : Représentation des voyelles dans l'espace F 1 F2.

340

427

513

599

686

772

858

F1

Figure 14 : Représentation des voyelles dans l'espace El E2.

40 175 310 444 579 714 849 984 BP2

1

24

72

120
168

215

263

311

359

BPI

Figure 15 : Représentation des voyelles dans l'espace BP 1 BP2.

DISCUSSION

A/ Méthodes mathématiques.

Globalement nous pouvons dire que la logique floue, pour la reconnaissance de voyelles est meilleure que la métrique euclidienne car les modèles flous donnent toujours des résultats beaucoup plus proches du patient que les modèles euclidiens.

La distance de Hamming moyenne est de 85 pour le flou contre 106 pour l'euclidien. ( moyenne sur 10200 matrices.).

On peut aussi remarquer des similitudes importantes pour la reconnaissance entre les deux méthodes ce qui permet de valider les résultats d'un point de vue significativité. ( ceci en plus du grand nombre de données.).

B/ Etude acoustique.

L'étude acoustique montre que le plan F2F1 est le plus discriminant.

Nous pouvons aussi regarder les résultats paramètre par paramètre.( cf figure 16 ).

F2

41021L Idirmalle 41101MIMIL

MW/ IIIILWAIIPF 11111111111111

F1

d'eu Arenr rrenri.

w niummor nfflummour A2

I i 0 I 1 I I II In I r e -MA I I I I I I I I ri La--..0 gill I I I I I I W

'n1IMIIIIMMINallIM-4111.111.01rA1.1.

Al

4 I il "g - -I .1 2; 5 1 I I I I reled I 1 I I 1 I I I I I I .-- « e 11111 0 I II IIIIIIIIIIIIIIir.k

._. _1 _i miniblililliPOIWF F

BP2

- -

/utOteal

 

BPI

eallellillallir

\`.-- _nlielletiMMUI-M1111111111111111.1"11PI'

E2

KIEZZIK-...1111»./Mkr.

'ee
·._IIIIIII1Mbim..___`INMIIIIIIIIIIIMIIIMIIIIMOIP

El

Idereele:ill."--11111Mlibb.-..491.1

91 ll 1 IUI NI PA I I el il ._...
· MI I I 11.111 I I II I II II I I II I 1 I MW I I . ° w

Figure 16 : Représentation des sous ensembles de voyelles pour chaques paramètres

On peut les classer par ordre de discrimination des voyelles en trois groupes.

F2, FI sont les plus discriminants.

A2, BPI., El sont moyennement discriminants.

BP2, E2, Al ne sont pratiquement pas discriminants.

Théoriquement si l'I.C. joue son rôle d'oreille bionique, l'écoute du patient sera proche des modèles comportants les paramètres F2, FI, Al, Ti et El. Les paramètres Al, T2 et E2 seront théoriquement assez mauvais.

On peut seulement noter que F1 est sous-representer par l'I.C. car sa variation en numéro d'électrode est très faible par rapport à celle de F2. Cette constatation est regrettable car théoriquement Fi peut apporter une bonne contribution à la discrimination de voyelles.

C/ Patients.

Les résultats peuvent nous renseigner sur l'importance des paramètres pour chaque patient. Nous pouvons en déduire le tableau récapitulatif suivant.

Patient

Modèle Euclidien

Modèle flou

Moyenne

AM

F2, T2

Fl, E2, El

F2, T2, F 1

BA

E2, T2, T1

E2, El

E2, T2, El, T1

CO

F2, E2, F 1

F2, Fl

F2, Fl

LA

T2, Ti

T2, Ti

T2, Ti

Paramètres importants pour la reconnaissance des voyelles pour les patients

Nous pouvons constater que seuls AM et CO privilégient les formants pour la reconnaissance de voyelles. Les patients BA et LA utilisent plutôt T1 et T2.

Les résultats obtenus dans C/ 1/ b/ nous donnent des informations sur la qualité de reconnaissance par sexe du locuteur.

Le tableau ci-dessous nous donne la moyenne des distances de Hamming par sexe du locuteur. Chaque valeur est une moyenne de 5100 distances par méthode et 10200 distances pour la moyenne.

Sexe

Euclidien

Flou

moyenne

Femme

103

81

92

Homme

108

90

99

Distances moyennes de Hamming par sexe du locuteur.

74%

 

A

I

U

E

A

31

0

1

28

I

0

59

0

1

U

0

1

58

1

E

5

7

18

30

CO

64%d

 

A

I

U

E

A

28

0

12

20

I

0

60

0

0

U

6

0

35

19

E

7

0

22

31

36% I

Matrices de reconnaissance des patients pour les locuteurs feminins. La moyenne est de 54% de reconnaissance. (960 données).

CO

BA

 

A

I

U

E

A

23

11

6

20

I

9

21

17

13

U

10

18

20

12

E

21

9

7

23

AM

 

A

I

U

E

A

17

0

3

40

I

6

24

2

28

U

0

0

56

4

E

3

0

14

43

58%

BA

32%

 

A

I

U

E

A

26

12

10

12

I

11

14

21

14

U

10

16

23

11

E

24

11

11

14

LA

42% I

 

A

I

U

E

A

26

10

3

21

I

1

18

23

18

U

2

20

29

9

E

24

3

5

28

1

 

A

I

U

E

A

32

0

19

9

I

0

54

2

4

U

7

0

37

16

E

7

6

8

39

68%

LA

45% I

 

A

I

U

E

A

39

1

9

11

I

11

20

11

18

U

0

21

22

17

E

15

6

12

27

Matrices de reconnaissance des patients pour les locuteurs masculins.

La moyenne est de 51% de reconnaissance pour les locuteurs hommes. (960 données.)

Ces données montrent que les modèles se rapprochent le mieux du patient pour les locuteurs feminins que pour les masculins. Ce qui semblerait nous montrer que les patients comprennent les femmes que le hommes. Ce résultat semble être montré par les matrices de reconnaissances.

Les résultats donnent aussi des renseignements sur la qualité moyenne des modèles pour chaque patient. Chaque distance moyenne du tableau ci-dessous est calculée sur 2550 données par méthode et 5100 données par classement.

Patients

Euclidien

Flou

Moyenne

Classement

AM

105

80

92.5

2

BA

115

94

104.5

3

CO

96

80

88

1

LA

106

87

96.5

4

Distance moyenne de Hamming pour chaque patient

Le classement donne, par ordre croissant la qualité de représentation des modèles pour chaque patient.

On peut discuter globalement sur la qualité de reconnaissance des voyelles en établissant les matrices de reconnaissances des patients.

66% I

34% I

AM

 

A

I

U

E

A

48

0

4

68

I

6

83

2

29

U

0

1

114

5

E

8

7

32

73

BA

 

A

I

U

E

A

49

23

16

32

I

20

35

38

27

U

20

34

43

23

E

45

20

18

37

CO

 

A

I

U

E

A

60

0

31

29

I

0

114

2

4

U

13

0

72

35

E

14

4

32

70

66%

LA

44% I

 

A

I

U

E

A

65

11

12

32

I

12

38

34

36

U

2

41

51

26

E

39

9

17

55

Matrices de reconnaissances des patients.

Nous voyons qu'il y a une similitude entre la qualité de reconnaissance des patients et la qualité des modèles d'écoute par rapport au patient.

Analyse des modèles proches de l'écoute des patients en fonction des réglages des patients.

Comme nous l'avons dit auparavant, nous pouvons séparer les patients en deux groupes, ceux qui utilisent principalement les formants pour la reconnaissance ( AM, CO) et ceux qui n'en tiennent pratiquement pas compte ( BA, LA ).

Ceci est un fait, mais il faudrait savoir pourquoi BA et LA n'utilisent pratiquement pas les paramètres les plus importants vis à vis de la théorie phonétique?

Nous allons passer brièvement sur les patients AM et CO car leur écoute peut se modéliser principalement par F 1 et F2, résultats auquel on s'attendait.

Pour LA, nous pouvons aussi expliquer le fait qu'il n'utilise pratiquement pas F 1 et F2 car lorsque l'on regarde ses réglages ( page 40 ), on s'aperçoit qu'il ne dispose que de 5 électrodes actives sur 22. Il doit donc s'aider des autres paramètres ( A, T, E) pour pouvoir écouter.

Pour BA, cela parait incompréhensible, puisqu'il a 22 électrodes actives mais il ne se sert pas de ce potentiel pour écouter.

Nous pensons que le patient BA ne discrimine pas les voyelles par les formants car ce patient est devenu sourd à l'âge de 18 mois. Il est resté sourd pendant 38 ans. Il n'a pratiquement pas eu d'apprentissage de la discrimination fréquentielle. Il faudrait donc accentuer les différences fréquentielles par les réglages et la rééducation pour pouvoir l'aider à apprendre la discrimination fréquentielle.

CONCLUSION

La modélisation de la reconnaissance des voyelles par des patients porteurs d'un implant cochléaire a montré que :

0 . l'utilisation d'une métrique floue rend mieux compte de l'écoute des patients

implantés que la métrique euclidienne. Ce résultat est intéressant car la logique floue est par définition basée sur le raisonnement humain.

. le second formant est globalement le paramètre le plus important pour la compréhension des patients, mais ceci n'est pas le cas lorsque les patients sont pris séparement.

. Le modèle F1F2 n'est pas toujours le plus représentatif de l'écoute des patients implantés. L'adaptation des stratégies de reconnaissance au patient semble être un point à étudier dans le futur.

. F 1 semble être mal exploité par l'implant cochléaire alors que l'étude acoustique laisse penser qu'il permettrait de bien discriminer les voyelles.

La souplesse de codage dans les implants cochléaires semble donc être une des qualités importantes que l'on demande aux machines d'aujourd'hui.

ANNEXES

voyelle n°1 c'est i ça

 

voyelle n°2

c'est a ça

voyelle n°3

c'est e ça

voyelle n°4

c'est a ça

voyelle n°5

c'est i ça

voyelle n°6

c'est e ça

voyelle n°7

c'est i ça

voyelle n°8

c'est ou ça

voyelle n°9

c'est i ça

voyelle n°10

c'est a ça

voyelle n°11

c'est a ça

voyelle n°12

c'est e ça

voyelle n°13

c'est a ça

voyelle n°14

c'est ou ça

voyelle n°15

c'est a ça

voyelle n°16

c'est e ça

voyelle n°17

c'est ou ça

voyelle n°18

c'est ou ça

voyelle n°19

c'est ou ça

voyelle n°20

c'est ou ça

voyelle n°21

c'est a ça

voyelle n°22

c'est i ça

voyelle n°23

c'est e ça

voyelle n°24

c'est e ça

voyelle n°1

c'est i ça

voyelle n°2

c'est a ça

voyelle n°3

c'est e ça

voyelle n°4

c'est a ça

voyelle n°5

c'est i ça

voyelle n°6

c'est e ça

voyelle n°7

c'est i ça

voyelle n°8

c'est ou ça

voyelle n°9

c'est i ça

voyelle n°10

c'est a ça

voyelle n°11

c'est a ça

voyelle n°12

c'est e ça

voyelle n°13

c'est a ça

voyelle n°14

c'est ou ça

voyelle n°15

c'est a ça

voyelle n°16

c'est e ça

voyelle n°17

c'est ou ça

voyelle n°18

c'est ou ça

voyelle n°19

c'est ou ça

voyelle n°20

c'est ou ça

voyelle n°21

c'est a ça

voyelle n°22

c'est i ça

voyelle n°23

c'est e ça

voyelle n°24

c'est e ça

Matrices de reco. du patient A.M pour les dix locuteurs.

 

HA

I

U

E

A

6

0

1

5

I

4

3

0

5

U

0

0

10

2

E 12

 

0

3

7

al.am sy.am

 

A

I

U

E

A

11

0

0

1

I

0

12

0

0

U

0

0

12

0

E

0

2

1

9

lo.am

1 A

I

U

E

A

3

0

1

8

I

1

7

2

2

U

0

0

12

0

E

1

0

3

8

va.am

H A

I

U

E

 

2

0

0

10

I

0

12

0

0

U

0

0

12

0

E

2

1

2

7

el.am

 

A

I

U

E

A

5

0

1

6

I

0

12

0

0

U

0

0

12

0

E

0

3

6

3

ar.am

 

A

I

U

E

A

3

0

0

9

I

0

6

0

6

U

0

0

11

1

E

0

0

1

11

a.am

 

I

U

E

A 1

0

0

11

I

0

4

0

8

U

0

0

11

1

E

0

0

0

12

no.am

 

A

I

U

E

 

4

0

1

7

I

1

4

0

7

U

0

0

12

0

E i0

0

7

5

o.am

 

1A

I

U

E

A

4

0

0

8

I

0

12

0

0

U

0

1

10

1

E

3

0

3

6

ce.am

 

H A

I

U

I E

A

9

0

0

3

I

0

11

0

1

U

0

0

12

0

E

0

1

6

5

fem.am

i

A

I

U

E

A

31

0

1

28

I

0

59

0

1

U

0

1

58

1

E

5

7

18

30

mal.am

 

HA

I

U

E

A

17

0

3

40

I

6

24

2

28

U

0

0

56

4

E

3

0

14

43

tot.am

 

il

A

I

U

E

A

48

0

4

68

I

6

83

2

29

U

0

1

114

5

E

8

7

32

73

Segmentation des impulsions du locuteur CE de la liste d'apprentissage du patient AM.

A

 

Fl

18

19

18

17

17

18

18

18

18

18

18

18

Al

71

69

70

69

69

69

69

69

69

69

69

69

tl 1

259

216

242

250

245

241

246

253

251

240

248

244

t12

259

216

242

250

245

241

246

253

251

240

248

244

F2

16

16

15

16

17

17

17

17

16

17

14

14

A2

72

69

70

69

69

69

69

69

69

69

69

69

t21

277

212

247

246

249

232

239

227

250

231

263

257

t22

277

212

247

247

249

232

239

227

250

231

263

257

I

 

F1

21

21

21

21

21

21

21

21

21

21

21

21

Al

70

70

70

70

70

69

70

69

70

70

69

69

tl 1

169

169

170

169

169

168

168

167

169

169

167

165

t12

169

169

170

169

169

168

168

167

169

169

167

165

F2

11

9

8

7

6

6

7

6

7

6

6

5

A2

69

69

69

69

69

69

69

69

69

69

69

69

t21

246

300

278

287

315

290

309

294

294

302

339

336

t22

246

300

278

287

315

290

309

294

294

302

339

336

 
 

F1

21

21

21

21

21

21

21

21

21

21

21

21

U

71

70

70

70

70

70

70

70

70

70

70

70

 

177

174

173

174

171

173

171

172

173

173

171

174

t

77 177 7

17

174

173

174

171

173

171

172

173

173

171

174

F2

 

17

18

18

17

17

17

18

18

18

17

17

A2

70

69

69

69

69

69

69

70

69

69

69

69

t21

198

185

183

182

186

194

180

192

187

188

188

178

t22

198

185

183

182

186

194

180

192

187

188

188

178

E

 

Fl

20

19

21

19

19

19

20

19

19

20

20

19

Al

72

69

70

69

69

69

70

69

69

70

70

69

tll

211

247

175

249

236

233

190

205

248

190

196

215

t12

211

247

175

249

236

233

190

205

248

190

196

215

F2

20

14

15

18

18

18

17

19

18

19

18

19

A2

72

69

69

69

69

69

69

69

69

69

69

69

t21

184

252

224

211

215

218

203

185

208

181

201

198

t22

184

252

224

211

215

218

203

185

208

181

201

198

C' est' a' ça

Dabut : ENERGIE DU SIGNAL

· · 138 TO

24 4?
·
· 7C
115

1

2

3

4

5

6

7

8

9

HUMER° D'ELECTRODE FI

10

11

12

13

14

15

16

17

18

19

20

eg4

e e kee ,,eX777--77--le______

epei

me keeD e.iee e ke

» ee:

MM .

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

eei

mime

keemg emeemmeemme«etmeee

 
 

C' est ' i ' ça

Debut: ENERGIE DU SIGNAL

111 TO

 
 
 
 

· 19

· .39

'se '

NUNERO D'ELECTRODE

C' est ' u ' ça

Debut:

ENERGIE DU SIGNAL

1

TO

 
 
 
 
 
 
 
 

24 47 . 70 . . . .9

. . . .115 . . . .

tal

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

 
 
 
 

NUMERO D'ELECTRODE

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

e

ee:

 
 
 

.e

e

 

ee ee

et

hA

§2:5 erry
·w,,,4:ie tee4
·

 
 
 

m eefflee

 

C' est '9' ça

Dabut:

ENERGIE DU SIGNAL

'19

k

111 TO

a

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17
le

200

*92

eh.e.,:«#* ;:e:ffl

eameefflo eaammemmeese

.38 5d ' ' '74 '9S

HUMER° D'ELECTRODE

Petite partie des Résultats par ordre croissant de la comparaisson de reconnaissance du
locuteur CE par le patient AM avec l'ordinateur en utilisant la méthode euclidienne

T2F1

Mat. de reco. par ordi.

ORDI

A

I

U

E

A

6

1

0

5

I

0

10

1

1

U

0

0

12

0

E

0

0

6

6

distance de Hamming: 20.8

Mat. de reco. par pat.

PAT

A

I

U

E

A

9

0

0

3

I

0

11

0

1

U

0

0

12

0

E

0

1

6

5

T2F1A1

Mat. de reco. par ordi.

ORDI

A

I

U

E

A

6

1

0

5

I

0

10

1

1

U

0

0

12

0

E

0

0

6

6

distance de Hamming: 20.8

Mat. de reco. par pat.

PAT

A

I

U

E

A

9

0

0

3

I

0

11

0

1

U

0

0

12

0

E

0

1

6

5

A2T2F1

Mat. de reco. par ordi.

ORDI

A

I

U

E

A

6

1

0

5

I

0

10

1

1

U

0

0

12

0

E

0

0

6

6

distance de Hamming: 20.8

Mat. de reco. par pat.

PAT

A

I

U

E

A

9

0

0

3

I

0

11

0

1

U

0

0

12

0

E

0

1

6

5

A2T2F1A1

Mat. de reco. par ordi.

ORDI

A

I

U

E

A

6

1

0

5

I

0

10

1

1

U

0

0

12

0

E

0

0

6

6

distance de Hamming: 20.8 Mat. de reco. par ordi.

ORDI

A

I

U

E

A

10

0

2

0

I

0

11

1

0

U

0

0

12

0

E

1

0

6

5

Mat. de reco. par pat.

PAT

A

I

U

E

A

9

0

0

3

I

0

11

0

1

U

0

0

12

0

E

0

1

6

5

F2T2T1

Mat. de reco. par pat.

PAT

A

I

U

E

A

9

0

0

3

I

0

11

0

1

U

0

0

12

0

E

0

1

6

5

distance de Hamming: 20.8

69

Résultats de jo.am

A2T2A1T1 50.0

TI

54.2

A2T2F1A1T1

54.2

T2A1T1

58.3

A2T2TI

58.3

A2T2F1T1

58.3

E2A2T2FIAITI

58.3

T2FIAITI

66.7

T2T1

70.8

E2A2T2A1T1

70.8

FIT!

75.0

A2T2A1

75.0

A212F1A1

75.0

E2T2FITI

75.0

E2T2F1A1T1

75.0

E2A2T2T1

75.0

E2A2T2FITI

75.0

F2F1T1

75.0

T2F1T1

79.2

E2T2A1T1

79.2

F2T1

79.2

F2F1

79.2

F2F1A1

79.2

F2FIAIT1

79.2

F2T2

79.2

F2T2T1

79.2

F2T2F1

79.2

F2T2F1T1

79.2

F2A2A1T1

79.2

F2A2F1

79.2

F2A2F1A1

79.2

F2A2F1A1T1

79.2

A2T2

83.3

A2T2FI

83.3

E2T2T1

83.3

E2A2FIA1

83.3

E2A2T2F1A1

83.3

F2A1T1

83.3

F2T2A1

83.3

F2T2AITI

83.3

F2T2FIA1

83.3

F2T2F1A1T1

83.3

F2A2TI

83.3

F2A2F1T1

83.3

F2A2T2

83.3

F2A2T2T1

83.3

F2A212A1

83.3

F2A2T2AITI

83.3

F2A2T2F1

83.3

F2A2T2F1T1

83.3

F2A2T2F1A1

83.3

F2A2T2FIAITI

83.3

F2E2T1

83.3

F2E2F1T1

83.3

F2E2T2

83.3

F2E2T2T1

83.3

F2E217A1

83.3

F2E2T2A1T1

83.3

F2E2T2F1

83.3

F2E2T2FITI

83.3

F2E2T2F1A1

83.3

F2E2T2F1A1T1

83.3

F2E2A2T2

83.3

F2E2A2T2T1

83.3

F2E2A2T2A1

83.3

F2E2A212A1T1

83.3

F2E2A2T2F1

83.3

F2E2A2T2F1T1

83.3

F2E2A2T2FIA1

83.3

F2E2A2T2F1AIT1

83.3

T2FIAI

87.5

A2

87.5

A2F1T1

87.5

F2E2AITI

87.5

F2E2F1A1T1

87.5

F2E2A2TI

87.5

F2E2A2A1T1

87.5

F2E2A2F1T1

87.5

F2E2A2FIAITI

87.5

F1

91.7

FIAIT1

91.7

T2A1

91.7

A2F1

91.7

E2A2F1

91.7

E2A2T2F1

91.7

F2T2E1T1

91.7

F2T2E1A1T1

91.7

F2T2FIEIT1

91.7

F2T2FIEIAIT1

91.7

F2A2T2E1T1

91.7

F2A2T2EIAITI

91.7

F2A2T2F1EIT1

91.7

F2A2T2FIEIAITI

91.7

F2E2T2F1E1T1

91.7

F2E2T2FIEIAITI

91.7

F2E2A2T2F1E1T1

91.7

F2E2A2T2FIEIAITI

91.7

FIAI

95.8

E2A2F1A1T1

95.8

E2A2T2

95.8

E2A2T2A1

95.8

F2

95.8

AIT!

100.0

A2A1T1

100.0

A2F1A1T1

100.0

F2E2F1

100.0

F2E2F1A1

100.0

F2E2T2EIT1

100.0

F2E2T2E1AITI

100.0

F2E2A2FI

100.0

F2E2A2F1A1

100.0

F2E2A2T2EITI

100.0

F2E2A2T2E1A1T1

100.0

T291

104.2

A2T1

104.2

A2A1

104.2

A2FIAI

104.2

E2F1

104.2

E2T2FIAI

104.2

F2A1

104.2

F2A2

104.2

F2A2A1

104.2

 

108.3

E2A1T1

108.3

E2F1A1

108.3

E2T2

108.3

E2T2A1

108.3

E2T2F1

108.3

E2A2A1T1

108.3

E2T1

112.5

E2FITI

112.5

E2A2T1

112.5

E2A2F1T1

112.5

T2FIEIT1

116.7

T2F1EIAIT1

116.7

A2T2F1E1T1

116.7

A2T2FIEIAIT1

116.7

E2FIAIT1

116.7

E2A2A1

116.7

F2E1

116.7

F2E ITI

116.7

F2E1A1

116.7

F2EIAITI

116.7

F2F1E1

116.7

F2FIEITI

116.7

F2F1E1A1

116.7

F2FIEIAITI

116.7

F2T2F1E I

116.7

F2T2F1E1A1

116.7

F2A2E1

116.7

F2A2EIT1

116.7

F2A2E1A1

116.7

F2A2EIA1T1

116.7

F2A2FI El

116.7

F2A2F1E1T1

116.7

F2A2FIEIAI

116.7

F2A2FILIAITI

116.7

F2A2T2F1E1

116.7

F2A2T2F1E1A1

116.7

F2E2

116.7

F2E2A1

116.7

F2E2EI

116.7

F2E2EIT1

116.7

F2E2E1A1

116.7

F2E2E1A1T1

116.7

F2E2F1E1

116.7

F2E2F1E1T1

116.7

F2E2F1E1A1

116.7

F2E2FIEIAITI

116.7

F2E2A2

116.7

F2E2A2A1

116.7

Exemple de classementpar ordre des meilleurs modèles du locuteur Jo du patient....(M Euclide ).

E2T2FIEIA1T1

 

120.8

E2A2T2E1TI

 

120.8

E2A212E IAIT1

 

120.8

E2A2T2FIEIT1

 

120.8

E2A2T2FIEIAITI

 

120.8

F2T2E1

 

120.8

F2T2E1A1

 

120.8

F2A2T2E1

 

120.8

F2A2T2E1A1

 

120.8

F2E2T2E1

 

120.8

F2E2T2E1A1

 

120.8

F2E2T2F1E1

 

120.8

F2E2T2FIEIAI

 

120.8

F2E2A2T2E1

 

120.8

F2E2A2T2E1A1

 

120.8

F2E2A2T2FIE1

 

120.8

F2E2A2T2F1E1A1

 

120.8

E2F1EI

 

129.2

E2FIEIA1

 

129.2

E2A2F1E1

 

129.2

E2A2F1E1A1

 

129.2

FIEITI

 

133.3

FIEIAIT1

 

133.3

A2F1E1T1

 

133.3

A2FIEIAITI

 

133.3

E2

 

1333

E2A1

 

133.3

E2EIT1

 

133.3

E2EIAITI

 

133.3

E2F1E1T1

 

133.3

E2FIEIAIT1

 

133.3

E2A2

 

133.3

E2A2E1T1

 

133.3

E2A2E1AITI

 

133.3

E2A2FIE1TI

 

133.3

E2A2FIEIAIT1

 

1333

EIT1

 

137.5

EIAIT1

 

137.5

F1E1

 

137.5

F1E1A1

 

137.5

A2E IT1

 

137.5

A2E1A1T1

 

137.5

A2FIE I

 

137.5

A2F1E1A1

 

137.5

E2E1

 

137.5

E2E1A1

 

137.5

E2A2E1

 

137.5

E2A2E1AI

 

137.5

Al

 

141.7

El

 

145.8

A2E1

 

145.8

A2EIA1

 

145.8

LIAI

 

150.0

A2T2F1E1

 

154.2

T2F1E1

 

158.3

E2T2F1E1

 

1583

E2T2FIEIA1

 

158.3

E2A2T2E1

 

1583

E2A2T2F1E1

 

158.3

E2A2T2FIEIAI

 

1583

E2T2E1

 

162.5

E2T2EIAI

 

162.5

E2A2T2E1A1

 

162.5

T2E1

 

166.7

T2EIA1

 

166.7

T2F1E1A1

 

166.7

A2T2E1

 

166.7

A2T2E1A1

 

166.7

A2T2F1E1A1

 

166.7

 
 

170.8

E2T2F1E1T1

A2T2EIT1

A2T2E1A1T1

E2T2E IT1

E2T2EIAITI

T2E1T1

T2E1A1T1

F2E2A2FIEIAIT1

F2E2A2F1EITI

F2E2A2FIE1AI

F2E2A2E1AITI

F2E2A2FI El

120.8

120.8

120.8

120.8

120.8

120.8

120.8

116.7

116.7

116.7

116.7

116.7

116.7

F2E2A2E1 116.7

F2E2A2E1T1 116.7

Exemple : résultats de la méthode Euclidienne.
Résultats pour chaque paramètres pour AM

120 121 119 125

ler paramètre 2ème paramètre 3ème paramètre

Regroupement

F2 E2

A2

T2

Fl

El

Al

Ti

gal

Orli: 123

124

 
 

144

123

<<

 

I 109

103

114

100

106

102

 

va

100

99

 

98

90

134
106

98
91

.. iee.. :

et

95

90

':'::::::.: . *

gar

92

94

lie"

91

101

94

.

pa

IN: ..... 140

131

 
 

155

131

129

no

M 111

111

 

107

122

112

ME:::.... .........:

sy

99

97

92

NE

123

97

E:,

jo

110

106

:::e....

105

125

108

ee >. ".....

ce

110

100

 
 

132

99

.

fem reg

ni:,,..:71 89

87 84

119

87

 

mal reg

MiWir 103

97 96

90 ki:!::::::: 87

..........,........,

110
118

97
91

:i..i::..

tot reg 96

fem 103

99

...:

.
·

95

124

99

 

mal

115

113

Mil

109

126

113

::13;:;,'

tot

109

106

kn:..

102

125

106

Mi..: .... -

Résultats pour chaque paramètres pour BA

ter paramètre 2ème paramètre 3ème paramètre

Regroupement F2 E2 A2 T2 Fl El Al T1

111 1er paramètre Ri 2ème paramètre Fi 3ème paramètre
Résultats pour chaque paramètres pour CO

F2 I E2 I A2 I T2 I Fl I El

Regroupement

Al Ti

81

lo j 116

va 103

gal

84

104

80

84

127

116

121

120

103

117

97

102

97

...
· ...

el

94

108

94

95

128 120

131

137

130

gar

84 111

89

111

85

89

pa

no 78 79

78

89

77

97

100

96

97

sy

144

jo

95 92

91

96

91

ce 117

111

140

109

110

fem reg

93 85

79 ......

96 85 86

mal reg

74

92

80

74

73

89

69

tot reg

73

103 Meg

99

fem

112 97 99

mal

97

100

114

95

100

100

100

113

96

tot

100

Résultats pour chaque paramètres pour LA 1er paramètre R. 2ème paramètre 3ème paramètre

Regroupement IJ F2

E2

T2 F1

El Al

T1

gal

116

127 115 eg

116

114

lo

108

105

106

121

119

129
135

115 95 143

117

118
111
82

112

110
93
93

va

el

119

120

118

110

114

111

gar


· ..

81

81

83

pa

114

112

113

no

J

111

115

112

sy

jo

94

106_,

93

94

96

92

93

101

ce

fem reg

87

88

84

84

92

mal reg

90

90

89

103 90

84

83

tot reg

82

87 83

fem

108

110

112

mal

107

105

104

117 104

108

115

tot

Nom et prénom du candidat : GALLEGO Stéphane

Titre du mémoire de recherche :

IMPORTANCE DES PARAMETRES DU CODAGE POUR LA RECONNAISSANCE
DE VOYELLES CHEZ LES PATIENTS IMPLANTES COCHLEAIRES

Résumé en français du mémoire de recherche :

Dans ce travail on compare la reconnaissance acoustique de sujets porteurs d'implant cochléaire avec des modèles construits sur les caractères électriques de l'excitation. Il s'agit de repérer les éléments qui peuvent expliquer les performances des patients à l'étage acoustique. Au total, 255 modèles ont été construits, modèles qui sont basés sur une métrique euclidienne et sur une logique floue. Les meilleurs résultats ont été obtenus avec la logique floue.

Quatre patients et dix locuteurs ont participé à cette étude; ils ont prononcé des listes de 48 items basés sur les voyelles /Y, /u/, /a/ et le/, prises en ordre aléatoire.

Les résultats montrent que l'importance du premier formant ( amplitude et position ), est habituellement sous-estimée et que les logiques de reconnaissance varient avec le patient. Ces résultats sont importants pour orienter le réglage des machines.

Résumé en anglais du mémoire de recherche :

In this study a comparison betwen the acoustic recognition made par subjects fitted with a cochlear implant and the performances of models constructed on the electrical features of the excitating pulses is performed. The aim is the determination of elements able to provide an explanation on how the recognition is made by patients at the acoustical stage. Altogether, 255 models where constructed; they were base upon an euclidian metric or a fuzzy logic.

Four patients and 10 speakers collaborated to this experiment. Best results were obtained with the fuzzy logic; 48-item lists were spoken, based on vowels /i/, /u/, /a/ and /3/ arranged in a random order.

Results show that the importance of the first formant ( amplitude and electrode number ) is usually under estimated, and that recognition strategies depend on the patient. This point is important for the setting of the speech processor.

Mots-clefs : IMPLANT COCHLEAIRE / LOGIQUE_FLOUE, MODELE / CARACTERE_ELECTRIQUE / LOGIQUE_DE_RECONNAISSANCES / RECONNAISSANCE_DE_VOYELLES.

Composition du jury de soutenance de mémoire :

Professeur CLECHET Professeur COLLET Professeur COLLOMBEL Professeur DEMONGEOT Docteur DEPEURSINGE

Monsieur DITTMAR Professeur GOU I lt, Madame MAGNIN Monsieur PERNIER Docteur RUS CH

Coordonnées personnelles de l'auteur :

69100 VILLEURBANNE






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Il faudrait pour le bonheur des états que les philosophes fussent roi ou que les rois fussent philosophes"   Platon