WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Importance des paramètres du codage pour la reconnaissance des voyelles chez les patients implantés cochléaires

( Télécharger le fichier original )
par Stéphane GALLEGO
Université Lyon I - DEA 1994
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

A/ Méthodes mathématiques.

Globalement nous pouvons dire que la logique floue, pour la reconnaissance de voyelles est meilleure que la métrique euclidienne car les modèles flous donnent toujours des résultats beaucoup plus proches du patient que les modèles euclidiens.

La distance de Hamming moyenne est de 85 pour le flou contre 106 pour l'euclidien. ( moyenne sur 10200 matrices.).

On peut aussi remarquer des similitudes importantes pour la reconnaissance entre les deux méthodes ce qui permet de valider les résultats d'un point de vue significativité. ( ceci en plus du grand nombre de données.).

B/ Etude acoustique.

L'étude acoustique montre que le plan F2F1 est le plus discriminant.

Nous pouvons aussi regarder les résultats paramètre par paramètre.( cf figure 16 ).

F2

41021L Idirmalle 41101MIMIL

MW/ IIIILWAIIPF 11111111111111

F1

d'eu Arenr rrenri.

w niummor nfflummour A2

I i 0 I 1 I I II In I r e -MA I I I I I I I I ri La--..0 gill I I I I I I W

'n1IMIIIIMMINallIM-4111.111.01rA1.1.

Al

4 I il "g - -I .1 2; 5 1 I I I I reled I 1 I I 1 I I I I I I .-- « e 11111 0 I II IIIIIIIIIIIIIIir.k

._. _1 _i miniblililliPOIWF F

BP2

- -

/utOteal

 

BPI

eallellillallir

\`.-- _nlielletiMMUI-M1111111111111111.1"11PI'

E2

KIEZZIK-...1111»./Mkr.

'ee
·._IIIIIII1Mbim..___`INMIIIIIIIIIIIMIIIMIIIIMOIP

El

Idereele:ill."--11111Mlibb.-..491.1

91 ll 1 IUI NI PA I I el il ._...
· MI I I 11.111 I I II I II II I I II I 1 I MW I I . ° w

Figure 16 : Représentation des sous ensembles de voyelles pour chaques paramètres

On peut les classer par ordre de discrimination des voyelles en trois groupes.

F2, FI sont les plus discriminants.

A2, BPI., El sont moyennement discriminants.

BP2, E2, Al ne sont pratiquement pas discriminants.

Théoriquement si l'I.C. joue son rôle d'oreille bionique, l'écoute du patient sera proche des modèles comportants les paramètres F2, FI, Al, Ti et El. Les paramètres Al, T2 et E2 seront théoriquement assez mauvais.

On peut seulement noter que F1 est sous-representer par l'I.C. car sa variation en numéro d'électrode est très faible par rapport à celle de F2. Cette constatation est regrettable car théoriquement Fi peut apporter une bonne contribution à la discrimination de voyelles.

C/ Patients.

Les résultats peuvent nous renseigner sur l'importance des paramètres pour chaque patient. Nous pouvons en déduire le tableau récapitulatif suivant.

Patient

Modèle Euclidien

Modèle flou

Moyenne

AM

F2, T2

Fl, E2, El

F2, T2, F 1

BA

E2, T2, T1

E2, El

E2, T2, El, T1

CO

F2, E2, F 1

F2, Fl

F2, Fl

LA

T2, Ti

T2, Ti

T2, Ti

Paramètres importants pour la reconnaissance des voyelles pour les patients

Nous pouvons constater que seuls AM et CO privilégient les formants pour la reconnaissance de voyelles. Les patients BA et LA utilisent plutôt T1 et T2.

Les résultats obtenus dans C/ 1/ b/ nous donnent des informations sur la qualité de reconnaissance par sexe du locuteur.

Le tableau ci-dessous nous donne la moyenne des distances de Hamming par sexe du locuteur. Chaque valeur est une moyenne de 5100 distances par méthode et 10200 distances pour la moyenne.

Sexe

Euclidien

Flou

moyenne

Femme

103

81

92

Homme

108

90

99

Distances moyennes de Hamming par sexe du locuteur.

74%

 

A

I

U

E

A

31

0

1

28

I

0

59

0

1

U

0

1

58

1

E

5

7

18

30

CO

64%d

 

A

I

U

E

A

28

0

12

20

I

0

60

0

0

U

6

0

35

19

E

7

0

22

31

36% I

Matrices de reconnaissance des patients pour les locuteurs feminins. La moyenne est de 54% de reconnaissance. (960 données).

CO

BA

 

A

I

U

E

A

23

11

6

20

I

9

21

17

13

U

10

18

20

12

E

21

9

7

23

AM

 

A

I

U

E

A

17

0

3

40

I

6

24

2

28

U

0

0

56

4

E

3

0

14

43

58%

BA

32%

 

A

I

U

E

A

26

12

10

12

I

11

14

21

14

U

10

16

23

11

E

24

11

11

14

LA

42% I

 

A

I

U

E

A

26

10

3

21

I

1

18

23

18

U

2

20

29

9

E

24

3

5

28

1

 

A

I

U

E

A

32

0

19

9

I

0

54

2

4

U

7

0

37

16

E

7

6

8

39

68%

LA

45% I

 

A

I

U

E

A

39

1

9

11

I

11

20

11

18

U

0

21

22

17

E

15

6

12

27

Matrices de reconnaissance des patients pour les locuteurs masculins.

La moyenne est de 51% de reconnaissance pour les locuteurs hommes. (960 données.)

Ces données montrent que les modèles se rapprochent le mieux du patient pour les locuteurs feminins que pour les masculins. Ce qui semblerait nous montrer que les patients comprennent les femmes que le hommes. Ce résultat semble être montré par les matrices de reconnaissances.

Les résultats donnent aussi des renseignements sur la qualité moyenne des modèles pour chaque patient. Chaque distance moyenne du tableau ci-dessous est calculée sur 2550 données par méthode et 5100 données par classement.

Patients

Euclidien

Flou

Moyenne

Classement

AM

105

80

92.5

2

BA

115

94

104.5

3

CO

96

80

88

1

LA

106

87

96.5

4

Distance moyenne de Hamming pour chaque patient

Le classement donne, par ordre croissant la qualité de représentation des modèles pour chaque patient.

On peut discuter globalement sur la qualité de reconnaissance des voyelles en établissant les matrices de reconnaissances des patients.

66% I

34% I

AM

 

A

I

U

E

A

48

0

4

68

I

6

83

2

29

U

0

1

114

5

E

8

7

32

73

BA

 

A

I

U

E

A

49

23

16

32

I

20

35

38

27

U

20

34

43

23

E

45

20

18

37

CO

 

A

I

U

E

A

60

0

31

29

I

0

114

2

4

U

13

0

72

35

E

14

4

32

70

66%

LA

44% I

 

A

I

U

E

A

65

11

12

32

I

12

38

34

36

U

2

41

51

26

E

39

9

17

55

Matrices de reconnaissances des patients.

Nous voyons qu'il y a une similitude entre la qualité de reconnaissance des patients et la qualité des modèles d'écoute par rapport au patient.

Analyse des modèles proches de l'écoute des patients en fonction des réglages des patients.

Comme nous l'avons dit auparavant, nous pouvons séparer les patients en deux groupes, ceux qui utilisent principalement les formants pour la reconnaissance ( AM, CO) et ceux qui n'en tiennent pratiquement pas compte ( BA, LA ).

Ceci est un fait, mais il faudrait savoir pourquoi BA et LA n'utilisent pratiquement pas les paramètres les plus importants vis à vis de la théorie phonétique?

Nous allons passer brièvement sur les patients AM et CO car leur écoute peut se modéliser principalement par F 1 et F2, résultats auquel on s'attendait.

Pour LA, nous pouvons aussi expliquer le fait qu'il n'utilise pratiquement pas F 1 et F2 car lorsque l'on regarde ses réglages ( page 40 ), on s'aperçoit qu'il ne dispose que de 5 électrodes actives sur 22. Il doit donc s'aider des autres paramètres ( A, T, E) pour pouvoir écouter.

Pour BA, cela parait incompréhensible, puisqu'il a 22 électrodes actives mais il ne se sert pas de ce potentiel pour écouter.

Nous pensons que le patient BA ne discrimine pas les voyelles par les formants car ce patient est devenu sourd à l'âge de 18 mois. Il est resté sourd pendant 38 ans. Il n'a pratiquement pas eu d'apprentissage de la discrimination fréquentielle. Il faudrait donc accentuer les différences fréquentielles par les réglages et la rééducation pour pouvoir l'aider à apprendre la discrimination fréquentielle.

CONCLUSION

La modélisation de la reconnaissance des voyelles par des patients porteurs d'un implant cochléaire a montré que :

0 . l'utilisation d'une métrique floue rend mieux compte de l'écoute des patients

implantés que la métrique euclidienne. Ce résultat est intéressant car la logique floue est par définition basée sur le raisonnement humain.

. le second formant est globalement le paramètre le plus important pour la compréhension des patients, mais ceci n'est pas le cas lorsque les patients sont pris séparement.

. Le modèle F1F2 n'est pas toujours le plus représentatif de l'écoute des patients implantés. L'adaptation des stratégies de reconnaissance au patient semble être un point à étudier dans le futur.

. F 1 semble être mal exploité par l'implant cochléaire alors que l'étude acoustique laisse penser qu'il permettrait de bien discriminer les voyelles.

La souplesse de codage dans les implants cochléaires semble donc être une des qualités importantes que l'on demande aux machines d'aujourd'hui.

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Aux âmes bien nées, la valeur n'attend point le nombre des années"   Corneille