WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Algorithmes évolutionnaires dans les systèmes de parole

( Télécharger le fichier original )
par Mohamed Oulmahdi
Université Aberrahmane Mira de BéjaàŻa Algérie - Master recherche informatique 2011
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

Table des figures

1.1

Classification morphologique des signaux

4

1.2

phonèmes du français, symboles de l'alphabet phonétique international

10

1.3

Echelle de Mel

15

1.4

Exemple de graphe de décodage

17

1.5

Exemple de classification phonétique

17

1.6

Chemin optimal par DTW

18

1.7

Exemple de découpage syntaxique

21

2.1

Cycle de base d'un algorithme évolutionnaire

25

3.1

Schéma d'un croisement direct

39

3.2

Exemples de création par la méthode Full

42

3.3

Exemples de création par la méthode Grow

42

3.4

Différentes possibilités de Mutation

44

3.5

Recombinaison par échange de sous-arbres

44

3.6

Permutation

44

3.7

Encapsulation

45

3.8

Permutation

45

3.9

Permutation

46

4.1

Résumé récapitulatif de l'analyse comparative

58

Depuis l'arrivée des premières générations des ordinateurs, l'idée de les contrôler à travers des claviers avec un jeu de caractère restreint a toujours été remise en cause. Le rêve de communiquer avec les machines de façon plus sophistiquée, plus naturelle et spontanée n'a cessé de submerger l'esprit humain. Dans les années 50, cette idée a commencée à devenir une réalité, grâce à des réalisations qui ont permis de contrôler le fonctionnement d'un ordinateur avec un nombre très limité de commandes orales, qu'il comprenait.

Avec toute l'évolution que les systèmes de parole ont connue depuis cette époque, les résultats obtenus sont encore loin d'être idéal, et le domaine demeure un sujet de recherche très actif. Les ordinateurs n'ont plus maintenant à faire à des données exactes telles que les caractères et les nombres, mais plutôt à des données de nature très variable. Pour cette raison, tous les systèmes de paroles doivent passer par des périodes d'apprentissage durant lesquelles ils apprennent à faire face à ce problème de variabilité, en utilisant le plus souvent des méthodes statistiques et probabilistes. En fait, une étape d'apprentissage n'est pas tout à fait suffisante, le problème doit encore être affronté lors de la phase de reconnaissance pour estimer les correspondances entre les données déjà apprises et les nouvelles données. Il en résulte par conséquent un travail important de calcul et d'optimisation.

Etant donné qu'il n'existe pas de méthodes exactes plus efficaces, les systèmes de parole, quelque soit le modèle qui leur est adopté, ont toujours recours à des méthodes d'approximation (heuristiques) pour remédier à la complexité du calcul. Une famille importante de ces heuristiques, connues sous le nom d'Algorithmes évolutionnaires, a commencé à émerger il y a une trentaine d'années, et a pratiquement intégré tous les domaines scientifiques. Ces méthodes ont suivi une nouvelle approche inspirée du processus d'évolution naturelle, et se sont basées sur les principes d'évolution et de sélection. Avec cette approche très simple et intuitive, ces algorithmes ont pu fournir des résultats très intéressants là où ils ont été appliqués. Toutefois, les travaux sur les systèmes de parole qui sont fondés sur des algorithmes évolutionnaires ne sont pas nombreux. Le présent travail consiste en une analyse théorique des possibilités d'ap-

plication de ces algorithmes dans les systèmes de parole. Ces systèmes sont complexes et très compliqués; en conséquence de quoi, un modèle directe basé sur un algorithme évolutionnaire ne peut être défini. Nous étudierons donc la façon par laquelle ces algorithmes peuvent contribuer à l'amélioration de la qualité et de la performance des systèmes de parole, que ce soit durant l'apprentissage ou lors de a phase de traitement avec ses différent niveaux.

Ce document est divisé sur trois chapitres. Le premier présente un état de l'art général sur les systèmes de reconnaissance de la parole. Nous essayons de traiter d'un maximum d'aspect afin de pouvoir identifier toutes les possibilités d'application des algorithmes évolutionnaires. Nous traitons donc des caractéristiques du signal vocal, de ses niveaux ainsi que de son processus de traitement, de l'apprentissage et des traitements linguistiques.

Le second chapitre expose, de façon générale, les éléments de base des algorithmes évolutionnaires. Nous tentons de discuter chaque élément sans tenir compte d'une méthode particulière. A la fin, le chapitre récapitule l'ensemble des travaux, que nous avons pu réunir, sur les systèmes de parole qui ont utilisé des algorithmes évolutionnaires.

Dans les deux derniers chapitres, nous effectuons une étude comparative de deux méthodes particulières : les stratégies d'évolution et la programmation génétique. Dans le troisième chapitre, nous donnons une présentation détaillée des deux méthodes, et dans le dernier une analyse comparative. Dans le troisième chapitre aussi, nous proposons des possibilités de mise en oeuvre, pour chacune des deux méthodes, dans les différents modèles et niveaux de traitement.

En traitant d'un ensemble important d'aspects relatifs au traitement de la parole, et en choisissant deux types d'algorithmes évolutionnaires largement différents, nous espérons pouvoir couvrir un maximum de possibilités et de déceler les différentes options que peut offrir les algorithmes évolutionnaires pour les systèmes de parole.

1.1 Généralités sur les signaux

Un signal est la représentation physique de l'information qu'il transmet de sa source à sa destination. La nature physique du signal peut être de n'importe quelle grandeur mesurable (ondes acoustiques, signale optique, magnétique ou radioélectrique).

Les signaux peuvent être classés en de différents types selon différents critères. Si l'on considère la durée des signaux, on peut les diviser en des signaux à durée limitée et des signaux à durée illimitée. Ces derniers se décomposent à leur tour en des signaux à énergie finie, à puissance moyenne finie et des signaux causaux. Selon leur évolution, il existe des signaux déterministes (périodiques, pseudopériodiques et transitoires) dont l'évolution peut être parfaitement décrite par un model mathématique, contrairement aux signaux aléatoires dont le comportement est imprévisible dans le temps et pour la représentation desquels on doit se contenter des observations statistiques. Un autre mode de classification est selon la morphologie. On distingue des signaux analogiques, quantifiés, échantillonnés et numériques. Une dernière classification est suivant la représentation spectrale par laquelle un signal est classé par le domaine de variation de la fréquence moyenne (basse fréquence, haute fréquence...).[143]

Le signal qui véhicule l'information est fréquemment distordu. Cette distorsion peut prendre naissance à la prise du signale ou durant la transmission. On est donc fréquemment amené à filtrer le signal. Un filtre est un dispositif susceptible de privilégier les composantes d'un signal dont les fréquences sont situées dans un certain domaine, tout en affaiblissant les autres. Les filtres peuvent aussi être utilisés pour la mise en forme du signal. Ceci inclus toutes les modifications que l'on peut faire subir à un signal pour faire apparaitre certaines caractéristiques ou pour en masquer d'autres.

Les signaux primaires porteurs d'information sont pratiquement toujours de type analogique (amplitude et temps continu)[143]. Un système d'acquisition ou tout autres système traite des données sous forme de suite de nombre discrets. Le rôle de l'échantillonnage est de représenter le signal sous forme de suite de valeurs ponctuelles en procédant à un découpage, dans le temps, du signal.

FIGURE 1.1 - Classification morphologique des signaux

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Il existe une chose plus puissante que toutes les armées du monde, c'est une idée dont l'heure est venue"   Victor Hugo