Table des figures
1.1
|
Classification morphologique des signaux
|
4
|
1.2
|
phonèmes du français, symboles de l'alphabet
phonétique international
|
10
|
1.3
|
Echelle de Mel
|
15
|
1.4
|
Exemple de graphe de décodage
|
17
|
1.5
|
Exemple de classification phonétique
|
17
|
1.6
|
Chemin optimal par DTW
|
18
|
1.7
|
Exemple de découpage syntaxique
|
21
|
2.1
|
Cycle de base d'un algorithme évolutionnaire
|
25
|
3.1
|
Schéma d'un croisement direct
|
39
|
3.2
|
Exemples de création par la méthode Full
|
42
|
3.3
|
Exemples de création par la méthode Grow
|
42
|
3.4
|
Différentes possibilités de Mutation
|
44
|
3.5
|
Recombinaison par échange de sous-arbres
|
44
|
3.6
|
Permutation
|
44
|
3.7
|
Encapsulation
|
45
|
3.8
|
Permutation
|
45
|
3.9
|
Permutation
|
46
|
4.1
|
Résumé récapitulatif de l'analyse
comparative
|
58
|
Depuis l'arrivée des premières
générations des ordinateurs, l'idée de les contrôler
à travers des claviers avec un jeu de caractère restreint a
toujours été remise en cause. Le rêve de communiquer avec
les machines de façon plus sophistiquée, plus naturelle et
spontanée n'a cessé de submerger l'esprit humain. Dans les
années 50, cette idée a commencée à devenir une
réalité, grâce à des réalisations qui ont
permis de contrôler le fonctionnement d'un ordinateur avec un nombre
très limité de commandes orales, qu'il comprenait.
Avec toute l'évolution que les systèmes de
parole ont connue depuis cette époque, les résultats obtenus sont
encore loin d'être idéal, et le domaine demeure un sujet de
recherche très actif. Les ordinateurs n'ont plus maintenant à
faire à des données exactes telles que les caractères et
les nombres, mais plutôt à des données de nature
très variable. Pour cette raison, tous les systèmes de paroles
doivent passer par des périodes d'apprentissage durant lesquelles ils
apprennent à faire face à ce problème de
variabilité, en utilisant le plus souvent des méthodes
statistiques et probabilistes. En fait, une étape d'apprentissage n'est
pas tout à fait suffisante, le problème doit encore être
affronté lors de la phase de reconnaissance pour estimer les
correspondances entre les données déjà apprises et les
nouvelles données. Il en résulte par conséquent un travail
important de calcul et d'optimisation.
Etant donné qu'il n'existe pas de méthodes
exactes plus efficaces, les systèmes de parole, quelque soit le
modèle qui leur est adopté, ont toujours recours à des
méthodes d'approximation (heuristiques) pour remédier à la
complexité du calcul. Une famille importante de ces heuristiques,
connues sous le nom d'Algorithmes évolutionnaires, a commencé
à émerger il y a une trentaine d'années, et a pratiquement
intégré tous les domaines scientifiques. Ces méthodes ont
suivi une nouvelle approche inspirée du processus d'évolution
naturelle, et se sont basées sur les principes d'évolution et de
sélection. Avec cette approche très simple et intuitive, ces
algorithmes ont pu fournir des résultats très intéressants
là où ils ont été appliqués. Toutefois, les
travaux sur les systèmes de parole qui sont fondés sur des
algorithmes évolutionnaires ne sont pas nombreux. Le présent
travail consiste en une analyse théorique des possibilités
d'ap-
plication de ces algorithmes dans les systèmes de
parole. Ces systèmes sont complexes et très compliqués; en
conséquence de quoi, un modèle directe basé sur un
algorithme évolutionnaire ne peut être défini. Nous
étudierons donc la façon par laquelle ces algorithmes peuvent
contribuer à l'amélioration de la qualité et de la
performance des systèmes de parole, que ce soit durant l'apprentissage
ou lors de a phase de traitement avec ses différent niveaux.
Ce document est divisé sur trois chapitres. Le premier
présente un état de l'art général sur les
systèmes de reconnaissance de la parole. Nous essayons de traiter d'un
maximum d'aspect afin de pouvoir identifier toutes les possibilités
d'application des algorithmes évolutionnaires. Nous traitons donc des
caractéristiques du signal vocal, de ses niveaux ainsi que de son
processus de traitement, de l'apprentissage et des traitements
linguistiques.
Le second chapitre expose, de façon
générale, les éléments de base des algorithmes
évolutionnaires. Nous tentons de discuter chaque élément
sans tenir compte d'une méthode particulière. A la fin, le
chapitre récapitule l'ensemble des travaux, que nous avons pu
réunir, sur les systèmes de parole qui ont utilisé des
algorithmes évolutionnaires.
Dans les deux derniers chapitres, nous effectuons une
étude comparative de deux méthodes particulières : les
stratégies d'évolution et la programmation
génétique. Dans le troisième chapitre, nous donnons une
présentation détaillée des deux méthodes, et dans
le dernier une analyse comparative. Dans le troisième chapitre aussi,
nous proposons des possibilités de mise en oeuvre, pour chacune des deux
méthodes, dans les différents modèles et niveaux de
traitement.
En traitant d'un ensemble important d'aspects relatifs au
traitement de la parole, et en choisissant deux types d'algorithmes
évolutionnaires largement différents, nous espérons
pouvoir couvrir un maximum de possibilités et de déceler les
différentes options que peut offrir les algorithmes
évolutionnaires pour les systèmes de parole.
1.1 Généralités sur les signaux
Un signal est la représentation physique de
l'information qu'il transmet de sa source à sa destination. La nature
physique du signal peut être de n'importe quelle grandeur mesurable
(ondes acoustiques, signale optique, magnétique ou
radioélectrique).
Les signaux peuvent être classés en de
différents types selon différents critères. Si l'on
considère la durée des signaux, on peut les diviser en des
signaux à durée limitée et des signaux à
durée illimitée. Ces derniers se décomposent à leur
tour en des signaux à énergie finie, à puissance moyenne
finie et des signaux causaux. Selon leur évolution, il existe des
signaux déterministes (périodiques, pseudopériodiques et
transitoires) dont l'évolution peut être parfaitement
décrite par un model mathématique, contrairement aux signaux
aléatoires dont le comportement est imprévisible dans le temps et
pour la représentation desquels on doit se contenter des observations
statistiques. Un autre mode de classification est selon la morphologie. On
distingue des signaux analogiques, quantifiés,
échantillonnés et numériques. Une dernière
classification est suivant la représentation spectrale par laquelle un
signal est classé par le domaine de variation de la fréquence
moyenne (basse fréquence, haute fréquence...).[143]
Le signal qui véhicule l'information est
fréquemment distordu. Cette distorsion peut prendre naissance à
la prise du signale ou durant la transmission. On est donc fréquemment
amené à filtrer le signal. Un filtre est un dispositif
susceptible de privilégier les composantes d'un signal dont les
fréquences sont situées dans un certain domaine, tout en
affaiblissant les autres. Les filtres peuvent aussi être utilisés
pour la mise en forme du signal. Ceci inclus toutes les modifications que l'on
peut faire subir à un signal pour faire apparaitre certaines
caractéristiques ou pour en masquer d'autres.
Les signaux primaires porteurs d'information sont pratiquement
toujours de type analogique (amplitude et temps continu)[143]. Un
système d'acquisition ou tout autres système traite des
données sous forme de suite de nombre discrets. Le rôle de
l'échantillonnage est de représenter le signal sous forme de
suite de valeurs ponctuelles en procédant à un découpage,
dans le temps, du signal.
FIGURE 1.1 - Classification morphologique des signaux
|