Algorithmes évolutionnaires dans les systèmes de parole

( Télécharger le fichier original )
par Mohamed Oulmahdi
Université Aberrahmane Mira de Béjaà¯a Algérie - Master recherche informatique 2011

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

1.5.2 Extraction des paramètres

L'extraction des paramètres est l'objet principal de l'analyse de la parole et c'est le passage obligé de toutes les applications de traitement de la parole.[113]

En considérant le degré de connaissance associé au signal, il existe des méthodes d'extraction non paramétriques qui sont basées généralement sur une représentation fréquentielle du signal sans tenir compte de sa structure fine. Les méthodes paramétriques ou les méthodes d'identification en revanche, sont fondée sur une connaissance des mécanismes de production de la parole. Elles reposent sur un model. Celui-ci repose sur un ensemble de paramètres numériques, dont les niveaux de variation représentent l'ensemble des signaux couverts par le model. Pour un signal et un model donné, l'analyse estime les paramètres du model pour lui faire correspondre le signal analysé.

Selon que l'on prenne en compte l'évolution fréquentielle ou temporelle du signal de la parole, on distingue des méthodes d'analyse spectrales et des méthodes d'analyse temporelles. L'analyse spectrale est basée sur deux principe : le premier est que le timbre de la parole dépend de la position, dans l'échelle des fréquences, des formant qui sont liés aux résonnances du conduit vocal, le deuxième est le fait que le spectre du signal vocal présente une certaine stabilité pendant plusieurs centièmes ou même dixièmes de secondes. On pourra donc appliquer une transformée de Fourrier aux intervalles de stabilité du spectre et pouvoir isoler les différentes fréquences qui le composent. L'analyse peut être réalisée en utilisant des filtres analogique (unique ou multiples en parallèle) ou des filtres numériques. Les filtres numériques présentent une précision plus élevée et plus de possibilité de simulation mais avec un prix de complexité considérable.

L'analyse temporelle utilise le fait que certains évènement, comme la fermeture brusque du conduit vocal, sont mieux caractérisée par l'évolution temporelle du signal que par son spectre. La fonction d'autocorrélaton, le taux de passage à zéro et la prédiction sont les principales techniques d'analyse temporelle.

L'analyse prédictive est sûrement la plus utilisée. Le conduit vocal, filtrant le signal d'excitation, peut être assimilé à un filtre récursif : avec une bonne approximation, le signal émis à un instant donné peut être calculé à partir des valeurs qu'il a prises aux instants antérieurs (exploitation de l'aspect redondant de la parole).

Les analyses fréquentielles exigent d'être effectuées sur une durée suffisamment langue. Il en résulte qu'elles sont peu adaptées à l'étude des phénomènes évoluant rapidement. La prédiction élimine une part importante de la redondance que présente le signal de la parole et fait, par conséquent, débarrasser l'analyse des éléments n'apportant pas de nouvelles informations.

précédent sommaire suivant

"Le doute est le commencement de la sagesse" Aristote