1.5.2 Extraction des paramètres
L'extraction des paramètres est l'objet principal de
l'analyse de la parole et c'est le passage obligé de toutes les
applications de traitement de la parole.[113]
En considérant le degré de connaissance
associé au signal, il existe des méthodes d'extraction non
paramétriques qui sont basées généralement sur une
représentation fréquentielle du signal sans tenir compte de sa
structure fine. Les méthodes paramétriques ou les méthodes
d'identification en revanche, sont fondée sur une connaissance des
mécanismes de production de la parole. Elles reposent sur un model.
Celui-ci repose sur un ensemble de paramètres numériques, dont
les niveaux de variation représentent l'ensemble des signaux couverts
par le model. Pour un signal et un model donné, l'analyse estime les
paramètres du model pour lui faire correspondre le signal
analysé.
Selon que l'on prenne en compte l'évolution
fréquentielle ou temporelle du signal de la parole, on distingue des
méthodes d'analyse spectrales et des méthodes d'analyse
temporelles. L'analyse spectrale est basée sur deux principe : le
premier est que le timbre de la parole dépend de la position, dans
l'échelle des fréquences, des formant qui sont liés aux
résonnances du conduit vocal, le deuxième est le fait que le
spectre du signal vocal présente une certaine stabilité pendant
plusieurs centièmes ou même dixièmes de secondes. On pourra
donc appliquer une transformée de Fourrier aux intervalles de
stabilité du spectre et pouvoir isoler les différentes
fréquences qui le composent. L'analyse peut être
réalisée en utilisant des filtres analogique (unique ou multiples
en parallèle) ou des filtres numériques. Les filtres
numériques présentent une précision plus
élevée et plus de possibilité de simulation mais avec un
prix de complexité considérable.
L'analyse temporelle utilise le fait que certains
évènement, comme la fermeture brusque du conduit vocal, sont
mieux caractérisée par l'évolution temporelle du signal
que par son spectre. La fonction d'autocorrélaton, le taux de passage
à zéro et la prédiction sont les principales techniques
d'analyse temporelle.
L'analyse prédictive est sûrement la plus
utilisée. Le conduit vocal, filtrant le signal d'excitation, peut
être assimilé à un filtre récursif : avec une bonne
approximation, le signal émis à un instant donné peut
être calculé à partir des valeurs qu'il a prises aux
instants antérieurs (exploitation de l'aspect redondant de la
parole).
Les analyses fréquentielles exigent d'être
effectuées sur une durée suffisamment langue. Il en
résulte qu'elles sont peu adaptées à l'étude des
phénomènes évoluant rapidement. La prédiction
élimine une part importante de la redondance que présente le
signal de la parole et fait, par conséquent, débarrasser
l'analyse des éléments n'apportant pas de nouvelles
informations.
|