1.2.3 Niveaux de complexité
La parole est un signal très complexe et son traitement
est un problème très difficile. Les sources de complexité
sont de natures différentes, elles peuvent être liées au
locuteur, à l'environnement sonore ou au signal lui-même.
Il y a d'abord le problème de la variabilité
intra et inter-locuteurs. Le système est-il dépendant du locuteur
ou indépendant du locuteur? Evidemment, les systèmes
dépendants du locuteur sont plus faciles à développer et
sont caractérisés par de meilleurs taux de reconnaissance que les
systèmes indépendants du locuteur étant donné que
la variabilité du signal de parole est plus limitée. Cette
dépendance au locuteur est cependant acquise au prix d'un
entraînement spécifique à chaque utilisateur.
Le système reconnaît-il des mots isolés ou
de la parole continue? Evidemment, il est plus simple de reconnaître des
mots isolés bien séparés par des périodes de
silence que de reconnaître la séquence de mots constituant une
phrase. En effet, dans ce dernier cas, non seulement la frontière entre
mots n'est plus connue mais, de plus, les mots deviennent fortement
articulés. Dans le cas de la parole continue, le niveau de
complexité varie également selon qu'il s'agisse de texte lu, de
texte parlé ou, beaucoup plus difficile, de langage naturel avec ses
hésitations, phrases grammaticalement incorrectes, faux départs,
etc.
La taille du vocabulaire et son degré de confusion sont
également des facteurs importants. Les petits vocabulaires sont
évidemment plus faciles à reconnaître que les grands
vocabulaires, étant donné que dans ce dernier cas, les
possibilités de confusion augmentent. Certains petits vocabulaires
peuvent cependant s'avérer particulièrement difficiles à
traiter; ceci est le cas, par exemple, pour l'ensemble des lettres de
l'alphabet, contenant surtout des mots très courts et acoustiquement
proches.
Le système est-il robuste, c'est-à-dire capable de
fonctionner proprement dans des conditions difficiles? En effet, de nombreuses
variables peuvent affecter significati-
vement les performances des systèmes de reconnaissance
bruits d'environnement, acoustique déformé et bruits
corrélés avec le signale de parole utile, systèmes
d'acquisition de différents caractéristiques, bande
fréquentielle limitée, etc.
|