WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Algorithmes évolutionnaires dans les systèmes de parole

( Télécharger le fichier original )
par Mohamed Oulmahdi
Université Aberrahmane Mira de BéjaàŻa Algérie - Master recherche informatique 2011
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

1.2 Le signal vocal

Le signal vocal correspond à une variation de la pression de l'aire causée par le système articulatoire. Le phénomène s'accompagne d'une propagation d'énergie entre la source et le destinataire. Cette propagation est impossible dans le vide et sa vitesse ne dépond que de la nature du milieu et de ses caractéristiques physiques. Ces milieux ne transmettent que les ondes dont les fréquences ont des valeurs bien précises : c'est le phénomène d'amortissement.

Le signal vocal possède plusieurs propriétés : il est produit par l'homme, il est très variable du fait de la diversité phonétique et il est modifié par l'environnement sonore. Ces propriétés font du signal vocal un signal complexe, variable et souvent bruité.[113]

1.2.1 Caractéristiques déterminantes

Le signal vocal forme une résonnance lorsque les fréquences du signal peuvent être modélisées comme des multiples d'une fréquence de base appelée fréquence fondamentale. Les différents multiples de cette fréquence sont appelés des harmoniques.

Pour le signale vocale, la fréquence fondamentale est celle à laquelle la glotte s'ouvre et se ferme périodiquement.[82]

Chaque phonème contient un grand nombre d'harmoniques dont les amplitudes relatives dépendent de la configuration du conduit vocal. Ils présentent donc un timbre. Ce timbre est lié à la position, à l'amplitude et la largeur de bande des maxima du spectre. La production d'un phonème fait apparaître une ou plusieurs résonnances qu'on regroupe sous le nom de formants. La position des fréquences formantiques, pour un locuteur donné, peut varier d'une élocution à l'autre, même dans le même contexte. Mais elles varient beaucoup plus encor entre un locuteur et un autre.

1.2.2 Informations véhiculées par la parole

La parole transmet plusieurs types d'informations : linguistiques, paralinguistiques mais aussi extralinguistiques. La transmission d'informations linguistiques est le premier objectif de la parole. Cependant, les informations paralinguistiques comme l'intonation modifient et ajoutent des éléments utiles pour la compréhension. Les informations dites extralinguistiques comme les variabilités dues aux locuteurs sont souvent des facteurs qui perturbent les systèmes.[63]

Les informations linguistiques sont de plusieurs types. Un message est composé de phrases, de mots. Chacun de ces mots peut être décomposé en syllabes. La syllabe est une combinaison de phonèmes dont le noyau est une voyelle parfois entourée de plusieurs consonnes. Le phonème est la plus petite unité segmentale distinctive. Le phonème n'est pas un élément unique en lui même. Pour un même phonème, on pourra trouver différentes variantes acoustiques appelées allophones. Il existe donc des traits caractéristiques communs ou discriminants que l'on peut exploiter dans la tâche d'extraction de caractéristiques.

Les informations paralinguistiques regroupent les composantes du signal de parole qui ne sont pas à proprement parler des informations linguistiques. Souvent, elles permettent une meilleure compréhension du contexte linguistique. L'intonation est un exemple d'information paralinguistique utile à la compréhension. Une phrase selon qu'elle soit prononcée de manière déclarative ou interrogative peut changer sensiblement de sens. Des variabilités dues aux locuteurs sont également comprises dans les informations paralinguistiques. L'état émotif, affectif et l'attitude du locuteur sont des exemples de ces variabilités. Le niveau social ainsi que l'accent régional sont également des informations paralinguistiques. Par définition, les émotions ne sont pas contrôlables par le locuteur. Quant aux autres informations paralinguistiques comme le ni-

veau social, le locuteur ne contrôle pas ces informations dans le cas d'une conversation naturelle.

De nombreuses autres informations dites extralinguistiques sont présentes dans le signal de parole. Elles transmettent essentiellement des caractéristiques propres aux locuteurs comme le genre ou l'âge. L'environnement sonore, Les conditions de prise de son et le canal de transmission sont des exemples d'informations extralinguistiques.

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Il ne faut pas de tout pour faire un monde. Il faut du bonheur et rien d'autre"   Paul Eluard