SECTION 2 :
FONCTIONNEMENT
2.1.
Principe
Le principe de la téléphonie sur IP est la
numérisation de la voix, c'est-à-dire le passage d'un signal
analogique à un signal numérique. Celui-ci est
compressé en fonction des codecs choisis, cette compression a comme
but de réduire la quantité d'information qui est transmise sur
le réseau. Le signal obtenu est découpé en paquets,
à chaque paquet on ajoute les entêtes propres au réseau
(IP, UDP, RTP....) et pour finir il est envoyé sur le réseau.
A l'arrivée, les paquets transmis sont
réassemblés en supprimant d'abord les entêtes. Le signal
de données ainsi obtenu est décompressé puis converti en
signal analogique afin que l'utilisateur puisse écouter le message
d'origine.
2.2. Architecture de
transmission VoIP
La technologie de la voix sur IP (VoIP pour Voice over IP)
nous présente une architecture découpée en 8 grandes
étapes :
Figure 3 : 8 étapes de la voix à IP
2.2.1 Acquisition du
signal
La VoIP suppose la transformation d'un signal continu
analogique (la voix) en un signal discret numérique (composé
d'une série de chiffres). La première étape consiste
naturellement à capter la voix à l'aide d'un micro, qu'il
s'agisse de celui d'un téléphone ou d'un micro casque.
2.2.2
Numérisation
La voix passe alors dans un convertisseur analogique
numérique qui réalise deux tâches distinctes :
· l'échantillonnage du signal sonore,
c'est-à-dire un prélèvement périodique de ce signal
;
· la quantification, qui consiste à affecter
une valeur numérique (en binaire) à chaque échantillon.
Plus les échantillons sont codés sur un nombre de bits important,
meilleure sera la qualité (on parle de «résolution») de
la conversion. Généralement, la voix est
échantillonnée à 8 kHz et chaque échantillon est
codé sur 8 bits, ce qui donne un débit de 64 kbit/s (norme
G711).
2.2.3
Compression
Le signal une fois numérisé peut être
traité par un DSP (Digital Signal Processor) qui va le compresser,
c'est-à-dire réduire la quantité d'informations (bits)
nécessaire pour l'exprimer. Plusieurs normes de compression et
décompression (Codecs) sont utilisées pour la voix. L'avantage de
la compression est de réduire la bande passante nécessaire pour
transmettre le signal.
2.2.4 Habillage des
en-têtes
Les données «brutes» qui sortent du DSP
doivent encore être enrichies en informations avant d'être
converties en paquets de données à expédier sur le
réseau. Trois «couches» superposées sont
utilisées pour cet habillage :
La couche IP
La couche IP correspond à l'assemblage des
données en paquets. Chaque paquet commence par un en-tête
indiquant le type de trafic concerné, ici du trafic UDP.
La couche UDP
La deuxième couche, UDP, consiste à formater
très simplement les paquets. Si l'on restait à ce stade, leur
transmission serait non fiable : UDP ne garantit ni le bon acheminement des
paquets, ni leur ordre d'arrivée.
La couche RTP (Real Time Protocol) / RTCP (Real Time
Control Protocol)
Pour palier l'absence de fiabilité d'UDP, un formatage
RTP est appliqué de surcroît aux paquets. Il consiste à
ajouter des entêtes d'horodatage et de synchronisation pour s'assurer du
réassemblage des paquets dans le bon ordre à la réception.
RTP est souvent renforcé par RTCP qui comporte, en plus, des
informations sur la qualité de la transmission et l'identité des
participants à la conversation.
2.2.5 Emission et
transport
Les paquets sont acheminés depuis le point
d'émission pour atteindre le point de réception sans qu'un chemin
précis soit réservé pour leur transport. Ils vont
transiter sur le réseau (réseau local, réseau
étendu voire Internet) en fonction des ressources disponibles et arriver
à destination dans un ordre indéterminé.
2.2.6
Réception
Lorsque les paquets arrivent à destination, il est
essentiel de les replacer dans le bon ordre et assez rapidement. Faute de quoi
une dégradation de la voix se fera sentir. Ce point sera
détaillé plus loin.
2.2.7 Conversion
numérique analogique
La conversion numérique analogique est l'étape
réciproque de l'étape 2, qui permet de transformer les
données reçues sous forme de série discrète en un
signal électrique «continu».
2.2.8
Restitution
Dès lors, la voix peut être retranscrite par le
haut-parleur du casque, du combiné téléphonique ou de
l'ordinateur.
|