REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET
POPULAIRE
MINISTRE DE L'ENSEIGNEMENT SUPERIEUR ET DE LA
RECHERCHE
SCIENTIFIQUE
UNIVERSITE MOHAMED KHIDER- BISKRA
FACULTE DES
SCIENCES ET SCIENCES DE L'INGENEUR
DEPARTEMENT D'AUTOMATIQUE
Mémoire de fin d'étude
Pour l'obtention du
diplôme
D'ingénieur d'état en automatique
Thème:
Compression des images animées
par le codage EZW 3D
Réalisé par : Encadré
par :
- Guenidi Sif Eddine - Mr. Zitouni Athmane
- Kebairi Athmane
Année 2007/2008
L'utilisation d'images numériques est devenue de plus
en plus répandue. Les programmes multimédias modernes qui sont
développés de nos jours contiennent des centaines sinon des
milliers d'images, et de vidéo ceci exige des espaces mémoires
plus importants.
La nécessité de la compression dans les
applications de l'imagerie à donnée naissance a des nouvelles
méthodes qui garantissent des résultats optimaux. Parmi ces
méthodes le sujet de ce mémoire : le codage EZW 3D (Embedded
Zero-Tree Wavelet).
Dans notre travail on a vu les différents aspects de
la transformée en ondelette tridimensionnelles. Suivi d'une étude
du codage EZW 3D qui se démarque par les avantages suivants :
· L'utilisation des propriétés de l'analyse
multirésolution en ondelettes (multiresolution wavelet transform ).
· Garde un flux emboîté (Embedded) car le
codage peut être arrêté à tout moment pour avoir la
qualité désirée.
· Il se base sur la structure de l'arbre du zéro
(Zero-Tree ) pour faire diminuer considérablement la taille des
données .
Le travail a été appliqué sur deux
séquences d'images biomédicales (IRM) et les résultats
sont satisfaisants des points de vue qualité et compression des images
reconstituées.
Introduction générale
Soucieux de son confort, l'homme n'hésite pas
à exploiter à l'épuisement tous les moyens qui peuvent lui
rendre la vie plus simple et plus facile. Parmi ces moyens la communication qui
se dresse en tête de liste ,
· celle-ci se caractérise par
une importante consommation de l'information.
Le volume d'informations de toute nature
(téléphone, images, documents écrits ,
·
données diverses) produit et diffusée quotidiennement est un
facteur en forte expansion ces dernières années.
Par conséquence la mise en place de nouveaux
systèmes de communications ,
· de transmission et d'archivage.
Le coût de tels systèmes croit avec le volume d'informations
à transmettre ou à stocker.
Le besoin de transmettre ou stocker des images croit
rapidement avec le développement des communications modernes.
Le terme « images » est pris ici dans sont sens le
plus large.
Il ne s'agit plus de simples images prises avec des
appareils photo mais d'imagerie médicale, d'images satellitaires
etc...., ces types d'images contiennent beaucoup d'informations utiles et doit
être traité comme tel
Afin d'utiliser au mieux les moyens actuels de
transmission (câbles, fibres optiques, satellites...) pour absorber ce
volume croissant de communication ,
· de nombreuses recherches sont
entreprises avec comme objectifs principaux d'étudier des
procédés de compression d'informations .
L'idée de base commune à l'ensemble de ces
traitements de l'information est d'extraire d'une source d'information la
partie utile et non redondante de l'information afin de ne transmettre,
visualiser ou archiver que celle-ci.
Les techniques de compression permettent d'assurer un
gain en complexité pour les systèmes de communication (gain en
débit global à transmettre) ou d'archivage (gain en volume de
stockage).
Chapitre 1 Généralité sur l'image
et la compression
C H A P I T R E 1
Généralité sur l'image et la
compression
1.1 Introduction
1.2 Image numérique
1.3 La vidéo
1.4 Compression des données 1.5
Conclusion
1.1 Introduction
Dans ce chapitre on va essayer de parler de l'imagerie en
général et d'évoquer quelques notions de base ; toute en
donnant une définition des images fixes et animées et leurs
formats en passant par leur compression ce qui globalement donne une
idée plus claire sur l'intérêt de ce mémoire.
1.2 Image numérique
On désigne sous le terme d'image numérique
toute image (dessin, icône, photographie..) acquise, créée,
traitée ou stockée sous forme binaire (suite de 0 et de 1) :
acquise par des dispositifs comme les scanners, les appareils photo ou
caméscopes numériques, les cartes d'acquisition vidéo (qui
numérisent directement une source comme la télévision).
Créé directement par des programmes informatiques,
via la souris, les tablettes graphiques ou par la modélisation 3D «
images de synthèse ».
Traitée grâce à des outils informatiques. Il
est facile de la modifier en taille, en couleur, d'ajouter ou supprimer des
éléments, d'appliquer des filtres variés, etc....
Stockée sur un support informatique (disque dur, CD-ROM,
...).
2
Compression d'images animée par codage EZW 3D
Chapitre 1 Généralité sur l'image
et la compression
1.2.1 Types d'images
On distingue deux types d'images à la composition et au
comportement différent : les images matricielles et les images
vectorielles.
1.2.1.1 Images matricielles (ou images
bitmap)
Elle est composée comme son nom l'indique d'une
matrice (tableau) de points à plusieurs dimensions, chaque dimension
représentant une dimension spatiale (hauteur, largeur, profondeur),
temporelle (durée) ou autre (par exemple, un niveau de
résolution).
· Images 2D
Dans le cas des images à deux dimensions (le plus
courant), les points sont appelés pixels. D'un point de vue
mathématique, on considère l'image comme une fonction de
R×R dans R où le couplet d'entrée
est considéré comme une position spatiale.
· Images 2D + temps (vidéo), images 3D,
images multi résolution
Lorsqu'une image possède une composante temporelle, on
parle d'animation.
Dans le cas des images à trois dimensions les points sont
appelés des voxels. Ils représentent un volume.
Ces cas sont une généralisation du cas 2D, la
dimension supplémentaire représentant respectivement le temps,
une dimension spatiale ou une échelle de résolution. D'un point
de vue mathématique, il s'agit d'une fonction de R × R
× R dans R.
1.2.1.2 Images vectorielles
Le principe est de représenter les données de
l'image par des formules géométriques qui vont pouvoir être
décrites d'un point de vue mathématique. Cela signifie qu'au lieu
de mémoriser une mosaïque de points élémentaires, on
stocke la succession d'opérations conduisant au tracé. Par
exemple, un dessin peut être mémorisé par l'ordinateur
comme « une droite tracée entre les points (x1, y1) et (x2, y2)
», puis « un cercle tracé de centre (x3, y3) et de rayon 30 de
couleur rouge ».
3
Compression d'images animée par codage EZW 3D
Chapitre 1 Généralité sur l'image
et la compression
L'avantage de ce type d'image est la possibilité de
l'agrandir indéfiniment sans perdre la qualité initiale, ainsi
qu'un faible encombrement. L'usage de prédilection de ce type d'images
concerne les schémas qu'il est possible de générer avec
certains logiciels de DAO (Dessin Assisté par Ordinateur) comme AUTO
CAD. Ce type d'images est aussi utilisé pour les animations Flash,
utilisées sur Internet. Étant donné que les moyens de
visualisation d'images actuels comme les moniteurs d'ordinateur reposent
essentiellement sur des images matricielles, les descriptions vectorielles.
Doivent préalablement être converties en descriptions matricielles
avant d'être affichées comme images.
1.2.2 Définition et résolution
Les images matricielles sont également définies
par leur définition et leur résolution.
La définition d'une image est définie par le
nombre de points la composant. En image numérique, cela correspond au
nombre de pixels qui compose l'image en hauteur (axe vertical) et en largeur
(axe horizontal) : 200 pixels par 450 pixels par exemple, abrégé
en « 200×450 ».
La résolution d'une image est définie par un
nombre de pixels par unité de longueur de la structure à
numériser (classiquement en bpp). Ce paramètre est défini
lors de la numérisation et dépend principalement des
caractéristiques du matériel utilisé lors de la
numérisation. Plus le nombre de pixels par unité de longueur de
la structure à numériser est élevé, plus la
quantité d'information qui décrit cette structure est importante
et plus la résolution est élevée. La résolution
d'une image numérique définit le degré de détail de
l'image. Ainsi, plus la résolution est élevée, meilleure
est la restitution.
Cependant, pour une même dimension d'image, plus la
résolution est élevée, plus le nombre de pixels composant
l'image est grand. Le nombre de pixels est proportionnel au carré de la
résolution, étant donné le caractère bidimensionnel
de l'image : si la résolution est multipliée par deux, le nombre
de pixels est multiplié par quatre. Augmenter la résolution peut
entraîner des temps de visualisation et d'impression plus longs, et
conduire à une taille trop importante.
4
Compression d'images animée par codage EZW 3D
Chapitre 1 Généralité sur l'image
et la compression
1.2.3 Représentation des couleurs
Il existe plusieurs modes de codage informatique des
couleurs, le plus utilisé pour le maniement des images est l'espace
colorimétrique Rouge, Vert, Bleu (RVB ou RGB : Red, Green, Blue). Cet
espace est basé sur une synthèse additive des couleurs,
c'est-à-dire que le mélange des trois composantes R, V, et B
à leur valeur maximum donne du blanc.
Il existe d'autres modes de représentation des couleurs
:
· Cyan, Magenta, Jaune, Noir (CMJN ou CMYK) utilisé
principalement pour l'impression, et basé sur une synthèse
soustractive des couleurs.
· Teinte, Saturation, Luminance (TSL ou HSL), où
la couleur est codée suivant le cercle des couleurs ;base de couleur
optimale YUV, Y représentant la luminance, U et V deux chrominances
orthogonales.
Les images bitmap en couleurs peuvent dont être
représentées soit par une image dans laquelle la valeur du pixel
est une combinaison linéaire des valeurs des trois composantes couleurs,
soit par trois images représentant chacune une composante couleur. Dans
le premier cas, selon le nombre de bits alloués pour le stockage d'une
couleur de pixel, on distingue généralement les différents
types d'images suivants :
· Images 24 bits (ou « couleurs vraies
»)
Le codage de la couleur est réalisé sur trois
octets, chaque octet représentant la valeur d'une composante couleur par
un entier de 0 à 255. Ces trois valeurs codent
généralement la couleur dans l'espace RVB. Le nombre de couleurs
différentes pouvant être ainsi représenté est de 256
x 256 x 256 possibilités, soit près de 16 millions de couleurs.
Comme la différence de nuance entre deux couleurs très proches
mais différentes dans ce mode de représentation est quasiment
imperceptible pour l'oeil humain, on considère commodément que ce
système permet une restitution exacte des couleurs, c'est pourquoi on
parle de « couleurs vraies ».
5
Compression d'images animée par codage EZW 3D
Chapitre 1 Généralité sur l'image
et la compression
R
|
V
|
B
|
Couleur
|
0
|
0
|
0
|
Noir
|
0
|
0
|
1
|
nuance de noir
|
255
|
0
|
0
|
rouge
|
0
|
255
|
0
|
vert
|
0
|
0
|
255
|
bleu
|
128
|
128
|
128
|
gris
|
255
|
255
|
255
|
blanc
|
|
Tableau 1.1 : Exemple de représentation
des couleurs dans l'espace RVB
Les images bitmap basées sur cette représentation
peuvent rapidement occuper un espace de stockage considérable, chaque
pixel nécessitant trois octets pour coder sa couleur.
· Images à palettes, images en 256
couleurs (8 bits)
Pour réduire la place occupée par l'information
de couleur, on utilise une palette de couleurs « attachée »
à l'image. On parle alors de couleurs indexées : la valeur
associée à un pixel ne véhicule plus la couleur effective
du pixel, mais renvoie à l'entrée correspondant à cette
valeur dans une table (ou palette) de couleurs, dans laquelle on dispose de la
représentation complète de la couleur
considérée.
Selon le nombre de couleurs présentes dans l'image, on
peut ainsi gagner une place non négligeable : on considère en
pratique que 256 couleurs parmi les 16 millions de couleurs 24 bits sont
suffisantes.
Une autre méthode consiste à se passer de la
palette, et de coder directement les trois couleurs en utilisant un octet :
chaque composante couleur est codée sur deux bits, le bit restant peut
servir soit à gérer plus de couleurs sur une des composantes,
soit à gérer la transparence du pixel. On obtient des images
bitmap avec un codage couleur limité à 8 bits.
6
Compression d'images animée par codage EZW 3D
Chapitre 1 Généralité sur l'image
et la compression
· Images en teintes (ou niveaux de
gris)
On ne code ici plus que le niveau de l'intensité
lumineuse, généralement sur un octet (256 valeurs). Par
convention, la valeur zéro représente le noir (intensité
lumineuse nulle) et la valeur 255 le blanc (intensité lumineuse
maximale) :
Figure 1.1 : Palettes des images en niveau de
gris
Ce procédé est fréquemment utilisé
pour reproduire des photos en noir et blanc ou du texte dans certaines
conditions.
1.2.4 Formats d'images
1.2.4.1 Définition
Un format d'image est une représentation informatique
de l'image, associée à des informations sur la façon dont
l'image est codée et fournissant éventuellement des indications
sur la manière de la décoder et de la manipuler.
1.2.4.2 JPEG
JPEG (également appelé JPG) Joint Photographic
Experts Group.
Le JPEG est un format à perte, qui élimine donc
des informations, mais un des points forts de JPEG est que son taux de
compression est réglable. Un compromis doit cependant être fait
entre le taux de compression et la qualité de l'image
comprimée.
Le format JPEG sauvegarde davantage d'informations couleur
que le format GIF et garantit de ce fait un nombre élevé de
couleurs. La compression flexible rend possible une réduction de la
taille du fichier JPEG sans avoir trop d'impact sur la qualité de
l'image.
7
Compression d'images animée par codage EZW 3D
Chapitre 1 Généralité sur l'image
et la compression
1.2.4.3 JPEG 2000
Le JPEG 2000 est capable de travailler avec ou sans pertes,
utilisant une transformation en ondelettes (méthode d'analyse
mathématique du signal). En compression irréversible, JPEG 2000
est plus performante que la méthode de compression JPEG. On obtient donc
des fichiers d'un poids inférieur pour une qualité d'image
égale.
Les performances en compression de JPEG 2000, sont meilleures
que JPEG. La résistance aux erreurs de transmission, le codage sans
pertes, et les diverses extensions visant diverses applications font
l'intérêt de la norme.
1.2.4.4 GIF
Le Graphics Interchange Format : GIF Ce format utilise
l'algorithme de compression sans perte le format GIF a été
étendu pour permettre le stockage de plusieurs images dans un fichier.
Ceci permet de créer des diaporamas, voire des animations si les images
sont affichées à un rythme suffisamment soutenu. Chaque image
d'une animation peut avoir sa propre palette, ce qui permet de créer des
images contenant 16.777.215 couleurs simultanément, mais d'une taille
non négligeable.
1.2.4.5 PNG
Le Portable Network Graphics : est un format d'images
numériques , qui a été créé pour remplacer
le format GIF, Le PNG est un format sans perte spécialement
adapté pour publier des images simples comprenant des aplats de
couleurs.
1.2.4.6 TIFF
Le Tagged Image File Format généralement
abrégé TIFF est un format de fichier pour image
numérique.
Le TIFF non compressé est un format courant et lu par
beaucoup des logiciels de traitement d'image matricielle.
Il permet d'utiliser de nombreux types de compression, avec ou
sans perte de données.
8
Compression d'images animée par codage EZW 3D
Chapitre 1 Généralité sur l'image
et la compression
1.2.4.7 Bitmap
Bitmap, connu sous le nom BMP, est un format d'image
numérique .C'est un des formats d'images les plus simples. Il est
lisible par quasiment tous les éditeurs d'images .Il s'agit d'images
matricielles , Ainsi, les images BMP peuvent être en 2 couleurs (1 bit),
16 couleurs (4 bits), 256 couleurs (8 bits), 65 536 couleurs (16 bits) ou 16.8
millions de couleurs (24 bits).
1.2.4.8 Scalable Vector Graphics
Scalable Vector Graphics (SVG). C'est un format de fichier
permettant de décrire des ensembles de graphiques vectoriels .Les
coordonnées, dimensions et structures des objets vectoriels sont
indiquées sous forme numérique.
Chaque forme crée est facilement modifiable, soit en
bougeant des points, soit en changeant la couleur, Il en est de même pour
le texte ; ce qui génère un énorme avantage au niveau des
schémas par exemple.
9
Compression d'images animée par codage EZW 3D
Chapitre 1 Généralité sur l'image
et la compression
1.2.4.9 Tableau comparatif des différents formats
d'images
Type
(matriciel/
vectoriel)
JPEG matriciel
Compression
des données
Oui,
réglable
(avec perte)
Nombre de
couleurs
supportées
Affichage
progressif
Animation Transparence
16 millions Oui Non Non
Oui,
JPEG2000 matriciel avec ou sans 32 millions Oui
Oui Oui
perte
GIF matriciel Oui,
Sans perte
|
256 maxi
(palette) Oui Oui Oui
|
|
PNG
|
matriciel
|
Oui, sans perte
|
Palettisé (256 couleurs ou
moins) ou 16 millions
|
Oui
|
Non
|
Oui (couche Alpha)
|
|
TIFF matriciel
|
Compression ou pas avec ou sans pertes
|
de monochrome
à 16 millions Non Non
|
Oui (couche Alpha)
|
|
BMP
|
matriciel
|
Oui, avec perte
|
16 millions
|
Oui
|
Non
|
Non
|
|
SVG vectoriel compression
possible 16 millions
|
ne s'applique pas
|
Oui Oui
(par nature)
|
|
10
Compression d'images animée par codage EZW 3D
Chapitre 1 Généralité sur l'image
et la compression
1.3 La vidéo
La vidéo regroupe l'ensemble des techniques,
technologie, permettant l'enregistrement ainsi que la restitution d'images
animées, accompagnées ou non de son, sur un support adapté
à l'électronique. [1.1]
1.3.1 Vidéo numérique
Le principe de la numérisation d'une image
vidéo est assez simple. La première étape consiste
à sous diviser chaque image vidéo selon une résolution
donnée (normalement 720 x 486 pixels pour une image vidéo
normale) et a associer une valeur numérique à chacun des
éléments qui forment la couleur de ce pixel (YUV ou RGB) en
utilisant une table de conversion de couleurs (normalement 24 bits par pixels
pour 16 millions de couleurs possibles en chaque point).
Si un signal vidéo de 720x486 pixels de
résolution est numérisé en utilisant la norme YUV, le
fichier résultant sera de 683.44 Ko par image ou 20.02 Mo/sec. C'est ce
qu'on appelle le format non compressé. Ces valeurs sont calculées
de la façon suivante:
· 720 pixels X 486 pixels X 16 bits/pixel= 699,840
octets/image.
· Conversion octets/image en Koctets/image, 699,840
octets/image X 1 Ko/1024 octets= 683.44 Ko.
· Conversion Koctets par image en Koctets par seconde,683.4
Ko/image X 30 images/sec.= 20502 Ko/sec.
· Conversion Koctets par seconde en Moctets par seconde,
20503.2 Ko/sec. X 1 Mo/1024 Ko = 20.02 Mo/sec.
Avec un débit d'environ 20 Mo/sec, la vidéo
numérique non-compressée exigerait donc plus de 1.2 Go d'espace
disque pour capter une seule minute de vidéo.
1.3.2 Formats de vidéo
Comme nous venons de le voir, le JPEG permet de traiter des
séquences d'images. En réalité, il se contente de
considérer une séquence vidéo comme une succession
d'images fixes, chacune d'elles compressée séparément en
utilisant le standard JPEG.
11
Compression d'images animée par codage EZW 3D
Chapitre 1 Généralité sur l'image
et la compression
Lorsque le facteur de compression devient plus important (au
delà de 10:1), la dégradation des images devient telle qu'elle
est aisément perceptible par l'oeil humain.
Tant que l'on se contente de compresser des séquences
vidéo en considérant chaque image séparément, le
facteur de compression peut difficilement dépasser 4:1 si l'on souhaite
conserver un niveau de qualité compatible avec un usage professionnel.
Pour atteindre des facteurs de compression supérieurs, il faut se baser
sur les similitudes existant entre plusieurs images successives. Cette
constatation a donné naissance au standard MPEG. [1.2]
1.3.2.1 MPEG-1 Moving Picture Experts Group
Le MPEG-1 est une norme de compression pour la vidéo
numérique en 1988.
Le MPEG-1 permet d'encoder une vidéo grâce à
plusieurs techniques :
· Intra coded frames (codage
inter-images): les images sont codées séparément
sans faire référence aux images précédentes.
· Predictive coded frames (codage prédictif
des images) : les images sont décrites par différence
avec les images précédentes.
· Bidirectionally predictive coded frames
(codage prédictif bidirectionnel des images) : les images sont
décrites par différence avec l'image précédente et
l'image suivante. [1.3]
1.3.2.2 MPEG-2
Le MPEG-2 est la norme de seconde génération
(1994), il définit les aspects de la compression d'image et du son et le
transport à travers des réseaux pour la télévision
numérique.
Ce format vidéo est utilisé pour les DVD et
avec différentes résolutions d'image. Ce format est
également utilisé dans la diffusion de télévision
numérique par satellite, câble, réseau de
télécommunications. [1.4]
12
Compression d'images animée par codage EZW 3D
Chapitre 1 Généralité sur l'image
et la compression
1.3.2.3 MPEG-4
MPEG-4 introduit en 1998 il est d'abord conçu pour
gérer le contenu de scènes comprenant un ou plusieurs objets
audio vidéo. Contrairement à MPEG-2 qui visait uniquement des
usages liés à la télévision numérique , les
usages de MPEG-4 englobent toutes les nouvelles applications multimédias
comme le téléchargement et le streaming sur Internet, le
multimédia sur mobile, la radio numérique, les jeux vidéo,
la télévision et les supports haute définition.
MPEG-4 a développé de nouveaux Codecs audio et
vidéo et enrichi les contenus multimédia, en ajoutant de
nouvelles applications, le support pour des présentations 3D.
· MPEG-4 AVC
H.264, ou MPEG-4 AVC, est une norme de codage vidéo.
[1.5]
1.3.2.4 MPEG-7
Contrairement à MPEG-4 qui décrit un format de
codage vidéo, MPEG-7 est une norme de description dont le but est de
faciliter l'indexation et la recherche de documents multimédia.
Le format MPEG-7 n'est actuellement que très peu
utilisé dans les applications grand public. [1.6]
1.3.2.5 MPEG-21
Le MPEG-21 est un standard développé par MPEG
dont le but est de créer une architecture permettant
l'interopérabilité et l'utilisation transparente de tous les
contenus multimédia. [1.7]
13
Compression d'images animée par codage EZW 3D
Chapitre 1 Généralité sur l'image
et la compression
1.4 Compression des données
La compression des données traite de la manière
dont on peut réduire l'espace nécessaire à la
représentation d'une certaine quantité d'information. Elle a donc
sa place aussi bien lors de la transmission que lors du stockage des
données.
On peut classifier les méthodes de compressions en deux
types : la compression avec perte « également dite non
conservatrice » et la compression sans perte.
1.4.1 Compression sans perte
La compression est dite sans perte lorsqu'il n'y a aucune perte
des données sur l'information d'origine. Il y a autant d'information
après la compression qu'avant.
L'information à compresser est vue comme la sortie
d'une source de symboles qui produit des textes finis selon certaines
règles. Le but est de réduire la taille moyenne des textes
obtenus après la compression tout en ayant la possibilité de
retrouver exactement le message d'origine.
1.4.2 Compression avec pertes
La compression avec pertes ne s'applique qu'aux
données « perceptuelles », en général sonores ou
visuelles, qui peuvent subir une modification, parfois importante, sans que
cela ne soit perceptible par un humain. La perte d'information est
irréversible, il est impossible de retrouver les données
d'origine après une telle compression. La compression avec perte est
pour cela parfois appelée compression irréversible ou non
conservatrice. [1.8]
1.4.3 Compression d'image
La compression d'image est une application de la compression
des données sur des images numériques. Cette compression a pour
utilité de réduire la redondance des données d'une image
afin de pouvoir l'emmagasiner sans occuper beaucoup d'espace ou la transmettre
rapidement.
La compression d'image peut être effectuée avec
perte de données ou sans perte.
La compression sans perte est parfois
préférée pour des images artificielles telles que les
schémas, les dessins techniques.
14
Compression d'images animée par codage EZW 3D
Chapitre 1 Généralité sur l'image
et la compression
Des méthodes de compression sans perte peuvent
également être préférées pour garder une
grande précision, tel que pour des balayages médicaux, ou des
numérisations d'images destinées à l'archivage. Les
méthodes avec perte sont particulièrement appropriées aux
images normales telles que des photos dans les applications où une perte
mineure de fidélité (parfois imperceptible) est acceptable.
Les méthodes les plus importantes de compression d'image
sans perte sont :
· La méthode du codage des répétitions
(RLE).
· Le codage de source.
· Les algorithmes à dictionnaire adaptable tels que
LZW.
Les méthodes les plus importantes de compression avec
perte sont :
· La réduction de l'espace des couleurs aux
couleurs les plus fréquentes dans une image. Les couleurs choisies sont
indiquées dans la palette de couleur dans l'en-tête de l'image
compressée. Chaque pixel indique juste une référence sur
une couleur dans la palette de couleurs.
· Le codage par transformation. C'est
généralement la méthode la plus utilisée. La
transformée en cosinus discrète et la transformation par
ondelettes sont les transformations les plus populaires. Le codage par
transformation comprend l'application de la transformation à l'image,
suivie d'une quantification et d'un codage entropique. [1.9]
1.4.4 Compression vidéo
La compression vidéo est une méthode de
compression des données, qui consiste à réduire la
quantité des données, en limitant au maximum l'impact sur la
qualité visuelle de la vidéo. L'intérêt de la
compression vidéo est de réduire les coûts de stockage et
de transmission des fichiers vidéo.
15
Compression d'images animée par codage EZW 3D
Chapitre 1 Généralité sur l'image
et la compression
1.4.4.1 Principes fondamentaux de la compression
vidéo
Les séquences vidéo contiennent une très
grande redondance statistique, aussi bien dans le domaine temporel que dans le
domaine spatial.
· La redondance spatiale
Lorsque des informations sont similaires ou se
répètent dans des zones de l'image proches l'une de l'autre (dans
une image, deux points voisins sont souvent similaires).
· La redondance temporelle
Lorsque des informations se ressemblent ou se
répètent dans le temps, même si leur position dans l'image
a changé (deux images successives sont souvent relativement similaires).
La compression va donc consister à déterminer ces redondances et
à les éliminer. La contrainte liée à la
qualité de l'image nous oblige à être capables de
reproduire l'image originale intacte ou, tout au moins, une image très
proche de celle-ci.
Ainsi, on suppose que l'importance d'un pixel particulier de
l'image peut être prévue à partir des pixels voisins de la
même image ou des pixels d'une image voisine .Toutes les méthodes
reposent sur le fait d'exploiter la corrélation spatiale pour
réaliser une compression efficace de données. [1.10]
1.5 Conclusion
Les images et la vidéo numérique sont de
plusieurs types : couleurs, noir et blanc, niveaux de gris et couleurs
indexées. Celles en couleurs peuvent être
représentées sur des différentes espaces (RVB,
YUV,....).
Dans ce chapitre on donne une représentation
générale sur l'image et la vidéo numériques, ils
existent en plusieurs formats ou chaque format a des caractéristiques
spéciales, souvent ces formats sert à compressée et
permettent de minimiser l'espace de stockage avec un taux de compression bien
élevé, enfin on a abordé quelques notions sur la
compression des données et des images fixes et animées.
16
Compression d'images animée par codage EZW 3D
Chapitre 2 Transformée en ondelettes
C H A P I T R E 2
Transformée en ondelettes
2.1 Introduction
2.2 Définition des ondelettes
2.3 Transformée de Fourier
2.4 Transformée en ondelettes
2.4.3 Familles d'ondelettes
2.5 Bancs de filtres
2.6 Compression d'image par transformée en
ondelettes 2.7 Conclusion
2.1 Introduction
Les ondelettes ont généré dans les
dernières années un grand intérêt dans le domaine
théorique et également dans le domaine pratique.
La théorie des ondelettes est issue de nombreux travaux
en traitement du signal et en compression d'images. En traitement du signal, la
théorie des bancs de filtres a donné le schéma de
décomposition reconstruction de Stephane Mallat [2.1], en
compression d'images, l'algorithme de décomposition pyramidal d'une
image a servi de base pour l'analyse multi résolution.
Dans ce chapitre nous allons voir les limites de la
transformée de Fourier. Ainsi que la théorie des ondelettes ;
nous évoqueront diffèrent types d'ondelettes et la
généralisation sur les images en deux et trois dimensions.
2.2 Définition des ondelettes
Les ondelettes sont des fonctions élémentaires
très particulières; ce sont des vibrations très courtes
[2.2]. Mathématiquement, le but essentiel de l'analyse par ondelettes
est de décomposer les espaces fonctionnels usuels sur des bases ayant
d'excellentes propriétés tel que l'orthogonalité et la
régularité.
17 -
Compression d'images animée par codage EZW 3D
Chapitre 2 Transformée en ondelettes
La transformée en ondelettes est une méthode de
représentation temps fréquence d'un signal qui consiste à
le décomposer en une somme de fonctions élémentaires qui
dérivent toutes d'une même fonction appelée mère,
par translation, contraction et dilatation. [2.2]
2.3 Transformée de Fourier
Les séries de Fourier sont utilisées pour
l'analyse des signaux périodiques. Pour les signaux non
périodiques on a recours à une intégrale de Fourier. Cette
méthode consiste à représenter le signal
étudié par une superposition d'ondes sinusoïdales de toutes
les fréquences possibles. Les amplitudes associées à
chaque fréquence représentent les importances respectives des
diverses ondes sinusoïdales dans le signal global. Ces amplitudes forment
alors une fonction de la fréquence f appelée "spectre continu des
fréquences du signal" : c'est la transformée de Fourier du signal
s (t), notée S (f) :
+8
S f s t e - jwf
( ) = ? ( )
|
dt 2.1
|
-8
(Le nombre complexe S (f) s'identifie ; pour
une fréquence f donnée, à un point du plan).
L'analyse du signal consiste à dégager des
informations contenues dans celui-ci. Ceci en fonction d'une seule variable
(temps) ou de deux variables (temps et fréquence). Dans ce dernier cas,
L'analyse de Fourier classique est inadéquate, car la
représentation d'un signal f par l'intermédiaire de sa
transformée de Fourier S (f) ne fournit qu'une
information
globale sur Je signal. L'évolution dans le temps des
composantes fréquentielles du signal n'est pas directement accessible
par cette représentation. C'est pour atteindre cette information que la
représentation temps fréquence a été
créé.
2.3.1 Transformée de Fourier à
fenêtre glissante
La représentation temps fréquence met en jeu
deux opérations réciproques: J'analyse et la synthèse.
Pour effectuer l'analyse du signal, on le décompose en une somme de
fonctions élémentaires øa ,b
(fonctions sinusoïdales pour J'analyse de Fourier) où 'a' est
lié à la
fréquence et 'b' est lié au temps. Pour
décomposer un signal quelconque on affecte à chaque
18 -
Compression d'images animée par codage EZW 3D
Chapitre 2 Transformée en ondelettes
fonction élémentaire des coefficients
Ca,b ou :
+8
Ca , b ? S ( t ) ø
a , b ( t ) dt
= 2.2
-8
Ces coefficients donnent une information directe sur les
propriétés temporelles et fréquentielles du signal. Les
fonctions øa ,b doivent être bien
localisées dans le temps, de
sorte que les coefficients Ca , b
dépendent seulement des valeurs que prend le signal dans l'intervalle de
temps sur lequel la fonction øa ,b n'est
pas négligeable. La synthèse donne les règles permettant
de reconstruire un signal à partir des éléments Ca
, b fournis par I'analyse.
En 1940, D.Gabor [2.4] découvre la
première forme de représentation temps fréquence. Il
obtient une analyse temporelle en découpant arbitrairement le signal en
des plages de longueur limitée. Chaque plage, centrée autour du
paramètre ' b' de localisation en temps, est alors étudiée
séparément des autres par L'analyse traditionnelles de Fourier,
ce qui revient à décomposer le signal sur des fonctions
élémentaires øa ,b qui
dérivent toutes d'une
même "fonction fenêtre" ø(t)
par translation et modulation en temps. C'est la
transformation de Fourier a fenêtre glissante.
L'inconvénient majeur de ce procédé est
que la longueur de la plage est fixée une fois pour toutes et que l'on
ne peut pas analyser simultanément des phénomènes dont les
échelles de temps sont différentes. Ce problème est
résolu par l'analyse multi échelle par ondelettes où il y
a des familles d'ondelettes qui correspondent à des
décompositions différentes. Elles ont des
propriétés différentes et permettent ainsi des analyses
différentes. L'analyse par ondelettes est une méthode
mathématique pour représenter le signal.
2.4 Transformée en ondelettes
J. Morlet [2.5] a construit une famille d'ondelettes
engendrée par une seule ondelettes ø (t) dite
analysante et définie par :
- t 2
ø = × 2.3
2
a b t t a
( ) cos( 5 )
,
19
Compression d'images animée par codage EZW 3D
Chapitre 2 Transformée en ondelettes
II a construit les ondelettes øa
,b à partir de l'ondelette analysante
ø, non pas par
translation et modulation, comme pour la transformée de
Fourier a fenêtre glissante, mais par translation en temps
(paramètre 'b') et contraction ou dilatation en temps selon que le
paramètre 'a' (fréquence) est plus petit ou plus grand que un. Il
suffit donc de "jouer à l'accordéon" avec I'ondelettes analysante
y pour obtenir la famille des ondelettes øa ,b.
La transformée en ondelettes réalise une analyse
à toutes les échelles. Elle est une fonction
S(a, b) qui associe aux paramètres 'a' et 'b'
la valeur du coefficient Ca , b de
l'ondelette
øa,b dans la
décomposition du signal. La quantité 'b' est le paramètre
de localisation temporelle, tandis que (1/a) est le paramètre de
fréquence. Ca , b est une intégrale qui mesure
la somme des aires algébriques décrites par la courbe (produit
s (t) øa,b )
comme montre la figure 2.1 .
2.4.1 Transformation continue en ondelettes
La transformation continue en ondelette, ou transformation
intégrale en ondelette a la possibilité de faire un "zoom", c'est
à dire que la dimension de la cellule de Gibbs (voir la figure
2.2) peut s'adapter à la position du centre dans le plan (t,
w), et devient plus étroite si l'on se déplace vers les hautes
fréquences, et plus large vers les basses fréquences [2.6]. Une
expansion d'ondelette utilise des transformations et des dilatations d'une
fonction fixe, l'ondelette ø , Dans le cas de la transformation
continue en ondelettes, les paramètres de
translation et de dilatation varient continuellement, et la
transformation utilise les fonctions:
1
ø a b x
, ( ) = ø
a
x b ?
?? ??
a
? -
Où a, b ? R , a ? 0 2.4
Alors, la transformation continue en ondelettes définie
par :
W(a,b) =< f,øa
, b> 2.5
20 -
Compression d'images animée par codage EZW 3D
Chapitre 2 Transformée en ondelettes
|
(a) Ondelette de morlet øa
,b de fréquence 1/a centrée en
b.
(b) signal S(t).
(c) produit S (t)
øa,b .
(d) mesure du coefficient Ca , b
représenté par
L'intégrale « aire » du signal produit.
|
Figure 2.1
Pour pouvoir définir correctement la transformation en
ondelettes il faut que ø possède Tes
propriétés suivantes :
1. ø est aussi une fonction fenêtre, dont
le centre est w0 > 0 , pour localiser les
fréquences en utilisant l'effet de "zoom".
2. Ø = ? ø ù ù < +8
C ù 2 d
1 pour permettre la reconstruction de f à partir des
valeurs
( )
de la transformée par ondelette W(a,
b).
21 -
Compression d'images animée par codage EZW 3D
Chapitre 2 Transformée en ondelettes
La transformation continue en ondelettes nous permet
d'utiliser des ondelettes plus générales. Et elle est
utilisée dans la détection de la singularité et dans
l'interprétation (caractérisation).
Figure 2.2 : Cellule de Gibbs
2.4.2 Transformation discrète en ondelettes
Cette approche [2.7] peut être utilisée pour
traiter des images. Nous supposons que les
données { ( 0 ) }
fi sont les produits scalaires en un pixel
'i' de la fonction f(x) et d'une fonction
d'échelle donnée Ö(x) :
fi ( 0) f x x i 2.6
=< ( ) ; Ö ( - ) >
Où Ö(x) doit satisfaire l'équation de
dilatation :
Ö ? Ö ?
( x ) ( ) ( )
h n x n
2
1
2
n
Où h (n) est la valeur de l'échantillon n. 2.7
Le premier processus effectué entre deux échelles
conduit à l'ensemble de { ( 1 ) }
fi La
différence { ( 0) }
fi - { ( 1 ) }
ficontient l'information entre ces deux
échelles i
Fet i + 1
F .
22 -
Compression d'images animée par codage EZW 3D
Chapitre 2 Transformée en ondelettes
C'est l'ensemble discret associé a la transformation en
ondelettes correspondant à Ö(x)L'ondelette associée
ø (x) est : 1 / 2 ( / 2) ( ) 1 / 2 ( / 2)
ø x = Ö x ? Ö x
F ? ? ? ? ?
0
F ? ? ? ? ?
1
F ? ? ? ? ?
2
Figure 2.3 : Filtrage avec un facteur
décroissant de distance deux entre les échantillons La distance
entre deux échantillons croit par un facteur de deux de l'échelle
(n-1) à la
suivante, ( k )
fi est donné par (voir la
figure 2.3) :
f h n f k 2.8
( )
k = ? + - k
( ) 1 -
( 1 )
i i n 2
n
Et la transformation discrète en ondelettes w (i,
j) par :
w i k = f i - - f
( , ) k
( 1 ) ( )
k
i
h ( - 1 )
h (1)
h (0)
h ( - 1 )
h (1)
h (0)
2.9
23 -
Compression d'images animée par codage EZW 3D
Chapitre 2 Transformée en ondelettes
2.4.3 Familles d'ondelettes
2.4.3.1 Ondelettes orthogonales
Soit {Vn ; n ? Z} une
analyse multirésolution, engendrée par une fonctionÖ , et
soit ø une ondelette associée, qui engendre les sous
espaces complémentaires W n , n ?
Z.
L'ondelette ø est orthogonale si et seulement si:
pourn ? k, et pour tout
j,l? Z :
øk,j-øn,l
(<øk,j;øn,l >= 0)
2.10
Dans ce cas W n , n ? Z
sont des espaces complémentaires orthogonaux. Cependant, en
général nous n'avons pas øk , j
orthogonal àøl , j.
2.4.3.2. Ondelettes biorthogonales
~
Il existe une fonction d'échelle duale Ö
et une ondelette dualeø~ , qui
génèrent une
~
|
~
|
analyse multirésolution duale avec les sous espaces
V j
|
, et W j
|
, tels que :
|
V~j -
Wj et V~j -
W~j 2.11
W~j -
|
W ~ et pour
j '
|
j?j ' 2.12
|
Ce qui est équivalent à :
< Ö ? >=< Ö ? >=
ø x l ø x l
~
, ( ) , ( ) 0 2.13
En plus, les fonctions duales aussi doivent satisfaire :
~
~
<Ö , Ö (
|
x-l) >= ä l
|
et < ø , ø ( x -
l ) >= ä l
~ 2.14
|
24 -
Compression d'images animée par codage EZW 3D
Chapitre 2 Transformée en ondelettes
Par l'utilisation d'un argument d'échelle, nous avons des
propriétés plus générales telles que :
< Ö Ö >= ä l , l ' , j
? Z 2.15
~
'
j l -
, , ' l l
j l
,
Et
<øø >= ä ä l l j j
? Z
~ '
, , ' . , , , ' 2.16
' '
j l ' j j l l
- -
j l
,
~
Les définitions de Ö et ø ~ sont
semblables a celles de Ö etø . Le rôle de la base
j , l j , l j , l j ,
l
~
(Ö etø) et de la base duale ( Ö
|
etø~ ) peuvent être interchangées.
[2.8]
|
2.4.3.3 Ondelettes usuelles
Un exemple très simple mais très utile pour
illustrer les meilleures propriétés des ondelettes, est
l'ondelette de Haar, où l'on peut illustrer facilement les
propriétés de la fonction d'échelle et de l'ondelette.
Cette ondelette a aussi des utilisations pratiques.
Fonction d'échelle, elle est définit par :
Ö = 0 ailleurs
( )
x ?? = =
? 1 si 0 x 1 2.17
Le sous espace V0 est étendu par la
fonction d'échelle Ö(x - k), qui est
formée de translations entières de la même fonction. Les
sous espace V1 est étendu par Ö(2x -
k) qui est formée de translations de k /2 de la
fonction d'échelle sur un intervalle de 1 / 2. En général,
Vj est étendu par des translations de j
k / 2 de la fonction d'échelle sur un
intervalle de j
1 / 2 . Les relations de double échelle de l'ondelette
de Haar sont :
Ö x = ? p k Ö x
- k = Ö x + Ö x -
( ) (2 ) (2 ) (2
k
Avec p0 = p1 =1 et
pj = 0,?j
1) 2.18
25 -
Compression d'images animée par codage EZW 3D
Chapitre 2 Transformée en ondelettes
L'ondelette de Haar ø correspond à la
fonction d'échelle de Haar Ö(x) donnée par
:
1
=
= x
1 si 0
2
2.19
-
1
=
x 1
<
1 si
2
Ö x
( )
0 ailleurs
?
· Relations de décomposition et de
reconstruction Les relations de reconstruction sont données par
:
?? ø ( )
?
??
11
1 1
-
?Ö ( )
x ? ?
x ?? = ??
? Ö ( )
2 x ?
?? ø ( )??
2 1
x -
2.20
Les relations de décomposition sont l'inverse des celles
de reconstruction et il sont données par:
?
??
ø
?
??
? Ö
??ø
Ö ( )
x ?
x ??
( )
?1 1
??1 1
-
( )
2 x?
( )??
2 1
x -
2.21
II existe plusieurs autres ondelettes usuelles telles que:
l'ondelette de Daubechies. [2.9] 2.4.3.4 Ondelettes sur un
intervalle
Les ondelettes définies sur un intervalle le sont sur
un ensemble compact, tel qu'un intervalle unidimensionnel ou bidimensionnel.
Pour être spécifique, nous pouvons considérer le cas d'une
fonction f(x) définie sur un intervalle [a, b] et telle que f(x) est
nulle à l'extérieure de [a, b]. Les ondelettes comportent des
discontinuités aux points d'extrémités a et b, et sont
efficaces pour détecter les singularités. [2.8]
Pour construire des ondelettes bornées sur un
intervalle, considérons un ensemble fini de fonctions linéaires
et indépendantes Ö 0,....,Ö m-1
définies sur cet intervalle et supposons
V0 l'espace vectoriel étendu par ces
fonctions, en observant que pour une fonction d'échelle Ö on
considère un ensemble fini de fonctions d'échelle.
26 -
Compression d'images animée par codage EZW 3D
Chapitre 2 Transformée en ondelettes
Comme exemple des ondelettes sur un intervalle, citons parmi
d'autres :
· L'ondelette linéaire et quadratique de
Legendre, l'ondelette de premier ordre et de second ordre de
Flatlet et l'ondelette borne de Meyer. [2.9]
2.4.3.5 Ondelettes multidimensionnelles
Une méthode simple pour obtenir des ondelettes
multidimensionnelles est d'utiliser le produit tensoriel.
Considérons : Ö ( x , y ) = Ö
( x ) ? Ö ( y) 2.22
?
= = 1 ?2 Ö - - ?
f f x y x k y k L Z
( ) ( ) ( )?
2 2
V : , , ,
0 , 1 2
? ë ë
k k ?
1 2
? k k
, ?
|
2.23
|
Si Ö(x-l)/l? Z est un
ensemble orthonormale, alors
Ö(x-k1,y-k2)
forme une base orthonormale de V0. Par une échelle
dyadique on obtient une analyse multirésolution
deL2(R2). Le
complément W0 de V0 dans
V1 est de façon semblable
généré par la translation des trois fonctions :
ø ø ø ø ø ø
ø
( 1 ) , ( 2 ) , ( 3 )
= Ö ? = ? Ö = ? 2.24
Par décomposition d'une seule dimension pour chaque
variable, on obtient :
f x y f i l j k
( )
, , ( x, y )
= ?? ø , ? ø , ø
? ø 2.25
i,l j ,k
i l j k
, ,
Les fonctions øi,l ?øj,k
impliquent deux échelles, - i
2 et - j
2 , et chacune est supportée
sur un rectangle. Pour cela cette décomposition est
appelée décomposition rectangulaire d'ondelette. [2.8]
27 -
Compression d'images animée par codage EZW 3D
Chapitre 2 Transformée en ondelettes
2.5 Bancs de filtres
2.5.1 Notion des bancs de filtres
La théorie des ondelettes trouve ses fondements dans la
théorie des bancs de filtres couramment utilisée en traitement du
signal et en télécommunication.
L'idée est de séparer le signal original en
plusieurs bandes de fréquence (basse fréquence et haute
fréquence) pour mieux le traiter et le transmettre. Au récepteur,
on reconstruit le signal en rassemblant ces diverses bandes (voir la
figure 2.4). Le problème est de savoir comment on peut avoir un
signal reconstruit X identique au signal original
X0.
Figure 2.4 : Banc de filtres (banc
d'analyse/synthèse à un étage)
En utilisant les notations de la figure 2.4, on
rappelle qu'une décimation par M implique (notation avec la
transformée en z) :
- 2 ð jk
? ?
1 / M
? l 2.26
M ?
? ?
Et en suite une interpolation par M : ( ) ( M
)
Y Z = X 0 Z 2.27
28 -
Bancs d'analyse Bancs de synthèse
ha, ga hs, gs
X0
Original
ha
2 2
hs
ga
2
2
gs
X
Reconstruite
Y : décimation par M
X0 M Y : Interpolation par M
X0
M
M - 1
Y Z X Z
( ) ?
= 0
k 0
Compression d'images animée par codage EZW 3D
Chapitre 2 Transformée en ondelettes
Dans le cas de filtres orthogonaux, l'énergie des
coefficients transmis est la même que celle du signal original. Tandis
que dans le cas ou les filtres sont biorthogonaux, ce n'est pas le cas. Par
contre, dans les deux cas, on reconstruit un signal identique à
l'original mais avec une phase pouvant être différente. Il est
bien connu [2.10 ; 2.11] que le seul banc de fiItres RIF réels ayant une
phase linéaire est celui avec des filtres de Haar.
2.5.2 Réalisation d'un banc de filtres à base
d'ondelettes
· Design d'un banc de filtres a deux
étages
Un banc de filtres est un ensemble de filtres reliés
entre eux par des décimateurs et des interpolateurs. Pour un banc de
filtres à deux canaux, les filtres analysants sont normalement un
passe-bas et un passe-haut.
La structure de base a la forme suivante :
Figure 2.5 : Structure de base
Un banc de filtres à reconstruction parfaite
décompose un signal par filtrages et sous échantillonnages. Il le
reconstruit par insertions de zéros, filtrages et sommation.
Un banc de filtres (discrets) sous échantillonnés
à deux canaux convolue un signal X0(n) avec
un filtre passe-bas ha (n) = h (-n) et un filtre passe-haut
ga (n) = g (-n) et
sous-échantillonné par deux les sorties.
On dit qu'on a un banc de filtres à reconstruction
parfaite quand X0 (n) = X(n) . Lorsqu'en plus ha
= hs et ga = gs, on parle de filtres miroirs
conjugués.
X0 (n)
ha
2 2
hs
ga
2
2
gs
X(n)
29 -
Compression d'images animée par codage EZW 3D
Chapitre 2 Transformée en ondelettes
2.6 Compression d'image par transformée en
ondelettes
2.6.1 Compression en deux dimensions
La théorie des ondelettes peut être
généralisé, en plusieurs dimensions. Nous
étudierons les ondelettes bidimensionnel et ces applications sur
l'image.
Chaque sous-espace correspond à un produit tensoriel de
deux espaces identiques suivant la formule :
Vm ( x , y ) = Vm ( x
) ? Vm(y) 2.28
La fonction d'échelle bidimensionnelle est alors un
produit tensoriel de deux fonctions d'échelle monodimensionnelles :
Ö ( x , y ) = Ö ( x ) Ö
( y ) . 2.29
Où Ô( x) est la fonctions d'échelle
monodimensionnelle.
L'approximation d'un signal bidimensionnel É (x,
y) à la résolution 2-m est alors
donnée par :
An m nx m ny
( ) = { < ( ) Ö ( ) Ö ( ) > }( ) ? Æ
Æ
nx ny f x y , x , y nx ny
, , , , * 2.41
Comme dans le cas monodimensionnel, le détail est
obtenu en projetant le signal f(x, y) sur un espace
complémentaire Wm. Une base de cet espace
complémentaire peut être obtenue par translation et dilation d'une
fonction d'ondelettes.
Soit ø(x) l'ondelette associée
à Ö(x) on peut alors définir les trois ondelettes
bidimensionnelle.
(, ) ( ) ( )
x y x y
= Ö ø
= Ö
= ø
30 -
ø 1
( , ) ( ) ( )
x y x y
ø ø
2
2.30
( , ) ( ) ( )
x y x y
ø ø
3
Compression d'images animée par codage EZW 3D
Chapitre 2 Transformée en ondelettes
La différence entre deux approximations successives
caractérisées par les trois coefficients d'ondelette
représentant les détails :
D n
H ( ,
m x
|
ny
|
)
|
{ }
< Ö >
f x y x y
( , ), ( ) ( )
m nx m ny nx ny
, , ( , )
ø
|
? Z
|
2
|
D n
V (
m x
|
,
|
ny
|
)
|
{ }
< Ö >
f x y x y
( , ), ( ) ( )
ø m nx m ny nx ny
, , ( , )
|
?Z
|
2
|
2.31
|
D n
D (
m x
|
,
|
ny
|
)
|
{ } 2
< >
f x y x y
( , ), ( ) ( )
ø ø
m nx m ny nx ny Z
, , ( , ) ?
|
Le calcule d'une image Sm (n x ,
ny) à une résolution inférieur et les calcules
du coefficients d'ondelettes { ( n x , n y ) , d ? { H,
V, D } }
Dm d se font par convolution en utilisant
des filtres séparables 2D. Le filtrage 1D défini
pour les signaux monodimensionnel est appliqué indépendamment sur
les lignes et les colonnes, nous présentons d'une façon
générale dans les figures 2.6-2.7 le principe de
décomposition et de reconstruction dans le cas bidimensionnels.
H1
G1
Am-1
H1
1:2
2:1
G1
1:2
H1
1:2
2:1
G1
1:2
Am
Dm H Dm V Dm D
Figure 2.6 : Un étage de
décomposition multi-résolution bidimensionnelle
31 -
Compression d'images animée par codage EZW 3D
Chapitre 2 Transformée en ondelettes
Figure 2.7 : un étage de la
synthèse multi-résolutions bidimensionnelle
Donc, à partir d'image initiale à la
3eme résolution, on obtient quatre sous image (voir
la figure 2.7 (a) .Après, on fait la
décomposition sur trois niveaux du résolution et la
figure 2.7 (b) représente un exemple de décomposition
d'image sur trois niveaux de résolution
m=3, m=2, m=1.
H2
1:2
+
1:2
1:2
G2
+
Am-1
Am
1:2
Dm H
Dm v
Dm D
H2
G2
1:2
1:2
G2
H2
+
A3
|
2-3
|
Horizontal
D2 H
Résolution
2-2
|
Horizontal D1 H Résolution 2-1
|
2-3
|
2-3
|
Vertical
D2 V
Résolution
2-2
|
Diagonal
D
D2
Résolution
2-2
|
Vertical D1V Résolution
2-1
|
Diagonal D1D Résolution 2-1
|
(a) (b)
Figure 2.7 décomposition bidimensionnelle
sur trois niveaux de l'image
32 -
Compression d'images animée par codage EZW 3D
Chapitre 2 Transformée en ondelettes
2.6.2 Compression en trois dimensions
Dans le cas de la 2eme dimension la construction d'une
transformée en ondelette est le résultat d'un produit tensoriel
d'une analyse multirésolution [2.8 ; 2.1] à une dimension
V0 = V ?0
V0, ou V j ,j? Z
est une multirésolution de ( )
L 2 R . La multirésolution
est similaire
à celle d'une seule dimension, elle est comme suit :
.... 2 1 0 1 2
V ? V ? V ? V - ? V
-
V0=V0?V0 2.32
F V F j j V F x x f x f x f g V
? ? ? = ?
( ) 0 ( 1 2 ) 1 2 0
2 ,2 , , ( ) ( ), ,
j
Et le produit :
Ö = Ö Ö = Ö ? Ö - ?
0 , , 1 2 0 , 1 0 , 2 1 0 , 2
m n n m m
x x x x x n x m n m Z 2.33
( , ) ( ) ( ) ( ) ( ), ,
Est une base orthonormale de V0; la
base Vj est obtenue comme [2.1] :
1
Ö = Ö Ö = Ö ? Ö -
(2 ) (2 )
j
( , ) ( ) ( ) 2.34
, , 1 2 , 1 , 2 1 0 , 2
x x x x x n x m
- - j
j m n j n j m j m
2
Le complément orthogonal dans
Vj-1 pour Vj est
Wj : V V V V W V W
- = - ? - = ? ? ?
( )
j j j j j j j
1 1 1
? ? ? ? ? ?
[ ( ) ( ) ( ) ]
V W W V W W
j j j j j j
Et les, Wj dépend de trois parties,
qui sont des bases de ø, ces des combinaisons a une dimension
de la fonction d'échelle Ö et la fonction d'ondelette
ø :
k ( , ) ( ) ( )
= ö ø
x x x x
1 2 1 2
v ( , ) ( ) ( )
= ø ö
x x x x
1 2 1 2
d ( , ) ( ) ( )
x x x x
= ø ø
1 2 1 2
33 -
V j ? V j
2.35
Ø
Ø
Ø
2.36
Compression d'images animée par codage EZW 3D
Chapitre 2 Transformée en ondelettes
L'ensemble { j n ; j Z , n Z
2 , h , v , d}
Ø , ? ? ë =
ëest une base orthogonale de
L2(R2) [2.8],
Dans cette construction, l'échantillonnage se fait
séparément : verticalement et horizontalement, mais les bases
d'ondelettes sont non separable.
La transformation en ondelette rapide en deux dimension est
obtenue en utilisons des opérations de filtrage dans les directions
horizontal et vertical de l'image.
L'image originale est filtrée en quadrants et ensuite
le quadrant d'approximation est filtré lui aussi. Si la taille de
l'image originale en N * N alors chaque quadrant est de taille N / 2 * N / 2.
La transformation a la propriété de reconstruction parfaite.
Une approche similaire à celle de la transformation en
deux dimensions est prévue .Le cas de trois dimensions est
appliquée par exemple pour des images médicales, l'analyse
multirésolution donne la configuration suivante :
VV V V
j j j j
- 1 1 1 1
= - ? - ? -
( ) ( )
V W V W
j j j j
? ? ?
( ) [ ( ) ( ) ( ) ( )
V V V W W V W W W W
? ? ? ? ? ? ? ? ? ]
j j j j j j j j j j
( ) ( ) ( ) ( )
? V V W V W W V W W
? ? ? ? ? ? ? ? ?
j j j j j j j j j
V V V
j j j
? ? ? ?? ( ) ( ) ( ) ( )??
? ? ? ? ? ? ? ? ? ? ? ? ?
W V V W V W W W V W W W
j j j j j j j j j j j j ?
La fonction d'échelle pour la base V0
est :
Ö = Ö ? Ö ? Ö ? ?
n n n x x x x n x n x n n n n Z 2.38
0 , , , 1 2 3 1 1 2 2 3 3 1 2 3
( , , ) ( ) ( ) ( ) ; , ,
1 2 3
2.37
34 -
Compression d'images animée par codage EZW 3D
Chapitre 2 Transformée en ondelettes
Et le filtrage des l'images est fait en utilisant une fonction
d'échelle et sept ondelettes, qui sont définies comme :
(x1, x2,)
(x3)
x3)0()x10(x2
0
w s,a
w h,a
(x1, x2,
)gt(x3)
X3) 0( Xi) 0( X2
w v,a (x1 ,
x2
) 0(x)gt( )
(x3)
x
2
x3
0
w d,a (x1 ,
x2 , x3
) 0(x)gt(
)v(x3)
x
2
2.39
s,d (x1 ,
x2, x3 =
)
gt )0 x2 0
( ( ) (x3)
x1
wh,d
(x1, x2 , x3
= » X2
) ( ( )0
v,d (x1 ,
x2, x3 yf x x »
) (1 )gt(2
d,d
(x1,x2,x3gtx1 x2
)()
gt
(
)gt (x3)
Où toutes les dimensions sont dilatées de la
même manière et l'échantillonnage se fait
séparément le long de chaque dimension de l'image 3D. Si l'image
originale est de taille N * N * N alors celle filtrée sera de taille N /
2 * N / 2 * N / 2 comme l'illustre.
(x3)
(x3 )
a0
d .
1
v a
d1h.a
d1d.a
ed
dv.d
1
ed
ed
L'image originale
Transformation à deux niveaux
Figure2.8 : Une transformation en ondelette 3D
appliques deux fois
35 -
Compression d'images animée par codage EZW 3D
Chapitre 2 Transformée en ondelettes
2.7 Conclusion
La transformée en ondelettes a été
étudiée en ses débuts par des physiciens
théoriciens dans le domaine de mécanique quantique. Plus
récemment elle a été utilisée en théorie
constructive des champs. La transformée en ondelettes en mode continu
coïncide avec la notion d'analyse multirésolution
développée par les chercheurs en vision.
La transformation en ondelettes constitue un puissant outil
d'analyse. Une de ses premières applications a été en
séismologie. Cette transformation a été ensuite
appliquée à l'analyse des sons, des images, et de toutes sortes
de signaux.
Du fait que les ondelettes servent à analyser des
phénomènes qui se produisent simultanément à des
échelles différentes, elles constituent un outil naturel pour
étudier les objets de type fractal, où les objets qui demeurent
semblables à eux-mêmes lorsqu'on les considère à des
échelles différentes. [2.2]
L'analyse et la synthèse par ondelettes permettent
d'analyser efficacement des signaux où se combinent des
phénomènes d'échelles très différentes.
L'idée de l'analyse par ondelette est de
décomposer un signal sur une base de fonctions d'un sous espace ayant
des propriétés bien déterminée. En particulier, on
peut chercher à analyser un signal en tentant de localiser dans le temps
les irrégularités du signal c'est-à- dire les variations
brusques dans le signal qui correspondent aux hautes fréquences.
Schématiquement, la transformation en ondelettes
revient à effectuer une série de filtrage passe-bande dans
l'espace réciproque (ou plan de Fourier de l'objet), et pour chaque
échelle, à reconstituer l'image de l'objet après filtrage.
[2.16]
La mise en oeuvre de la transformation en ondelettes sur
ordinateur ne présente pas de difficultés techniques importantes.
Toutefois sa rapidité est fortement liée à la
résolution utilisée.
36 -
Compression d'images animée par codage EZW 3D
Chapitre 3 Codage EZW
C H A P I T R E 3
Codage EZW
3.1 Introduction
3.2 Présentation du codage EZW
3.3 Algorithme
3.6 Conclusion
3.1 Introduction
La transformée en ondelette permet, comme décrit
dans le chapitre précédent, de représenter les images sous
forme de coefficients ordonnes en bandes de fréquences. Pour la
compression d'images, la transformée représente le premier
maillon de la chaîne, afin de compresser l'information, il faut
compléter le cycle par la quantification et le codage.
Afin de garder le coté progressif de la transformée
en ondelettes, une méthode d'organisation et de quantification des
coefficients s'impose : c'est le EZW.
La méthode de codage progressif connue sous le nom de
Embedded Zerotree Wavelet coding (EZW), proposée par Shapiro [17], est
une méthode simple et très efficace de compression d'image par
ondelettes. Elle a démontré sa puissance dans les deux formes de
compression (avec et sans perte d'informations) depuis son élaboration
en 1993. Plusieurs variantes de ce type de codage ont été
proposé par différents chercheurs dans le domaine, ce qui fait sa
force .On peut citer par exemple le SPIHT (Set Partitionning in Hierarehical
Tree) réalisé par A. SAID et W.PEARLMAN [18] qui est la variante
la plus populaire de I'EZW. L'intérêt de consacrer ce chapitre
à cette méthode est de la mettre en évidence vu qu'elle
sera à la base des algorithmes proposés dans notre travail.
3.2 Présentation du codage EZW
En général, dans une représentation d'image
par coefficients d'ondelettes, l'image obtenue est organisée de
façon à représenter les principaux traits de l'image dans
les bandes
37 -
Compression d'images animée par codage EZW 3D
Chapitre 3 Codage EZW
de basse fréquence, puis les détails dans les
bandes de haute fréquence. Le principe de 1'EZW s'appuie sur cette
représentation, pour coder les coefficients d'une manière
progressive. Ainsi, on commence par les basses fréquences L, ensuite on
code les détails (hautes fréquences), l'avantage de cet
algorithme, est que l'on a en tout temps un niveau de compression et que l'on
peut arrêter en tout moment le codage.
Le codage EZW est basé sur deux principales observations
:
· Quand une image est transformée par ondelettes,
l'énergie dans les sous-bandes diminue pendant que l'échelle
diminue (la basse échelle signifie la haute résolution). Ainsi
les coefficients d'ondelette seront plus petits en moyenne dans les sous-bandes
plus hautes que dans les sous-bandes inférieures. Ceci prouve que le
codage progressif est un choix très normal pour des images
transformées par ondelettes, puisque les sous-bandes plus hautes
ajoutent seulement les détails fins.
· Les grands coefficients d'ondelette sont plus
importants que les plus petits.
Ces deux observations sont exploitées en codant les
coefficients d'ondelettes par ordre décroissant, dans plusieurs
passages. Pour chaque passage on choisit un seuil par rapport auquel tous les
coefficients d'ondelettes sont comparés. Si un coefficient d'ondelette
est supérieur au seuil, il est codé et retiré de l'image,
sinon, il est laissé pour le prochain passage. Quand tous les
coefficients d'ondelettes ont été examinés, le seuil est
abaissé et l'image est rebalayée pour ajouter plus de
détails à l'image déjà codée. Ce processus
est répété jusqu'à ce que tous les coefficients
d'ondelettes soient encodés complètement ou qu'un autre
critère soit satisfait (PSNR choisit est atteint) selon le mode de
compression utilisé.
L'algorithme emploie la dépendance entre les
coefficients d'ondelettes à travers différentes échelles
pour coder efficacement les grandes parties de l'image qui sont au dessous du
seuil actuel, c'est ici qu'intervient le zerotree.
Dans la représentation de « l'image ondelettes
», chaque coefficient peut être considéré en tant
qu'ayant quatre descendants dans la prochaine plus haute sous-bande figure
3.1). Ainsi que pour les quatre descendants, chacun à également
quatre fils dans la prochaine
38 -
Compression d'images animée par codage EZW 3D
Chapitre 3 Codage EZW
plus haute sous-bande et nous voyons un arbre à quatre
descendants émerger ; chaque racine a quatre branches, ce processus se
poursuit jusqu'aux fréquences les plus hautes.
Figure 3.1 : Représentation de
l'organisation en arbre des coefficients d'ondelettes
Nous pouvons maintenant donner une définition du
zerotree. Un zerotree est un quadruple-arbre dont tous les noeuds enfants sont
égaux ou plus petits que les noeuds parents. L'arbre est codé
avec un symbole unique et reconstruit par le décodeur comme
quadruple-arbre rempli de zéros. Nous devons insister sur le fait que la
racine doit être plus petite que le seuil par rapport auquel les
coefficients d'ondelettes sont comparés, sinon, ce coefficient ne serait
pas considéré comme base de zerotree.
Le codeur d'EZW exploite le fait qu'il y 'a une
probabilité très élevée que tous
les
coefficients dans un arbre quadruple soient plus petits qu'un certain
seuil si la racine de cet
arbre est plus petite que ce seuil. Ceci
entraîne alors un seul code zerotree pour tout l'arbre.
39 -
Compression d'images animée par codage EZW 3D
Chapitre 3 Codage EZW
Ceci dit, en balayant toute la représentation des
coefficients d'ondelettes, des basses aux hautes fréquences, on aura
automatiquement beaucoup de zerotree ce qui constituera un gain
considérable au niveau de la compression.
Une bonne approche est d'utiliser un seuil et seulement un
signal au décodeur si les valeurs sont plus grandes ou plus petites que
le seuil. Si nous transmettons également le seuil au décodeur, il
peut reconstruire une bonne partie de l'image. Pour arriver à une
reconstruction parfaite, on doit cependant répéter le processus
après abaissement du seuil, jusqu'à ce que le seuil devienne
inférieur au plus petit coefficient que nous avons voulu transmettre.
Nous pouvons rendre ce processus beaucoup plus efficace par la soustraction du
seuil du coefficient d'ondelette qui lui était supérieur. Le
choix des seuils peut être optimisé en considérant un lien
entre eux, si l'ordre prédéterminé est un ordre des
puissances de deux, le codage est appelé codage « bitplane »,
puisque les seuils correspondent dans ce cas-ci aux bits dans la
représentation binaire des coefficients. Le codage d'EZW tel que
décrit dans [17] utilise ce type de seuils.
L'information additionnelle minimale exigée par le
décodeur, outre le code des coefficients signifiants, est le nombre de
niveaux de transformées d'ondelettes utilisés et le seuil
initial. Si on retranche le coefficient après son codage, il est
nécessaire d'envoyer aussi la valeur moyenne de l'image, ça
permet une meilleure reconstruction et l'obtention d'un meilleur PSNR.
3.3 Algorithme
L'algorithme peut être divisé en deux parties :
une tache principale (aussi passage dominant) qui constitue le fond de tache du
codeur, et une partie secondaire ou subalterne qui est plus pour le raffinement
de la reconstruction de l'image pendant le décodage.
3.3.1 Traitement principal
Comme initialisation de l'algorithme, on choisit le seuil de
départ, pour le « bitplane coding », le seuil de départ
est défini par [17] :
t log max ,
[ ( im ( x y ) ) ]
= 2 3.1
2
0
40
Compression d'images animée par codage EZW 3D
Chapitre 3 Codage EZW
Où im(x, y) désigne
les coefficients d'ondelettes, x et y étant leur position dans
l'espace.
Le symbole « Max » correspond à la valeur
maximale de tous les coefficients de la représentation en ondelettes de
l'image. Ce seuil, comme le montre la définition, est un multiple de
deux, en fait c'est la puissance de deux la plus proche (inférieur ou
égale) du maximum des coefficients de l'image Cette puissance fera
partie par la suite du paquet d'informations transmis pour initialiser le
décodage, cette partie sera développée plus en
détail dans la description du protocole du codec EZW.
La matrice de coefficients est parcourue par l'une des
méthodes suivantes :
« Raster scan » ou «
Morton scan » (figure 3.2). Ces méthodes
de parcours ont été choisies de manière a préserver
l'ordre d'importance des coefficients traités, ainsi, pour les deux
types, on commence par parcourir les coefficients de basse fréquence, et
on avance graduellement vers les détails (hautes fréquences ), la
différence entre elles est la façon avec laquelle est parcourue
une même sous bande .La figure 3.2 illustre l'ordre de
parcours des coefficients pour les deux méthodes sur une matrice issue
de transformée en ondelette à trois niveaux de
décomposition .
41 -
Compression d'images animée par codage EZW 3D
Chapitre 3 Codage EZW
Chacun des coefficients parcourus est comparé (en valeur
absolue) au seuil t0, si le
coefficient est supérieur au seuil il est codé
' Positif ' ou ' Négatif ', sinon il est soit ' Zéro isole ' ou
bien ' Zerotree', on se ramène ainsi de X (selon niveaux de gris,
résolution de l'image...) symboles à coder a un dictionnaire de
quatre symboles :
· Positif (P) : indique que la valeur
absolue du coefficient traité est supérieure au seuil et que son
signe est positif.
· Négatif (N) : indique que la
valeur absolue du coefficient traité est supérieure au seuil et
que son signe est négatif.
42 -
.
Figure 3.2 : Méthodes de parcours des
coefficients
Morton scan
Raster scan
Compression d'images animée par codage EZW 3D
Chapitre 3 Codage EZW
· Zéro isolé (Z) :
indique que la valeur absolue du coefficient traité est
inférieure au seuil et qu'il existe parmi ses descendants (selon
l'arborescence présentée dans la Figure 3.1)
ceux qui sont signifiant (c'est à dire supérieurs au seuil).
· Zerotree (ZTR) : indique que la
valeur absolue du coefficient traité est insignifiante par rapport au
seuil considéré ainsi que tous les coefficients qui lui
succèdent dans l'arbre de descendance.
Après le parcours de tous les coefficients, le seuil
est divisé par deux, et l'opération est refaite selon le nouveau
seuil, cette méthode est appelée 'quantification par
approximations
successives' et peut être refaite tant que le seuil t
n , est supérieur ou égal à 1 , sachant
que :
t n = tn-1 /2 3.2
3.3.2 Traitement secondaire
Le traitement secondaire (passage subalterne) sert à
faire du raffinement sur les valeurs des coefficients, ainsi, après
chaque passage dominant, chaque coefficient codé ' Positif ou
Négatif ' subit une autre comparaison sur un autre seuil t
qui est proportionnel au seuil du passage dominant n
t = 2 . [17]
= +
2 n
t n
|
2 2
n 1 n
+-
|
3.3
|
|
|
Ceci peut être ramené à :
tn 3.4
= n
3 * 2 - 1
Où n est la puissance du seuil du passage dominant.
Ce passage secondaire permet au décodeur dans le cas
d'une compression avec pertes d'informations, d'avoir plus de précision
sur la valeur du coefficient codé, certes, la reconstruction ne sera pas
parfaite, mais, elle sera de loin meilleure que si on ne code qu'avec le
passage dominant.
43 -
Compression d'images animée par codage EZW 3D
Chapitre 3 Codage EZW
Dans le cas où l'on veut effectuer une compression sans
pertes d'informations, le passage subalterne devient inutile.
3.3.3 Protocole de codage
Pour que le codage soit parfait, un protocole entre codeur et
décodeur est établi, ainsi, le décodeur doit
connaître le dictionnaire de codage (dans ce cas les 4 symboles
utilisés au codage), et le type de parcours des coefficients
effectués (Raster ou Morton scan). Pour sa part, le codeur doit
transmettre au moins le seuil de départ, de préférence la
puissance associée à ce seuil (une puissance de deux puisque le
codage est bitplane), et le nombre de niveaux de décomposition par
ondelettes. On peut aussi trouver dans certains cas une condition d'arrêt
si l'on effectue une compression sans pertes d'informations.
3.3.4 Décodage
En premier lieu, le décodeur crée une matrice
de dimension égale à l'image traitée à partir du
nombre de niveaux de décomposition, ensuite, comme le codeur, il calcule
le premier seuil dont la puissance lui a été transmise. Le
parcours de la matrice 'image' commence alors et selon les symboles lus par le
décodeur un traitement est effectué :
· Si le symbole est 'Positif ' (P), la valeur du seuil est
additionné au contenu de la case en cours.
· Si le symbole est 'Négatif (N), Le seuil est
retranché du coefficient parcouru.
· Si le symbole est 'Zerotree' (ZTR), tout l'arbre
associé à ce coefficient sera ignoré par rapport au seuil
courant.
· Si le symbole est 'Zero isolé' (Z) : cela veut
dire qu'il existe au moins un coefficient appartenant à l'arborescence
du coefficient étudié qui est signifiant par rapport au seuil
courant d'où, aucun coefficient ne sera ignore dans cette
arborescence.
A la fin du parcours, le seuil est divisé par deux et
l'algorithme reprend. Si le seuil atteint la valeur 1, la reconstruction ne
sera parfaite sans aucune perte, mais au cas où l'on désire
arrêter avant le décodage idéal, on peut avoir recours au
traitement secondaire qui permettra plus de précision au niveau de la
compression avec pertes d'informations.
Le principe général de la méthode est
illustré par l'organigramme suivant :
44 -
Compression d'images animée par codage EZW 3D
Chapitre 3 Codage EZW
Coefficients de l'image
Figure 3.3 : Test de signifiance des
coefficients
Oui
Pas de sortie
Non
Oui
Pas de sortie
Non
Non
Oui
+
-
Sortie « Zi »
Ajoutez à la liste
Subordonnées
Quel
signe ?
Oui Non
Précédemment
Significatif
Significatif ?
A des
descendants
significatifs
Descend de
la racine de
zerotree
Sortie « P »
|
|
Sortie « N »
|
|
Sortie « Zt »
|
|
|
|
|
|
|
|
|
|
|
|
|
45 -
Compression d'images animée par codage EZW 3D
Chapitre 3 Codage EZW
3.4 Exemple
La méthode est illustrée par l'exemple suivant, le
codage a été appliqué sur la matrice de coefficients
à trois niveaux de décomposition suivante :
Figure 3.4 : Exemple de Shapiro
Seuil initial
Type de parcours choisi Raster scan.
Résultats obtenus
Premier passage dominant
Le tableau suivant montre les coefficients parcourus pour
t=32, et les résultats obtenus avec l'algorithme EZW ; nous employons
les symboles DL et SL pour les liste dominantes et subordonner , respectivement
, Le signe F dans la liste dominante indique que le coefficient est
significatif pour le seuil courant.
46 -
Compression d'images animée par codage EZW 3D
Chapitre 3 Codage EZW
Tree Output
|
Root Symbol
|
DL: dominant list SL: subordinate list
|
|
|
DL = {(0,0)}
SL = Ø
|
(0,0)
|
POS
|
DL = {(0,0) F, (0,1), (1,0), (1,1)} SL =
{63}
|
(0,1)
|
NEG
|
DL = {(0,0) F, (1,0), (1,1), (0,2), (0,3),
(1,2), (1,3), (0,1) F} SL = {63,34}
|
(1,0)
|
IZ
|
DL = {(0,0)F,(1 ,0),(1 ,1),(0,2),(0,3),(1
,2),(1 ,3),(0, 1)F,(2,0),(2, 1),(3,0),(3,1)}
|
(1,1)
|
ZTR
|
|
(0,2)
|
POS
|
DL= {(0,0) F, (1,0), (1,1), (0,3), (1,2),
(1,3), (0,1) F, (2,0), (2,1), (3,0), (3,1), (0,4), (0,5),
(1,4), (1,5), (0,2) F}
SL = {63, 34,49)}
|
(0,3)
|
ZTR
|
|
(1,2)
|
ZTR
|
|
(1,3)
|
ZTR
|
|
(2,0)
|
ZTR
|
|
(2 ,1)
|
IZ
|
DL = {(0,0) F, (1,0), (1,1), (0,3), (1,2),
(1,3), (0,1) F, (2,0), (2,1), (3,0), (3,1), (0,4), (0,5),
(1,4), (1,5), (0,2) F, (4,2), (4,3), (5,2), (5,3)}
|
(3,0)
|
ZTR
|
|
(0,4)
|
Z
|
|
(1,4)
|
Z
|
|
(4,2)
|
|
|
(3,0)
|
ZTR
|
|
(0,4)
|
Z
|
|
(1,4)
|
Z
|
|
(4,3)
|
POS
|
DL = {(0,0) F, (1,0), (1,1), (0,3), (1,2),
(1,3), (0,1) F, (2,0), (2,1), (3,0),
(3,1), (0,4), (0,5), (1,4), (1,5), (0,2) F,
(4,2), (5,2), (5,3), (4,3) F}
SL = {63, 34, 49,47}
|
(5,2)
|
Z
|
|
(5,2)
|
Z
|
|
|
|
DL = {(0,0)F,(1 ,0),(1 , 1),(0,3),(1
,2),(1 ,3),(0, 1)F,(2,0),(2,1),(3,0),
(3, 1),(0,4),(0,5),(1 ,4),(1 ,5),(0,2)F,
(4,2),(5,2),(5,3),(4,3)F) SL =
{63,34,49,47)
|
|
Tableau 3.1 : les coefficients parcourus pour
t=32
47 -
Compression d'images animée par codage EZW 3D
Chapitre 3 Codage EZW
Commentaires :
· Le coefficient '63' est supérieur au seuil, et
comme il est positif, il est codé 'P', il est aussi supérieur au
seuil secondaire donc, son second code est 1 , ce coefficient va changer de
valeur pour le prochain passage dominant, on aura dans cette position 31
· On a ici un coefficient négatif '-34' dont la
valeur absolue est supérieur au seuil actuel, il est donc codé
'N', cependant, dans le passage secondaire, il est inférieur au seuil
secondaire, donc il est codé '0' pour le passage subalterne.
· Le coefficient 31 est inférieur au seuil (en
valeur absolue), et comme il possède un descendant dont la valeur est
supérieur au seuil (47 dans la sous-bande LH1), il est codé '2'
(Zero isolé). Le traitement secondaire n'est pas effectué dans ce
cas vu que le coefficient n'est codé ni positif ni négatif.
· On remarque que le coefficient '23' ainsi que tout ses
descendants sont insignifiants par rapport au seuil considéré,
d'où, le coefficient actuel sera code 'Zerotree' (ZTR), et tous ses
descendants ne seront pas traités pendant ce passage.
· Les principales remarques c'est que les sous bandes
HH1 et HH2 ne figure pas dans la liste, et ceci parce qu'ils sont descendant
d'un arbre de zéros (zerotree), c'est pourquoi on a sur 64 coefficients
dans la matrice, juste 20 d'entre eux sont codés.
Les résultats complets de cet exemple donnent
:
t= t s =
0 3 2 ; 0 48 D1:
pnztpttttz tttttttptt
t= t s =
1 1 6 ; 1 24
D2 :
ztnptttttt tt
t= t s = 3 8; 3 12
D3 : zzzzzppnpp
nttnnptptt nttttttttp tttptttttt tttptttttt tttttt
S3:1001110111 1011011000
48 -
Compression d'images animée par codage EZW 3D
Chapitre 3 Codage EZW
t= t s 4 4; 4
D 4 : zzzzzzztzt znzzzzpttp
tpptpnptnt ttttptpnpp pptttttptp tttpnp
6
S4:1101111101 1001000001 110110100010010101100
t= t s = 5 2 ; 5
|
3
|
D5 : zzzzztzzzz ztpzzzttpt tttnptpptt ptttnppntt
|
ttpnnpttpt tppttt
|
S5:1011110011 0100010111 1101011011 0010000000
0110110110 011000111
D 6 : zzzttztttz tttttnnttt
Où :
ti = Seuil, tsi = valeur
de reconstruction
P : Positif.
N : Négatif.
Z : Zéro isolé.
T : Zerotree.
D : passage dominant. S :
passage subalterne.
On remarque que pour t = 1, on a effectué
juste le passage dominant, ceci s'explique par le fait que si on arrive a ce
stade, c'est que la reconstruction est parfaite, donc on n'a pas besoin de
raffinement, d'où la non utilisation du passage secondaire.
49 -
Compression d'images animée par codage EZW 3D
Chapitre 3 Codage EZW
3.5 Organigramme de l'algorithme EZW
Figure 3.5 : Organigramme de l'algorithme EZW
Début
Application de la transformation en
ondelettes sur
l'image
Seuil : To = max de coefficient d'image transformée
divisé par d
Liste dominante contenant tous les coefficients de la sous
bande
plus basse fréquence
Liste subordonnée
vide
Dominante passe
Subordinate passe
T = T/2
Non
PSNR
RC
Oui
STOP
50 -
Compression d'images animée par codage EZW 3D
Chapitre 3 Codage EZW
3.6 Conclusion
Malgré toutes les recherches qui ont suivi la mise en
oeuvre du codage zerotree, il demeure une des méthodes de codage les
plus utilisés et la plus souvent citée dans les revues
spécialisées.
L'avantage de cette méthode est de classer les
coefficients par ordre d'importance et de permettre un codage progressif qui
permet par la suite d'avoir une bonne représentation de l'image selon un
taux de compression désiré. Cependant, le codage EZW en lui
même n'effectue pas de la compression, il doit être associé
au codage arithmétique, qui jusqu'à ce jour demeure le codage
entropique le plus efficace associé au EZW.
51
Compression d'images animée par codage EZW 3D
Chapitre 4 Simulation, Résultats et
Discussions
C H A P I T R E 4
Simulation, résultats et discussion
4.1 Introduction 4.2 Simulation 4.3
Résultats
4.4 Discussions 4.5 Conclusion
4.1 Introduction
La tendance actuelle est à l'utilisation croissante
d'images digitalisées. La plupart des techniques modernes d'imagerie et
de vidéo produisent des données 3D, (télé HD, IRM,
scanner, échographie).
Certaines images sont intrinsèquement volumiques alors
que d'autres correspondent au contraire à une succession d'images 2D
(encore appelée pile d'images), à laquelle on ajoute une
dimension supplémentaire, à savoir l'écart entre deux
coupes successives .Ce qui est notre cas dans ce mémoire.
De fait, la majorité des vidéos produites de nos
jours peuvent être vues comme des images à au moins trois
dimensions. La quantité importante de ces images volumiques produites
par les différents canaux de transmissions se chiffre à plusieurs
Téra octets.
Par exemple dans le cas de l'imagerie médicale, dans un
service classique de radiologie les données d'une seule année
nécessitent un volume de stockage conséquent.
L'augmentation croissante et continue des capacités de
stockage apporte une réponse partielle à ce problème mais
demeure la plupart du temps insuffisante. La compression semble donc
incontournable pour résoudre ce problème d'archivage. De plus,
elle présente un intérêt évident pour la
transmission de ces images qui peut s'avérer délicate du fait des
bandes passantes existantes.
52 -
Compression d'images animée par codage EZW 3D
Chapitre 4 Simulation, Résultats et
Discussions
Actuellement, le meilleur moyen pour répondre aux
exigences est d'effectuer une compression sans perte. Ce type de compression
avec une reconstruction exacte de l'image de départ, garantissant
l'intégrité des données demeure le
préféré.
Pour ce type de compression, il faut toujours trouver un
compromis entre le taux de compression et la fidélité des
données, c'est le défi majeur qu'il faut relevé.
Une manière simple d'effectuer la compression est
d'appliquer un algorithme de compression 2D pour chaque coupe
indépendamment. Ainsi, l'idée de base des algorithmes de
compression des images 3D est de s'appuyer sur la corrélation des
coefficients dans les trois dimensions pour améliorer les performances
de codage.
La majorité des approches utilise une
transformée 3D décorrélante avec des algorithmes de
quantification/codage qui ont prouvé leur efficacité dans le cas
des images 2D. [4.1] [4.2]
4.2 Simulation
4.2.1 Structure du programme
Dans notre application pour la compression d'image en
mouvement ; nous utilisons des transformations en ondelettes tridimensionnelles
pour décomposer la séquence d'images en sous-bandes selon une
architecture pyramidale. Cette opération nous permet d'avoir alors des
sous bandes non corrélées entres elles , ce qui permet de
réaliser au mieux les étapes suivantes de codage . On a
utilisé le codage EZW 3D qui est une extension du codage EZW2D
déjà mentionné dans le chapitre
précédent.
La structure générale de la chaîne de
compression (analyse et synthèse) sur laquelle repose ce travail est
représentée en la figure 4.1.
53 -
Compression d'images animée par codage EZW 3D
Chapitre 4 Simulation, Résultats et
Discussions
Séquence originale
|
|
Décomposition Sous-bands 3D
|
|
Codeur EZW3D
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Canal de
Transmission
|
|
|
|
|
|
|
|
|
|
|
Décodeur EZW3D
|
|
|
Séquence Reconstitue
|
|
Reconstitution Sous-bands 3D
|
|
|
|
|
|
|
|
|
|
|
Figure 4.1 : Algorithme général de
codage
Cette structure est divisée en 2 étapes :
1) Décomposition en ondelettes tridimensionnelles.
2) Codage EZW.
4.2.2. Décomposition tridimensionnelle en
ondelettes
Comme la transformée bidimensionnelle, la
transformée 3D peut être obtenue par une décomposition
séparable à base de la transformée 1D appliquée
dans les trois directions (horizontale, verticale et temporelle). Celte
dernière est à l'origine de la conception des systèmes de
codage vidéo qui ne nécessitent pas une compensation de
mouvement, et qui exploitent la redondance temporelle de la même
manière que la redondance spatiale tout en considérant que le
mouvement est assez lent en fonction du temps.
De ce fait, une partie importante d'énergie du signal est
concentrée principalement dans la sous-bande de plus basses
fréquences spatio-temporelles dans le domaine transformé.
54 -
Compression d'images animée par codage EZW 3D
Chapitre 4 Simulation, Résultats et
Discussions
Il existe deux différents types de décomposition
3D en ondelettes la décomposition dyadique utilisée dans le cadre
de ce mémoire l et la décomposition en paquets d'ondelettes,
[4.2,4.3] .Dans le cas dyadique, une décomposition temporelle est suivie
par une décomposition spatiale et le processus est itéré
pour la sous-bande spatio-temporelle des plus basses fréquences
jusqu'à ce qu'on obtienne un certain niveau de décomposition De
cette façon, le nombre de niveaux de décompositions dans les
directions spatiale ou temporelle est le même, et le nombre des
sous-bandes dans ce cas est 7N+1( où N est le nombre de niveaux de
décompositions spatiotemporelles).
La figure 4.2 montre la structure de
décomposition 3D dyadique en ondelettes à deux échelles
spatio-temporelles où ' Ht ' et ' Bt ' représentent les
sous-bandes temporelles hautes fréquences et basses fréquences
respectivement, et ' Hh ', ' Bh ', ' Hv ' et ' Bv ' représentent les
sous-bandes spatiales hautes fréquences en horizontale, basses
fréquences en horizontale, hautes fréquences en verticale et
basses fréquences en verticale respectivement.
Dans la transformation en paquet d'ondelettes, le nombre de
décompositions spatiales et temporelles peut être
différent. Dans ce cas, la transformée en ondelettes 1D est
appliquée successivement suivant la direction temporelle pour avoir le
nombre désiré d'échelles de décomposition Ensuite,
toutes les images de la séquence sont séparément
décomposées dans les directions horizontale et verticale Le
nombre des sous-bandes qu'on peut avoir est (Nt +1) (3
N5 +1) où Nt et
N5, sont les niveaux de décomposition temporelle et
spatiale,
respectivement. La figure 4.3 montre la
structure d'une décomposition 3D en paquet d'ondelettes. [4.2]
55 -
Compression d'images animée par codage EZW 3D
Chapitre 4 Simulation, Résultats et
Discussions
Hv
Bv
Hv
Bv
Hv
Bt
Bv
Hv
Hh
Ht
GOP
Bh
Hh
Ht
Hh
Bh
Bv
Bv
Bh
Hv
Bv
Hv
Bt
Hh
Hv
Hv
Bv
Bh
Bv
Figure 4. 2 : Décomposition en ondelettes
3D dyadique à deux échelles spatio-temporelles
56 -
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
Compression d'images animée par codage EZW 3D
Chapitre 4 Simulation, Résultats et
Discussions
4.2.3 Codeur EZW3D
L'algorithmes EZW3D est une extension de l'algorithme EZW2D,
que nous avons vus au chapitre précédent, présentant ainsi
des caractéristiques similaires : arrangement par amplitude des
coefficients, transmission des bits les plus significatifs dans la passe de
raffinement et exploitation des autosimilarités à travers les
régions spatio-temporelles de la structure arborescente du signal
décomposé.
De cette façon, le flux de bits reste parfaitement
emboîté, et la qualité progressive de la vidéo est
garantie .La phase de codage peut être arrêtée à tout
moment pour un taux de bits cibles.
Admettant q'une certaine distorsion à la
reconstruction, on continue le traitement jusqu'à ce que toute
l'information soit transmise en cas de reconstruction sans perte ce qui est
parfois désirée dans certaines applications telle que la
télévision haute définition HDTV.
Dans l'algorithmes EZW3D , la passe de triage des coefficients
est effectuée de la même manière que dans les algorithme
EZW2D , la seule différence qui existe est la structure de l'arbre
défini dans le domaine transformé à travers les
sous-bandes. Une fois les coefficients triés (au sens de signification),
la passe de raffinement reste inchangée.
Dans la structure 3D des sous-bandes, un nouvel arbre
d'orientation spatio-temporelle avec sa propre relation parent-enfants a
été introduit [4.1] [4.2] [4.3] [4.4]. Il est défini de
telle sorte que chaque noeud ait huit enfants (Figure 4.3 et
4.4). Pour la liste dominante contient tous les pixels de la
sous-bande de plus basses fréquences (le niveau le plus haut de la
pyramide) qui sont les racines de l'arbre .Et à l'exception des
sous-bandes de plus bas niveaux de la pyramide, les enfants d'un pixel de
coordonnées (i, j, k) dans une décomposition dyadique est
l'ensemble O (i, j, k) :
O (i, j, k) = {(2i,2j,2k),
(2i,2j+l,2k), (2i+l.2j.2k), (2i+l,2j+l,2k), (2i,2j,2k+l), (2i+l,2j,2k+l),
(2i,2j+l,2k+l), (2i+l,2j+l,2k+l)} [4.2]
57
Compression d'images animée par codage EZW 3D
Chapitre 4 Simulation, Résultats et
Discussions
|
|
|
|
|
|
|
|
|
|
Hv
|
|
HHH1
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Hh
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Bv
|
|
|
|
|
|
|
|
|
|
|
|
HHB1
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ht
|
|
|
|
|
|
|
|
|
Hv
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
HBH1
|
|
|
|
|
|
Bh
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Hh
Bh
Bv
Hv
Bv
Hv
Bt
HBB1
BHH1
BHB1
BBH1
Bv
BBB1
Figure 4 .3 : Illustration d'un exemple de
décompression tridimensionnelle à une étape
58 -
Compression d'images animée par codage EZW 3D
Chapitre 4 Simulation, Résultats et
Discussions
Figure 4.4 : Illustration de chaque parent ayant
huit fils
Compression d'images animée par codage EZW 3D
59 -
Chapitre 4 Simulation, Résultats et
Discussions
4.3 Résultats
1) Les séquences de test
Des séquences vidéo à niveaux de gris
(Figure 4.5, 4.6) représentent des séquences de
test connues et utiliser dans beaucoup de travaux de recherche (images IRM) on
été utilisées pour évaluer les performances du
codeur EZW.
Le tableau ci-dessous illustre les caractéristiques de
chacune de ces séquences :
Séquence
|
Dimension
|
Nombre d'images
|
Taille Brute (Octets)
|
Description
|
1. Brain
|
256 x 256
|
16
|
90.208
|
Séquence médicale (IRM)
|
2. Head
|
256 x 256
|
16
|
90.991
|
Séquence médicale (IRM)
|
|
Tableau 4.1 : caractéristiques des
séquences test
Figure 4.5 : Image 01 de la séquence
Brain (Droite)
Figure 4.6 : Image 01 de la séquence
Head (Gauche)
60
Compression d'images animée par codage EZW 3D
Chapitre 4 Simulation, Résultats et
Discussions
2) Estimation des performances
· Taux de compression (RC)
Le taux de compression, souvent utilisé, est l'inverse
du quotient de compression, il est habituellement exprimé en pourcentage
.il est mesuré par le rapport entre le volume des données
initiales et celui des données codées .Plus le taux de
compression est élevée ; plus l'espace nécessaire pour le
stockage diminue, ainsi que le temps nécessaire pour la transmission .Il
est calculé par la formule suivante :
Taille de l'image après le codage entropie
RC (%) = 100 - × 100 4.1
Taille de l'image originale
· Qualité de l'image compressée
(PSNR)
Nous allons présenter les résultat obtenus pour
les deux séquences de test utilisées en terme de rapport signal
sur bruit crête (PSNR en dB), et taux de compression TC (bits/pixel). Ce
paramètre est exprimé par la relation suivante :
?
PSNR (dB) = 10 log10 ??
255 4.2
2 ?
?? EQM
Avec : ( )
EQM = -
x i y j
n m
*
2
1 ??
n
m
i = =
1 1
j
(erreur quadratique moyenne) 4.3
n,m : la longueur et la largeur de l'image.
xi; , yi : les valeurs de l'image
originale et l'image reconstruite respectivement.
255 : la valeur maximale (niveau de gris) de l'image originale ;
égale à 255 pour les images en bits/pixel.
61 -
Compression d'images animée par codage EZW 3D
Chapitre 4 Simulation, Résultats et
Discussions
3) Choix des filtres
Pour effectuer une étude comparative entre les deux
séquences, nous avons choisi trois types d'ondelettes (Haar,
Daubechies4, Biorthogonale3.3) sachant que le filtrage temporel s'effectue
toujours avec l'ondelette de Haar.
Figure 4.7 : Coefficient des filtres de
décompositions et de reconstructions associés
obtenus par
l'ondelette de Haar
62 -
Compression d'images animée par codage EZW 3D
Chapitre 4 Simulation, Résultats et
Discussions
Figure 4.8 : Coefficient des filtres de
décompositions et de reconstructions associés
obtenus par
l'ondelette de Daubechies 4
63 -
Compression d'images animée par codage EZW 3D
Chapitre 4 Simulation, Résultats et
Discussions
Figure 4.9 : Coefficient des filtres de
décompositions et de reconstructions associés
obtenus par
l'ondelette de Biorthogonale3.3
64 -
Compression d'images animée par codage EZW 3D
Chapitre 4 Simulation, Résultats et
Discussions
Les tableaux suivants représentent les
résultats de simulation sur les deux plans, qualitatif (PSNR en dB) et
quantitatif (RC %) pour les deux séquences dans le cadre du codage EZW
3D.
4) Les tableaux récapitulatifs des
résultats 1) Séquence Head
RC (%)
|
PSNR (dB)
|
97.11
|
22.8284
|
93.85
|
27.0078
|
88.84
|
31.3420
|
|
Tableau 4.2 : Résultats obtenus par le
filtre Haar
RC (%)
|
PSNR (dB)
|
97.16
|
23.6177
|
94.41
|
28.2399
|
90.19
|
32.3919
|
|
Tableau 4.3 : Résultats obtenus par le
filtre db4
RC (%)
|
PSNR (dB)
|
96.09
|
24.9943
|
92.70
|
29.5087
|
88.09
|
32.0410
|
|
Tableau 4.4 : Résultats obtenus par le
filtre Bior3.3
65 -
Compression d'images animée par codage EZW 3D
Chapitre 4 Simulation, Résultats et
Discussions
2) Séquence Brain
RC (%)
|
PSNR (dB)
|
96.87
|
22.3333
|
93.61
|
26.7253
|
88.49
|
30.7962
|
|
Tableau 4.5 : Résultats obtenus par le
filtre Haar
RC (%)
|
PSNR (dB)
|
96.93
|
23.1504
|
94.14
|
27.7794
|
90.08
|
31.7530
|
|
Tableau 4.6 : Résultats obtenus par le
filtre db4
RC (%)
|
PSNR (dB)
|
96.01
|
24.7447
|
92.75
|
29.6394
|
88.37
|
32.0093
|
|
Tableau 4.7 : Résultats obtenus par le
filtre Bior3.3
Compression d'images animée par codage EZW 3D
66 -
Chapitre 4 Simulation, Résultats et
Discussions
5) Les Figures des images reconstituées 1)
Séquence Head
Images originales
|
Reconstituées avec Haar PSNR=31
.342 RC=88.84
|
Reconstituées
avec Db4 PSNR=32.3919 RC=90.19
|
Reconstituées avec Bior
3.3 PSNR=32.041 RC=88.09
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Tableau 4.8 : cinq images
reconstituées de la séquence Head
67
Compression d'images animée par codage EZW 3D
Chapitre 4 Simulation, Résultats et
Discussions
2) Séquence Brain
Images originales
|
Reconstituées avec Haar PSNR=31
.342 RC=88.84
|
Reconstituées avec Db4 PSNR=31
.753 RC=90.08
|
Reconstituées avec Bior
3.3 PSNR=32.0093 RC=88.37
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Tableau 4.9 : cinq images reconstruits de la
séquence Brain
68
Compression d'images animée par codage EZW 3D
Chapitre 4 Simulation, Résultats et
Discussions
Figure 4.10 : Graphe : Taux de compression /
PSNR
Compression d'images animée par codage EZW 3D
69 -
Chapitre 4 Simulation, Résultats et
Discussions
4.4 Discussions
D'après ces résultats, nous remarquons que la
méthode de codage EZW 3D conserve sa propriété de
transmission progressive des données, et nous donne un flux de bits
décroissant par ordre de signifiance, c'est à dire une
transmission des bits de poids forts en premier lieu.
Cela nous permet d'avoir des taux de compression
élevés et une qualité d'images reconstituée
acceptable et exploitable.
D'après la figure 4.10 on constate une augmentation du
taux de compression, quand le PSNR se dégrade ; à cause de la
diminution des coefficients significatifs à coder.
Le PSNR (rapport signal sur bruit) obtenu dans les trois
filtres se situe entre 22 et 33db et le taux de compression entre 88% et 98%,
car pour des images médicales un PSNR de 30 dB est largement suffisant
pour leur exploitation.
Un compromis entre un PSNR de 30dB et Un taux de compression
supérieur à 88% est toujours préférable puisque il
garantit la qualité et la compression en même temps.
Le choix du filtre n'influe pas sur la qualité des images
reconstituées, il montre une marge de 1dB seulement.
Le temps de calcul reste le seul désavantage , une
séquence 3D ( 256x256x16) nous donne 1048576 pixels à
traité , car avec un PC d'une configuration moyenne le temps d'attente
est un peu long.
70 -
Compression d'images animée par codage EZW 3D
Chapitre 4 Simulation, Résultats et
Discussions
4.5 Conclusion
En général ; on peut dire que le codeur EZW
utilisé dans ce travail permet d'attendre des très bons
résultats de point de vue qualité des séquences d'images ;
et un bon taux de compression.
L'EZW en effet permet de réduire énormément
la quantité des données contenues dans les séquences
d'images toute en conservant leurs propriétés originales.
La compression est n'est pas affectée par le choix des
filtres utilisés (Haar, db4, Bior3.3).
Un compromis est toujours trouvé entre le taux de
compression et la qualité des images.
71 -
Compression d'images animée par codage EZW 3D
Conclusion générale
Nous avons étudié une méthode de
compression d'images basée sur l'utilisation de TOD 3D (la
transformée en ondelettes tridimensionnelles) et le codage
hiérarchique EZW 3D (Embedded Zerotree wavelet 3D).
Ce travail se base sur l'utilisation de ce codeur sur
différent transformée en ondelettes (Haar, daubechies,
Biorthogonale) et leur influence sur des séquences d'images
biomédicale (IRM) sur le plan qualitatif et quantitatif.
Cette étude nous a permit d'obtenir des résultats
satisfaisants de point de vue PSNR (rapport signal sur bruit) et taux de
compression (qui peut attendre 90%).
Notre travail a été appliqué et
analysé sur des images 3D « deux séquences d'images
biomédicales » .Le codeur EZW à la propriété
de la transmission progressive des données. Il permet aussi le choix
entre une compression conservatrice ou non selon le choix du seuil de
signifiance.
La qualité des images reconstituées peut
être améliorée en utilisant progressivement plus de
coefficients d'ondelettes. Ceci est possible car le codage EZW permet de
classifier ces coefficients par ordre décroissant d'importance. Notons
aussi que la séquence de transmission des coefficients d'ondelettes
dépend des résultats désirés. Pour avoir une image
reconstituée qui ressemble a l'image originale, il faut transmettre au
début des coefficients d'ondelettes importants qui contribuent à
faire apparaître sur l'image reconstituée les informations de
hautes fréquences comme les bords et par la suite, des coefficients
d'ondelettes de moindre importance qui à leur tour contribuent à
faire apparaître sur l'image reconstituée les informations de
basses fréquences comme des zones de niveaux de gris constants.
En perspectives nous proposons:
· D'utiliser un autre langage de programmation tel que le
langage C. Parce que la programmation du schème de compression utilise
énormément de structures et
la programmation par TM
MATLAB n' y est pas adaptée.
· L'Application d'un codage arithmétique sur le flux
à transmettre.
Chapitre 1
[1.1]
http://fr.wikipedia.org/wiki/Image_num%C3%A9rique
[1.2]
http://danjean.developpez.com/video/signal-video-numerique
[1.3]
http://fr.wikipedia.org/wiki/MPEG-1
[1.4]
http://fr.wikipedia.org/wiki/MPEG-2
[1.5]
http://fr.wikipedia.org/wiki/MPEG-4
[1.6]
fr.wikipedia.org/wiki/MPEG-7
[1.7]
http://fr.wikipedia.org/wiki/MPEG-21
[1.8]
http://fr.wikipedia.org/wiki/Compression_de_donn%C3%A9es
[1.9]
http://fr.wikipedia.org/wiki/Compression_d%27image
[1.10]
fr.wikipedia.org/wiki/Compression_vidéo
Chapitre 2
[2.1] S.Mallat,(1989). Multifrequency channel
decomposition of images and wavelet models. IEEE Transactions and Acoustics.
Speech and Signal Processing, 37(12),pp (2091-2110). [2.2]
Alpert B.K., (1992). Wavelets and Other Bases for fast Numerical Linear
alagbra. Acadernic Press.
[2.3] Bourges-Sévenier Mikael, (1994).
Wavelib 1 .O User's guide. IRISA/INRIA, Campus de Beaulieu, 35042 RENNES,
France.
[2.4] S. Mallat, (1989). A theory for
multiresolution signal decompostion : The wavelet representation. IEEE Trans
Pattern analvsis and machine Intellinence,ll, pp. 674- 693
[2.5] Grossmann, A., Morlet, J., (1987). Math.
& Phys., Lectures on recent results. L.Streit, World Scientific.
[2.6] Beylkin G., Coifman R. and
Rokhlin.,(1991). Fast Wavelet Transform and Numericals Algorithms.
Communications on Pure and Applied Mathematics, XLIV, pp. 141-183.
[2.7] Battle G., (1987). ABlock Spin
construction of Ondelettes. Comm. Math. Phvs., 110, pp. 601-615.
[2.8] Antonini M., Badaud M., Mathieu P. and
Daubechies I., (1992). Image Coding Using Wavelet Transfom. IEEE Transactions
on image Processinq, i(2), pp. 205-220.
[2.9] Belfiore J.C. and Vallet R., (1992).
Apport des Modulation fractales pour les Canaux à
Évanouissements.
[2.10] Chui C.K., (1992). An introduction to
Wavelets. Academic Press.
[2.11] Chui C.K., (1992). Wavelets : A Tutorial
in the Theorv and Applications. Academic Press.
[2.12] Coifman R.R., Meyer Y., Quaks S. and
Wickerhauser M.V., (1990). Signal Processing and Compression with Wave Packet.
Num. Algo. Research Group,Dept of Math. Yale University.
[2.13] Coifman R.R and Wickerhauser MeV.,
(1990). Entropy-based Algorithms for Best Basis Selection. IEEE Transaction on
Information Theory, 38(2), pp. 7 13-7 18.
[2.14] Coifman R.R and Wickerhauser M.V.,
(1990). Best adapted wave Packed bases Num. Algo. Research Group, Dept of Math.
Yale University.
[2.15] Bond D.M. and Vavasis S.A., (1994). Fast
Wavelet Transforms Matrices Arising from Boundarv Element Methods.
[2.16] Alpea B.K., (1993). A Class of Banes in
2
I for the Sparse Representation of Integral
Operators SIAM J. Math. Ad., 3(1), pp. 246-262.
Chapitre 3
[3.1] Shapiro, J.M.(1993), Embedded image coding
using zerotrees of wavelet coenicients, IEEE Trans. On signal processing, 4 1
(1 2), pp.3445-3456.
[3.2] Said, A., Pearlman, W. (1996) New, fast
and efficient image codec based on set partitioning hierarchical trees, IEEE
Trans. Cire.& Sys. Video Tech, vo1 .6 no.3, pp. 243-249.
Chapitre 4
[4.1] Un schéma de compression avec
pertes efficace pour les images médicales volumiques. [4.2]
Z.Athmane Compression d'images en mouvement par la transformée
en ondelettes. [4.3] Beong-Jo Kim and William A.pearlman, ( An
Embedded wavelet video Coder Using
Three-Dimensional Setprtitioning in hiérarchical trees (
SPIHT) ) .
[4.4] Y.chen and W. A.pearlman «
Three-dimension Subband Coding of video using the zerotree methode in visual
communications and image precessing « Prov SPIE2727 pages 1302-1309 mars
1996.