2.2.Flux optique
Similaire à l'approche précédente,
l'utilisation du flux optique ou flot optique procure une information de
mouvement pour chaque pixel de l'image. Ainsi, il mesure les vecteurs de
déplacement à partir de l'intensité des pixels de deux
images consécutives ou temporellement rapprochées. Dans un
contexte de détection de mouvement, les pixels inactifs
possèderont alors une vélocité nulle contrairement aux
pixels appartenant à des objets dynamiques. Une classification sous
forme de regroupement est donc nécessaire afin d'isoler et de localiser
les zones représentant du mouvement. Cette technique a notamment
été utilisée pour la détection de piétons
(Kunret et al.,
2001). Il y a finalement plusieurs méthodes pour
calculer le flux optique, mentionnons entre autres celle de (Lucas
et Kanade, 1981).
L'inconvénient majeur de l'utilisation du flux optique est la somme
importante de calculs à réaliser pour l'estimation du
mouvement.
Par ailleurs, une variante utilisant le block
matching2 peut bénéficier de certaines instructions
optimisées MMX (MultiMedia eXtension ou MatriX Math), ce qui peut
accélérer le traitement global. Néanmoins, une tâche
supplémentaire de classification et d'interprétation est
nécessaire. De plus, si certaines parties d'un objet ne sont pas en
mouvement, elles seront complétement ignorées par cette
méthode. Ça peut être le cas par exemple d'une
séquence vidéo contenant une personne assise par terre et agitant
les bras. Dans cette situation bien précise, le corps de la personne ne
serait pas détecté contrairement à ses bras.
2.3.Soustraction de l'arrière-plan par
modélisation statistique
La présente technique est la moins récente et
l'une les plus utilisées, probablement grâce à sa
simplicité théorique ainsi qu'à sa faible
complexité algorithmique. Le principe fondamental repose sur une
estimation statistique de la scène observée.
2 Le block matching est algorithme utilisé dans
plusieurs algorithmes de compression vidéo pour l'estimation du
mouvement entre différentes images d'une vidéo.
17
Le mouvement est détecté en comparant une image
test (image de référence) avec le modèle
d'arrière-plan calculé auparavant. Certaines hypothèses de
base doivent par contre être respectées pour un fonctionnement
adéquat de cette méthode.
Tout d'abord, la caméra utilisée est fixe et ne
doit bouger à aucun moment. Une caméra à l'épaule
ou une caméra sur pied est un bon exemple de situation non applicable
à la Soustraction d'Arrière-Plan (SAP). Pour ce qui est de la
scène observée, elle doit être relativement constante et
conserver la même apparence. Un paysage observé à partir
d'une voiture à une vitesse constante est donc une bonne
représentation d'une scène non statique. Il est important de
noter qu'aucune limite n'est utilisée pour la quantité d'objets
en mouvement. De plus, des variations de luminosité sont
tolérées en autant qu'elles ne soient pas trop brusques.
Le modèle statistique calculé lors de la phase
d'initialisation est constamment mis à jour, lui permettant ainsi de
s'adapter aux changements qui peuvent se produire dans la scène
observée (par ex : soleil levant). Cette capacité d'adaptation
est commune à toutes les techniques de SAP par modélisation
statistique et leur confère un atout majeur qui sera abordé en
détails tout au long de nos recherches. Par ailleurs, cette
méthode connaît plusieurs implantations différentes qui
varient principalement selon le type de capteur utilisé.
2.3.1. Visibilité sur deux dimensions (2D)
La première catégorie de méthodes de
soustraction d'arrière-plan regroupe les techniques basées sur
l'utilisation d'images 2D dans le spectre visible. Un des modèles de
couleurs le plus fréquemment utilisé pour la modélisation
statistique est le RGB, soient le rouge (R), le vert (G) et le bleu (B).
La technique de base consiste à modéliser
l'arrière-plan à partir de plusieurs images acquises
séquentiellement. Pour chaque pixel de l'image, ainsi que pour chacun
des canaux (R, G et B), une moyenne et une variance sont calculées.
Lorsqu'un pixel test doit être classifié, il faut tout d'abord lui
soustraire la moyenne correspondante dans le modèle statistique. Il sera
alors étiqueté comme un pixel contenant du mouvement seulement si
la valeur absolue du résultat dépasse un certain multiple de
l'écart-type correspondant.
Les travaux de (Horprasert et
al.,2000) ont proposé un nouveau
modèle de couleurs basé sur le RGB. Leur technique permet la
classification des pixels en quatre catégories, soient
l'arrière-plan original, illuminé, ombré et un pixel en
mouvement. Pour
18
ce faire, deux mesures sont ajoutées à la
méthode de base en RGB : la distorsion chromatique
(á) et la luminosité
(CD). Les points faibles de cette approche
résident surtout dans la somme d'opérations
supplémentaires nécessaires pour calculer ces deux mesures ainsi
que les seuils associés. En pratique, certaines erreurs de
classifications peuvent également se produire entrainant, par exemple,
l'identification d'un objet en mouvement comme étant de l'ombre. Il y a
finalement un très grand nombre de méthodes de SAP par
modélisation statistique non abordées dans le cadre de ce travail
(McIvor, 2000), notamment pour des raisons de
complexité et pour lesquelles les gains en performance sur la technique
de base sont relativement négligeables.
|