1.3 ACP de densités de probabilité
1.3.1 Introduction
L'ACP classique a entre autres pour objectif de
représenter dans un espace de faible dimension, un nuage de
points représentant m individus ou objets décrits par
p variables numériques, en utilisant soit les
corrélations soit les covariances entres les variables [301.
L'analyse en composantes principales de densités de
probabilité poursuit le même objectif, sauf que les
individus sont des fonctions de densités et l'espace des individus est
un espace fonctionnel de dimension infinie.
On introduit la mesure d'affinité (produit scalaire
entre deux densités) [281 avec laquelle on définit un
opérateur compact autoadjoint V (appelé aussi
opérateur de covariance [291) dont la diagonalisation
fournira une base suivant laquelle seront décomposées
les densités. Grace a la proposition 1.2.4, l'étude se
ramène a la diagonalisation d'une matrice
symétrique et les densités seront
représentées dans la base des vecteurs propres de cette
matrice.
1.3.2 Affinité L2 entre deux densités de
probabilités
Soit f1,...,fL un nuage de L
densités de probabilités, supposées appartenir a
l'espace de Hilbert H = L2(IR") des
fonctions de carrée intégrable par rapport a la mesure
de Lebesgue sur IR".
Definition 1.3.1 (Qannari, 1983)
Considérons deux densités de probabilités
f et g, de carrée intégrable par
rapport a la mesure de référence ? sur
(IR",I3IRP). On appelle affinité
L2 entre f et g la
quantité suivante:
Z< f,g >= IRP
f(x)g(x)d(?(x))
(1.3)
Exemple
Soit f et g deux densités
gaussiennes a p dimensions de paramètres respectifs
(ii, Ó) et (in, V ). L'affinité
L2 entre f et g est donnée par la
formule suivante [31;
1
< f,g >= 2 e
(2ð)p 2 |Ó +
V |1
1.3.3 Définition de 1'ACP de densités
|
2 iu-mi2
1 (Ó+V )-1. (1.4)
|
L'objectif de la méthode proposée est d'obtenir
une représentation approchée du nuage des L
densités f1,...,fL. On note
Pg le projecteur orthogonal sur le sous espace
engendré par le vecteur g de H.
Première étape:
On cherche g1 = PL t=1 a(1)
t ft de norme unité dans H, minimisant
la quantité:
Ig1 = XL kPg1(ft) -
ftM2. (1.5)
t=1
Deuxième étape:
On cherche g2 = PL t=1 a(2)
t ft de norme unité dans H,
orthogonale a g1 rendant minimum la
quantité:
Ig2 = XL kPg2(ft) -
ftM2. (1.6)
t=1
Ainsi de suite.
Les fonctions g1,g2... ainsi obtenues,
qui ne sont pas nécessairement des densités de
probabilités, constituent un système orthonormal
[31.
Soit alors l'opérateur compact U défini
sur IRL par:
Vv E IRL, Uv =
XL vtft, v = (v1,...,vL).
(1.7)
t=1
Son adjoint U* est défini par: [31
car:
|
< v,U*g
>RL=< g,Uv >H=
|
XL t=1
|
< ft,g > vt. (1.9)
|
On a alors la définition suivante.
Definition 1.3.2 .
On appelle ACP de densités de probabilités, l'ACP
"pas a pas" de l'opérateur U. La minimisation de (1.5)
est équivalente a la maximisation de la
quantité suivante:
11Pgi(ft)112 =
< ft,g1 >2=
1U*g1l2RL (1.10)
XL t=1

=
Ig1
XL t=1
oil 1.1RL désigne
la norme usuelle de RL.
D'autre part:
1U*g1l2RL
=< U*g1,U*g1
>RL=< g1,UoU*g1
> (1.11)
max (/' ) = max < > . (1.12)
hig111=1 (Ig1)
11g11=1
On déduit de cette derniere définition
que l'ACP de ces densités est équivalente a
l'analyse spectrale de l'opérateur autoadjoint W
= U*oU. Dans la base canonique
e1,...,eL de RL, la matrice W
s'écrit [3]:
<
f1,f1 > ... < f1,fs
> ... < f1,fL >
... ... ...
< ft,f1 > ... < ft,fs >
... < ft,fL >
... ... ...
< fL,f1 > ... < fL,fs >
... < fL,fL >
Remarque
1. Si u de RL est vecteur propre de
l'opérateur W associé a la valeur propre non nulle
ë, alors g = vUu ë est un vecteur
propre de V associé a la meme valeur propre non nulle
ë.
2. Les vecteurs propres de l'opérateur V sont
les facteurs principaux, et leur image par U* sont les
composantes principales.
|