1.1.3 La variance
Considérons le système des points munis de
masses
Soit N = f(ML,mj/i = 1,2, ...,n) porté
par une droite, chaque
point M' est identifié à son
abscissexL.
Si le centre de gravité n'est pas à l'
origine on aura donc la variance du nuage N est :
VAR(N) = >fmj(xt -
X(G))2/>mj/i ? l) VAR(N) = I~(N)/mtotai
I.1.4 Projection Orthogonale de nuage sur un espace F
Soit un sous ensemble de R , %~ la projection orthogonale
de e, sur F , on va chercher F tel que :
n
@?e - %~?2
i=1
soit minimal ce qui revient d'après le
théorème de Pythagore à maximiser
n
@?%~ - g?2
i=1
Car
?eL - g?2 = ?eL - %~?2 + ?%~ -
g?2
La recherche d'axes portant le maximum d'inertie
équivaut à la construction de nouvelles variables (auxquelles
sont associés ces axes) de variance maximale.
En d'autres termes, on effectue un changement de
repère dans R de façon à se placer dans un nouveau
système de représentation où le premier axe apporte le
plus possible de l'inertie totale du nuage, le deuxième axe le plus
possible de
l'inertie non prise en compte par le premier axe, et
ainsi de suite.
On appelle axes principaux d'inertie les axes de
direction des vecteurs propres de V normés à 1.
Il y en a p.
Le premier axe est celui associé à la plus
grande valeur propre ë1.
On le note u1.
Le deuxième axe est celui associé à
la deuxième valeur propre ë2, on le note u2.
Composantes principales
A chaque axe est associée une variable
appelée
composante principale.
La composante c1 est le vecteur renfermant les
cordonnées des projections des individus sur l'axe 1.
La composante c2 est le vecteur renfermant les
cordonnées des projections des individus sur l'axe 2.
Pour obtenir ces coordonnées, on écrit que
chaque composante principale est une combinaison linéaire des variables
initiales
exemple : C1 = u1x1 +
u2x2 + ? + u x
|