II. Analyse des Données Multidimensionnelle
On dispose de 9 variables continues actives et on travaille
désormais avec des données centrées réduites pour
la mise en oeuvre d'une l'Analyse en Composantes Principales (ACP).
1. Les nouveaux axes
Dans un premier temps nous déterminons le nombre d'axes
avec lesquels nous allons travailler, c'est-à-dire la dimension du
nouvel espace. Pour cela nous sommes conduits à chercher les valeurs
propres de la matrice de corrélation des variables centrées
réduites et à déterminer une rupture dans la suite de ces
valeurs.
On décide, au moyen de l'histogramme fourni par SPAD de ne
conserver que les trois premières composantes pri nci pales.
N um é ro
|
Valeur prop re
|
Pourcentage
|
|
|
|
Pourcentage cumulé
1 3,9460 43,84 43,84
2 2,9668 32,96 76,81
3 1,3950 15,50 92,31
4 0,6099 6,78 99,09
5 0,0445 0,49 99,58
6 0,0280 0,31 99,89
7 0,0092 0,10 99,99
8 0,0006 0,01 100,00
9 0,0000 0,00 100,00
Le tableau récapitulatif des valeurs propres montre
qu'on retranscrit alors plus de 90% de l'information disponible (pourcentage
d'inertie expliquée). Précisément, le pourcentage de
non-déformation du nuage initial des individus est alors de 92,31%
(valeur rouge du tableau ci-dessus).
En particulier, pour la suite, le pourcentage de non
déformation dans le premier plan factoriel est 76,81% .
Il est intéressant, pour essayer d'interpréter
les nouveaux facteurs, d'observer les corrélations entre chaque facteur
et chaque variable initiale (les critères) où chaque nouveau
facteur est une combinaison linéaire des critèress de base. Ces
valeurs sont regroupées dans le tableau suivant :
Libellé de la variable Axe 1 Axe 2 Axe 3 Axe 4 Axe
5
-0,90
|
0,06
|
-0,3 1
|
0,27
|
0,10
|
0,06
|
0,71
|
0,42
|
0,56
|
0,01
|
-0,54
|
0,50
|
-0,63
|
-0,22
|
0,04
|
-0,51
|
-0,60
|
0,58
|
-0,18
|
0,13
|
-0,94
|
0,29
|
0,12
|
-0,05
|
-0,08
|
-0,56
|
0,82
|
-0,0 1
|
-0,08
|
0,01
|
-0,90
|
-0,37
|
0,19
|
0,11
|
-0,04
|
perçue comme chère
plutôt pour les enfants
plaît plutôt aux femmes
plaît plutôt aux hommes
perçue comme une eau de qualité bonne pour la
santé et la forme
on la boit pour se faire plaisir
on aime la boire à tout moment de la journée
|
-0,15
|
0,72
|
0,59
|
-0,34
|
-0,02
|
eau plutôt réservée pour des occasions (ex:
repas entre amis
|
-0,73
|
-0,67
|
-0,0 1
|
0,06
|
-0,09
|
On précise que, puisqu'on travaille sur données
centrées réduites les corrélations du tableau sont les
coordonnées des critères sur les axes formés par les
nouveaux facteurs.
2. Interprétations des axes
A partir de maintenant il faut faire particulièrement
attention dans l'interprétation des axes à cause du codage des
modalités qui a été choisi pour rendre compte de l'avis
des participants car la note diminue quand l'intensité du critère
augmente.
Prenons un exemple : plus une eau est
considérée comme chère, plus sa note diminue (car se
rapproche de 1) et plus sa coordonnée sur l'axe 1 augmente à
cause de la corrélation négative et plus sa coordonnée sur
l'axe 2 diminue à cause de la corrélation positive. Ainsi
plus les eaux sont perçues comme chères plus leur
coordonnée sur l'axe 1 augmente et plus leur coordonnée sur l'axe
2 diminue.
Axe 1 : On observe que les
corrélations les plus importantes avec cet axe sont celles impliquant
les notions de cherté, de qualité, de plaisir, d'occasions. On en
déduit que l'axe 1 est principalement expliqué par ces quatre
variables.
Axe 2 : Les corrélations
positives les plus importantes ont lieu avec les critères `enfant',
`santé', `tout moment'. La corrélation négative la plus
importante a lieu avec le critère `occasions'. De même l'axe 2 est
principalement expliqué par ces quatre variables.
On visualise la situation grâce au cercle des
corrélations où on rappelle que la coordonnée de chaque
variable sur cet axe est la valeur de sa corrélation avec cet axe :
On constate que toutes les variables sont bien
représentées car les extrémités des flèches
sont suffisamment éloignées de l'origine. On retrouve donc bien
toutes les informations dégagées précédemment.
|
|