3.3.3. Vérification de la validité de
l'Analyse :
Dans de nombreuses études on procède à
l'estimation de la validation d'une analyse en se basant sur quelques
indicateurs issus des étapes tels que :
Ø les tests d'égalité des
moyennes des groupes,
Ø les matrices intra groupes
combinés
Ø le Test de Box de l'égalité
des matrices de covariances
· Les tests d'égalité des moyennes
des groupes
Cette étape permet de tester si toute fois les
différentes moyennes sont égales ou non. Et ceci dans l'objectif
de distinguer les variables caractéristiques qui ont un pouvoir
discriminant et celles qui n'en n'ont pas.
Chacune de ces variables caractéristiques choisies
pour la construction du modèle est testée.
Ce test repose principalement sur un Fisher
F, sur une erreur de significationá et sur le
Lambda de Wilks.
TableauN° 22: Tests d'égalité
des moyennes des groupes
|
Lambda de Wilks ou Lw
|
F
|
ddl1
|
ddl2
|
Signification ou á
|
homme
|
,993
|
1,795
|
2
|
477
|
,167
|
agricult
|
,986
|
3,395
|
2
|
477
|
,034
|
commerce
|
,977
|
5,534
|
2
|
477
|
,004
|
jeune
|
,989
|
2,615
|
2
|
477
|
,074
|
adulte
|
,988
|
2,982
|
2
|
477
|
,052
|
monogame
|
,966
|
8,515
|
2
|
477
|
,000
|
polygame
|
,953
|
11,848
|
2
|
477
|
,000
|
analphab
|
,966
|
8,327
|
2
|
477
|
,000
|
nonscol
|
,989
|
2,669
|
2
|
477
|
,070
|
inf20ind
|
,869
|
36,010
|
2
|
477
|
,000
|
On retient :
- le Lambda de Wilks est toujours
inférieur à 1 (Lw <1) et lorsque Lw tend vers la valeur
zéro (Lw tend vers 0) , la variable correspondante a une grande
influence dans le modèle. De ce fait elle devient de plus en plus
sélectionnable dans le modèle.
- le Fisher est associé à deux
degrés de liberté dont le premier degré de liberté
(ddl1) est égal à 2 (k-1 ou 3-1) et le second degré de
liberté (ddl2) est égal à 477 (N-k ou 480-3). Pour une
variable quelconque plus le Fisher correspondant est grand, plus elle a la
chance d'être retenue dans le modèle..
- la signification á repose deux
hypothèses :
Ho : á>0,05 les moyennes sont
identiques dans les différents groupes. Dans ce cas pour une variable
indépendante quelconque correspondante à cette valeur de
á on retient que celle-ci n'a aucun pouvoir
discriminant, donc elle sera exclue du modèle
H1 : á<0,05, il y a au moins
une moyenne qui diffère des autres. Dans ce cas pour une variable
indépendante quelconque correspondante à cette valeur de
á, on retient que celle-ci a un pouvoir discriminant,
donc elle sera retenue dans le modèle
Donc seules les variablespolygame, monogame,
analphab et inf20indvsont retenues dans le modèle du
faite qu'elles ont à la fois des Fisher très grands, des Lambda
de Wilks qui sont inférieurs à l'unité et un pouvoir
discriminant. .
· Les matrices intra groupe
combinés
Ces matrices nous renseignent sur l'existence d'une matrice de
corrélation et de covariance pour l'ensemble des données, sans
tenir compte du groupe d'appartenance.
L'objectif visé est de savoir s'il y a un lien
significatif entre les variables pour éviter un phénomène
de redondance.
Par la suite lorsque deux variables caractéristiques du
CM sont corrélées (et que la corrélation dépasse
0,80), au lieu de prendre toutes les deux à la fois on se limite
à une seule variable et on exclu l'autre du modèle.
Tableau N° 23: Matrices intra-groupes
combinés
|
|
homme
|
agricult
|
Com
merce
|
jeune
|
adulte
|
Mono
game
|
Poly
game
|
Anal
phab
|
Non
scol
|
Inf
20ind
|
Corrélation
|
homme
|
1,000
|
,118
|
,009
|
-,145
|
,082
|
,063
|
,152
|
-,133
|
,076
|
-,051
|
|
agricult
|
,118
|
1,000
|
-,303
|
,094
|
,004
|
,045
|
-,011
|
,014
|
,038
|
-,021
|
|
commerce
|
,009
|
-,303
|
1,000
|
,076
|
,0 ùp46
|
-,012
|
,056
|
,024
|
,019
|
-,105
|
|
jeune
|
-,145
|
,094
|
,076
|
1,000
|
-,607
|
,205
|
-,145
|
,041
|
-,095
|
,062
|
|
adulte
|
,082
|
,004
|
,046
|
-,607
|
1,000
|
-,084
|
,078
|
-,101
|
-,024
|
-,011
|
|
monogame
|
,063
|
,045
|
-,012
|
,205
|
-,084
|
1,000
|
-,885
|
-,055
|
-,087
|
,160
|
|
polygame
|
,152
|
,011
|
,056
|
-,145
|
,078
|
-,885
|
1,000
|
,023
|
,112
|
-,159
|
|
analphab
|
-,133
|
,014
|
,024
|
,041
|
-,101
|
-,055
|
,023
|
1,000
|
,409
|
-,027
|
|
nonscol
|
,076
|
,038
|
,019
|
-,095
|
-,024
|
-,087
|
,112
|
,409
|
1,000
|
,018
|
|
inf20ind
|
-,051
|
,021
|
-,105
|
,062
|
-,011
|
,160
|
-,159
|
-,027
|
,018
|
1,000
|
Ont retenir ces quelques informations suivantes:
- Une corrélation ligne-colonne dont la valeur est
égale à l'unité (ou 1), correspond au croisement d'une
variable avec lui même. On retrouve ces valeurs unitaires des
corrélations au niveau de la diagonale de cette matrice.
- il y a un phénomène de redondance entre la
variable homme et la variable adulte, car la valeur du coefficient de
corrélation entre ces deux variables est égale à 0,82
(cette valeur est supérieure à 0,80)
§ Test de Box de l'égalité des
matrices de covariances
Ce test permet de déterminer si les matrices dans la
corrélation sont identiques ou non. Lorsque ces dernières sont
identiques, cela permet de dire que les variables retenues ne permettent pas
d'élaborer un bon modèle. Dans le cas contraire, on peut conclure
que les variables que ces variables retenues peuvent favoriser la
différenciation des groupes de ménages.
Pour interpréter le Test de Box de
l'égalité des matrices de covariances on passe
premièrement par ses principes en analysant le tableau
Déterminants Log et deuxièmement par ses
résultats analysés, cette fois à partir du tableau
Résultats du test.
TableauN° 24 : Test de Box de
l'égalité des matrices de covariances
Déterminants Log
Classes de ménages
|
Rang
|
Déterminant Log
|
1 ménages très pauvres
|
3
|
-7,488
|
2 ménages moins pauvres
|
3
|
-4,794
|
3 ménages pauvres
|
3
|
-4,838
|
Intra-groupes
Combinés
|
3
|
-6,237
|
Les rangs et logarithmes naturels des déterminants
imprimés sont ceux des matrices de covariance du groupe.
Chaque groupe est associé à une matrice qui est
caractérisée par son rang et son déterminant.
Ainsi on trouve que toutes ces matrices de corrélations
ont pour rang 3 et l'ordre de grandeur de leur déterminant varie d'une
manière décroissante du groupe 2 au groupe1, en passant par le
groupe 3
Résultats du test
M de Box
|
344,270
|
F
|
Approximativement
|
27,630
|
ddl1
|
12
|
ddl2
|
12021,330
|
Signification ó
|
,000
|
Teste l'hypothèse nulle de matrices de covariance à
égales populations
Les résultats du test montrent que :
- le test de BOX est principalement basé sur des
règles de décision. Celle-ci est prise à partir des deux
hypothèses suivantes :
Ho : si ó<=0,05, alors il devient possible de
choisir les variables retenues pour construire un modèle. Ce qui fait
dire qu'il y a au moins une variable qui détient un pouvoir
discriminant.
H1 : si ó>0,05, les variables retenues n'ont
alors aucun pouvoir discriminant.
Dans un tel cas l'analyse n'est pas valide.
Avec les résultats dont nous disposons, on a
trouvé ó= 0,00 ; ce qui se traduit par le
choix de l'hypothèse Ho : la construction d'un modèle de
classement des chefs de ménages selon leurs niveaux de pauvreté
devient possible, car il y a au moins une variable caractéristique qui a
un pouvoir déterminant. L'hypothèse selon laquelle il y a
égalité est rejeté.
- Le M de BOX obtenu est égal à 344,270 (le
M de BOX doit toujours être le plus élevé possible), cette
valeur peut être alors jugée comme très
élevée. Étant donné que le M de BOX est très
lié à la signification ó (qui doit tendre vers la valeur
0), qui est ici égale à 0,00, alors on peut retenir que l'analyse
est valide.
|
|