Chapitre III : Elaboration du profil de la
vulnérabilité Alimentaire des ménages
ruraux au Niger
(Analyse discriminante).
Alhassane G. Abdoulaziz Page
Elève Ingénieur Statisticien 98
|
Promotion 2008-2011
|
|
10 Profil de vulnérabilité des
ménages au Niger : une Analyse Discriminante.
L'analyse discriminante est une autre forme d'analyses
statistiques multidimensionnelles qui cherche à décrire une
variable qualitative à k modalités à l'aide de p variables
quantitatives.
L'analyse discriminent poursuit deux(2) objectifs :
? Un objectif de description : il s'agit de voire comment les p
variables
explicatives X1, X2, , Xp permettent de mettre en évidence
les différences entre les groupes. Plus précisément, il
s'agit de chercher la combinaison linéaire (variables discriminantes)
des p variables qui permettent le mieux possible de séparer les k sous
groupes.
? Un objectif de décision : on peu chercher un
critère pour affecter un individu dont le groupe n'est pas connu mais on
connais les variables X1,
X2, ,Xp .
Globalement, la méthode d`analyse discriminante cherche
à reconstituer le même classement mais en fonction d`autres
variables.
Il est question pour nous ici de :
Etudier les relations entre la variable qualitative et
dépendante (niveau de vulnérabilité) et l'ensemble de
variables explicatives quantitative que nous avons retenues et que nous
n'avions pas utilisées dans la classification (voire annexe 3 pour la
liste et significations des variables retenues).
Aider à analyser les différences entre les groupes
et/ou de donner les moyens pour assigner les cas dans le groupe lui ressemblant
le plus.
Alhassane G. Abdoulaziz Page
Elève Ingénieur Statisticien 99
Promotion 2008-2011
Alhassane G. Abdoulaziz Page
Elève Ingénieur Statisticien
100
Promotion 2008-2011
NB : nous avons utilisé la méthode pas à pas
d`entrées des variables, car elle nous permet d`obtenir un modèle
performant évitant les variables qui n'apportent que peut d`informations
au modèle.
10.1 Interprétations des résultats de
l'analyse discriminante.
Parmi les nombreux résultats sortis par SPSS, pour
analyser les résultats, nous allons nous intéresser aux
différentes étapes suivantes :
? Vérification des différences entre les groupes en
utilisant les statistiques des groupes et les tests statistiques
d'égalité des moyennes.
? Validation de l'étude en utilisant le test M de Box, le
tes de Wilk Lambda, la corrélation globale intragroupes combinés,
et la corrélation globale (valeurs propres).
? Vérification du pouvoir discriminent des axes avec
notamment les coefficients des fonctions discriminantes.
? Jugement de la qualité de la représentation du
modèle en utilisant la matrice de confusion qui regroupe les
ménages biens classés et les ménages mal
classés.
NB : avant toutes validations des différents tests, nous
nous sommes focaliser d'abord sur le résultat du test M de Box qui fait
un test global sur les variables retenues et c'est ce résultat qui nous
donne le feu vert d'avancer dans les interprétations des
données.
10.1.1 Vérification des différences entre
les groupes :
SPS nous a offert le tableau statistique des groupes et le
tableau des tests statistique d'égalité des moyennes nous
permettant d'observer les différences entre les groupes.
10.1.1.1 Le tableau statistique des groupes.
Le tableau de l'annexe 5 (statistique des groupes) résume
la statistique descriptive des variables mis en jeu. Les statistiques
calculées sont : les moyennes, les écart-types et le nombre
d'observation traite.
10.1.1.2 Le tableau des tests statistiques
d'égalité des moyennes des groupes Tableau 40 : tests
d'égalité des moyennes des groupes (cf. annexe 8).
Tests of Equality of Group
|
Colonne
|
Colonne
|
Colonne
|
Colonne
|
Colonne
|
Means
|
1
|
2
|
3
|
4
|
5
|
|
Wilk
|
|
|
|
|
|
Lambda
|
F
|
df1
|
df2
|
Sig.
|
Alhassane G. Abdoulaziz
Page
Elève Ingénieur Statisticien
101
Promotion 2008-2011
Diffa
|
0.943
|
141.679
|
4
|
9327
|
0,000
|
Dosso
|
0.999
|
2.856
|
4
|
9327
|
0,000
|
Maradi
|
0.996
|
9.753
|
4
|
9327
|
0,000
|
Tahoua
|
0.994
|
13.991
|
4
|
9327
|
0,000
|
Tillabery
|
0.992
|
18.467
|
4
|
9327
|
0,000
|
Zinder
|
0.995
|
10.831
|
4
|
9327
|
0,000
|
Niamey
|
0.996
|
10.322
|
4
|
9327
|
0,000
|
Masculine
|
0.992
|
18.939
|
4
|
9327
|
0,000
|
Zoneagricole
|
0.997
|
6.920
|
4
|
9327
|
0,000
|
Zoneagropastorale
|
0.997
|
6.369
|
4
|
9327
|
0,000
|
Maripoly
|
0.996
|
8.383
|
4
|
9327
|
0,000
|
Veuf
|
0.994
|
13.470
|
4
|
9327
|
0,000
|
Agriculture
|
0.987
|
31.823
|
4
|
9327
|
0,000
|
Elevage
|
0.947
|
131.113
|
4
|
9327
|
0,000
|
Commerce
|
0.996
|
10.059
|
4
|
9327
|
0,000
|
TravailJour
|
0.998
|
4.451
|
4
|
9327
|
0,000
|
Superieur
|
0.979
|
49.700
|
4
|
9327
|
0,000
|
Inferieur
|
0.988
|
27.253
|
4
|
9327
|
0,000
|
VentAnimal
|
0.989
|
26.843
|
4
|
9327
|
0,000
|
Bonne
|
0.988
|
28.877
|
4
|
9327
|
0,000
|
Moyen
|
0.998
|
5.170
|
4
|
9327
|
0,000
|
FFW
|
0.993
|
16.992
|
4
|
9327
|
0,000
|
CFW
|
0.995
|
11.547
|
4
|
9327
|
0,000
|
VentBien
|
0.989
|
24.797
|
4
|
9327
|
0,000
|
departActif
|
0.978
|
52.885
|
4
|
9327
|
0,000
|
ventAnimReprod
|
0.989
|
26.843
|
4
|
9327
|
0,000
|
VentBienNonProd
|
0.989
|
24.797
|
4
|
9327
|
0,000
|
VentTerres
|
0.992
|
19.538
|
4
|
9327
|
0,000
|
code321
|
0.979
|
49.700
|
4
|
9327
|
0,000
|
code322
|
0.998
|
4.475
|
4
|
9327
|
0,000
|
code323
|
0.988
|
27.253
|
4
|
9327
|
0,000
|
code223
|
0.995
|
12.496
|
4
|
9327
|
0,000
|
code224
|
0.990
|
23.604
|
4
|
9327
|
0,000
|
code231
|
0.995
|
10.721
|
4
|
9327
|
0,000
|
code237
|
0.996
|
9.820
|
4
|
9327
|
0,000
|
code242
|
0.995
|
11.897
|
4
|
9327
|
0,000
|
code243
|
0.996
|
8.848
|
4
|
9327
|
0,000
|
code251
|
0.991
|
20.529
|
4
|
9327
|
0,000
|
code252
|
0.988
|
27.922
|
4
|
9327
|
0,000
|
code263
|
0.992
|
19.089
|
4
|
9327
|
0,000
|
code264
|
0.981
|
46.060
|
4
|
9327
|
0,000
|
Alhassane G. Abdoulaziz Page
Elève Ingénieur Statisticien
102
Promotion 2008-2011
code267
|
0.998
|
3.693
|
4
|
9327
|
0,000
|
code17
|
0.992
|
18.939
|
4
|
9327
|
0,000
|
DEPENSES ALIMENTAIRES
|
|
|
|
|
|
MENSUELLES
|
0.965
|
84.706
|
4
|
9327
|
0,000
|
DEPENSES NON
|
|
|
|
|
|
ALIMENTAIRES MENSUELLES
|
0.945
|
134.568
|
4
|
9327
|
0,000
|
DEPENSES TOTALES
|
|
|
|
|
|
MENSUELLES EN CASH
|
0.914
|
219.095
|
4
|
9327
|
0,000
|
PART DES DEPENSES
|
|
|
|
|
|
ALIMENTAIRES DANS LES
|
|
|
|
|
|
DEPENSES TOTALES Y
|
|
|
|
|
|
COMPRIS
|
|
|
|
|
|
AUTOCONSOMMATION
|
0.814
|
531.091
|
4
|
9327
|
0,000
|
DEPENSES ALIMENTAIRES
|
|
|
|
|
|
MENSUELLES EN CASH
|
0.846
|
425.430
|
4
|
9327
|
0,000
|
le tableau 40 retrace les différentes valeurs moyennes
issues du test de la moyenne des différents groupes.
B ? ? ? ? ? ?? ? ? ?
k ? k ? ? k ?
N i
Notons que le lambda de Wilk est basé sur le Fisher qui a
deux degrés de liberté dont les formules sont les suivantes :
Df1=K-1 ; df2=n-k, avec K le nombre de modalité du
variable «niveau de vulnérabilité alimentaire » et n la
taille des ménage.
? ,,
Les autres formules :
W =
1
n
`
B est la matrice variance covariance entre groupe (between
group). W est la matrice variance-covariance intra groupe (wthin group). =
centre de gravite des k groupes.
Variance totale V = B+W.
Alhassane G. Abdoulaziz Page
Elève Ingénieur Statisticien
103
Promotion 2008-2011
Ainsi, la formule de Wilk Lambda est :
Étant le déterminant de la matrice variance
covariance intra groupe Est le déterminant de la matrice
variance-covariance entre groupe. Hypothèses :
Ho : les cinq moyennes des différentes variables
indépendantes mis en jeu sont identiques ?
H1 : les cinq moyennes sont différentes les unes des
autres, c`est à dire que les cinq moyennes des variables mis en jeu ont
un pouvoir discriminent.
Si on accepte h1, cela veut dire qu`a travers ces variables on
peut classer les ménages par ordre de sévérité de
la vulnérabilité alimentaire.
Nous constatons que la différence entre les moyennes est
significative au niveau de signification 0,05. En effet, pour une valeur de
Fisher quelconque et un risque alpha (sig) <0,05, nous sommes conduits
à rejeter l'hypothèse nulle d'égalité des moyennes,
d'où une différence significative des moyennes des classes.
On remarque également que la variable part des
dépenses alimentaires dans les dépenses globale y compris
autoconsommation est la plus discriminante car ayant la plus
grande valeur de Fisher (F=531.091). Cette variable elle seule permet de
baptiser les groupes car ayant le plus pouvoir discriminent.
|