Paragraphe 2 : Présentation de la
méthodologie
La base des données fournit pour chacune des 77
communes du Bénin, des informations sur les variables ci-dessus
citées que nous jugeons à priori explicatives de
l'achèvement. En dehors de la variable «Région» toutes
les autres sont des variables quantitatives.
Tout d'abord, il sera question de voir les corrélations
au sein des différents types de variables explicatives à savoir
socio-économiques, liées à l'offre scolaire et à la
rétention et de cibler quelques communes d'intervention prioritaire.
Ceci se fera à l'aide de l'Analyse en Composantes Principales (ACP) sous
le logiciel SPAD compte tenu de la nature quantitative de la
quasi-totalité des variables explicatives.
Il s'agira ensuite de détecter parmi les variables
explicatives choisies, celles qui sont significativement liées à
l'achèvement et permettent de distinguer les communes où le TAPf
2007 est susceptible de baisser par rapport à la moyenne de 2005 de
celles où le contraire risque de se produire. Il sera donc
procédé à une recherche factorielle des variables les plus
déterminantes à l'aide de l'Analyse Factorielle Discriminante
(AFD) sous le même logiciel. Cette méthode statistique
multidimensionnelle permet de décrire linéairement l'influence de
certaines variables sur une autre sans prétendre d'emblée
à la modélisation.
Dynamique de l'achèvement du cycle primaire par les
filles au Bénin Décembre 2006
Enfin, l'analyse économétrique va s'appuyer sur
les variables indépendantes issues de l'analyse factorielle pour mieux
appréhender et quantifier les liaisons entre la variable
dépendante et les variables explicatives que nous aurait indiqué
l'AFD. Elle consistera à la modélisation du
phénomène étudié par un modèle dichotomique,
compte tenu de la nature qualitative de la variable à expliquer à
l'aide du logiciel EViews.
Section 3 : Aperçu des outils d'analyse
Paragraphe 1 : L'analyse factorielle des données
Les méthodes factorielles établissent des
représentations synthétiques de vastes tableaux de données
et ont pour but de réduire les dimensions des données de
façon à représenter les associations entre individus et
entre variables dans des espaces graphiquement visibles. Il s'agit de faire ici
un aperçu de l'Analyse en Composantes Principales (ACP) puis de
l'Analyse Factorielle Discriminante (AFD).
1- Aperçu de l'Analyse en Composantes principales
L'Analyse en Composantes Principales (ACP) est une
méthode d'analyse factorielle des corrélations au sein d'un
tableau de mesures quantitatives qui vise à produire des photographies
des variables où l'on voit instantanément l'essentiel des
corrélations qu'elles présentent les unes avec les autres. Elle
permet aussi de repérer dans le meilleur espace de dimension faible (un
ou deux), les groupes d'individus semblables ou non vis-à-vis de
l'ensemble de ces variables. Les données se présentent sous la
forme d'un tableau X croisant individus (en ligne) et variables (en colonne). A
ce tableau X, on associe deux nuages de points : le nuage des points variables
(nuage dual) et le nuage des points individus (nuage direct). Malheureusement,
l'espace de représentation des variables a pour dimension le
Dynamique de l'achèvement du cycle primaire par les
filles au Bénin Décembre 2006
nombre d'individus du tableau et l'espace de
représentation du nuage des individus a pour dimension le nombre de
variables. Ces espaces sont de dimension supérieure à trois ce
qui ne permet pas de repérer directement les individus qui se
ressemblent ni les variables qui ont le même comportement sur l'ensemble
des individus. Le principe de base de l'ACP est d'obtenir des nuages dans le
meilleur espace de dimension faible (un ou deux) en conservant le maximum
d'information du tableau et en révélant les configurations
cachées entre individus et variables
Dans le cadre de notre étude, les individus sont les
communes du Bénin et les variables sont : Région (REG),
Pourcentage d'Ecoles Primaires Publiques (PEPP), Pourcentage d'Enseignants
Qualifiés (PEQ), Pourcentage d'Ecoles en Situation de
Discontinuité (PESD), Ratio Elèves/Maître (REM), Nombre de
Cantines Scolaires (NCS), Nombre d'Ecoles Maternelles (NEM), Revenu du Chef de
Ménage (RCM) et Taux de Promotion des filles (TPf). Toutes ces variables
excepté la variable Région qui est nominale sont quantitatives et
seront donc considérées comme actives. Ce sont elles qui
serviront à comparer les individus entre eux. Mais cela ne signifie pas
que nous abandonnons la variable Région. Elle servira à illustrer
les similitudes ou les différences entre individus. On l'appelle donc
variable illustrative ou supplémentaire. La variable Achèvement
(ACH) que nous voulons expliquer sera aussi mise en supplémentaire
à cause de son caractère dichotomique. Pour éviter
l'influence des unités de mesure différentes des variables
actives, il faut d'abord les rendre centrées réduites en
réalisant une Analyse en Composantes Principales normée.
Pour mettre en évidence l'inégalité entre
les communes dans notre analyse, nous allons adjoindre à chaque point
individu une pondération qui traduit l'importance de chaque commune.
Nous prenons comme pondération la proportion de femmes du Bénin
présentes dans une commune donnée lors du recensement de 2002.
Dynamique de l'achèvement du cycle primaire par les
filles au Bénin Décembre 2006
Pour le choix des axes factoriels à utiliser pour
interpréter les nuages, nous allons utiliser le critère de
Kaiser. D'après ce critère, on choisit les axes de variance
(valeur propre) supérieure ou égale à 1.
Analyse des nuages
Pour le nuage dual, l'analyse s'intéressera aux
variables ayant une forte contribution c'est-à-dire qui
déterminent le positionnement des axes factoriels et celles qui y sont
bien représentées. En ACP normée, les contributions des
variables sont données par les corrélations variable-facteur. La
qualité de la représentation est donnée par le
carré des coordonnées10 des variables sur les axes qui
coïncident avec les cosinus carrés. Comme pour les variables, nous
nous intéresserons aux individus ayant une forte contribution et qui
sont bien représentés sur le nuage direct c'est-à- dire
ayant un cosinus carré élevé11.
2- Présentation de l'Analyse Factorielle Discriminante
(AFD)
L'Analyse Factorielle Discriminante (AFD) est une technique
qui permet de déterminer les variables dites symptômes qui
expliquent l'appartenance des individus à des groupes définis par
une variable qualitative appelée diagnostic. L'analyse discriminante
connue dans la pratique marketing comme une des techniques de "Scoring" essaie
de déterminer les variables qui expliquent l'appartenance des individus
à des groupes. Deux ou plusieurs groupes sont comparés sur
plusieurs variables pour déterminer s'ils diffèrent et pour
comprendre la nature de ces différences. L'AFD cherche donc à
décrire une variable qualitative Y à k
modalités à l'aide de p variables quantitatives ou
non(X1, X2, ...,
Xp). Pour cela, on dispose d'un
échantillon de n individus pour lesquels on
connaît simultanément les valeurs
10 cf Tableau n°2 en annexe C
11 cf Tableau n°3 en annexe C
Dynamique de l'achèvement du cycle primaire par les
filles au Bénin Décembre 2006
de(Y, X1, X2,
..., Xp). L'échantillon pourra donc se
répartir en k sous groupes. Chaque
sous-groupe étant associé à une
modalité de la variable Y.
Ainsi, dans le cadre de notre étude, l'AFD permettra
précisément de trouver les variables explicatives qui permettent
de différencier au mieux les deux groupes de communes à savoir
:
- celui des communes où l'on peut espérer que le
TAPf augmente en 2007 par rapport à la moyenne de 2005
- celui des communes où au contraire on s'attend à
ce que le TAPf de 2007 soit en baisse par rapport à la moyenne de
2005
La règle de décision est exprimée
à l'aide de la fonction linéaire de Fisher reconstituée
à partir des variables d'origine. En fait, on obtient à l'issue
de la procédure un tableau présentant les différentes
variables discriminantes avec leurs coefficients respectifs, les statistiques
de Student et les probabilités correspondantes. Les variables dont les
coefficients de la fonction de régression sont statistiquement
significatifs constituent les déterminants du phénomène
étudié. L'examen du signe de chacune des modalités permet
de savoir si elles favorisent ou non la réalisation du
phénomène étudié.
|