CHAPITRE 5 : ESSAI D'EXPLICATION DES DISPARITÉS
RÉGIONALES ENMATIÈRE DE SCOLARISATION EN GUINÉE
L'analyse descriptive (par les tableaux croisés) nous a
permis de déceler les variables liées avec la
fréquentation scolaire. Le test de khi2 de Pearson indiquait que ces
liaisons étaient parfois très fortes. Pour autant, elle ne nous
permet pas de tirer des conclusions fiables sur la nature des associations
observées. L'analyse multivariée nous permet de répondre
à ces préoccupations dans la mesure où elle confirme ou
infirme les résultats de l'analyse descriptive.
Dans ce chapitre, nous allons présenter les
résultats et les commentaires de la régression logistique entre
la scolarisation et les variables indépendantes et de contrôles
retenues.Pour ce faire, nous avons opté pour un modèle de
régression à pas croissant. L'avantage de cette méthode
est qu'elle permet d'évaluer la part de la variance expliquée par
chaque groupe de variables introduites dans l'équation de la
régression. L'ordre d'introduction des variables dans le modèle
est arbitraire. Nous avons introduit les caractéristiques des enfants
justes après la région pour la simple raison que la scolarisation
concerne en premier chef l'enfant.
Le premier (modèle 0) rend compte de la
régression entre la scolarisation et la région de
résidence. Le deuxième modèle (modèle 1)
intègre les caractéristiques de l'enfant (sexe et âge comme
variables de contrôle). Dans le troisième modèle
(modèle 2), nous contrôlons l'effet partiel des
caractéristiques démographiques de l'enfant, du ménage et
de la mère sur la scolarisation. Le quatrième modèle
(modèle 3) prend en compte l'influence des caractéristiques
sociodémographiques et des caractéristiques
socio-économiques sur les disparités régionales de
scolarisation. Dans le cinquième modèle (modèle 4) nous
essayons d'appréhender l'effet de la religion sur les différences
régionales de scolarisation. Le modèle final (modèle5)
intègre l'ensemble des variables.
Les analyses sont faites à l'aide du logiciel STATA,
version 7.0. La commande utilisée est : logistic. Un des
avantages de cette procédure (logistic) est de disposer d'une
variante permettant une estimation robuste et non biaisée des
paramètres et de rejeter automatiquement les modalités qui sont
source de multicolinéarité. Nous utiliserons aussi, la
pondération : pweight(probabilityweight). Cette
commande permet de pondérée chaque observation par l'inverse de
la probabilité de sondage. La pondération, pweight
représente le poids recherché pour l'extrapolation et non pas le
poids réel dans la population (BOCQUIER, 1998).
5.1. Présentations et interprétations des
résultats
|