3.4 Méthode d'analyse
L'analyse des données se fait à deux niveaux :
au niveau descriptif et au niveau explicatif. Au niveau descriptif, nous allons
analyser les relations qui existent entre les différentes variables et
la fréquentation scolaire tandis qu'au niveau explicatif il s'agit de
trouver une relation de cause à effet entre les variables
indépendantes et la scolarisation.
3.4.1 Analyse descriptive
A ce stade de l'analyse des données, nous devons mettre
en exergue les associations qui existent entre l'appartenance ethnique ou
religieuse et la scolarisation. Il s'agit dans la pratique d'examiner les
variations du niveau de la scolarisation selon l'ethnie et la religion du chef
de ménage, les autres caractéristiques liées d'une part au
chef de ménage et d'autre part à l'enfant. Pour ce faire, nous
étudierons les corrélations entre l'ethnie et la scolarisation
d'une part et entre la religion et la scolarisation d'autre part. Au niveau de
l'analyse descriptive, le logiciel SPSS nous fournit les probabilités de
signification de la statistique du Khi-2 des associations entre la
fréquentation scolaire et les variables indépendantes. Nous
apprécions cette signification aux différents seuils de 1%, 5%,
ou 10%.
3.4.2 Analyse explicative
A ce niveau, la méthode d'analyse s'avère
très importante car elle doit permettre d'établir une relation
causale entre les variables. Nous recourons ici à une méthode
multivariée explicative qui nous permettra de détecter les
relations fallacieuses qui existent souvent au niveau descriptif.
a- Présentation du modèle
L'analyse de la régression est une technique
statistique permettant d'établir une relation entre une variable et des
variables explicatives, afin d'étudier les associations et de faire des
prévisions (Taffé, 2004). En fonction de la nature de la variable
à expliquer, on note deux types de régressions : la
régression linéaire et la régression logistique. Lorsque
la variable dépendante est qualitative ou catégorielle, la
régression linéaire n'est pas appropriée et on recourt
plutôt à la régression logistique. En outre, on distingue
deux types de régression logistique selon le nombre d'attributs que peut
prendre la variable dépendante. Lorsque la variable expliquée est
dichotomique (elle ne prend que deux
modalités : Oui ou Non), on fait appel au modèle
binomial de la régression logistique. Par contre le modèle
multinomial est réservé aux variables dépendantes
polytomiques c'est-à- dire qui comptent plus de deux
modalités.
b- Justification du modèle
Nous recourons à la régression logistique pour
l'analyse explicative. Ce choix est inspiré par la nature qualitative
des variables que nous souhaitons mettre en relation. Dans le cas
présent, la fréquentation scolaire a été saisie par
la réponse par Oui ou par Non à la question : (NOM)
fréquente-t-il/elle en 199 7/98 l'école ? Ainsi, la variable
à expliquer est binaire (présence [1], absence [0] de la
fréquentation scolaire), on recourt donc à la régression
logistique binomiale.
c- Principes et interprétation de la
méthode
Dans une série d'enfants d'âge variant de 6
à 14 ans, nous consignons la fréquentation ou la non
fréquentation scolaire en fonction des variables indépendantes.
Pour une caractéristique X donnée de la variable
indépendante, la régression logistique permet de calculer la
probabilité d'observer Y (fréquentation ou non
fréquentation scolaire chez l'enfant). Elle permet de modéliser
l'espérance mathématique de y conditionnelle à
x en introduisant au préalable un codage quantitatif permettant
de représenter les différents attributs.
Y=1 si l'enfant fréquente Y =0 sinon
Si nous posons P(y=1)=p1 : probabilité pour qu'un
enfant (vérifiant une caractéristique x1 de X) fréquente
et P(y=0)=p0 : probabilité pour qu'un autre enfant (vérifiant une
caractéristique x0 de X) ne fréquente pas. Nous
définissons le Odds et le Odds Ratio :
Un Odds est un rapport de cotes qui se
définit pour une probabilité p :
p
odds=p 1-
Pour les différentes caractéristiques x0, x1,
x2... nous avons des Odds : p0 1-
p0,
p1 1-p1,
p2 1-p2 ...
Le Odds Ratio (OR) est un rapport de chance et
se définit par :
p1
p1 = =
1 - p , ... Où
2 p log [ ( 1 )]
it p y x x
= =
= â
0 0
e
2 p 0 e
0
p1
p2 1
=
1x
log
it [ (
p y
e
= x )] â â
0 1
+
1 e
1
-
p
1
= ,
OR
OR
1
p0
Dans cet exemple, la modalité x0 de X est
considérée comme référence et x1, x2, ... sont les
autres modalités de X.
Si le OR1 est différent de 1, cela signifie qu'il y a
une association entre la fréquentation scolaire et les modalités
x0et x1 de X. Par exemple si X est le sexe, x1 le sexe masculin et x0 le sexe
féminin. OR1>1 signifie que les enfants du sexe masculin ont plus de
chance de fréquenter que ceux de sexe féminin. Si OR1<1, alors
ce sont les filles qui sont les plus favorisées pour la
fréquentation scolaire.
La statistique r ou coefficient de
corrélation partielle : C'est le pouvoir discriminant d'une
variable dans un modèle explicatif. Elle est assortie d'une
probabilité qui, comparée aux différents seuils permet
d'apprécier la signification du pouvoir explicatif de la variable dans
un modèle donné.
Conclusion partielle
Ce chapitre a permis d'adapter le cadre conceptuel aux
données issues de l'enquête prioritaire de 1998 au Burkina
Faso.
D'une manière générale, les
données obtenues sont de qualité acceptable. La source de
données utilisée est adaptée aux objectifs de
l'étude dans la mesure où elle fournit, en plus des
caractéristiques du ménage et de l'enfant, l'ethnie et la
religion du chef de ménage, deux aspects cruciaux du socioculturel.
Toutefois, d'autres informations auraient été souhaitées
pour étoffer cette étude. Il s'agit notamment des informations
sur les caractéristiques socioculturelles des parents biologiques de
l'enfant.
Vu la qualité dichotomique de la variable
dépendante, nous retenons la régression logistique binaire pour
l'analyse explicative. Mais auparavant, dans le chapitre suivant, nous
procédons à l'analyse différentielle sur la base de
tableaux croisés.
CHAPITRE 4 : CARACTERISATION DES ENFANTS AGES DE 6 A 14 ANS ET ANALYSE
DIFFERENTIELLE DE LEUR SCOLARISATION
|
Cette section a pour but essentiel de faire une analyse
différentielle de la fréquentation scolaire selon les
caractéristiques socioculturelles des enfants. Il s'agit dans un premier
temps, de procéder à l'examen des caractéristiques
socioculturelles de la population cible de l'étude. Dans un second
temps, nous procédons à une étude différentielle de
la scolarisation selon ces caractéristiques. Au cours de cette seconde
partie du chapitre, sont également présentés certains
indicateurs sur la fréquentation scolaire des enfants de 6 à 14
ans.
|