II.5.3. Concernant l'analyse multivariée des
données
Rappelons ici que l'analyse bivariée ou la
corrélation entre deux variables peut toujours être due à
une autre variable cachée. Ce qui signifie que l'analyse bivariée
ne permet pas de distinguer l'existence d'une relation de causalité
entre deux variables. Par contre, l'analyse multivariée effectuée
par le biais de la modélisation économétrique, permet de
dépasser ces limites. En effet, elle permet de tirer parti de la
variété des situations observées dans des données
pour identifier les liens de causalité entre les différentes
variables.
Dans le cadre de notre étude, nous utiliserons la
fonction classique de production de l'éducation pour essayer d'expliquer
les acquisitions des élèves. Il s'agira alors d'analyser les
différents facteurs (scolaires comme extrascolaires) qui permettent de
déterminer les scores ou résultats des élèves.
Cette fonction de production est généralement estimée
à l'aide des modèles de régression linéaire. Une
spécification de la régression des scores (Y) des
élèves sur les facteurs (X) pourrait s'écrire sous la
forme ci-après :
Yij = á0 + á1xij +
á2xij + á3xij + ... + ákxij +
Uij
26 L'analyse bivariée permettra
d'étudier la relation entre deux variables pour voir si elles sont
liées, si les valeurs de l'une influencent les valeurs de l'autre ou si
les variables sont indépendantes.
34
Cette fonction permet de représenter la performance de
l'élève i scolarisé dans l'école j et d'expliquer
cette performance à travers les caractéristiques personnelles de
l'élève ainsi que celles liées à l'organisation des
parents d'élèves au sein de l'école.
Dans cette fonction, Yi, est la variable à
expliquer ou dépendante ou encore endogène et les Xi,
sont les variables explicatives ou exogènes. Les ák sont des
paramètres à estimer. En effet, leur significativité
statistique permettra d'apprécier l'existence de relation et de mesurer
l'importance de l'impact des différents facteurs sur les performances
des élèves. Un contrôle de la
multi-colinéarité entre les variables explicatives sera
effectué afin de s'assurer des effets nets des variables.
Rapportée à notre étude, nous utiliserons
cette fonction pour chercher à analyser le lien entre l'implication de
la communauté des parents d'élèves et les résultats
des apprentissages des élèves. La fonction de régression y
afférente peut alors s'écrire sous la forme :
Score = (á1 * Age élève) + (á2 *
statut école) + (á3 * Nombre réunions APE) + (á4 *
Fréquence réunions avec la collectivité locale) +
(á5 * achat d'équipements pédagogiques en partenariat
avec l'APE) + (á6 * zone géographique école) +
(á7 * existe d'une association d'APE) + (á8 * existence d'une
AME) + Uij
Signalons que l'usage de cette méthode d'analyse se
justifie également comme une réappropriation du contenu des
modules « 16MSE501 - Méthodologie de l'analyse de données et
statistiques fondamentales » et « 16MSE502 - Statistiques
décisionnelles » suivis dans le cadre de ce master.
|