3.2.2.3 Conditions d'application du modèle
? La variable à expliquer doit être qualitative
et dichotomique, dans notre cas elle prend la valeur "1" si l'individu ne
fréquente plus l'école au moment du recensement mais a
fréquenté dans le passé et "0" si l'individu
fréquente actuellement ;
? Les variables explicatives doivent être
catégorielles et dichotomisées avant leur introduction dans le
modèle. On choisit une modalité pour chaque variable
(modalité de référence, celle qui servira de comparaison)
qui ne sera pas introduite dans le modèle mais servira de
référence dans les interprétations des paramètres
rattachés aux autres modalités de la variable
considérée.
3.2.2.4 Clarification du modèle d'analyse
a) Test de multicolinéarité
Selon BOUBA DJOURDEBBE (2015), un problème important
de multicolinéarité est décelé dans une
régression lorsque la VIF la plus élevée est plus grande
que 10 ou lorsque la moyenne des VIF est supérieure ou égale
à 2. De même, dans la note de cours de RWENGE (2017), il montre
comment effectuer ce test sous le logiciel STATA. En effet, il suffit de
calculer une mesure de changement de la variance de chacun des facteurs
lorsqu'on les introduit dans la régression. Cette mesure est souvent
notée VIF pour variance infation factor. La commande estat vif
réalise automatiquement ce travail. Dans la pratique, on mettra en
évidence la multicollinéarité dans la régression si
la VIF la plus élevée est plus grande que 10 ou si la moyenne de
tous les VIF est beaucoup plus fort que 1. Dans notre cas, la moyenne des VIF
est égale à 1,42 donc par conséquent, il n'y a pas de
multicolinéarité entre les variables explicatives (cf. Tableaua15
en annexe).
b) Adéquation du modèle aux
données
Premièrement nous allons nous intéresser au test
de significativité du modèle saturé au moyen du test de
khi-deux qui permet de vérifier l'hypothèse nulle H0 selon
laquelle tous les coefficients des variables explicatives sont nuls ou au
contraire l'hypothèse alternatives H1 selon laquelle il existe au moins
une variable dont le coefficient est différent de zéro. On
rejette H0 si P-value est significative au seuil fixé en avance. Dans
notre cas, les résultats du modèle saturé montrent que le
teste est significatif au seuil de 1%. Ce qui signifie qu'à ce seuil, il
existe au moins une variable dépendante dans le modèle
saturé qui détermine d'abandon scolaire des enfants en
Guinée.

0.00 0.25 0.50 0.75 1.00
1 - Specificity
Area under ROC curve = 0.6268
LAMAH François Xavier Master Professionnel en
Démographie Page 70
(M1) à (M11) permettront de voir et d'examiner les
mécanismes d'action entre variables explicatives. Dans tous ces
modèles, les résultats sont exprimés en termes de «
odds ratios », c'est-à-dire les risques (ou probabilités)
relatifs des modalités d'une variable par rapport à la
modalité de référence.
Dans l'exécution des modèles, la variable de
contrôle est introduite en premier lieu. Celle-ci est suivie par les
variables socioéconomiques et culturelles, puis les variables
caractéristiques des chefs de ménage et des ménages et
enfin, les variables caractéristiques des enfants. Cette
procédure connue sous le nom de méthode « pas à pas
», permet de dégager à la fois les effets nets de chaque
variable explicative et les mécanismes d'action entre variables
explicatives.
|