III.4. METHODES STATISTIQUES D'ANALYSE DES DONNEES
Pour atteindre les objectifs spécifiques de notre
étude, nous utiliserons dans un premier temps des méthodes
d'analyse statistique descriptive afin de caractériser la population des
adolescentes ayant débuté leur vie féconde, ensuite le
recours à une méthode d'analyse statistique explicative
permettrait de tester les différentes hypothèses
énoncées plus haut.
III.4.1. Analyse descriptive
Cette phase se fera également en deux temps :
premièrement nous procéderons à une analyse
bivariée (fréquences, tableaux croisés avec application du
test de khi-deux) afin d'apprécier l'existence ou non de relations entre
chacun des facteurs avec la variable dépendante
« maternité précoce ». Ensuite, une Analyse
Factorielle des Correspondances Multiples (AFCM) nous servira pour comparer les
profils des adolescentes en rapport avec la maternité précoce.
L'AFCM est, en effet, une technique d'analyse des interdépendances entre
des variables qu'on veut analyser simultanément ; il permet de
croiser plusieurs caractères connus par classes et de comparer des
profils en lignes et en colonnes. La proximité entre modalités de
caractères différents traduit la surreprésentation de
l'une dans l'autre c'est-à-dire la propension d'avoir des
« profils ligne » comparables et l'éloignement
traduit la sous représentation ; la proximité entre
individus exprime qu'ils ont des « profils colonne »
voisins et, la proximité de points individus à un point
modalité traduit la surreprésentation de celle-ci dans
ceux-là, de même que l'éloignement traduit leur sous
représentation sur cette modalité (Dumolard P., 2005). Les deux
principaux avantages de cette méthode sont la réduction de
l'information par la définition des dimensions principales ou axes
principaux, et la possibilité de représentation graphique pour
une visualisation des « points caractères », ou « points
individus » et qui sont des représentations des groupes d'individus
caractérisés par la variable.
Enfin, pour vérifier la liaison significative entre une
variable explicative et la variable dépendante et établir des
relations de causalité, nous devrons recourir à l'analyse
multivariée explicative afin de tenir compte de l'effet des autres
variables et déceler d'éventuelles relations fallacieuses.
III.4.2. Analyse explicative
La démographie offre peu d'exemples d'un
phénomène qui « expliquerait » directement un
autre (cas qui correspond à une régression simple). Plus souvent,
les phénomènes examinés
s'« expliquent » par la conjonction de plusieurs
facteurs : ceci impose de passer d'un modèle de régression
simple à un modèle de « régression
multiple », où plusieurs variables
« explicatives » notées
X1,...,Xp rendent compte de la variabilité de Y,
variable « à expliquer ». Pour identifier ces
facteurs, nous utiliserons la régression logistique.
a) Justification du choix du modèle
Notre choix d'appliquer le modèle statistique de
régression logistique est déterminé par la nature des
données à analyser, de leur structure et des objectifs
assignés à notre étude. Le modèle de
régression logistique permet d'estimer la force de l'association entre
une variable qualitative à deux classes (dichotomique) appelée
variable dépendante et des variables qui peuvent être
qualitatives ou quantitatives appelées variables explicatives
ou indépendantes. La variable à expliquer (variable
dépendante Y) est l'incidence ou non de l'événement
étudié - présence ou non d'un enfant chez une adolescente
- et les variables explicatives (variables indépendantes Xi, i=1,2,...,
n) sont des facteurs susceptibles d'influencer la survenue de
l'événement (facteurs d'exposition, facteurs de risque ou
facteurs de confusion).
La régression logistique peut examiner une seule
variable indépendante, mais son intérêt réside dans
son utilisation multivariée puisqu'elle permet, alors, d'estimer la
force de l'association entre la variable dépendante et chacune des
variables explicatives, tout en tenant compte de l'effet simultané de
l'ensemble des autres variables explicatives intégrées dans le
modèle. L'association ainsi estimée est dite «
ajustée » sur l'ensemble des autres facteurs.
|