1.6.4 Présentation de la base
Les données utilisées dans ce travail
proviennent de l'enquête personnelle organisée en Mars et Avril
2008 dans les villes d'Abidjan et Bonoua par le Projet Pédi-Test ANRS
12165 ; obtenues après apurement par des méthodes d'imputation de
type Hot-deck dont le principe est le suivant : la valeur manquante est
remplacée par la valeur observée chez un répondant «
proche », le « donneur ». Cette méthode a
été utilisée pour les variables âge (avec 11 valeurs
manquantes) et le nombre d'année passé dans la formation
sanitaire (avec 18 valeurs manquantes)
Cette méthode se divise elle-même en plusieurs
méthodes.
> Le hot-deck d'ensemble : le donneur est choisi de
façon aléatoire parmi les répondants ;
> Le hot-deck par classe : le donneur est choisi
de façon aléatoire dans la classe à laquelle appartient le
receveur ;
> Le hot-deck séquentiel : le fichier
à compléter défile. Si une unité est manquante,
alors on lui impute la valeur renseignée par l'individu le plus <<
récent >> du tableau de données et appartenant à la
même classe. Cette procédure exige une valeur initiale ;
> Le hot-deck hiérarchisé : une
suite de critères C1, ,..., Ck est utilisée. On remplace
l'unité défaillante par une unité ayant les mêmes
valeurs pour C1, ,..., Ck. S'il n'en existe pas alors on la remplace par une
unité ayant les mêmes valeurs pour C1, ,..., Ck-1; etc ;
> Le hot-deck métrique ou méthode du
plus proche voisin : on construit une distance notée d(ij) entre
unités en fonction de variables clés bien renseignées
qu'elles ont en commun. Si l'unité k est défaillante, on lui
impute la valeur observée chez son plus proche voisin << donneur
potentiel >>. S'il y a ex-æquo, alors on impute une de ces valeurs
possibles aléatoirement.
|