CHAPITRE 3
ASPECTS MÉTHODOLOGIQUES
Dans la recherche en sciences sociales, la collecte et
l'analyse des données sont des opérations déterminantes.
En effet, elles permettent de vérifier les hypothèses
formulées. Toutefois la collecte des données est une
opération couteuse tant en terme de temps qu'en terme de finance. C'est
pour cette raison que nous utiliserons dans le cadre de notre étude des
données déjà existantes. Il s'agit
précisément des données du projet «Impact
résistance 2012» collectées par le Programme Nationale de
Lutte contre le Paludisme (PNLP) dans la région du Nord Cameroun.
Après avoir présenté et évalué les
données, nous définirons les variables opérationnelles et
enfin nous présenterons les différentes méthodes
d'analyses qui nous permettront d'atteindre nos objectifs en vérifiant
les hypothèses.
3.1 Données utilisées
Les données que nous utiliserons sont celles du projet
«Impact résistance dans le Nord Cameroun» mené par le
Programme National de Lutte contre le Paludisme(PNLP) du Ministère de la
santé (MINSANTE). Il s'agit des données longitudinales qui ont
été collectées entre Aout 2012 et Décembre 2012
dans trois districts de santé de la région du Nord
Cameroun(PITOA, GAROUA, MAYO OULO).
3.1.1 Enquête sur «L'impact
résistance dans la région du Nord Cameroun 2012»
L'objectif de l'enquête était de
déterminer l'impact de la Moustiquaire imprégnée sur la
transmission du paludisme en zone de résistance.
3.1 Données utilisées Aspects
Méthodologiques
SANDIE Arsène Brunelle c~IFORD
2013-2014
55
Plus spécifiquement il s'agissait de :
- déterminer l'impact des MILDA sur l'incidence et la
transmission du paludisme en présence de la résistance
métabolique des vecteurs aux insecticides;
- mieux comprendre la résistance aux insecticides et
son mécanisme dans la principale espèce d'anophèle (An
gambiae) responsable du paludisme;
- d'étudier la répartition des gènes de
résistance et de mieux comprendre la tendance général de
flux de gènes entre la population des vecteurs et contrôler les
changements de structure dans la population des vecteurs;
- de mieux comprendre la réponse des vecteurs en
relation avec l'intervention et étudier les possibles changements
induits par la résistance.
3.1.2 Plan d'échantillonnage
De toutes les 10 régions administratives du Cameroun,
la région du Nord a été choisie du fait que la
résistance métabolique de la population des An. gambiae s.l aux
insecticides a été démontrée dans le district de
Pitoa (Etang et al, 2007). La région du Nord Cameroun est
constituée de 13 districts de santé, un district de santé
est constitué de 2 ou plusieurs aires de santé (clusters ou
localités). L'aire de santé comprend 5 à 10 000 habitants
et regroupe un ou plusieurs villages ou quartiers déservis par un centre
de santé. De ces 13 districts de Santé, 3 districts de
santé ont été sélectionnés (PITOA, GAROUA,
MAYO OULO). Les critères de sélection de ces 03 district
étaient essentiellement basés sur la
représentativité des 03 niveaux de résistance. Des
clusters ont été sélectionnés dans chacun des
districts de santé pour ainsi constituer 28 clusters et 60 enfants de
moins de 5 ans ont été sélectionnés par cluster
soit un total de 1680 enfants au début de l'étude dont 51.81% de
sexe masculin et 48.18% de sexe féminin. Il s'agissait
précisément d'une étude de cohorte, où chaque
enfant sélectionné était régulièrement suivi
toutes les 2 semaines.
3.1.3 Informations collectées
Avant d'être introduit dans la cohorte au début
de l'étude, chaque enfant a été diagnostiqué du
paludisme par des examens médicaux de Test de Diagnostique Rapide (TDR)
ou par microscopie. Les enfants diagnostiqués positifs ont
été traités, de façon à ce que au
début de l'étude, les 1680 enfants soient tous idem du paludisme.
Une équipe spécialisée de collecte de données
3.1 Données utilisées Aspects
Méthodologiques
SANDIE Arsène Brunelle c~IFORD
2013-2014
56
constituée des agents enquêteurs et des
personnels médico-sanitaires y passaient toutes les deux semaines pour
un suivi pour chaque enfant introduit dans l'étude. Chaque enfant ayant
un maximum de 8 suivis, soit 112 jours pour la durée maximale du suivi.
Lors des différents suivis, des TDRs et des prises de température
étaient effectués par enfant. Si au cours de ces suivis, un
enfant est diagnostiqué positif du paludisme, il est complètement
pris en charge et il sort de l'étude. Si entre deux visites, un enfant
manifeste des symptômes du paludisme (fièvre, vomissement, etc.)
son chef de ménage ou tout autre personne du ménage se charge de
contacter un relai communau-taire1 qui a été mis en
place dans chaque cluster, l'enfant est alors diagnostiqué, s'il est
positif, il est également pris en charge et il sort de l'étude.
Tout enfant qui sort de l'étude pour toutes autres raisons autre que le
paludisme, est systématiquement remplacé par un autre enfant
ayant des caractéristiques sociodémographiques (Age et sexe)
similaires. Quelques caractéristiques de l'enfant (Age, sexe), ceux de
son ménage (taille du ménage, nombre de MILDA disponible dans le
ménage, niveau d'instruction du CM, etc.) ont été
notés au début de l'étude.
Outre les données collectées au niveau micro et
au niveau méso, les données entomologiques ont été
collectées au niveau de chaque localité.
Précisément, une équipe d'entomologistes ont
collecté les données sur le niveau de résistance de chaque
localité selon le protocole de l'OMS définie dans la section
2.1.7. Ainsi les données que nous disposons sont d'ordre
sociodémogra-phique, socioéconomique,
épidémiologique et entomologique.
1. Personnel médical en charge des cas
déclarés entre deux visites.
3.1 Données utilisées Aspects
Méthodologiques
13"35'E 13"5
13"1'I20"E 13"18'10"E
18°E
9"E 13°30'E
Mogode
Hine
9"E
13.10'E 18`E
3"E
5"E
14"E
13"E
14"E
Guider
L, mbou
ilga
O Lawan
15"E
Légende
Localité
District d'étude
La région du Nord dans le Cameroun
Exh-me- ord
200 Km
Le département de la Benoué dans la région
du Nord
*Bala Dorbeye
Mayo Oulo
Mayo Oulo
Gaschiga
Fi · uil
Boussa
Mayo Lebri
Boula !bib
*
Pitoa
Boul. u
G izigare
Garoua urbain 2
Lounderou
Djamboutou 2PlateauKolle
°.4lfhadi
Ouro Hourso 1Kanadi
20Km
l I
aroua urbai
Ngon,
Mbolom
*Be Centre Nassarao
* *
Bibemi Source: Découpage administratif du cameroun
édition 2007 (INC)
Référence spatiale: WGS 84 Juillet 2013
SANDIE Arsine Brunelle (c)IFORD 2013-2014
57
13"1'20"E
|
3"18'17'E
|
13'.5E
|
13.51'50"E
|
FIGURE 3.1 -- Carte des localités ou clusters de
l'étude
3.2 Evaluation de la qualité des données
Aspects Méthodologiques
SANDIE Arsène Brunelle c~IFORD
2013-2014
58
3.2 Evaluation de la qualité des
données
3.2.1 Taux de non-réponse des
variables
Les non-réponses ou données manquantes
proviennent soit de l'enquêté(e) qui refuse de répondre
à une question, soit de l'enquêteur par omission ou par erreur de
remplissage ou de l'agent de saisie qui peut commettre une erreur de saisie.
Nous présentons dans le tableau 3.1, le taux de non-réponse
correspondant à chaque variable. Il ressort que toute les variables ont
un taux de non-réponse négligeable car ces taux sont tous
inférieurs au seuil autorisé de 10%.
Tableau 3.1 - Taux de non-réponses des
différentes variables
Variables
|
Données manquantes (en %)
|
Infection palustre
|
0.00
|
Durée de l'infection
|
0.00
|
Sexe de l'enfant
|
0.00
|
Age de l'enfant
|
0.00
|
Niveau d'instruction du CM
|
1.14
|
Matériel de construction de l'habitat
|
1.88
|
Taille du ménage
|
0.00
|
Nombre de MILDA dans le ménage
|
0.00
|
Utilisation de MILDA
|
0.87
|
Milieu de résidence
|
0.00
|
Niveau de résistance
|
0.00
|
3.2.2 Données sur l'âge et le sexe de
l'enfant
Le sexe et l'âge constituent des variables de
vérification de la qualité des données. En effet, ces deux
variables ont le plus souvent des distributions standards et connues qui
permettent de faire les comparaisons afin de détecter d'éventuels
décalages. Dans notre étude, les enfants sont repartis selon le
sexe ainsi qu'il suit: 51.81% enfants sont de sexe masculin et 48.18% enfants
sont de sexe
3.2 Evaluation de la qualité des données
Aspects Méthodologiques
SANDIE Arsène Brunelle c~IFORD
2013-2014
59
féminin. Ce qui est conforme à la règle
générale d'un plus grand nombre de naissances masculines par
rapport aux naissances féminines.
L'âge est une variable cruciale tant dans l'analyse des
phénomènes démographiques qu'en
épidémiologie. Nonobstant, il n'est pas toujours aisé de
collecter ou d'observer cette variable en Afrique. Dans le cadre de notre
étude, nous utiliserons la méthode graphique pour évaluer
les données sur l'age des enfants. La figure 3.2 donne la distribution
des enfants en fonction de leur âge. On observe sur cette figure des
grands pics d'effectifs aux âges ronds 12 mois, 24 mois, 36 mois et 48
mois. Cette répartition n'est guère satisfaisante. En effet, les
pics d'effectifs observés aux âges ronds (1 ans, 2 ans, 3 ans et 4
ans) seraient dus aux mauvaises déclarations de l'âge des enfants
par leurs parents qui ont tendance à arrondir l'âge des enfants.
Pour tenter de résoudre ce problème d'effectif, nous allons
regrouper selon les grands groupes comme le montre la figure 3.3
FIGURE 3.2 - Effectif des enfants en fonction de l'âge
(en mois)
FIGURE 3.3 - Effectif des enfants en fonction des groupes
d'âges (en mois)
3.3 Distributions des fréquences des variables
Aspects Méthodologiques
SANDIE Arsène Brunelle c~IFORD
2013-2014
60
3.3 Distributions des fréquences des
variables
3.3.1 Variable à expliquer
Nous cherchons à expliquer la transmission ou
l'infection palustre. Pour cela, nous utilisons les données de survie
sur les enfants de moins de 5 ans. Chaque enfant étant suivi 8 fois avec
des espacements de 2 semaines, si un enfant est diagnostiqué malade de
paludisme au cours de l'étude, alors on dira que cet enfant aura
réalisé l'évènement d'intérêt qu'on
notera E ; dans ce cas on note alors la durée de temps
nécessaire (différence entre la date d'inclusion et la date de
début de maladie) à la réalisation de E. Si
à contrario un enfant subsiste à la maladie (paludisme) à
la fin de l'étude on dira alors qu'il est censuré et on notera
F l'évènement de censure, on note également le
temps nécessaire à la réalisation de F. Ainsi
pour chaque enfant nous disposons à la fin de l'étude d'un couple
de variable (Yi, Ti), où
?
?
?
Yi =
1 Si l'individu i réalise E 0 Si
l'individu i réalise F
et Ti est la durée de temps nécessaire
pour l'individu i pour réaliser E ou F. Dans
toute la suite, de notre étude, nous appellerons temps ou
durée d'infection palustre le temps qui s'est
écoulé entre l'inclusion d'un enfant dans la cohorte et le moment
où il est diagnostiqué du paludisme. Compte tenu de la
portée et la pertinence des données que nous disposons, notre
variable à expliquer sera construite à partir du couple
aléatoire (Y, T). Cette construction dépendra selon que
nous effectuons l'analyse descriptive ou explicative. Pour l'analyse
descriptive, nous utiliserons les estimations de Kaplan Meir pour construire la
probabilité d'échapper à la maladie avant un certain
temps, et pour l'analyse explicative, nous utiliserons les estimations de
Nelson-Aleen pour construire la variable à expliquer qui sera le risque
instantané de réaliser la maladie. Ces différentes
méthodes seront plus détaillées dans les sections
suivantes.
Comme nous le montre la figure 3.4, 58,67% d'enfants sont
restés indemnes du paludisme contre 41,33% qui ont contracté la
maladie. Pour ce qui est de la durée de la réalisation de E
ou F, les moyennes de la durée de réalisation de
ces évènements sont respectivement de 92.87 et 88.73 jours.
Toutefois, la figure 3.5 montre que cette variable semble avoir la même
répartition dans les deux sous populations (E et
F).
3.3 Distributions des fréquences des variables
Aspects Méthodologiques
SANDIE Arsène Brunelle c~IFORD
2013-2014 61
FIGURE 3.4 - Répartition des enfants de l'étude
selon le statut d'infection
FIGURE 3.5 - Densité empirique de la durée de
réalisation des évènements E et F
3.3.2 Variables explicatives
a) Milieu de résidence
Cette variable est appréhendée par trois
modalités : le milieu Urbain, le milieu Semi urbain et le milieu Rural.
La différence entre ces trois milieux provient non seulement de la forte
concentration des infrastructures socio-sanitaires en milieu urbain, mais aussi
et surtout de part l'aménagement et l'assainissement du milieu. Le
milieu urbain étant mieux aménagé et assaini que les deux
autres milieux. Le milieu semi urbain étant un milieu en transition du
rural
3.3 Distributions des fréquences des variables
Aspects Méthodologiques
SANDIE Arsène Brunelle c~IFORD
2013-2014 62
vers l'urbain. Le graphique 3.6 donne la répartition
des enfants inclus dans l'étude par milieu de résidence. La
majorité (677 enfants, soit 45.5%) des enfants inclus dans
l'étude réside en milieu rural, en milieu semi-urbain, 417
enfants ont été sélectionnés, le milieu urbain est
celui qui a le plus petit nombre d'enfants (394 enfants).
FIGURE 3.6 - Répartition des enfants inclus dans
l'étude selon le milieu de résidence
b) Variables socioculturelles
Niveau d'instruction du CM : Désigne
le plus haut niveau d'études atteint par le chef de ménage dans
un système éducatif formel. Cette variable peut être saisie
soit par la dernière classe atteinte, soit par le diplôme le plus
élevé obtenu, voire par le nombre d'années passées
dans le système éducatif formel. Dans le cadre de notre travail,
le niveau d'instruction du CM sera mesuré en distinguant les
modalités suivantes: Sans niveau, Primaire, Secondaire,
Supérieur. La plupart (692 enfants) d'enfant ont un CM qui est sans
niveau d'instruction, 545 enfants ont un CM qui est sans niveau, 208 enfants
ont un CM de niveau primaire et seulement 26 ont un CM de niveau
supérieur.
c) Caractéristiques du ménage
Taille du ménage : Représente
le nombre total d'individus qui résident dans un ménage. Elle est
pertinente pour l'étude. En effet par rapport au nombre de moustiquaires
disponibles dans le ménage, certains membres du ménage peuvent
être privés de l'utilisation des moustiquaires au
3.3 Distributions des fréquences des variables
Aspects Méthodologiques
SANDIE Arsène Brunelle c~IFORD
2013-2014
63
FIGURE 3.7 - Répartition des enfants inclus dans
l'étude selon le niveau d'instruction du CM
profit d'autres. Il s'agit d'une variable quantitative
discrète, nous avons en moyenne 9.7 personnes par ménage, et la
médiane est de 8 personnes.
Type d'habitation du ménage : Il
s'agit du type de matériaux de construction du mur de l'ha-bitat du
ménage. Les modalités sont les suivantes : béton/parpaing,
Brique de terre simple, Bosse de terre battue, Natte chaume.
d) Variables liées à l'enfant
Sexe de l'enfant : Le sexe désigne
l'ensemble des caractères qui permettent de distinguer chez la
population des êtres vivants le genre mâle et le genre femelle (le
Petit Larousse, 1998). Il comporte deux modalités : Masculin et
Féminin. Le graphique 3.8 donne la répartition des enfants de
l'étude selon le sexe, on a un peu plus de
garçons que de filles.
L'âge de l'enfant : L'âge dont il
est question ici est celui de l'enfant au début de l'étude. Les
mo-dalités sont les suivantes :0-15 mois, 16-24 mois, 25-36 mois, 37-60
mois et 48-59 mois.
3.3 Distributions des fréquences des variables
Aspects Méthodologiques
FIGURE 3.8 - Répartition des enfants inclus dans
l'étude selon le sexe
e) Variable intermédiaire
Dans le cas de notre étude, la seule variable
intermédiaire est la variable Utilisation de moustiquaire pour les
enfants de moins de 5 ans, elle sera contrôlée par le nombre de
moustiquaires disponibles dans le ménage. L'enquête étant
longitudinale, lors du passage de l'agent enquêteur à chaque
visite, il était posé la question de savoir si l'enfant a
dormi sous moustiquaire la nuit précédente. Ainsi, pour
chaque enfant sera noté un certain nombre de fois la réalisation
de la variable a dormi sous moustiquaire la nuit précédente. Pour
définir la variable Utilisation de moustiquaire, pour chaque enfant,
nous rapporterons le nombre total de fois où l'enfant a
dormi sous moustiquaire sur le nombre total de ces visites avant la
réalisation de l'évènement d'intérêt E
ou de censure F. De cette façon, notre variable
Utilisation de moustiquaire aura deux modalités: Bonne utilisation et
Mauvaise utilisation. On dira qu'un enfant a eu Bonne utilisation si le rapport
dé-fini relativement à la variable à dormir sous
moustiquaire la nuit précédente est supérieur à 0.8
et dans le cas contraire, nous dirons que l'enfant a eu une
Mauvaise utilisation. Ainsi construite, la figure 3.9 donne la
répartition des enfants selon l'utilisation de la moustiquaire
imprégnée. Il en ressort que, 995 enfants sur 1488 (soit 66.87%)
ont une «mauvaise utilisation» de la moustiquaire et 493 enfants ont
une «bonne utilisation» de la moustiquaire.
SANDIE Arsène Brunelle c~IFORD
2013-2014 64
3.3 Distributions des fréquences des variables
Aspects Méthodologiques
SANDIE Arsène Brunelle c~IFORD
2013-2014
65
FIGURE 3.9 - Répartition des enfants selon l'utilisation
de la moustiquaire imprégnée
Résistance des anophèles femelles
: Cette variable est observée au niveau de chaque
localité. Elle est définie à partir du taux de
mortalité des anophèles soumises aux insecticides (Pour notre
étude il s'agissait de la delthamétrine). La méthodologie
de calcul de ce taux est détaillée dans la section 2.1.7. Le taux
de mortalité calculé est ensuite catégorisé en 3
modalités:
- Résistante : Une localité ayant cette
modalité est une localité où les anophèles femelles
résistent aux insecticides présentent sur les moustiquaires
imprégnées. Dans cette localité, le taux de
mortalité des anophèles femelles est faible (inférieur
à 90%). Au total, 1019 enfants résident dans cette zone, ce qui
correspond à 68.48% de l'ensemble des enfants inclus dans
l'étude.
- Sensible : Il s'agit des localités où les
anophèles sont sensibles au insecticides et n'y résistent pas
lorsqu'elles sont en contact avec les moustiquaires imprégnées.
Dans ce cas le taux de mortalité des anophèles est
élevé (supérieur à 98%). Pour cette zone, 215
enfants ont été sélectionnés ce qui correspond
à 14.44% de l'ensemble total des enfants
- Probable Résistante : Il s'agit des zones
intermédiaires entre la sensibilité et la résistance,
où le taux de mortalité des anophèles est
modéré (compris entre 90 et 97%). Dans cette zone, 254 enfants
ont été inclus dans l'étude, soit 17.07% d'enfants.
3.4 Méthodes d'analyse Aspects
Méthodologiques
SANDIE Arsène Brunelle c~IFORD
2013-2014
66
FIGURE 3.10 - Répartition des enfants selon
l'utilisation de la moustiquaire imprégnée
3.4 Méthodes d'analyse
3.4.1 Méthode statistique d'analyse descriptive
bivariée
Les données dont nous disposons sont des données
de survie. Chaque individu réalise l'évè-nement
d'intérêt E ou l'évènement de censure F
à des instants différents. Ces données nous
permettent de savoir la durée de temps T pour la
réalisation de l'évènement E ou F. Au
regard de ces données, la courbe de survie de Kaplan-Meier semble
être la plus adaptée pour l'analyse descriptive du risque
d'infection palustre; en effet, elle tient compte non seulement de la
réalisation de l'évènement d'intérêt mais
aussi et surtout du temps nécessaire pour la réalisation de cet
évènement.
La fonction de survie de Kaplan-Meier est définie par:
ST(t) = P(T > t), c'est la
probabilité de survivre (au paludisme) ou de ne pas réaliser
l'évènement d'intérêt E avant le temps
t. Si on souhaite étudier la liaison entre une variable
qualitative X à k modalités, et le
phénomène étudié E (paludisme), on fait
alors recours au test du Log - rank. Ce test compare la
fonction de survie entre les k sous-populations ayant
réalisées respectivement les k modalités de la
variable X. Les hypothèses de ce test sont:
- H0 : ST1 = ST2 = ·
· · = STk ;
- H1 : il existe i et j tel
que i =6 j et STi =6STj ;
Accepter l'hypothèse nulle H0, revient
à dire qu'il n'y pas de différence entre les courbes de survie
3.4 Méthodes d'analyse Aspects
Méthodologiques
SANDIE Arsène Brunelle c~IFORD
2013-2014 67
3.4 Méthodes d'analyse Aspects
Méthodologiques
des k sous-populations issues des k modalités de la
variable X. Ainsi accepter H0, revient à dire qu'il y a
indépendance entre X et le risque d'infection palustre.
3.4.2 Régression semi-paramétrique de
Cox
a) Pertinence et principe de la
méthode
Étant donnée que nous disposons des
données de survie, où la réalisation ou non de
l'évè-nement d'intérêt s'est faite à des
instants différents, nous utiliserons le modèle
sémi-paramétrique à risque proportionnel de Cox.
L'idée de base est d'écrire le risque comme le produit de deux
éléments, le premier est un risque de base alors que le second
est fonction des seules variables explicatives. Ce modèle permet
d'exprimer un effet multiplicatif des diverses covariables sur le risque
instantané de connaitre l'évènement
d'intérêt. La spécification du modèle est la
suivante:
ë(t, X, Z) =
ë0(t)eX1â1+···+Xpâp
(3.1)
Où
- ë(t, X, Z) est la fonction de risque instantané
de connaitre l'évènement d'intérêt E par
unité de temps, en fonction de X et du temps t;
- ë0(t) est le risque instantané de
base;
- X = (X1,··· ,
Xp) le vecteur des covariables et 9 =
(91,··· , 9p) son vecteur
coefficient associé.
On utilise alors la maximisation de la vraisemblance
conditionnelle à l'ensemble des instants où il y a eu
réalisation de l'évènement, pour estimer le vecteur des
coefficients 9 = (91, · · · ,9p).
Ensuite le test de Wald est utilisé pour tester la
significativité des coefficients. On utilise enfin les estimations de
Breslow ou Nelson-Aalen pour estimer le risque instantané de base.
b) Hypothèse de
proportionnalité
Le modèle de Cox est un modèle à risque
proportionnel, ce qui veut dire que ce modèle n'est applicable que si
l'hypothèse de proportionnalité est vérifiée. Avant
d'interpréter les résultats de la régression de Cox, il
est nécessaire de tester les hypothèses suivantes:
- H0 L'hypothèse de proportionnalité est
vérifiée;
SANDIE Arsène Brunelle c~IFORD
2013-2014
68
- H1 : L'hypothèse de proportionnalité n'est pas
vérifiée.
NB : Si H0 est rejetée, il faudra
alors stratifier suivant la covariable où l'hypothèse n'est pas
vérifiée, on parle alors de modèle de Cox
stratifié. Mais lorsqu'on stratifie selon une covariable, elle n'est
plus exprimée dans le modèle de régression comme variable
explicative. Dès lors, il n'est plus possible de savoir si cette
covariable est significativement associée ou pas au
phénomène étudié.
c) Interprétation des coefficients du
modèle de Cox
L'interprétation des coefficients dépend de la
nature de la variable associée. Soit âj, le coefficient
associé à une variable explicative Xj
- Si la variable Xj est quantitative, alors exp(âj)
s'interprète comme le risque relatif par unité de temps pour une
augmentation d'une unité de la variable.
- Si la variable Xj est une variable ayant deux classes 0 ou
1, alors exp(âj) s'interprète comme le risque relatif par
unité pour les individus de la classe «1» de connaitre
l'évè-nement par rapport à ceux de la classe
«0».
3.4.3 Modèle de durée de vie
accélérée
a) Pertinence et principe de la
méthode
Nous avons vu que le modèle de Cox n'est applicable que
si toutes les variables satisfont à l'hypothèse de
proportionnalité. Une variable qui ne vérifie pas cette
hypothèse est stratifiée et n'apparait plus dans les
résultats de l'estimation du modèle de Cox. Mais il peut se
trouver que des variables clés qui apparaissent dans nos objectifs ne
vérifient pas l'hypothèse de proportionnalité dans le
modèle de Cox. Dans ce cas, l'application du modèle de Cox ne
peut nous permettre de vérifier nos hypothèses et devient ainsi
moins pertinente. Pour contourner cette difficulté, nous utiliserons le
modèle de durée de vie
accélérée2.
Ce modèle considère les variables
indépendantes comme «accélérateurs» ou
«décélérateur» du temps de réalisation de
l'évènement d'intérêt (infection palustre).
Précisément, ce modèle per-
2. Chez les anglo-saxon est appelé Accelerated
Failure-Time models (AFT)
3.4 Méthodes d'analyse Aspects
Méthodologiques
SANDIE Arsène Brunelle c~IFORD
2013-2014
69
met de voir si les variables indépendantes allongent ou
rétrécissent le temps d'infection palustre. La
spécification du modèle est la suivante:
ln(T) = X1â1 +
· · · + Xpâp + u (3.2)
Où, X = (X1,···
, Xp) est le vecteur des variables explicatives, T
représente le temps de réalisation de l'évènement
d'intérêt (infection palustre) ou l'évènement de
censure(ne pas être tombé malade jusqu'à la fin de
l'étude) et u représente le terme d'erreur.
b) Interprétation des coefficients du
modèle de durée de vie accéléré
Une fois spécifiée, on utilise la méthode
de maximisation de la vraisemblance pour estimer les paramètres du
modèle 3.2. Ensuite on utilise le test de Wald pour tester la
significativité des variables. l'interprétation des coefficients
dépend de la nature de la variable Xj :
- Si Xj est quantitative, alors âj représente
l'élasticité de T. En d'autre terme, l'augmen-tation de Xj d'une
unité entraine un effet multiplicatif sur T en moyenne de
exp(âj).
- Si Xj est qualitative avec deux classes «0» et
«1», alors exp(âj) représente le taux de croissance de
T, lorsqu'on passe de la classe «0» à la classe
«1».
Si âj < 0 alors exp(âj) < 1 et dans ce cas,
la variable Xj a pour effet de diminuer le temps de réalisation de
l'évènement d'intérêt et donc favorise plus vite sa
réalisation. On dit alors que Xj est un accélérateur du
temps de réalisation de l'évènement
d'intérêt. Par contre Si âj > 0 alors exp(âj) >
1 et dans ce cas, la variable Xj a pour effet d'augmenter le temps de
réalisation de l'évènement d'intérêt et donc
de ralentir sa réalisation. On dit alors que Xj est un
«ralentisseur» ou un «décélérateur» de
l'événement d'intérêt.
3.4.4 Hiérarchisation des facteurs explicatifs
du risque d'infection palustre
Dans la recherche des facteurs explicatifs d'un
phénomène, il est important de hiérarchiser ces facteurs.
En effet, dans le cas d'une éventuelle intervention des gouvernements ou
des organismes, il est important de savoir les variables les plus prioritaires.
Variables sur lesquelles une action entraînerait la baisse du risque
d'infection palustre chez les enfants de moins de 5 ans. Ainsi nous utiliserons
la contribution relative de chaque variable qui est donné par la
formule:
mi
Cv = ÷2 sat -
÷2 (3.3)
÷2 sat
3.4 Méthodes d'analyse Aspects
Méthodologiques
SANDIE Arsène Brunelle c~IFORD
2013-2014 70
où
- Cv contribution de la variable;
- ÷2 sat Chi deux du modèle
saturé;
- ÷2 m. Chi deux du modèle sans la
variable.
Après avoir calculé la contribution de chaque
variable, la hiérarchisation des facteurs explicatifs du risque
d'infection palustre chez les enfants de moins de 5 ans se fera de la variable
dont la contribution est la plus grande à celle dont la contribution est
la plus petite.
Ce chapitre a globalement consisté à
présenter les données utilisées et les méthodes
statistiques que nous appliquerons dans le chapitre suivant pour effectivement
tenter de vérifier nos hypothèses. Les données
utilisées dans notre travail sont celles du projet «Impact
résistance dans la région du Nord Cameroun» mené par
le PNLP en 2012. Pour ce qui est de l'analyse des données; Au niveau
descriptif, nous avons présenté les courbes de survie de
Kaplan-Meier et au niveau explicatif, nous avons présenté dans un
premier temps le modèle semi paramétrique de Cox dont
l'application nécessite la vérification de l'hypothèse de
proportionnalité pour chaque variable. Or cette hypothèse n'est
pas toujours vérifiée, nous avons alors présenté le
modèle de durée de vie accélérée qui
constitue un palliatif. Enfin, nous avons présenté la formule du
calcul de la contribution relative des variables explicatives, ce qui nous
permettra par la suite de hiérarchiser les facteurs associé
à l'infection palustre chez les enfants de moins de 5 ans dans la
région du Nord Cameroun.
La suite de notre travail consistera à appliquer les
différentes méthodes statistiques que nous avons
présenté. Ceci dans le but de vérifier nos
hypothèses de travail.
SANDIE Arsène Brunelle c~IFORD
2013-2014 71
|