CHAPITRE QUATRIEME :
MODELISATION DE IA FONCTION DE RIS~~E
DE COI
En faisant suite au chapitre premier de cette recherche
dédié aux notions théoriques du modèle de Cox et en
se servant du pont érigé par le chapitre troisième de la
même recherche destiné l'analyse exploratoire des données,
ce présent chapitre réalise la mesure du risque de
mortalité. Il sera ici question de l'application effective du
modèle de Cox à risque proportionnel sur les données des
variables sous analyse.
La section première de ce chapitre revoie la revue de
littérature la liens entre eau-assainissement et mortalité
infantile, la deuxième spécifie le modèle de Cox à
risque proportionnel, la troisième section passe à l'estimation
puis à la validation du modèle, la quatrième quant
à elle, présente et interprète les résultats de
l'estimation et enfin la dernière section de ce chapitre donne quelques
recommandations quant à la préservation de la santé
publique.
4.1. Revue de la
littérature
Les littératures contemporaines sont quasiment unanimes
en ce qui concerne l'impact de l'eau et l'assainissement sur la
mortalité des enfants. Elles s'accordent sur le fait que l'accès
à l'eau potable et à l'assainissement contribue efficacement
à l'amélioration de l'état sanitaire des enfants de moins
de cinq ans et à fortiori au développement du milieu de vie.
Un grand apport en théorie et en statistiques est
fourni par le Rapport Mondial sur le Développement Humain 2006. En
effet, la crise de l'eau et de l'assainissement était le thème
central de rédaction de ce document et cela est exprimé en de
termes suivants : « ...donner accès à une eau salubre,
éliminer les eaux usées et fournir des systèmes
d'assainissement constituent trois des bases les plus fondamentales du
progrès humain. 19»
Dans ce rapport, on dénombre plusieurs articles sur
l'eau et l'assainissement dont ceux préparés par FUENTES,
PFÕTZE et SECK sur l'impact de l'accès à l'eau et à
l'assainissement sur le risque de mortalité
19 Rapport Mondial sur le Développement Humain
2006, page 2
néonatale (0 à 1 mois) et post-néonatale (1
à 12 mois), ainsi que sur le risque de diarrhée (première
cause de décès lié à l'eau chez les enfants).
Les données utilisées dans le cadre de cette
analyse de l'article ci haut indiqué, proviennent de l'enquête
démographique et sanitaire sur la situation des enfants dans 18 pays en
utilisant des variables socioéconomiques relatives aux individus, aux
ménages et aux communautés de vie.
Dans la première régression c'est-à-dire
l'impact de l'eau et de l'assainissement sur le risque de mortalité
néonatale, les auteurs ont utilisé le modèle logit afin
d'affirmer le risque certain de mortalité néonatale lié
à l'eau et à l'assainissement du milieu de vie. En ce qui
concerne la seconde régression, un modèle de Cox à risque
proportionnel était utilisé dans le but de montrer Le
degré du risque de la diarrhée chez les enfants de moins de 1 an
lorsque ces derniers n'ont pas accès aux infrastructures
nécessaires d'assainissement.
Par ailleurs, dans son article «Evaluation des OMD en
matière de la santé en RDC et perspectives à l'horizon
2015 20», SHIDI PALATA recommande un accès accru aux
services publics de base afin de se préserver des maladies
pathogènes. Il s'agit en outre de l'amélioration de
l'amélioration de l'hygiène et la protection de l'environnement
à travers la gestion des eaux usées, des déchets
ménagers et des excrétas ; une bonne politique d'habitat ; les
médias et les moyens de communications ainsi que l'éducation et
la formation.
Enfin, une attention particulière doit être
portée sur le Français Marie-Claude VILAND 21dans son
ouvrage « Eau et santé » présente les risques auxquels
les populations sont exposées en ayant à leur disposition une eau
chargée en germes pathogènes, et montre la diversité des
actions à prendre pour améliorer cette situation. Il s'appui sur
quelques expériences amorcées qui font réaliser qu'un
énorme travail reste à conduire pour permettre enfin, à
l'aube de ce siècle, aux populations les plus défavorisées
d'accéder à une eau saine. Ces premiers éléments,
réunis par M-C. VILAND et utilisés en 1989 dans plusieurs
programmes de formation villageoise en
20 SHIDI.P, Evaluation des OMD en matière de la
santé en RDC et perspectives à l'horizon 2015 in Grande
Conférence Académique, UNKIN, mars 2007
21 Biologiste, Marie-Claude VILAND travaille depuis le
début de la Décennie Internationale de l'Eau Potable et de
l'Assainissement (DIEPA), sur les problèmes de la qualité de
l'eau en Afrique de l'Ouest. En tant qu'expert à ce titre, est
chargée par l'OMS et par les coopérations bi-latérales de
missions OM, aussi bien en formation dans les milieux ruraux et péri
urbains, qu'en interventions techniques sur les points d'eau.
Afrique, sont une contribution au projet d'un manuel de
synthèse traitant de ces questions et de leurs remèdes.
4.2. Spécification du
modèle de Cox
Comme la durée de vie et l'analyse de survie de Kaplan-
Meier, le modèle de Cox est une méthode de modélisation
des données de la durée à l'événement avec
des observations censurées. Cependant le modèle de Cox permet
d'ajouter des variables indépendantes (covariables) aux modèles.
Le modèle de Cox gère les observations censurées
correctement et fournit des estimations des coefficients pour chacune des
covariables, permettant d'évaluer l'impact de plusieurs covariables dans
le même modèle. le modèle de Cox peut également
être utilisé pour étudier l'effet de covariables
continues.
Statistiques : Pour chaque modèle : -2LL, statistique
du rapport de vraisemblance et le Khi-Deux global. Pour les variables de ce
modèle : estimations, erreurs standard et statistiques de Wald. Pour les
variables hors du modèle : statistiques ponctuelles et Khi-Deux
résiduel.
Les diagrammes : Les diagrammes permettent d'évaluer le
modèle estimé et d'interpréter les résultats. Les
fonctions Survie, Hasard, LN (-Logn), et Un moins survie ne peuvent pas
être représentée. Ces fonctions dépendant des
valeurs des covariables, on peut utiliser les valeurs constantes des
covariables pour représenter graphiquement ces fonctions par rapport au
temps.
4.2.1.
Présentation des
variables
Etant donnée qu'il n'existe pas une formule
appropriée pour le choix ou la détermination des variables
d'analyse, l'option pour un type spécifique de variable dépend
des objectifs de la recherche. Le modèle de Cox prend en compte dans sa
formulation de trois types de variables à savoir la variable
d'état, la variable de durée et les variables explicatives ou
covariables.
A. la variable de durée :
Cette variable définie pour chaque individu une date du
début et une date de la fin de l'événement. Dans le cadre
de ce travail, nous retenons la variable indiquant la durée
séparant le dernier accouchement et la date de l'enquête. La
durée sera ici évaluée en mois pour
l'homogénéité des données.
B. La variable d'état
:
Cette variable résume l'état du sujet au moment
de l'enquête. En outre, la femme enquêtée a encore l'enfant
(de moins de cinq ans) au moment de notre enquête ? C'est à dire
l'enfant est-il en vie ou décédé ?. Dans cette recherche,
la variable d'état se définie par la réponse à la
question suivante adressée à la mère: « l'enfant issu
de la dernière naissance est-il en vie ou en décédé
».Noter qu'il faut définir l'événement pour la
variable état. Entrez là où les valeurs indiquant que
l'événement final a eu lieu. On saisie une seule valeur, un
intervalle ou une liste de valeurs. L'option Intervalle de valeurs n'est
disponible que si votre variable d'état est numérique.
c. Les covariables :
L'ensemble de tous les autres variables pouvant
expliqué la variable état précédemment
définie. La recherche retient la suite de variables ci-après :
· l'âge de la mère,
· sexe de l'enfant,
· poids de l'enfant,
· la taille de l'enfant,
· la taille du ménage,
· le niveau de vie de ménage évalué en
terme de richesse (wealth index quintiles)
· l'accès à l'eau de boisson,
· source d'approvisionnement en eau de boisson,
· le type de toilettes utilisées par le
ménage,
· l'espacement entre les naissance mesuré en 5
ans (1=faible pour plus de deux naissances pendant 5 ans et 2=grand pour moins
de deux naissantes en 5 ans),
· lieu d'emplacement des latrines,
· gestion des selles des enfants (0 à 3 ans) lors
que ces derniers n'utilisent pas des latrines,
· mode d'évacuation des eaux usées,
· mode d'évacuation des ordures
ménagères,
4.2.2. Les
signes attendus des coefficients des
covariables du modèle
Les signes attendus des coefficients des covariables
concernent le sens de variation de la variable expliquée du fait de la
modification d'un facteur explicatif de l'état des enfants de moins de
cinq ans.
a) L'âge de la mère
L'âge de la femme influence souvent l'état de
l'enfant à la naissance dans la mesure où une femme moins
âgée est plus sujette à l'inexpérience quant
à la maîtrise de certains caprices des enfants surtout en
âge préscolaire (en cas par exemple d'une maladie,
l'inexpérience de la mère devient la cause du décès
de l'enfant à cause d'une intervention tardive). Tandis qu'une femme
plus âgée est souvent habituée aux différentes
gestations enfantines; et donc elle connaît moins de décès
des enfants.
b) le sexe de l'enfant
En général, les garçons sont plus
résistants aux maladies que les filles en âge préscolaire.
En outre, le taux de mortalité des enfants fille de moins de cinq ans
est plus élevé que celui de garçons.
c) Poids de l'enfant
Le poids en soi n'est pas un indicateur de la santé de
l'enfant. Néanmoins, l'insuffisance pondérale rend l'enfant
encore plus vulnérables. L'OMS donne les critères de poids en
fonction de l'âge de l'enfant.
d) La taille du ménage
Une taille importante du ménage a directement des
effets sur les conditions d'assainissement du milieu de vie, lesquelles
conditions sont sources inévitables des maladies pathogènes.
e) Le niveau de vie du ménage:
Le niveau de vie du ménage évalué en
terme des richesses ou de patrimoine s'interprète à travers
l'accès à certains services jugés de base pour la vie. Un
ménage pauvre n'a pas accès facile à l'eau potable et aux
infrastructures nécessaires d'assainissement contrairement à un
ménage riche.
f) L'accès à
l'eau potable
L'eau c'est la vie, dit-on. L'inaccessibilité d'un
ménage à l'eau potable l'expose aux problèmes
d'assainissement qui sont les sources inévitables des maladies
pathogènes.
g) L'état de
l'assainissement
L'assainissement se trouve en amont comme en aval des
problèmes d'eau de boisson pour un ménage. Une carence
prolongée en eau soluble dégrade les infrastructures
d'assainissement et cause des maladies épidémiologiques. De
même un mauvais usage des eaux usées ne peut garantir
l'assainissement du milieu de vie.
h) Les espacements entre les naissances au sein
d'un ménage
Plus de deux naissances en cinq ans dans un même
ménage expose ce dernier aux problèmes de promiscuité et
ses corollaires à savoir l'assainissement du milieu qui source des
maladies diarrhéiques et des épidémies.
4.3.
Estimation et validation du
modèle de Cox
Les données issues de l'enquête MICS 2 sont
regroupées selon les variables de contrôle dans nouvelles bases de
données répertoriant uniquement les modules relatifs à
l'habitat, eau, assainissement du milieu, iodation du sel et mortalité
des enfants. Les variables de contrôles sont présentées en
annexes du travail.
Tenant compte de notre spécification, nous pouvons
estimer les coefficients de régression de cox Les résultats de
cox sont présentées par le logiciel SPSS en différents
tableaux traduisant les étapes de la régression selon le
modèle de Cox. SPSS présente à coté des
coefficients du modèle estimé, les statistiques
d'interprétation et de validation du modèle en
général. Les résultats de la régression de Cox se
présente de la manière suivante :
· Le tableau récapitulatif : ce tableau
présente les modalités ou les statistiques de bases de
l'estimation à savoir les nombres disponibles des observations dans
l'analyse (événements et données censurées) et les
observations enlevées du système subdiviser en observation avec
valeurs manquantes, les observations avec temps non positifs et enfin les
observations censurées avant l'événement le plus ancien
dans une strate.
· Le tableau de tests de la spécification du
modèle : le test de spécification du modèle de Cox sur le
logiciel SPSS s'effectue en trois niveau et suivant les différentes
étapes de la régression du
modèle. la
première colonne du tableau de test de
spécification présente le test sur le modèle global; le
deuxième et la troisième colonne du même tableau indiquent
respectivement la significativité du modèle modifié par la
suppression d'une variable et du modèle dont on a changé le bloc
précédent des variables.
En ce qui nous concerne, seul la significativité du
modèle à une étape précise fera l'objet de notre
test.
Il importe, par ailleurs, de signifier que le logiciel SPSS
procède à la régression par étape c'est à
dire qu'à chaque niveaux d'estimation du modèle, le logiciel
supprime successivement et systématiquement une variable ou un
caractère non significatif dans le modèle. En outre, à une
étape d'estimation de cox, une variable supprimée jusqu'à
la prise en compte de la dernière variable statistiquement
significatif.
· Le tableau d'estimation des coefficients du
modèle: le tableau d'estimation dans le modèle de Cox
présente les statistiques ci-après: les coefficients de la
régression â traduisant le logarithme du risque ainsi le risque
exp(â), le standard error S.E qui est l'écart type de la
régression, le coefficient de Wald (pour le test paramétrique
dans une maximum de vraisemblance) qui est en fait le quotient de l'estimateur
sur le standard error et enfin les probabilités et les intervalles de
confiances des coefficients du modèle estimé à 95%.
A coté de l'estimation des coefficients du
modèle, la régression de Cox procède également
à l'estimation du modèle pessimiste c'est-à-dire
l'estimation du modèle si les termes ou les autres variables du
modèle sont effectivement supprimées de l'équation de la
régression.
· La table de survie: la table de survie présente
la distribution de la fonction cumulée de risque ventilée par la
durée de temps considéré dans l'analyse. Dans le cas
d'espèce, il s'agit de la durée mesurée en mois de
naissance pour les enfants de moins de 59 mois révolus. La table de
survie présente également la fonction de risque cumulée de
base (hazard function) ainsi la distribution à la moyenne des
covariables de la fonction de survie).
· Les diagrammes: outre les statistiques
numériques d'estimation, la régression de cox procède
également à la représentation graphique des distributions
ci hautes indiquées. Il s'agit des graphique de la fonction de survie
cumulée, le graphique de la fonction logarithme de l'antilogarithme de
la fonction de survie cumulée, traduisant le risque instantanée
du sujet d'une classe d'âge par rapport à un autre
de la classe précédente. L'interprétation
de ces diagrammes se résume à travers le modèle suivant
:
Prob.
|
Haute probabilité Faible impact
|
Haute probabilité Fort impact
|
|
0
|
|
Faible probabilité Fort impact
|
|
|
|
|
|
Impact
Ce schéma indique plus ou moins le sens explicatif
à donner à l'allure d'une fonction de distribution de
probabilité. Les fonctions de probabilité étant
cumulées, nous allons plus nous intéresser de la zone
d'achèvement de la tendance des courbes.
4.3.1.
Présentation des résultats de
l'estimation
Les tableaux suivants présentent les résultats de
l'estimation du modèle de Cox par la méthode maximum de
vraisemblance.
REGRESSION DE COX (RESULTAT SPSS 10) TABLEAU 21
: Récapitulatif du traitement des observations
|
|
N
|
Pourcentage
|
Observations disponibles dans l'analyse
|
Evénement
|
1510
|
19,4%
|
|
Censurée
|
91
|
1,2%
|
|
Total
|
1601
|
20,5%
|
Observations enlevées
|
Observations avec valeurs manquantes
|
6197
|
79,4%
|
|
Observations avec temps non-positif
|
2
|
,0%
|
|
Observations censurées avant
l'événement le plus ancien dans une strate
|
0
|
,0%
|
|
Total
|
6199
|
79,5%
|
Total
|
|
7800
|
100,0%
|
|
TABLEAU 22 : Tests de spécification du
modèle
|
-2log- vraisemb lance
|
Global (note)
|
|
|
Changeme nt
de l'étape précédent
|
|
|
Changemen t du bloc précédent
|
|
|
Etape
|
|
Khi-deux
|
ddl
|
Signif.
|
Khi-deux
|
ddl
|
Signif.
|
Khi-deux
|
ddl
|
Signif.
|
1
|
21023,390
|
18,621
|
15
|
,231
|
19,282
|
15
|
,201
|
19,282
|
15
|
,201
|
2
|
21023,391
|
18,620
|
14
|
,180
|
,001
|
1
|
,980
|
19,281
|
14
|
,154
|
3
|
21023,424
|
18,587
|
13
|
,136
|
,033
|
1
|
,855
|
19,248
|
13
|
,116
|
4
|
21023,726
|
18,285
|
12
|
,107
|
,302
|
1
|
,583
|
18,946
|
12
|
,090
|
5
|
21023,961
|
18,058
|
11
|
,080
|
,235
|
1
|
,628
|
18,712
|
11
|
,066
|
6
|
21024,383
|
17,652
|
10
|
,061
|
,423
|
1
|
,516
|
18,289
|
10
|
,050
|
7
|
21024,864
|
17,174
|
9
|
,046
|
,480
|
1
|
,488
|
17,808
|
9
|
,037
|
8
|
21025,206
|
16,837
|
8
|
,032
|
,342
|
1
|
,559
|
17,466
|
8
|
,026
|
9
|
21025,918
|
16,130
|
7
|
,024
|
,712
|
1
|
,399
|
16,754
|
7
|
,019
|
10
|
21026,502
|
15,559
|
6
|
,016
|
,584
|
1
|
,445
|
16,170
|
6
|
,013
|
11
|
21027,212
|
14,875
|
5
|
,011
|
,709
|
1
|
,400
|
15,461
|
5
|
,009
|
12
|
21028,821
|
13,247
|
4
|
,010
|
1,609
|
1
|
,205
|
13,851
|
4
|
,008
|
13
|
21029,972
|
12,135
|
3
|
,007
|
1,151
|
1
|
,283
|
12,700
|
3
|
,005
|
14
|
21031,860
|
10,197
|
2
|
,006
|
1,888
|
1
|
,169
|
10,812
|
2
|
,004
|
15
|
21034,138
|
7,935
|
1
|
,005
|
2,278
|
1
|
,131
|
8,535
|
1
|
,003
|
|
Source: Résultat SPSS
a Variable(s) saisie à l'étape numéro 1:
WI3B WS1 WS2 WS2A WS3
WS4 WS5 WS5A WS5B SA1 CHWEIGHT WMWEIGHT
WLTHIND5 POTABLE HIMEM
b Variable supprimée à l'étape 2:
CHWEIGHT
c Variable supprimée à l'étape 3: WS5B
d Variable supprimée à l'étape 4: WS2
e Variable supprimée à l'étape 5: WS3
f Variable supprimée à l'étape 6: WS4
g Variable supprimée à l'étape 7: WS1
h Variable supprimée à l'étape 8:
POTABLE
i Variable supprimée à l'étape 9: WS5A
j Variable supprimée à l'étape 10: WS2A
k Variable supprimée à l'étape 11: SA1
l Variable supprimée à l'étape 12:
WMWEIGHT
m Variable supprimée à l'étape 13:
WLTHIND5
n Variable supprimée à l'étape 14: HIMEM
o Variable supprimée à l'étape 15: WI3B
p Bloc de départ numéro 0, fonction de
log-vraisemblance initiale : -2log-
vraisemblance : 21042,672
q Bloc de départ numéro 1. Méthode =
Ascendante pas à pas (rapport de
vraisemblance conditionnelle)
TABLEAU 23:Table de survie
|
Fonction de base de Hasard cumulé
|
A la moyenne des covariables du modèle
|
Temps
|
|
Survie
|
E.S.
|
Hasard cumulé
|
3,000
|
,001
|
,999
|
,001
|
,001
|
5,000
|
,006
|
,995
|
,002
|
,005
|
6,000
|
,048
|
,960
|
,005
|
,041
|
7,000
|
,137
|
,889
|
,008
|
,118
|
8,000
|
,241
|
,813
|
,009
|
,207
|
9,000
|
,359
|
,735
|
,011
|
,308
|
10,000
|
,461
|
,673
|
,011
|
,395
|
11,000
|
,590
|
,603
|
,012
|
,506
|
12,000
|
3,779
|
,039
|
,001
|
3,239
|
24,000
|
4,931
|
,015
|
,005
|
4,227
|
36,000
|
5,545
|
,009
|
,004
|
4,753
|
|
Source : résultat SPSS 10
TABLEAU 24 : Moyenne des covariables
|
Moyenne
|
WI3B
|
26,814
|
WS1
|
8,048
|
WS2
|
195,507
|
WS2A
|
3,117
|
WS3
|
4,399
|
WS4
|
2,132
|
WS5
|
2,524
|
WS5A
|
5,808
|
WS5B
|
5,150
|
SA1
|
1,384
|
CHWEIGHT
|
,943
|
WMWEIGHT
|
1,015
|
WLTHIND5
|
3,057
|
POTABLE
|
,502
|
HIMEM
|
6,743
|
|
Fonction de survie à la moyenne des prédicteu
|
1,2 1,0 ,8 ,6 ,4 ,2
0,0
-,2
|
|
|
-10 0 10 20 30 40
Durée
Fonction LML à la moyenne des prédicteurs
0 10 20 30 40
Durée
4.3.2.
Analyse et
interprétation des
résultats
L'analyse de résultat de la régression du
modèle de Cox indique que le test de spécification du
modèle est globalement significatif à partir de la
septième étape de la spécification de Cox. A cette
étape, le modèle est resté avec un nombre réduit
des covariables après avoir supprimé sept autres non
statistiquement significatives à savoir le poids des enfants, le mode
d'évacuation des ordures ménagères, le temps mis pour
aller puiser l'eau de boisson, les types de toilettes et le lieu d'emplacement
de ces dernières, et enfin la source d'approvisionnement en eau de
boisson. Au total neufs variables en dehors de celles-ci rendent le
modèle globalement significatif avec une probabilité de 0,046
(probabilité inférieur au seuil critique de 0,05).
Après la validation du modèle
spécifié, la régression rend le résultat (voir
tableau des variables dans l'équation en annexe du travail)
présenté en 15 étapes selon l'élimination
progressive de variable non significative à une étape
donnée jusqu'à la dernière étape de la
régression.
Le tableau d'estimation présente les
différentes étapes de l'estimation ainsi que les
différentes variables retenues à la régression, le
coefficient â accompagné du rapport de wald et les
probabilités de significativité des variables ainsi que exp(
â) traduisant le risque. Les résultats de la régression de
Cox montre que seule la variable interprétant « le mode de gestion
des selles des petits enfants (âgés de 0 à 3 ans) ; lors
que ces derniers n'utilisent pas des toilettes commune dans le ménage
» est significativement dominant dans les facteurs explicatifs de la
mortalité des enfants de moins de cinq ans. Soit une probabilité
de 0,005(inférieur au seuil critique de 0,05) ; le logarithme de risque
égale à -0.061 auquel l'on associe un risque équivalent
à 0,941. l'estimation du modèle si les termes sont
supprimés à différentes étapes témoigne le
score élevé de la variable WS522 et toutes les
fonctions de probabilité liées au risque sus mesuré seront
distribuées par rapport à cette variable sur les
différents âges des enfants sous examen.
La table de survie répertorie les probabilités
de survie cumulée des enfants de moins de cinq ans selon leur mois de
naissance, soit 0,99 pour les enfants de moins de 3 mois et 0,995 ; 0,96 ;
0,889 ; 0,813 ; 0,735 ; 0,673 ; 0,603 ; 0,039 ; 0,015 ; 0,009 des
probabilités respectivement pour les enfants de moins de 5, 6, 7, 8, 9,
10, 11, 12, 24 et 36 mois de naissance. Ces probabilités indiquent que
le risque de mortalité des enfants de moins de cinq ans évolue
avec l'âge de l'enfant; plus l'enfant évolue en âge, plus il
est exposé au risque de mortalité lié à la mauvaise
gestion des selles des enfants si
22 L'annexe de ce travail présente le
dictionnaire de toutes les variables sous analyses
ces derniers n'utilisent pas des toilettes habituelles.
L'âge le plus exposé varie entre 0 et 3 ans.
|
|