3.1. Le traitement de l'information
Pour la méthode de traitement de données, on
s'est proposé d'examiner les résultats de l'enquête en
réalisant des traitements allant de l'analyse unidimensionnelle (tris
à plats, tris croisés, histogrammes,) aux analyses
multidimensionnelles en effectuant principalement des analyses factorielles de
correspondances, ainsi que des tests statistiques.
Ainsi, selon le mode de traitement statistique et
cartographique, nous avons utilisé diverses méthodes statistiques
selon les questions d'analyse posées. Les tableaux, les graphiques, et
des cartes sont les résultats des traitements opérés avec
le maniement des données recueillies. Les logiciels tels que, Sphinx,
Excel et Arcgis ont été utilisés pour la
réalisation des opérations statistiques et cartographiques. Les
données issues de nos enquêtes ont été saisies au
fur et à mesure de la collecte au moyen du logiciel Sphinx, puis
classifiées en catégorie selon les indicateurs liés au
phénomène étudié.
Approche du traitement des données
La saisie des données recueillies a été
faite avec le logiciel sphinx où nous avions préalablement
élaboré un masque de saisie. La saisie des données
terminées, nous avons procédé à un épurement
de la base de données puis regroupés les informations selon les
thématiques et les indicateurs définis. Ainsi, à l'aide
des logiciels Excel, SPSS, Arc Gis, le traitement des données saisies a
été réalisé. Les résultats de ces
différents traitements se traduisent par les tableaux, les graphiques et
les cartes présentés dans le document.
Analyse et interprétation de données
obtenues
Les différentes informations que le logiciel de saisie
à traduit et synthétisé ont permis de réaliser des
graphiques (courbes et diagrammes) à partir du logiciel Excel version
2013. Nous avons également réalisé les cartes avec les
logiciels suivants : Adobe Illustrator version CS 4, Arc View version 3.2 et
Envi. Les résultats consignés dans les différents tableaux
ont fait l'objet de commentaires, d'analyse, d'explication et
d'interprétation. L'analyse des données a permis d'établir
des relations entre les différents phénomènes
observés et permis de mieux apprécier les relations entre les
différentes variables et d'élaborer clairement les rapports de
causalité. En sommes, les illustrations contenues dans ce travail final
se présentent sous forme de photographies, de graphiques et de
cartes.
§
59
La démarche statistique
Utilisation des tests statistiques pour notre
étude
Plusieurs études réalisées s'appuient sur
la base d'échantillons. En effet, comme il est presque toujours
impossible de travailler sur la population totale concernée par
l'enquête, diverses raisons sont évoquées pour expliquer
l'usage de la base d'échantillon. On peut citer entre autres, le
coût financier, les raisons techniques, le temps. Ainsi, on se demande
comment savoir si une tendance observée dans un échantillon est
bien valable pour l'ensemble de la population. C'est pour répondre
à cette question que l'on fait appel aux tests statistiques. Ceux-ci
permettent de s'assurer que les résultats observés dans un
échantillon sont généralisables (ou non) à
l'ensemble de la population concernée. Plusieurs tests statiques ont
été utilisés à cet effet.
Le choix des tests statistiques
-Le test de Khi2
Le test d'indépendance du Khi2 (l'écriture
anglaise est « chi-square ») a été
développé par PEARSON K. (1857-1936).
L'expression test du Khi2 recouvre plusieurs tests statistiques,
trois tests principalement :
· le test d'ajustement ou d'adéquation, qui
compare globalement la distribution observée dans un échantillon
statistique à une distribution théorique, celle du Khi2 ;
· Le test d'indépendance du Khi2 qui permet
de contrôler l'indépendance de deux caractères dans une
population donnée ;
· le test d'homogénéité du Khi2
qui teste si des échantillons sont issus d'une même
population.
Le test qui nous intéresse ici est uniquement le test
d'indépendance du Khi2. Ce test sert à apprécier
l'existence ou non d'une relation entre deux caractères au sein d'une
population, lorsque ces caractères sont qualitatifs où lorsqu'un
caractère est quantitatif et l'autre qualitatif, ou bien encore, lorsque
les deux caractères sont quantitatifs mais que les valeurs ont
été regroupées.
Le test de Khi2 permet également de
hiérarchiser les phénomènes selon leur importance et
d'indiquer leur poids dans l'explication de l'association. Le test est mis en
oeuvre pour savoir si une relation découverte au sein de
l'échantillon étudié est valable à l'échelle
de la population totale dont est tiré cet échantillon
Le test de Khi2, est un test de généralisation
statistique permettant d'évaluer s'il existe une relation
statistiquement significative entre deux variables ou si, à l'inverse,
celles-ci sont
60
indépendantes. Le test d'indépendance du Khi2
sert à apprécier l'existence ou non d'une relation entre deux
caractères au sein d'une population, lorsque ces caractères sont
qualitatifs où lorsqu'un caractère est quantitatif et l'autre
qualitatif.
Le test de Khi2 permet également de
hiérarchiser les phénomènes selon leur importance et
d'indiquer leur poids dans l'explication de l'association. Le test est mis en
oeuvre pour savoir si une relation découverte au sein de
l'échantillon étudié est valable à l'échelle
de la population totale dont est tiré cet échantillon.
- Le test de régression
La régression logistique est l'un des modèles
d'analyse multivariée les plus couramment utilisés en
épidémiologie. Elle permet de mesurer l'association entre la
survenue d'un évènement (variable expliquée qualitative)
et les facteurs susceptibles de l'influencer (variables explicatives). Le choix
des variables explicatives intégrées au modèle de
régression logistique est basé sur une connaissance
préalable de la physiopathologie de la maladie et sur l'association
statistique entre la variable et l'évènement. Les principales
étapes de sa réalisation, les conditions d'application à
vérifier, ainsi que les outils essentiels à son
interprétation sont exposés de manière concise. Nous
discutons aussi de l'importance du choix des variables à inclure et
à conserver dans le modèle de régression afin de ne pas
omettre des facteurs de confusion importants. Enfin, un exemple tiré de
la littérature permet d'illustrer le propos et de vérifier les
acquis du lecteur.
- Tests de comparaison de moyenne appelés analyse
de variance
Si le test de l'analyse de variance est significatif, cela
indique qu'au moins deux moyennes sont différentes. Pour connaître
quelles moyennes diffèrent entre elles, il faut réaliser ensuite
un test de comparaisons multiples de moyennes. Un tel test permet de constituer
des groupes de moyennes non significativement différentes entre elles.
C'est ainsi que l'on peut analyser complètement l'influence du facteur
étudié et que l'étude permet de prendre des
décisions : choix, préconisation de certaines des
modalités étudiées, par exemple. La statistique de test
est la différence entre deux moyennes observées. Elle est
comparée à une différence critique (valeur critique),
encore appelée Plus Petite Amplitude Significative (PPAS).
61
- Stratégie de recherche et traitement des
données
Pour collecter les informations afin de vérifier
empiriquement le modèle théorique, un questionnaire a
été administré aux ménages de la ville d'Aboisso.
En ce qui concerne l'interprétation des résultats, elle permet
d'identifier les facteurs influençant la dégradation de
l'environnement dans l'ensemble du système et de montrer les risques
sanitaires qui en découlent, mais aussi et surtout, le traitement vise
à mettre en relation des variables afin de prouver le lien
significatif.
|