3.5. Techniques et outils de collecte des
données
Nous avons extrait de la base de données du logiciel
médicotechnique INLOG à l'aide d'une requête informatique
Structure Querry Language (SQL) les données portant sur les variables
ci-dessus mentionnées (tableau I). Les données ont
été extraites sur un fichier Excel version 2013.
3.6. Facteurs de confusion potentiels
Les facteurs de confusion potentiels de notre étude
étaient les facteurs sociodémographiques (âge au don de
sang, site du don de sang, nombre de dons de sang, niveau d'instruction, lieu
de résidence, niveau socioéconomique du donneur de sang).
Mais les variables sur le site du don de sang, le niveau
d'instruction et le niveau socioéconomique des donneurs de sang n'ont pu
être collectées du fait du caractère rétrospectif de
notre étude. Le contrôle de ces facteurs de confusion s'est fait
par le choix aléatoire des donneurs de sang et par l'analyse
multivariée.
3.7. Traitement et analyse des données
3.7.1. Mesures prises pour éviter ou corriger les
biais
Afin d'améliorer le niveau de validité (interne
et externe) de nos résultats, plusieurs procédures ont
été mises en oeuvre pour limiter les biais.
Le biais de sélection ou d'attrition a
été minimisé par une définition claire de nos
critères d'inclusion et seuls les donneurs de sang répondant
à ces différents critères (et ne répondant pas aux
critères d'exclusion ou de non inclusion) ont été inclus
dans cette étude. Aussi, afin de tenir compte des données
manquantes, des perdus de vue ou d'un abandon prématuré du don de
sang pour quelque raison que ce soit, une analyse en intention de traiter a
été appliquée.
23
SAWADOGO Abdoul-G, Master Santé Publique-Option
Epidémiologie, Biostatistique et Recherche en santé -
Année académique 2018-2019
SAWADOGO Abdoul-G, Master Santé Publique-Option
Epidémiologie, Biostatistique et Recherche en santé -
Année académique 2018-2019
24
Quant au biais de confusion, un ajustement
à ce facteur de confusion a été utilisé au cours de
l'analyse des données afin d'en tenir compte.
3.7.2. Analyse des données
Les données collectées ont été
extraites de la base de données du LMT INLOG de gestion des donneurs de
sang et saisies dans le logiciel Excel version 2013. La validation a
été réalisée après vérification par
deux personnes différentes des incohérences des valeurs prises
par les différentes variables afin de dépister les erreurs
d'extraction et de disposer de données de qualité pour leur
interprétation.
Nous nous sommes assuré que les donneurs de sang inclus
dans l'échantillon répondaient effectivement aux critères
d'inclusion. Puis, nous avons affiché les valeurs de chacune des
variables en vue de repérer les valeurs manquantes et aberrantes et
procéder par la suite à leur suppression. L'analyse des
données a été faite avec le logiciel Stata SE 15.
Nous avons procédé à un nettoyage des
données aberrantes, à une labélisation de nos
différentes variables, puis à leur codage afin de faciliter
l'analyse et l'interprétation des résultats de l'analyse.
Les analyses univariées ont été faites en
utilisant le test de Chi-2 de Pearson pour les comparaisons de proportions des
différentes variables avec les intervalles de confiance afin de
déterminer les liens entre ces variables. Les variables quantitatives
ont été décrites par leurs effectifs, moyennes et
écart-types, valeur minimum et valeur maximum.
Des tests statistiques ont été utilisés
pour vérifier nos hypothèses de recherche et étudier
l'effet des variables explicatives sur notre variable d'intérêt
qui était la séroconversion liée au VHB.
L'estimateur de Kaplan-Meier a été
utilisé pour déterminer la durée médiane de
survenue des séroconversions du VHB chez les donneurs de sang inclus
dans notre étude et pour estimer les courbes de survie et ainsi
définir les probabilités de séroconversion du VHB
après le premier don de sang. La vérification de
l'égalité des durées médianes entre les
différents groupes de donneurs de sang étudiés s'est faite
par le Test de Log-Rank.
En analyse multivariée, la méthode de
sélection backward ou « pas-à-pas » descendante a
été utilisée pour la réduction du modèle. Le
seuil de sélection des variables était fixé à p =
0,30. Cette méthode a consisté à retirer progressivement
du modèle complet les variables ayant un degré de
significativité (p-value) le plus élevé, jusqu'à
obtention du modèle final, où les variables avaient toutes une
p-value significative (< 0,05).
Le seuil de signification a été fixé
à 0,05 pour toutes les analyses statistiques. L'adéquation
globale du modèle multivarié a été
vérifiée par le calcul des résidus de Cox-Snell à
travers une représentation graphique de la fonction de risque cumulatif
de Nelson-Aalen et les résidus de Cox-Snell.
SAWADOGO Abdoul-G, Master Santé Publique-Option
Epidémiologie, Biostatistique et Recherche en santé -
Année académique 2018-2019
25
Le modèle de Cox a été utilisé
pour déterminer les relations entre la fonction de risque
associée à la survenue d'une séroconversion liée au
VHB et les variables explicatives (âge, sexe et lieu de résidence
des donneurs de sang, nombre de dons de sang). Ce modèle nous a permis
d'une part de déterminer la prédiction de la probabilité
de survenue d'une séroconversion du VHB au cours de la période de
suivi, d'autre part, de déterminer le délai de survenue d'une
séroconversion chez les donneurs de sang en tenant compte du fait que
les donneurs de sang entraient dans notre cohorte au fur et à mesure.
En analyse multivariée, la méthode de
sélection backward ou « pas-à-pas » descendante a
été utilisée pour la réduction du modèle. Le
seuil de sélection des variables était fixé à p =
0,30. Cette méthode a consisté à retirer progressivement
du modèle complet les variables ayant un degré de
significativité (p-value) le plus élevé, jusqu'à
obtention du modèle final, où les variables auront toutes une
p-value significative (< 0,05). Le seuil de signification a
été fixé à 0,05 pour toutes les analyses
statistiques. L'adéquation globale du modèle multivarié a
été vérifiée par le calcul des résidus de
Cox-Snell à travers une représentation graphique de la fonction
de risque cumulatif de Nelson-Aalen et les résidus de Cox-Snell.
Les différents résultats sont
présentés sous forme de tableaux de fréquence, de tableaux
croisés, de graphiques et de figures.
|