3.3.2 Evaluation de la qualité des
données
Avant toute analyse, il est important d'évaluer la
qualité des données. L'évaluation de la qualité des
données permet d'apprécier la cohérence interne des
données et même leur cohérence externe. En effet, pour la
fiabilité des résultats issus des analyses, les données
à utiliser doivent être de bonne qualité. Pour être
acceptables, les données à utiliser doivent avoir un taux de
non-réponse inférieur à 10 %.
Pour évaluer la qualité des données dans
le cadre de ce travail, nous examinerons dans un premier temps les taux de
réponse des différentes variables et dans un second temps nous
évaluerons la qualité des données sur l'âge.
3.3.2.1 Examen des taux de réponse des
principales variables
Tableau 3.2 Taux de réponse des
différentes variables
Source : traitement des données de l'EDS
Tchad, 2004
Ce tableau montre que dans l'ensemble, les données
concernant les variables de notre étude sont de qualité
acceptable.
3.3.2.2 Evaluation de la qualité des
données sur l'âge
Pour évaluer la qualité des données sur
l'âge, nous aurons recours à deux méthodes pour
évaluer la qualité des données sur l'âge : la
méthode graphique et la méthode statistique.
a) Méthode graphique
Cette méthode consiste à construire la pyramide
des âges à l'aide de la répartition par âge et par
sexe des individus des ménages enquêtés et à
observer si l'allure de la pyramide est régulière ou pas.
Mais avant de construire la pyramide des âges, il
convient d'examiner la courbe des effectifs par âge et par sexe. Cette
courbe, comme l'indique le graphique ci-dessous montre de fortes
irrégularités dans la déclaration de l'âge, surtout
au niveau des âges ronds, en témoignent les pics qui sont plus
élevés au niveau des âges terminés par 0 ou 5. Ce
graphique montre par ailleurs qu'entre 15 et 45 ans, les pics sont plus
élevés pour les individus de sexe féminin, ce qui pourrait
traduire une mauvaise déclaration des âges de ces
dernières.
Graphique 3.1 Courbe des effectifs par âge
et par sexe
Population par âge et par sexe
Effectif de la population
|
700 600 500
|
|
|
|
400
|
|
Male Female
|
300 200 100
0
|
|
|
Age
Source Traitement des données de l'EDS
Tchad, 2004
On observe sur le graphique ci-dessus une diminution des
effectifs en « dents de scie ». Les saillies et les creux
dénotent une mauvaise déclaration des âges. D'une
manière générale, la population enquêtée a
une préférence pour les âges se terminant par 0 et 5. Les
âges ronds et semi-ronds sont plus attractifs chez le sexe féminin
que le sexe masculin. Pour minimiser les biais que peuvent entraîner
l'imprécision de la déclaration des âges dans
l'interprétation des résultats, nous avons procédé
à un regroupement des effectifs par groupe d'âges quinquennaux. Ce
procédé a conduit à la construction d'une pyramide des
âges permettant d'analyser l'évolution des structures par
âge des deux sous-populations (masculine et féminine). La pyramide
des âges est un instrument privilégié de l'analyse de la
qualité des données car la répartition par âge et
par sexe d'une population obéit à de certaines règles
Djourdebbé et Bonkoungou (2005).
En procédant à un regroupement en groupes
d'âges quinquennaux des âges, on parvient à réduire
les effets néfastes de cette mauvaise déclaration de l'âge.
Cette opération a abouti à la construction de la pyramide des
âges ci-dessous.
Graphique3.2 Pyramide des âges de la
population des ménages enquêtés lors de l'EDST-II
Population par age et sexe
3 000
|
2 500
|
2 000
|
1 500
|
1 000
|
500
|
0
|
0
|
500
|
1 000
|
1 500
|
2 000
|
2 500
|
3 000
|
Hommes
70+
60-64
50-54
40-44
30-34
20-24
10-14
0-4
Femmes
Population
Source: Traitem ent des données de l'EDST-II, 2004
(Tchad).
Cette pyramide des âges a une allure
quasi-régulière, en forme triangulaire avec une base large et un
sommet rétrécit. Cette allure est propre aux pays africains
à forte fécondité et mortalité. De même, elle
traduit de la jeunesse de la population tchadienne. Au regard de son allure,
nous pouvons présumer que les données sur l'âge sont de
qualité acceptable pour notre étude.
b) Les méthodes statistiques
Ces méthodes font recours à certains indices pour
évaluer l'attraction ou la répulsion observée dans la
déclaration de certains âges. Il s'agit notamment des indices de
Whipple, de
Myers, de Bachi et de l'indice combiné des Nations unis.
Dans le cadre de notre étude nous utiliserons les indices de Whipple et
de Myers.
L'indice de Whipple (Iw) permet de mettre en
évidence les distorsions dans la déclaration de l'âge
provenant de l'attraction pour les chiffres 0 et 5 au sein du groupe
d'âge 23-62 ans.
Si Iw=0, il y a répulsion totale du 0 et du
5 ; si Iw<1, il y a répulsion pour le 0 et le 5 ; si
Iw=1, il n'y a aucune préférence ; si
1<Iw<5, il y a attraction et cette attraction est d'autant
plus forte que Iw est voisin de 5 ; si Iw=5, tous les
âges enregistrés se terminent par 0 et 5 Roger G. et
collaborateurs (1981) cités par Tollegbé (2004).
Quant à l'indice de Myers (Im), il mesure
l'attraction ou la répulsion pour les âges terminés par les
chiffres allant de 0 à 9.
L'indice de Myers varie entre 0 et 180. Si Im=0, il
n'y a aucune distorsion sur les âges tandis que si Im=180,
cela signifie que tous les individus ont un âge terminé par le
même chiffre.
Les résultats du calcul de ces deux indices
effectué à l'aide de la procédure SINGAGE du logiciel PAS,
sont consignés dans le tableau suivant.
Tableau 3.3 Tableau récapitulatif des
valeurs des indices de Whipple et de Myers selon le sexe et pour l'ensemble de
la population (EDS Tchad, 2004)
Hommes Femmes Ensemble
Indice de Whipple 1,93 1,97 1,95
Indice de Myers 33,5 32,3 33,0
0 8,5 8,6 8,6
1 -4,1 -4,5 -4,3
2 0,7 1,3 1,0
3 -3,4 -2,9 -3,2
4 -2,9 -1,4 -2,2
5 6,3 6,1 6,2
6 -1,5 -2,3 -1,8
7 -1,4 -1,7 -1,5
8 1,2 0,2 0,7
9 -3,5 -3,4 -3,4
Les calculs ont conduit comme l'indique le tableau ci-dessus,
à des indices de Whipple de 1,93, 1,97et 1,95 respectivement pour les
individus de sexe masculin, ceux de sexe féminin et pour l'ensemble.
Nous constatons que quelque soit le sexe, l'indice de Whipple est compris entre
1 et 5. Il y a donc attraction pour les chiffres 0 et 5 et cette attraction est
plus forte chez les individus de sexe masculin que chez ceux de sexe
féminin. Néanmoins, le fait que cet indice soit plus proche de 1
que de 5 permet de penser qu'en dépit des irrégularités
qui pourraient exister au niveau de la déclaration de l'âge, cette
dernière est acceptable.
Les indices de Myers obtenus par sexe et pour l'ensemble sont
respectivement de 33,5 et 32,3 pour les individus de sexe masculin et ceux de
sexe féminin et de 33,0 pour l'ensemble. Ces indices sont plus proches
de 0 que 180, ce qui conforte la conclusion tirée cidessus quant
à la nature acceptable des données sur l'âge. Cependant,
ces indices permettent d'affiner davantage l'analyse par rapport à
l'indice de Whipple. En effet, bien que l'attraction pour les âges
terminés par les chiffres 0 et 5 soit confirmée, l'indice de
Myers permet de constater que les individus de sexe masculin ont un attrait
plus marqué pour les âges terminés par le chiffre 0 alors
que ceux de sexe féminin sont plus attirés par les âges
terminés par le chiffre 5. Par ailleurs, l'indice de Myers fait
ressortir une répulsion pour les âges terminés par les
chiffres 1, 4 et 9.
Dans l'ensemble, bien que nous puissions déplorer la
nature très grossière des données sur l'âge, nous
pensons que ces dernières sont quand même acceptables et
n'entraveront pas significativement les résultats de nos analyses.
c) Sources d'erreurs
Les statistiques démographiques comme toutes les
statistiques issues des enquêtes ou toutes autres sources comportent des
erreurs qui sont dues entre autres à la méthodologie de collecte
de données utilisées et aux difficultés pour les
enquêtées de se souvenir des événements
passés. Le défaut de mémoire combiné au faible
niveau d'instruction des enquêtées conduit le plus souvent
à des déclarations erronées des événements.
Les EDS étant des enquêtes à caractère
rétrospectif, les données recueillies sur cette base ne peuvent
qu'être entachées d'erreurs. D'où la
nécessité d'évaluer la qualité de ces
données afin de les ajuster au cas où elles s'avèrent
défectueuses en vue de leur utilisation comme base d'estimation.
Les données qui seront utilisées pour cette
étude ne sont pas parfaites, elles présentent quelques
imperfections. La critique que nous pouvons formuler est la surestimation de
l'effectif des femmes qui n'ont pas été assistées
médicalement au dernier accouchement. Cette estimation aura pour
explication le manque criard de centres de santé maternelle et infantile
d'une part et d'autre part, l'insuffisance quantitative du personnel de
santé qualifié.
|