B-/ ÉVALUATION DE LA
QUALITÉ DES DONNEES
Les données d'enquêtes ou de recensements sont en
général entachées d'erreurs (échantillonnage,
observation...). Cependant les déformations dues aux erreurs
d'observation sont les plus fréquemment rencontrées dans les
données africaines. Cela peut bien s'agir d'omissions (de jeunes
enfants, de vieillards, de personnes vivant isolément...) ; de
doubles comptes (d'hommes polygames, de personnes en
déplacement...) ; de déclaration erronée d'âge.
La déclaration erronée d'âge présente une plus
grande fréquence que les deux autres types d'erreurs d'observation
(Gendreau et Nadot, 1967). L'attraction ou la répulsion de certains
âges entraîne des pyramides très perturbées
lorsqu'elles sont tracées par année, mais n'entachent que
l'allure générale de la pyramide. Par contre, le rajeunissement
ou le vieillissement systématique de personnes de certains groupes
d'âges entraînent des déformations importantes de cette
répartition.
Les indices les plus couramment utilisés pour
déterminer le degré d'exactitude des statistiques
démographiques par âge sont au nombre de quatre :
Ø L'indice de WHIPPLE
Ø L'indice de MYERS
Ø L'indice de BACHI
Ø L'indice combiné des NATIONS UNIES.
Compte tenu du fait que l'indice de Bachi présente plus
d'amélioration que les deux premiers et permet par ailleurs d'avoir les
préférences des âges, ce que ne fait pas l'indice des
Nations Unies, il a donc été le seul indice à être
retenu pour évaluer la qualité de nos données. Notre
évaluation portera sur l'âge et l'état matrimonial des
femmes à l'enquête.
a-/
Evaluation de la qualité des données relatives à
l'âge
Comme nous l'avons signifié plus haut,
l'évaluation va se faire au moyen de l'indice de Bachi.
v L'indice de Bachi
L'un des inconvénients des indices de Whipple et de
Myers est qu'il n'est pas possible de définir de façon
précise les conditions théoriques dans lesquelles ils prennent
respectivement les valeurs 1 et 0. Bachi a élaboré un indice qui
ne présente pas cet inconvénient. Partant des effectifs
d'âge compris entre 23 et 72 ans, Bachi a constaté que pour des
populations où l'âge était bien déclaré, le
rapport "ru" des effectifs dont l'âge se terminait par chacun des
chiffres u de 0 à 9 à l'effectif total des 23-72 ans varie
à peu près linéairement en fonction du chiffre des
unités de 3 à 9 puis de 0 à 2. Il a montré par
ailleurs que la pente de cette droite ne varie pas si l'on modifie
légèrement les limites d'âge. Si l'on appelle "a" cette
pente, Bachi a calculé la valeur des différents rapports "ru"
théoriques, c'est-à-dire celle que l'on observerait dans une
situation de déclaration parfaite des âges ; ces valeurs
permettent de déduire des rapports tels qu'une déclaration
correcte des âges se terminant par un chiffre donné produirait un
indice de 10. Si les âges sont bien déclarés, tous ces
rapports sont égaux à 10% ; s'il y a
préférence (ou répulsion) pour certains âges, les
rapports correspondants sont supérieurs (ou inférieurs) à
10%. La somme des écarts positifs de ces rapports avec 10 donne
l'indice de Bachi.
Cet indice permet d'observer l'attraction et la
répulsion de l'un des chiffres de 0 à 9. Il varie entre 0 et 90
et est à peu près égal à la moitié de
l'indice de Myers pour les mêmes données.
Une application numérique de l'indice de Bachi aux
données de l'EDSC1 conduit à un résultat de cet indice
égal à 5,3 pour l'ensemble des deux sexes ; 6,2 pour les
hommes et 4,5 pour les femmes. Ces résultats témoignent d'une
préférence pour des âges se terminant par les chiffres
compris entre 0 et 9 comme le montre d'ailleurs le graphique ci-dessous. Mais
ces irrégularités de déclaration d'âge ne sont pas
d'ampleur à remettre en cause la qualité de nos données.
Graphique III.1 : Partage de la répulsion
ou de l'attraction des âges -EDSC1 (Bachi)
Source : Traitement des données
EDSC1
|