III.5.
Evaluation de la qualité des données
L'évaluation consiste à porter un regard
critique sur la qualité des données en vue de déceler des
erreurs éventuelles. Deux grands types d'erreurs sont souvent
mentionnés, à savoir les erreurs d'échantillonnage (dues
à l'inférence statistique) et les erreurs d'observation (dues aux
mauvaises déclarations et enregistrements, voire à la saisie des
données).
De leurs effets, va dépendre non seulement la
qualité des données et les résultats de l'enquête
(EDSC1), mais également les méthodes d'analyses ainsi que les
résultats auxquels ces analyses aboutiront. Dans cette section nous nous
proposons d'examiner la deuxième catégorie d'erreurs, notamment
les erreurs d'observation.
III.5.1. Détermination de la proportion de non
réponse des variables
Au regard des résultats, on constate que, seule la
variable type d'union n'est pas pertinente parmi les variables retenues dans
l'étude. Ce qui implique que l'interprétation des
résultats sur cette variable devra être relativisée.
Tableau3.1 :
Présentation des variables et proportion de non
réponse
Variables
|
Réponses valides
|
Valeurs manquantes
|
Proportion de non réponse (%)
|
Statut dans le ménage
|
-
|
-
|
-
|
Niveau d'instruction
|
16798
|
0
|
0
|
Occupation
|
16673
|
125
|
0,75
|
Ethnie
|
16778
|
20
|
0,12
|
Religion
|
16779
|
19
|
0,11
|
Age à l'accouchement
|
-
|
-
|
-
|
Etat matrimonial
|
16798
|
0
|
0
|
Type d'union
|
12803
|
3995
|
23,78
|
Milieu de résidence
|
16798
|
0
|
0
|
Région de résidence
|
16798
|
0
|
0
|
III.5.2. Evaluation de l'âge des
Femmes
L'indice de Whipple permet de se prononcer sur la
préférence (attraction ou répulsion) des âges ronds
(qui se terminent par 0 et 5). Cet indice vaut 5 lorsque tous les âges
enregistrés se terminent par 0 ou 5; il vaut 1 lorsqu'il y a aucune
préférence pour ces chiffres ; il est inférieur
à 1 lorsqu'il y a au contraire répulsion ou attraction pour ces
deux chiffres et vaut 0 si aucun âge ne se termine par l'un de ces deux
chiffres. Pour ce cas d'espèce l'indice de Whipple est égal
à 1,66; il est supérieur à 1. On peut conclure qu'il y a
des préférences pour les âges ronds comme l'indique
d'ailleurs le graphique ci-dessous.
Graphique3.1 :
Attraction des âges des femmes enquêtées
Ce graphique montre également une diminution des
effectifs des femmes en dents de scie qui dénote un mauvais classement
des femmes par rapport à leurs âges dans l'ensemble. Dans le
souci d'examiner les disparités des préférences pour les
âges ronds et le mauvais classement nous avons repris le graphique
précédent selon le milieu de résidence. On peut constater
qu'en dépit d'une petite différence au niveau des adolescentes,
la baisse des effectifs suit presque une même tendance et un même
rythme comparable à celui de l'ensemble. En milieu urbain comme en
milieu rural, il y a attraction pour les âges ronds. Cependant on
remarque des saillies et des creux au niveau des âges qui se terminent
par des chiffres autres que 0 et 5 qui dénotent une attraction ou une
répulsion qui serait nécessaire de vérifier avec les
indices de Myers et Bâchi.
Graphique3.2 : Attraction des âges et
Evolution des effectifs de femmes par milieu de résidence
Pour déterminer les indices de Myers et de Bâchi
nous avons eu recours à la procédure SINGAGE du logiciel PASEX.
En effet, à la différence de l'indice de Whipple qui est le plus
simple à calculer manuellement, ces indices sont plus complexes.
L'indice de Myers exprime les préférences ou les
aversions pour les âges se terminant par les chiffres compris entre 0 et
9. Si les déclarations d'âges sont exactes, l'indice est à
peu près nul. Sa valeur est d'autant plus élevée que les
aversions pour les âges se terminant par certains chiffres sont plus
grandes et sa valeur maximale est atteinte lorsqu'il y a
préférence pour tous les âges se terminant par un seul et
un même chiffre, il vaut dans ce cas 180.
Pour les données de l'EDSC1, l'indice de Myers que nous
avons trouvé vaut 11,2 pour les hommes et 9,9 pour les femmes. Cela
voudrait dire qu'il y a une préférence que pour certains de ces
chiffres et que ces préférences ne sont pas très
importantes.
L'examen du graphique3.3 obtenu à cet effet, montre une
légère répulsion pour les âges qui se terminent par
les chiffres 1 et 4 puis une légère attraction pour ceux qui se
terminent par les chiffres 0 ; 2 et 5. Les âges qui se terminent par
8 sont attractifs pour les hommes et répulsifs pour les femmes. Toute
fois les aversions pour ces chiffres sont plus prononcées chez les
hommes que chez les femmes, ce qui sous entend que les femmes ont plus ou moins
bien déclaré les âges par rapport aux hommes.
Graphique3.3 : Préférences des
âges d'après l'indice de Myers
-3
-2
-1
0
1
2
3
0
1
2
3
4
5
6
7
8
9
Hommes
Femmes
L'indice de Bâchi peut être
considéré comme une version améliorée de l'indice
de Myers. Elle permet d'observer l'attraction et la répulsion de l'un
des chiffres de 0 à 9. Le principe d'interprétation de cet indice
est le même que celui de Myers, à la différence qu'il varie
entre 0 et 90, il est généralement à peu près
égale à la moitié de l'indice de Myers pour les
mêmes données. Il est égal à 6,3 pour les hommes et
5,3 pour les femmes, ce qui suppose une préférence pour quelques
chiffres.
A travers le graphique3.4, on peut se rendre compte qu'il
s'agit d'une attraction des âges qui se terminent par les chiffres
0 ; 2 et 5 puis d'une répulsion des âges qui se
terminent par les chiffres 1 ; 4 ; 6 et légèrement
par ceux qui se terminent par 9. L'indice de bâchi confirme la tendance
observée au niveau de l'indice de Myers puisque le chiffre 8 demeure
répulsif pour les femmes et attractif pour les hommes. Il introduit une
petite différence au niveau de l'ampleur des préférences
pour tous ces chiffres.
Graphique3.4 : Préférences des
âges d'après l'indice de Bâchi
-3
-2
-1
0
1
2
3
4
0
1
2
3
4
5
6
7
8
9
Hommes
Femmes
Etant donné que l'absence de préférence
pour certains âges n'exclut pas la mauvaise déclaration
d'âges, nous avons utilisé la procédure AGESEX pour
évaluer la structure de la population avec l'indice combiné des
Nations Unies (ICNU). Cet indice permet d'apprécier la qualité
des données, notamment la structure par groupes d'âges et par sexe
de la population.
En effet, une valeur de l'ICNU inférieur à 20
indique que les données sont de bonne qualité, lorsqu'elle est
comprise entre 20 et 40, les données sont de mauvaise qualité et
elles sont de très mauvaise qualité lorsque l'ICNU est
supérieur à 40.
Les calculs que nous venons de faire aboutissent à un
indice brut de 57,94. Corrigé du fait que l'effectif de la population
est inférieur à un million, cet indice vaut finalement 35,31.
Cela dénote un mauvais classement des effectifs par groupes d'âge
puisque l'ICNU est compris entre 20 et 40 (20<ICNU<40). Cela peut encore
se remarquer à travers la courbe d'évolution des effectifs de
femmes ajustée. Car, on voie bien que l'allure de cette courbe n'est pas
tout à fait régulière. Ce qui veut dire que les
indicateurs de mortalité qui seront estimés sur la base de
l'âge des mères pourront comportés un biais, notamment une
surestimation ou une sous estimation (selon les cas) de la mortalité
puisque la mauvaise déclaration de l'âge des mères implique
un mauvais classement des événements (naissances et
décès) selon l'âge.
Graphique3.5 : Evolution de la structure par
âge de la population féminine
|