3.3 Evaluation de la qualité des
données
Ici, nous allons procéder à un test de la
qualité des données disponibles. Pour cela, il existe plusieurs
procédures parmi lesquelles, l'examen des taux de réponse qui
permet d'apprécier la proportion des réponses disponibles.
3.3.1 Evaluation des taux de non-réponse
Le taux de réponse est la proportion des
réponses valides. Pour une variable donnée, c'est le rapport du
nombre de valeurs (des données) valides sur le nombre total de valeurs
déclarées
On remarque d'une manière générale dans
le tableau 3.1, un taux presque nul de
non-réponse. Cette faiblesse de taux de non-réponse montre que
les variables ont été assez bien déclarées.
27 Remarquons certaines variables
indépendantes (le sexe du chef de ménage, la taille du
ménage, le statut familial de l'enfant, l'âge de l'enfant) ne
figurent pas dans ce schéma du fait qu'elles n'ont pas été
l'objet d'hypothèses spécifiques. Ces variables sont
utilisées comme des variables de contrôle au niveau explicatif de
l'étude.
Tableau 3.1 : Taux de réponse des
variables
Variables
|
Valeurs valides
|
Valeurs
|
Effectifs
|
%
|
Effectifs
|
%
|
Age de l'enfant
|
28870
|
100
|
0
|
0
|
Age du chef de ménage
|
28870
|
100
|
0
|
0
|
Ethnie/Nationalité du CM
|
28753
|
99,6
|
118
|
0,4
|
Fréquentation scolaire (97/98)
|
28034
|
97,1
|
836
|
2,9
|
Lien de parenté avec le CM
|
28870
|
100
|
0
|
0
|
Niveau d'instruction du CM
|
28494
|
98,7
|
376
|
1,3
|
Niveau de vie du ménage
|
28489
|
98,7
|
381
|
1,3
|
Religion du CM
|
28870
|
100
|
0
|
0
|
Sexe de l'enfant
|
28870
|
100
|
0
|
0
|
Sexe du CM
|
28870
|
100
|
0
|
0
|
Taille du ménage
|
28870
|
100
|
0
|
0
|
3.3.2 Evaluation de la qualité des données
sur l'âge
L'âge et le sexe sont deux grands éléments
de la structure démographique. Ils sont indispensables dans toute
analyse de l'état et de l'évolution des phénomènes
démographiques. Autant l'âge est indispensable, autant sa mauvaise
qualité peut biaiser les analyses démographiques. Aussi, est-il
nécessaire de s'assurer de la qualité des déclarations sur
l'âge avant toute utilisation de celui-ci.
a- La méthode graphique
L'évaluation de la qualité des
déclarations de l'âge par la méthode graphique consiste en
l'observation de l'allure de la courbe représentative de l'effectif des
individus en fonction de l'âge. Il n'est pas moins pertinent d'avoir une
courbe pour chaque sexe. Pour ce faire nous aurons aussi recours à la
pyramide des âges qui illustre à la fois la structure par
âge et par sexe de la population.
Graphique 3.1 : Courbe représentative de la
population par âge
Courbe représentative de la population par
âge
|
2500
|
|
2000
|
|
1500
|
|
1000
|
|
500
|
|
|
|
|
0
|
|
Masculin
|
Age
|
|
|
Féminin
|
La courbe ci-dessus révèle quelques
irrégularités dans la déclaration de l'âge de la
population. Les irrégularités sont plus poussées chez le
sexe féminin. Mais le regroupement des âges en groupe quinquennaux
montre une certaine régularité de la structure par âge de
la population comme le montre la pyramide des âges ci-dessous.
Graphique 3.2 : Pyramide des âges de la
population
La pyramide des âges de la population a une allure assez
régulière et dénote une bonne répartition de la
population par sexe et suivants les groupes d'âges quinquennaux. De ce
fait, nous déduisons une bonne déclaration des données sur
l'âge.
b- Les méthodes statistiques : l'indice de
Whipple et de Myers
Si la méthode graphique permet une compréhension
visuelle des fluctuations des valeurs, elle n'est pas toujours suffisante pour
une étude approfondie des irrégularités. Pour
aller plus loin dans l'évaluation des données
sur l'âge, nous aurons recours aux indices statistiques. Ces indices sont
nombreux, mais nous utiliserons ici ceux de Myers et Whipple qui nous
permettent en effet de savoir s'il y a ou non des « attractions »
à certains âges.
L'analyse des indices de Whipple et de Myers permet de savoir
s'il y a attraction ou répulsion à certains âges. On
appelle « attraction » à un âge x, la tendance
que les individus d'âges voisins de x ont à
déclarer avoir l'âge x. D'une manière
générale, les individus ont tendance à se donner des
âges terminés par 5 ou 0. L'indice de Whipple permet de mettre en
lumière cet état de fait. L'indice de Myers se veut une
généralisation de celui de Whipple à tous les
âges.
Tableau 3.2 : Indices de Whipple et de
Myers
|
Sexe
|
Indices
|
Masculin
|
Féminin
|
Ensemble
|
Whipple
|
1,32
|
1,53
|
1,43
|
Myers
|
12,0
|
17,9
|
15,2
|
Chiffre
|
Valeurs de l'indice de Myers suivant le chiffre terminal
|
0
|
3,1
|
5,5
|
4,4
|
1
|
-2,0
|
-2,2
|
-2,1
|
2
|
0,4
|
0,1
|
0,2
|
3
|
-0,2
|
-1,1
|
-0,7
|
4
|
-1,6
|
-2,4
|
-2,0
|
5
|
2,0
|
3,0
|
2,5
|
6
|
-0,4
|
-0,9
|
-0,7
|
7
|
-0,7
|
-0,6
|
-0,6
|
8
|
0,5
|
0,3
|
0,4
|
9
|
-1,3
|
-1,8
|
-1,5
|
L'indice de Whipple, calculé pour l'ensemble de la
population, est compris entre 1 et 5, cela signifie qu'il y a une faible
attraction car la valeur 1,43 est plus proche de 1 que de 5. Cette attraction
est un peu plus poussée chez le sexe féminin. Ici encore, comme
on l'a vu plus haut avec le graphique 3.1, les
individus de sexe masculin ont mieux déclaré leur âge que
ceux de sexe opposé.
c- Qualité des données sur l'âge de
la population cible
La qualité des données au niveau de la population
cible s'apprécie à travers l'observation des taux de
fréquentation scolaire selon l'âge déclaré.
Graphe 3.3 : Evolution des taux de scolarisation par
sexe selon l'âge
|
|
Taux de scolarisation par âge
|
|
|
|
40
|
|
|
|
|
|
|
35
|
|
|
|
|
|
|
30
|
|
|
|
|
|
|
25
|
|
|
|
|
|
|
|
Masculin
|
|
|
|
|
|
|
|
20
|
|
|
|
|
|
|
Féminin
|
|
|
|
|
|
|
|
Total
|
15
|
|
|
|
|
|
|
|
10
|
|
|
|
|
|
|
5
|
|
|
|
|
|
|
0
|
|
|
|
|
|
|
|
6 7
|
8
|
9 10 11
|
12
|
13
|
14
|
|
|
|
Age
|
|
|
|
L'observation de la courbe des taux de fréquentation
scolaire permet de voir s'il y a une concordance ou non entre les taux de
scolarisation aux différents âges. Si la courbe est croissante
jusqu'à dix ans, puis décroissante, cela dénote une bonne
déclaration de l'âge et de la fréquentation scolaire au
sein de la population cible. En effet, cette courbe doit être croissante
du fait des entrées (souvent tardives) jusqu'à « l'âge
de sortie de l'école » avant de connaître une
décroissance due aux « sorties ».
Dans l'exemple présent, on remarque un creux entre 9 et
11 ans (à l'âge de 10 ans). Cela pourrait être du à
un transfert d'âge entre 9 et 11 ans chez les garçons. Mais la
dénivellation est encore plus perceptible chez les filles. Cela pourrait
être dû aux attractions de 10 ans qui tendent à grossir
l'effectif de cet âge. Cela réduit par conséquent le taux
de fréquentation scolaire à cet âge28.
Tableau 3.3 : Taux de scolarisation des enfants de 6
à 14 par âge et par sexe
|
Sexe de l'enfant
|
Ensemble
|
IP (F/G)
|
Age
|
Masculin
|
Féminin
|
%
|
%
|
6
|
7,0
|
6,2
|
6,6
|
88,6
|
7
|
24,9
|
17,3
|
21,1
|
69,5
|
8
|
35,9
|
27,9
|
32,0
|
77,7
|
9
|
37,0
|
27,6
|
32,4
|
74,6
|
10
|
35,9
|
24,7
|
30,7
|
68,8
|
11
|
37,1
|
30,7
|
34,1
|
82,7
|
12
|
34,3
|
25,5
|
30,3
|
74,3
|
13
|
33,2
|
21,4
|
27,5
|
64,5
|
14
|
30,9
|
23,9
|
27,5
|
77,3
|
Total
|
30,4
|
22,3
|
26,5
|
73,4
|
28 Les âges des enfants qui
fréquentent seraient mieux connus que les autres. Dans l'incertitude,
les âges voisins de 10 ans des enfants s qui ne fréquentent pas
sont (par le phénomène d'attraction) le plus souvent
ramenés à 10 ans. Cela tend à augmenter la proportion des
enfants de « 10 ans » qui ne fréquentent pas et par
conséquent à réduire le taux de scolarisation à cet
âge.
|
|