La construction d'une variable composite (score) est
utilisée pour les facteurs OCM. Elle passe par plusieurs étapes.
Il faudrait au préalable disposer d'une bulle. Cette dernière est
constituée d'un ensemble d'items59 permettant de mieux cerner
un concept donné. Ces items sont
59 C'est une déclaration qui permet de cerner la
perception d'un individu quant à un phénomène
donné
des déclarations posées à
l'enquêté et dont les modalités de réponse sont
présentées en échelle. Celle-ci varie de 1 à 4
suivant l'opinion totalement en désaccord, un peu en désaccord,
un peu d'accord, totalement d'accord. Les items dont la négation semble
être corrélée positivement avec l'utilisation de la
contraception moderne sont codifiés de façon inverse
c'est-à-dire de 4 à 1. Ensuite, une analyse
factorielle60 est utilisée pour la détermination des
facteurs.
· Identification des facteurs
Les facteurs issus de l'analyse factorielle subissent ensuite
un test de fiabilité (test de Cronbach61). Ce test peut
être amélioré en supprimant quelques items fortement
corrélés avec les autres. Enfin, le score moyen est
calculé sur la base des items restants62. Il convient de
préciser que seuls les items dont le pourcentage de données
manquantes est inférieur à 15 % 63sont pris en compte
dans l'analyse.
Supposons par exemple qu'on ait la bulle «
disponibilité »64, composée de n items. La
démarche à suivre pour aboutir à l'identification des
facteurs et à la construction de leur score est la suivante :
Il faut tout d'abord vérifier que les
déclarations (items) Q1 à Qn sont chacune
ordonnées dans un sens positif, dans le cas contraire les questions
allant dans le sens négatif par rapport à la disponibilité
(exemple : les contraceptifs modernes sont difficiles à trouver dans les
environs d'ici), doivent subir une recodification à
l'envers65 ; puisqu'un score élevé doit traduire un
aspect positif, par exemple une bonne disponibilité du produit et un
score faible, son contraire.
Ensuite, pour déterminer les facteurs, on utilise
l'analyse factorielle, afin de déterminer les différentes
dimensions d'une bulle. Ces dimensions (facteurs) doivent être
constituées des items qui expriment une idée commune. Mais avant
d'engager l'analyse factorielle, il faut s'assurer que les données sont
factorisables ; pour ce, nous effectuons le test de Kaiser-MeyerOklin (KMO) et
le test de sphéricité de Bartlett. Pour que les données
soient factorisables, il faut qu'elles soient corrélées entre
elles. Ainsi, l'indice de KMO doit avoir une valeur supérieure à
0.6066. Quant au test de sphéricité de Bartlett, il
doit fournir une probabilité significative au seuil de 5 %.
L'hypothèse testée par Bartlett est :
60 Voir encadré C4 (ANNEXE C)
61 Voir encadréC5 (ANNEXE C)
62 PSI (2008)
63 Taux recommandé par la méthodologie de recherche
de PSI et utilisée par l'ACMS
64 Voir encadré (ANNEXE C)
65A la modalité « totalement d'accord », on
affecte le code 1, « un peu d'accord » reçoit le code 2 ainsi
de suite
66 D'après LE MOAL (2002)
H0 : la matrice de corrélation n'a que des 1 en
diagonale et 0 ailleurs (les variables ne sont pas corrélées). On
rejette H0 si la p-value du test est inférieure au seuil de
significativité.
Le Test de Kaiser-Meyer-Olkin (KMO), permet l'étude
des corrélations (partielles) entre 2 variables. L'indice de KMO est
égal au ratio de la somme des corrélations multiples sur la somme
des corrélations multiples et partielles. L'indice de KMO doit
être le plus grand possible, il est acceptable si l'indice est
supérieur à 0,6 et inacceptable s'il est inférieur
à 0,5.
Au cas où l'un de ces tests n'est pas validé,
on peut recourir à l'analyse de la matrice des corrélations entre
variables, afin de voir s'il existe tout de même des variables
corrélées entre elles.
Nous utilisons la règle de Kaiser pour le choix du
nombre d'axes. Cette règle consiste à choisir les facteurs dont
la valeur propre est supérieure à 1. En effet, les valeurs
étant standardisées, la variance de chaque variable est
égale à 1. Cette règle peut être
complétée par le test du coude qui recommande de retenir les
facteurs dont la valeur propre se situe avant la cassure du coude.
Après cela, la démarche que nous suivons
consiste à éliminer de l'analyse factorielle les items
jugés inacceptables, et à procéder de manière
itérative jusqu'à l'obtention d'une structure factorielle stable.
Les données manquantes ne sont pas prises en compte dans la
détermination des facteurs.
A l'issue de ces analyses, les facteurs qui en
résultent vont subir un test de fiabilité (test de
Cronbach)67, afin de juger de la qualité du facteur.
D'après la méthodologie de PSI, un facteur est jugé fiable
si la statistique de Cronbach est supérieure ou égale à
0,7 et faiblement fiable, s'il est compris entre 0,65 et 0,70. On peut
améliorer la valeur de la statistique de Cronbach en enlevant des items
du facteur, mais il faudra que ceux-ci soient fortement corrélés
aux autres items. A l'issue de ces analyses, nous ne retiendrons que les scores
fiables ou faiblement fiables. Pour une bulle qui n'a aucun score fiable, nous
choisirons un item dans cette bulle pour la représenter.
· Construction du score
Après avoir identifié les facteurs fiables, pour
chaque facteur68, nous construisons une variable dont la valeur est
le score du facteur ainsi qu'il suit :
67 Voir encadré C5 sur le test de Cronbach, annexe C
68 Il faut préciser que chaque facteur doit être
constitué d'au moins 3 items
Supposons qu'un seul facteur ait été extrait de
la bulle « disponibilité », et qu'il soit composé de m
items. Etant donné que les réponses possibles à chaque
question sont codées de 1 à 4, la moyenne pour chaque question
(Qj, j=1...m) varie également de 1 à 4. Ainsi, pour
évaluer toute la bulle « disponibilité », on passe par
une variable intermédiaire notée par exemple «dispo» et
définie comme suit : dispo = (Q1+Q2+Q3+...+Qm)/m. Comme les
quantités Q1 à Qm varient de 1 à 4, le score de
la bulle « disponibilité» se situe entre 1 et 4 autour d'une
valeur moyenne égale (1+4)/2=2,5. Par ailleurs, les questions Q1
à Qm sont ordonnées dans un sens positif, les valeurs
inférieures à cette moyenne témoignent
généralement d'une disponibilité insuffisante du produit,
tandis que les valeurs supérieures rendent compte d'une
disponibilité plutôt satisfaisante du produit.
Cette variable « dispo » qui représente le
score du facteur identifié sera utilisée dans le modèle de
régression logistique comme variable indépendante quantitative,
afin de voir si ce facteur est déterminant pour l'utilisation de la
contraception moderne. Cette procédure sera répétée
sur toutes les bulles afin d'identifier les facteurs et leurs scores.
Par ailleurs, si dans une bulle on a extrait plus d'un
facteur fiable, alors la procédure permettant la construction du score
est appliquée sur chaque facteur fiable distinctement.