Comme souligné plus haut, nous étions
obsédé par l'idée d'avoir un échantillon
représentatif pour le crédit de notre enquête.
Nous référant aux données de
Statistique Canada (recensement de 2006) qui n'ont
3
http://www.quebecinterculturel.gouv.qc.ca/publications/fr/diversite-ethnoculturelle/com-haitienne-2006.pdf
7
pu constituer la base de notre enquête,
l'échantillonnage aléatoire simple s'est avéré
être la méthode de prélèvement de
l'échantillon de notre enquête et a eu comme avantage de permettre
un jugement objectif de la valeur des estimations.
L'échantillonnage au hasard simple est une
méthode pour laquelle tous les échantillons possibles (de
même taille) ont la même probabilité d'être choisis et
tous les éléments de la population ont une chance égale de
faire partie de l'échantillon.4
Cette méthode s'est imposée à nous
étant donné qu'aucune strate, ni grappe, n'avait
été définie dans la préparation de notre
enquête. Grâce au logiciel SPHINX, les variances et les marges
d'erreur dans l'échantillonnage, sont connues et feront l'objet d'une
analyse approfondie dans la troisième partie du présent
rapport.
Les erreurs dont sont potentiellement entachées une
enquête comme celle-ci, sont de deux ordres :
· les erreurs dues à l'échantillonnage;
· les erreurs non dues à
l'échantillonnage.
«Les erreurs dues à l'échantillonnage
sont causées par le fait qu'une seule partie de la population
visée est enquêtée à travers un échantillon
aléatoire. Ces erreurs sont contrôlables a priori dans le cadre de
la définition du plan de sondage et de l'établissement de la
taille de l'échantillon. De plus, elles sont quantifiables a posteriori
et permettent de prendre en considération la variabilité des
estimations produites lors de leur analyse. Parmi les erreurs non dues à
l'échantillonnage, se trouvent les différents types de biais
pouvant affecter les résultats: biais dus à la non
réponse, biais dus aux opérations ou au mode de collecte, biais
de réponse, couverture insuffisante ou excessive de la population par la
base de sondage, etc. les erreurs nos dues à l'échantillonnage ne
sont pas formellement quantifiables comme le sont celles de la première
catégorie.»5
Au vu des données collectées et des deux
concepts cités ci-haut, notre enquête à l'instar d'autres,
ne peut échapper à ces erreurs qui potentiellement entachent
toute enquête; Cela est d'autant plus vrai que le logiciel SPHINX a pu
calculer la marge d'erreur et le coefficient de concentration et nous a permis
de connaitre les erreurs
4
http://www.er.uqam.ca/nobel/r30574/PSY1300/C6P3.html
5 Lucie Noël, des métiers et des gens en TIC,
Isabelle Quentin éditeur, 2000, Quebec, p. 149
8
dues à échantillonnage par la variation des
réponses.
En effet, le coefficient de concentration est le calcul de la
différence moyenne pour chaque question fermée entre la
modalité la plus citée et la modalité la moins
citée; il est donc compris entre 0 et 100; le coefficient de variation
quant à lui est le rapport entre l'écart-type et la moyenne.
« Le coefficient de variation est une mesure qui
permet de quantifier la précision de l'estimation; il contribue à
faciliter l'interprétation quant à la précision d'une
estimation. Plus le coefficient de variation est élevé, moins
précise est l'estimation et vice versa. Notamment, il faut être
très prudent lors de l'utilisation des estimations dont le coefficient
de variation est très élevé (supérieur à
25%), ce qui indique une très grande variabilité de l'estimation.
Ces estimations ne devraient être utilisées qu'à titre
indicatif. Le coefficient de variation a également l'avantage de
permettre de comparer la précision de différentes estimations
entre elles»6
Nous savons également que les erreurs dues à
l'échantillonnage sont soit le fait du mauvais taux de réponse
qui entraine des biais de la base de sondage, des questions difficiles à
interpréter, des erreurs de saisie ou des réponses volontairement
fausses des répondants. Le taux de réponse ou de remplissage
global pour notre enquête est de 87,7% (min 50%); certaines erreurs de
saisie décelées, ont été corrigées au fur
à mesure de l'analyse et de l'évaluation des données; la
question 23(part de la communication dans le budget de ménage), s'est
avérée difficile à interpréter par les
répondants parce que mal rédigée et nécessitait
toujours d'amples explications de notre part.