Chapitre 1 :
Modèles de mesure
I. Bref aperçus sur la théorie
classique
Le modèle de mesure dit classique permet
d'évaluer jusqu'à quel point un score obtenu à un test
reflète bien la compétence ou l'aptitude de l'individu en
question.
L'équation de base du modèle classique est
donnée par :
X = V + E
Où X est le score observé d'un individu, V est
le score vrai de cet individu et E est l'erreur de mesure.
L'équation de base signifie que, selon le modèle
classique, le score observé à un test est constitué de
deux composantes additives : V et E. le score observé à un test
est obtenu lors d'une administration particulière de ce test. Chaque
individu qui a passé ce test, à ce moment particulier, a donc un
score observé. Ce score observé varie d'une
répétition à l'autre du même test. Typiquement le
score observé peut être une fonction de la somme des items
réussis d'un test lorsque ces items sont corrigés de façon
dichotomique : 1 pour une bonne réponse 0 pour une mauvaise
réponse (Bertrand R., BLAIS J. (2004), p.39).
Il est bon de souligner que :
- le score observé est variable d'une
répétition à l'autre du test
- Le score vrai est intuitivement lié à un
individu particulier et à un test particulier : ainsi le score vrai
changera non seulement d'un individu à un autre mais aussi d'un test
à l'autre.
- l'erreur de mesure est une entité non observable,
inconnue, variable d'une
répétition à l'autre du test.
II. Analyse des items
II.1. Principe
Il est important dans toute évaluation d'examiner les
items du test en question, afin de s'assurer que ce dernier appréhende
bien la variable qu'on cherche à mesurer répondant ainsi aux deux
critères de fiabilité et validité. Avant de
développer cette analyse, nous allons expliquer brièvement ce que
signifient ces deux concepts dans le cadre des évaluations
psychométriques.
La fiabilité indique si un test est susceptible de
produire les mêmes résultats s'il est administré à
un même groupe de personnes testées plusieurs fois, de même
s'il est administré à différentes population. On parle
d'homogénéité ou de consistance interne des items
(appréciée à partir de leurs
inter-corrélations).
La validité indique si le test mesure bien ce qu'il
prétend mesurer .Par exemple un test d'algèbre est censé
mesurer uniquement les compétences des élèves en
algèbre. Mais s'il comprend des problèmes de texte, un tel test
peut être un défi pour les étudiants avec de faibles
compétences en langue. Il mesurerait ainsi non seulement leurs
compétences en algèbre mais aussi leurs compétences de
langue, s'écartant ainsi de son objectif principal.
L'analyse des items se fait en deux étapes : une
analyse qualitative et une analyse statistique.
|