III.4. Les différents modèles IRT
On distingue habituellement trois grands types de
modèle : le modèle logistique à un paramètre plus
connu sous le nom du modèle de Rasch et les modèles à deux
(Birnbaum) et trois paramètres. Ces modèles regroupés sous
l'appellation générique de modèles de riSRnsHLIj
LIl'LJHm (MRI) - Item Response Modeling (IRM) en anglais -- ont
été créés il y a une trentaine d'années. Il
faut signaler qu'ils ont été « inventés »
à peu près simultanément et de manière
indépendante au Danemark par le mathématicien Georg Rasch (1960)
qui cherchait un modèle permettant de comparer des compétences
d'élèves en lecture à plusieurs années d'intervalle
et, aux États-Unis, par le statisticien Allan Birnbaum (1959,
cité dans Birnbaum, 1968) qui cherchait à améliorer les
modèles de mesure en psychométrie.
Des modèles comportant un nombre de paramètres
supérieur à trois sont cités par certains auteurs. Nous
n'en parlerons pas ici, car ils sont très peu utilisés en
sciences de l'éducation.
III.4.1. Le modèle de Rasch
Le modèle de Rasch est un des modèles les plus
simplifiés de l'IRT puisque chaque item est modélisé par
un paramètre unique appelé le paramètre de
difficulté de l'item. Il s'écrit comme suit :
?? ?????? = ?? =
|
?????? ??? - ???? )
??+ ?????? ??? - ???? )
|
a) Propriétés du
modèle
Les défenseurs du modèle à un
paramètre ou modèle de Rasch revendiquent que seul ce
modèle permet d'obtenir une mesure objective et exhaustive. De plus, il
est plus facile à manipuler mais les données doivent
répondre à de nombreuses contraintes.
Une mesure objective
G. Rasch argumentait que l'estimation de la difficulté
des items et de la compétence des sujets étaient
indépendantes, ce qui fondait, selon lui, le concept
d'objectivité3 spécifique. Quels que soient les items
passés par un sujet, on obtiendra une même estimation de sa
compétence. Quels que soient les groupes de sujets auxquels l'item a
été administré, on obtiendra une même estimation de
sa difficulté.
Le modèle de Rasch n'est pas un `modèle de
données', mais une `définition de la mesure'. En d'autres termes,
avec le modèle de Rasch, si les items du test ne correspondent pas au
modèle, ce sont les items qui posent problème et non le
modèle. Par opposition, les modèles plus complexes sont
perçus comme imposant des contraintes arbitraires sur les valeurs que
les paramètres peuvent prendre dans le processus d'estimation (Jones,
1992). Selon Bond et Fox (2001), « c'est précisément
l'addition de paramètres supplémentaires qui dépouille les
données de leurs propriétés fondamentales de mesure »
(p. 191, trad.).
En termes mathématiques cette propriété
s'exprime comme suit : étant donné deux individu i1et i2, la
probabilité que le premier donne une réponse correcte à
l'item j et que le deuxième y donne une réponse correcte sachant
que l'un des deux y a répondu positivement est indépendante du
paramètre de difficulté de l'item en question :
??(?????? = ??,?????? = ??/???? = ??) =
???????(??????)
?????? ??????~+???????(??????)
Une mesure exhaustive
Cette propriété4 est très
importante dans la mesure où elle justifie l'utilisation du score
observé comme résumé de l'information portée par
3 La démonstration de cette
propriété est présentée en Annexe (annexe I)
4 La démonstration de la
propriété d'exhaustivité est présentée en
annexe (annexe I)
l'instrument de mesure ; c'est-à-dire que toute
l'information disponible sur le trait latent d'un élève est
contenue dans le score simple .
En bref, choisir le modèle de Rasch, c'est accorder la
primauté au modèle de mesure et non aux données. De plus
l'exigence plus réduite en termes de nombre de sujets fait du
modèle de Rasch le plus économique du point de vue du temps comme
du point de vue du coût.
|