2.4.2. Méthodes d'analyse descriptive
Elles nous permettent de mieux connaître
l'échantillon. Nous présenterons les caractéristiques
démographiques des enseignants et les conclusions les plus pertinentes
qui découlent du traitement de l'information au regard des
hypothèses et à l'usage du test de Chi-deux.
Notons que la variable « satisfaction au travail dans
l'établissement éducatif » est calculée par l'Analyse
des correspondances multiples (ACM) suivie de la Classification ascendante
hiérarchique (CAH) appliquées aux items de l'échelle du
MSQ. Par ailleurs, nous allons considérer les interactions entre la
flexibilité d'emploi et la sécurité perçue par
l'enseignant, afin de définir les variables de flexicurité
résumées par le tableau suivant :
Tableau 2.2 : Types d'enseignants par flexibilité
et sécurité d'emploi Flexibilité de l'emploi
Non Oui
Sécurité de
l'emploi
|
Non Enseignants en risque permanent Enseignants
temporaires
|
Oui Enseignants permanents Enseignants
`'flexicurisés»
|
Source : Origo et Pagani, 2009
Cette typologie des enseignants permet d'étudier la
flexicurité du marché de l'emploi enseignant à une
échelle microéconomique.
2.4.3. Méthodes d'analyse
économétrique
Dans ce paragraphe nous exposons le modèle
économétrique adopté pour tester les hypothèses, et
la démarche d'estimation face au problème éventuel
d'endogénéité dans le modèle.
A l'instar de Katharina MICHAELOWA (2002), Rohen D'AIGLEPIERRE
(2011), Kenneth KPONOU (2014), ORIGO et PAGANI (2009), nous utilisons des
modèles Probit pour estimer la satisfaction au travail des
enseignants.
26
Présenté et soutenu par Romaric KPANOU
Chapitre 2 : Données et méthodologie de
recherche
Modèle dichotomique de satisfaction au travail
des enseignants
Il s'agit d'estimer la probabilité qu'un enseignant ait
« la volonté de demeurer enseignant (JOB_SAT1)» compte tenu de
ses caractéristiques (variables explicatives). La forme
générale du modèle se présente comme suit :
????????(???? = 1| X??) = F(??'X??) (5)
Où
? j = 1,2, ... , N indice les individus,
? ???? = ??????_?? ???? 1 = 1 spécifie le désir de
rester enseignant,
? X?? est le vecteur- colonne des variables explicatives,
? ??' est le vecteur-ligne des paramètres à
estimer,
? F est la fonction de répartition de la loi normale
centrée réduite.
Satisfaction au travail des enseignants : Une approche
multinomiale
La satisfaction globale du métier enseignant (JOB_SAT2) et
la satisfaction au travail dans l'établissement éducatif
(JOB_SAT3) étant ordinales, la modélisation peut être
formalisée comme suit :
Soit y* la variable latente continue qui mesure la
satisfaction au travail de l'enseignant (JOB_SAT).
La variable y* est telle que :
y* < c1 si JOB_SAT = 1 (Pas du tout satisfait)
c1 = y* < c2 si JOB_SAT = 2 (Peu satisfait)
c2 = y* < c3 si JOB_SAT = 3 (Satisfait)
y* = c3 si JOB_SAT = 4 (Extrêmement satisfait)
Le modèle s'écrit :
y??* = ??'X?? + ???? (6)
Où :
- j = 1,2, ... , N indice les enseignants,
- ??' est le vecteur-ligne des paramètres à
estimer,
- X?? est le vecteur - colonne des variables explicatives,
- ???? est le terme d'erreur.
27
Présenté et soutenu par Romaric KPANOU
Chapitre 2 : Données et méthodologie de
recherche
Qualité de l'ajustement et pouvoir
prédictif du modèle
Pour un échantillon de n observations et n valeurs
prédites par le modèle, on considère que l'ajustement est
satisfaisant si :
? La distance entre la valeur observée et la valeur
prédite est petite.
? Le modèle est bien estimé c'est-à-dire que
les fréquences prédites sont proches de fréquences
réalisées
? On obtient des bonnes mesures de sensibilité et de
spécificité c'est-à-dire que le modèle permet de
bien discriminer entre les valeurs de y = 0 (insatisfaction) et y = 1
(satisfaction) en fonction variables explicatives du modèle.
Pour la qualité de l'ajustement du modèle aux
données, nous utiliserons le test de Hosmer - Lemeshow, et pour la
mesure de la sensibilité et de la spécificité, nous
utiliserons la matrice de classification13. Pour plus d'informations
sur ces notions, nous pouvons référer entre autre à Hosmer
(1988), Touré (2013), D. Le Blanc (2000).
En plus de ces statistiques, nous utiliserons la mesure BIC
(Bayesien Information Criteria) pour le choix d'une spécification du
modèle parmi tant d'autres, et le test de Wald pour la
significativité des coefficients des variables. A ce niveau nous ferons
le test joint des coefficients des variables explicatives de la
spécification finale et des tests individuels de chaque coefficient.
Enfin nous utiliserons le test de spécification de Pregibon (1980) pour
la qualité du lien entre la variable explicative et les variables
expliquées, dans le cas du Probit ordonné.
Problème d'endogénéité dans
le modèle : le modèle POLS
Certains facteurs non observables (tels que la capacité
individuelle, la motivation, et des informations concernant le marché du
travail) peuvent être
13 Il ne s'agit pas d'un test en soit.
L'idée de base de ces tables est de « prédire » y??
(observée) par y^?? (résultant de l'estimation) de la
façon suivante y^?? = 1 si la probabilité
estimée de valoir 1 dépasse un certain seuil (souvent 50%) et
y^?? = 0 sinon.
28
Présenté et soutenu par Romaric KPANOU
Chapitre 2 : Données et méthodologie de
recherche
corrélées à la fois au type de contrat et
à la sécurité de l'emploi. Tant que ces facteurs affectent
simultanément les variables d'intérêt, les
paramètres estimés peuvent être biaisés. Ce qui pose
le problème d'endogénéité que nous
étudierons à partir des deux stratégies d'estimation
suivantes.
1e stratégie
Compte tenu de la nature ordinale intrinsèque de la
variable dépendante, un estimateur Probit ordonné est
l'estimateur approprié. Cependant, il a été montré
que l'estimateur de la régression linéaire classique peut
être utilisé une fois que la variable dépendante a
été correctement transformée en une variable
«pseudo» continue (TERZA, 1987; Van Praag BMS, 2005; Van Praag BMS,
Ferrer-i-Carbonell A., 2004). Cette approche, connue sous le nom
Probit-Ordinary Least Square (Voir annexe A3.1. Le modèle POLS, p69) est
particulièrement utile si l'on a affaire à des modèles de
réponses ordonnées.
Concrètement :
? On estime le modèle (6) par un Probit ordonné
;
? Toutes les constantes : c1, c2 et c3 sont ensuite
récupérées ;
? La véritable variable latente est approchée
par son espérance conditionnelle. Intuitivement, même si nous
n'observons pas la valeur exacte de la variable latente pour chaque individu ou
observation, nous pouvons l'approcher avec un ensemble de moyennes (dont le
nombre est égal au nombre de catégories de la variable ordinale
observée c'est-à-dire quatre dans notre cas, et les individus,
avec la même réponse observée, sont
caractérisés par la même valeur de la variable
transformée) de la variable latente sous-jacente.
? Enfin, on estime à nouveau par MCO le modèle
(6) en utilisant la variable dépendante transformée.
Notons que la possibilité d'utiliser un estimateur
linéaire permet de mieux régler les problèmes de
poignée tels qu'endogénéité et auto
sélection.
29
Présenté et soutenu par Romaric KPANOU
Chapitre 2 : Données et méthodologie de
recherche
2e stratégie
Nous estimons d'abord la probabilité d'être l'un
des quatre types d'enseignants et nous utilisons ces estimations pour
contrôler l'endogénéité dans l'équation de la
satisfaction au travail (estimée avec POLS). Compte tenu de la nature
multinomial de la variable endogène (type d'enseignants) nous estimons
le modèle suivant en utilisant un Logit multinomial.
Ti = i'Xi + vi (7)
Où :
- Ti est une variable indicatrice pour les quatre types
d'enseignants selon les niveaux de flexibilité et de
sécurité ci-dessus définis,
- i' est le vecteur-ligne des paramètres
à estimer,
- Xi est le vecteur- colonne des variables
sociodémographiques et d'autres variables de contrôle,
- vi est le terme d'erreur,
- i indice l'individu ou l'observation.
A partir de cette estimation, nous mettons à jour un
ensemble de termes de correction, que nous ajoutons comme contrôles dans
le modèle (6) de la satisfaction au travail, pour tenir compte de la
corrélation possible des caractéristiques non observables. Nous
obtenons donc le modèle qui suit :
yi* = /3'Xi + A'E(v
|Tt)i + coi (8)
Où
o yi* est la variable latente mesurant la
satisfaction au travail,
o Xi est le vecteur-colonne des variables explicatives,
o /3' et A' sont les vecteurs-ligne des
paramètres à estimer,
o E(v |Tt) est une fonction des
probabilités estimées à partir du modèle (7) : la
capture de la corrélation entre les variables non observables de types
d'enseignants et la satisfaction au travail.
o coi est le terme d'erreur,
30
Présenté et soutenu par Romaric KPANOU
Chapitre 2 : Données et méthodologie de
recherche
o ?? indice l'individu ou l'observation et t
est mis pour le type d'enseignant.
L'ensemble des termes de correction d'un Logit multinomial est
obtenu comme suit (Dubin J, McFadden D, 1984):
(9)
??
??(??|?? = t) = ? (P?????? (P??) + ????
(P??))
1 - P ??
??=1
?????
Où
V' ?? = 4 est le nombre des différents types
d'enseignants, sont des estimations,
V' P?? ; t = 1,2,3,4 sont les
probabilités, pour l'individu d'être le type t
d'enseignant, calculer à partir du modèle (7),
V' ?? indice le type d'enseignant, tout comme t
mais ne prend pas la même valeur que ce dernier.
On estime alors le modèle (8) par une régression
linéaire (MCO par exemple) en utilisant la variable dépendante
transformée, comme décrite au niveau de la 1e
stratégie. Compte tenu de la spécification de
l'équation (8), si les coefficients du vecteur A'
estimés ne sont pas significatifs (statistiquement
différent de zéro), la question de
l'endogénéité peut être ignorée; au
contraire, s'ils sont statistiquement significatifs, la spécification
proposée permet d'obtenir des estimations non biaisées des
paramètres d'intérêt.
31
Présenté et soutenu par Romaric KPANOU
Chapitre 3 : Résultats et implications de politiques
|