Résultats du modèle
économétrique et discussion
Tout était mêlé, mais vint l'entendement
qui sépara tout pour le mettre en ordre .
ANAXAGORE, Maître d'Aristote
6.1) Mise en oeuvre du modèle
économétrique
L'algorithme1 de maximisation de la vraisemblance
est le SANN (Solid-Angle based Nearest-Neighbor Algorithm). Les
résultats présentés sont obtenus après au moins
10000 itérations de cet algorithme. Dans l'interprétation des
données, nous portons attention à la quantité p,
qui, dans le cas où son signe est positif, nous permet de valider une
sélection positive. Dans le premier modèle mis en oeuvre (Voir
Modèle I en annexe), toutes les variables intégrées sont
significatives, à la fois pour l'équation de sélection que
nous avons nommée Treatment Equation (TE) pour la suite
des commentaires , et la régression sur l'auto-emploi, l'Outcome
Equation (OE). Il s'agit en l'occurrence du niveau d'instruction, de
la situation financière du ménage, et de l'âge (cette
variable est uniquement présente dans le TE 2). En effet, la
régression pas à pas nous donne une idée globale des
variables les plus pertinentes pour le modèle. Elle est obtenue à
partir de la vraisemblance jointe du modèle, d'une régression non
linéaire en deux étapes pour l'analyse robuste, et sur un
ensemble plus large de variables qualitatives. Ce qui justifie la construction
étape par étape du modèle et le suivi des variables
intégrées, vue que les estimations sont fixées pour une
modalité de référence pour chacune d'elles. Cette
construction permet aussi de tenir compte de la convergence de l'algorithme
utilisé.
Le modèle II montre la pertinence et la
significativité de la variable sexe, qui non seulement
bénéficie d'une sélection positive, mais aussi d'une
sélection augmentée. Ce qui s'explique par une forte
corrélation entre les erreurs des deux équations de ce
modèle. Le modèle de sélection III obtenu avec les
migrants, montre que cette variable (la variable Migrant indique si
l'individu est un migrant ou non) n'est pas significative pour le TE, mais
l'est pour l'OE; mais son
1. L'algorithme peut être utilisé pour analyser
des images en 3D. A partir d'expériences ainsi que dans la
théorie, il est montré que l'algorithme dispose d'un faible
coût de calcul (Jacobus et al., 2012). Il est proche du SA (Simulated
annealing), qui est une technique probabiliste pour approcher l'optimum global
d'une fonction donnée (Bélisle, 1992).
2. Cette approche s'inspire de la règle d'exclusion,
même si avec des variables nominales uniquement, cette règle n'est
plus trop valable.
45
46
47
Tableau 6.1 - Variables mesurant la
santé
|
|
|
Variables
|
|
|
Modalités
|
b18 (%)
|
b19 (%)
|
b20 (%)
|
b21 (%)
|
b22 (%)
|
b23(%)
|
Non, pas de difficultés
|
97,11
|
98,49
|
98,46
|
94,16
|
91,07
|
98,65
|
Oui, quelques difficultés
|
1,63
|
1,24
|
0,97
|
5,11
|
5,53
|
1,04
|
Oui, beaucoup de difficultés
|
1,25
|
0,20
|
0,37
|
0,74
|
3,27
|
0,24
|
Incapacité totale
|
0,00
|
0,07
|
0,19
|
0,00
|
0,12
|
0,07
|
Source : Calcul de l'auteur
algorithme ne converge pas pour tous les estimateurs, dont
celui du p. Elle révèle tout de même une
présence non négligeable des migrants sur le marché de
l'auto-emploi. Cette variable sera reprise par la suite dans un autre
modèle, puisqu'elle introduit un échec dans les tests de
significativité des estimateurs de certains paramètres (pour le
modèle III). Il en est de même de la variable depart
(indiquant le département où a eu lieu l'interview), qui
malgré la significativité de quelques unes de ses
modalités dans le TE, induit une sélection négative pour
le modèle V. Le modèle VI montre l'influence significative du
niveau d'instruction de la mère et du père, même si cela
n'est pas confirmé pour le modèle robuste. Pour le modèle
VII, on retient que la formation professionnelle augmente la chance d'entrer
sur le marché du travail, mais a une influence négative sur
l'auto-emploi. L'homogénéité des réponses a mis en
mal l'estimation du modèle robuste. Sur tous les travailleurs
indépendants, seuls 4 avaient effectivement reçu une formation
professionnelle. Les autres facteurs démographiques tels que le milieu
de résidence, le fait d'avoir d'enfants ou non (tous significatifs) sont
étudiés dans le modèle VIII. Les variables Migrant
et Etat civil sont reprises dans ce dernier modèle : elles
demeurent significatives, et les célibataires sont les moins
présents sur le marché de l'auto-emploi. Un modèle sur
l'influence des handicaps n'était pas nécessaire, vu aussi le
degré d'homogénéité des réponses pour les
travailleurs indépendants (voir tableau 6.1). Il s'agit en l'occurrence
des variables : avoir des difficultés pour voir (b18), entendre
(b19), marcher (b20), mémoriser (b21),
prendre soin de soi (b22), ou communiquer (b23). Aucune de
ces variables n'est significative.
|
|