Analyse des déterminants de l’auto-emploi des jeunes de 15 à 29 ans au Bénin.par Nonvikan Karl-Augustt Alahassa Ecole Nationale de la Statistique et de l'Analyse Economique (ENSAE) - Ingénieur Statisticien Economiste (ISE) 2016 |
ConclusionL'auto-emploi est d'une importance économique évidente, et présente pour les jeunes l'opportunité d'une insertion professionnelle plus facile. Mais, pour mettre en oeuvre des politiques favorables à l'auto-emploi, afin de garantir un emploi décent pour tous, il faudrait identifier à la base les actions nécessaires, compte tenu de la situation actuelle. Les inquiétudes relatives à la qualité de l'environnement institutionnel, y compris le système éducatif, remontent à la surface : le Bénin est-il prêt à faire cet élan vers l'auto-emploi? Vus les problèmes inhérents au marché du travail et les difficultés rencontrées par la formation professionnelle, un diagnostic préalable est nécessaire pour identifier les actions à mettre en oeuvre. Dans cette étude, une classification a permis de mettre en lumière les caractéristiques de l'auto-emploi au Bénin. Nous avons identifié le travail indépendant comme une alternative au chômage et au sous-emploi. Il se développe principalement dans le secteur informel qui reste prédominant de part l'environnement familial, surtout pour les activités liées à l'agriculture et au commerce, où il ressort un transfert de capital culturel significatif. Dans une analyse économétrique par la suite, nous avons dégagé une influence négative du niveau d'instruction (qu'il soit primaire, secondaire) le plus élevé atteint par le jeune travailleur dans l'auto-emploi. Cette influence négative comparée à ceux n'ayant reçu aucune éducation formelle, reste particulièrement significative, et accentuée par le niveau d'instruction le plus élevé atteint par le père5 (surtout lorsqu'il est primaire), et celui atteint par la mère (lorsqu'il est primaire ou post-secondaire). Par ailleurs, bien que la formation professionnelle facilite l'insertion professionnelle (voir Modèle VII), elle n'incite pas le travailleur à s'orienter vers l'auto-emploi. Lorsque le père ou la mère a également reçu une formation professionnelle 6, cela réduit davantage les chances de l'individu d'opter pour le travail indépendant. Par ailleurs, en nous concentrant sur la variable sexe, il ressort que les femmes sont significativement les mieux représentées dans l'auto-emploi. Mais, l'étude révèle aussi que l'auto-emploi des femmes est grandement précarisé. Tout en créant de nouvelles opportunités d'emploi pour les femmes, le travail indépendant a plutôt renforcé leur vulnérabilité. Les autres facteurs démographiques restent significatifs, notamment le milieu de résidence (favorable quand il est rural compte tenu de la prédominance des activités agricoles), le statut
49 de migrant, le fait d'avoir d'enfant ou non (pour les femmes les plus âgées du groupe : économie de subsistance où la production pour consommation propre est forte), le fait de cohabiter avec ses parents ou non. Dans ce contexte, les questions de chômage, de sous-emploi des jeunes gagne à juste titre en importance, et cet intérêt pour l'auto-emploi reste légitime, compte tenu des besoins de nombreux jeunes sans éducation formelle, présents sur le marché du travail. Ces jeunes ont souvent un travail, dans le secteur informel rural, où ils ont des revenus inférieurs au seuil de pauvreté ; ou bien ils sont cultivateurs sur de petites exploitations, alors que l'accès à la terre ne cesse de se réduire. Leur voix se fait rarement entendre. Toute stratégie de développement des compétences devrait avoir pour principal objectif de leur donner les moyens d'échapper à ces emplois vulnérables. Trop souvent, l'accès aux compétences est inégal, perpétuant et exacerbant le désavantage qui frappe les pauvres, les femmes et les membres des groupes sociaux marginalisés. Les jeunes qui ont grandi dans la pauvreté et l'exclusion risquent davantage de faire peu d'études ou d'abandonner l'école. Par suite, ils ont moins de possibilités de développer les compétences menant à un emploi décent, et risquent donc d'être un peu plus marginalisés sur le marché du travail. Pratiquement toutes les personnes actives au Bénin sont en activité, d'après les précédentes statistiques. Avec cette étude, on comprend pourquoi paradoxalement, ces dernières demeurent effectivement pauvres : en effet, elles occupent des emplois à faible productivité, et par conséquent mal rémunérés. L'informel est source d'insécurité pour les acteurs, qui ne bénéficient pas de certains avantages et protections liés pourtant à leur statut. De même, l'entrepreneur individuel et les membres de sa famille sont exclus du système de protection sociale et d'assurance maladie. COMMENT ORIENTER L'AUTO-EMPLOI AU BÉNIN VERS UNE ÉCONOMIE DE DÉVELOPPEMENT ? Pour faire face aux défis de l'emploi décent et à la réduction de la pauvreté, le Gouvernement Béninois doit donner une place de choix à l'auto-emploi dans sa politique en matière d'emploi. L'adoption d'une politique nationale de l'emploi et d'un plan d'action renforcera la création d'emploi, à améliorer l'employabilité ainsi que l'organisation et le fonctionnement du marché de l'emploi. Pour cela, nous recommandons les actions suivantes : 1. Encourager et promouvoir le statut de l'entreprenant pour favoriser la migration de l'informel vers le formel : Toute initiative dans ce sens permettrait de mieux insérer certaines catégories d'acteurs économiques dans le circuit de création de la richesse. l'OHADA 7 a créé, en 2010, le statut de l'entreprenant pour offrir un statut simplifié aux micro et petites entreprises afin 7. Pour l'OHADA, l'entreprenant se veut être «un nouveau statut juridique simplifié ouvert à toute entreprise, personne physique, qui exerce une activité civile, commerciale, artisanale ou agricole et qui souhaite se déclarer au Registre du Commerce et du Crédit mobilier (RCCM)». 50 de faciliter la migration de l'informel vers le formel. C'est pourquoi il faut créer les conditions d'inversion de ces réalités, de réelles mesures d'incitation, pour amener les acteurs de l'informel à se formaliser pour que leurs efforts soient reconnus et mieux appréhendés. Les stratégies idoines pour la simplification de la procédure de leur formalisation doivent être muries pour la mise en place d'une fiscalité adaptée à leur profil.
8. Elles comprennent la capacité à résoudre des problèmes, à communiquer efficacement des idées et des informations, à faire preuve de créativité, de leadership et de conscience professionnelle, ainsi que d'esprit d'entreprise. Elles permettent de s'adapter aux différents environnements de travail et d'améliorer ses chances de conserver un emploi rémunérateur. 51 Annexe
Importance de la formation professionnelle et technique Udeme S. Udoetuk, Namkere J. Udoudo et Ofonmbuk Isaac Michael ont souligné l'effet potentiel de la formation technique et professionnelle sur le développement national. Les trois auteurs conclus dans un document intitulé "Achieving Sustainable Technological Development In Nigeria Through Entrepreneurship and Technical Vocational Education and Training (TVET)" que l'entrepreneuriat, l'auto-emploi, l'éducation technique et professionnelle peuvent contribuer au développement national durable au Nigeria s'ils sont promus. Ils pensent que si leurs recommandations sont prises en compte et sont fidèlement mises en oeuvre, le Nigeria saura en temps record rejoindre la ligue des nations industrialisées du monde (Udeme S. Udoetuk et al., 2013). En raison de l'importance croissante de la petite entreprise, il est nécessaire de créer une «culture d'entreprise» répandue dans les pays en développement. Les instituts de formation professionnelle (VTI) peuvent jouer un rôle dans la création de cette «culture d'entreprise» en intégrant plus de business, d'auto-emploi et l'entrepreneuriat dans les programmes de formation professionnelle et technique (Robert E. Nelson, 1996). Yangben et Seniwoliba recommandent de leur recherche qu'il faut assurer la liaison entre les écoles et les industries en service. Ainsi, des activités de formation peuvent être bien organisées et faciliter l'intégration des compétences des étudiants destiné au marché de l'emploi. Samuel Kwame Ansah du département de la Technologie de la Construction, au coût Cap Polytechnic au Ghana, et Kissi Ernest du même département à l'Université Kwame des sciences et de la technologie ont assez suggéré dans leur article intitulé Technical and Vocational Education and training in Ghana : A tool for Skill Acquisition and Industrial Development, que le certificat de compétence de base (Compétence Based Training) devrait être inclut dans la conception des programmes d'enseignement technique et professionnelle, à tous les niveaux pour aider à promouvoir l'acquisition de compétences et le développement industriel. Leur document souligne également que l'éducation scientifique et technologique reste tout de même nécessaire, ainsi que les compétences techniques qui peuvent créer de la richesse, et aider un pays à atteindre le développement économique et industriel. Le Gouvernement Béninois a lancé de nombreux projets pour la construction d'écoles agricoles et industriels. Par exemple, en 2006, le Centre de formation professionnelle de Djougou, et Kpondéhou, l'annexe du Lycée Technique Coulibaly (Cotonou) ont été ouverts. Mais, les principales questions sont les suivantes : combien d'élèves fréquentent ces écoles? Les programmes 52 sont-ils vraiment adaptés aux besoins du marché du travail? Y at-il assez de sensibilisation et de valorisation pour motiver les parents à envoyer leurs enfants? Quality and number of students : In most developing countries, science education at the pre-tertiary level is too poor to provide students with a solid knowledge foundation. As a result, the number of students at the secondary school level, who have the necessary background to enable them to pursue scientific and technical programs at tertiary level, is inadequate. In some countries, policy arrangements cause this poor scientific background of students entering higher education. [...] Quality and number of educators : In most developing countries, there are not enough specialized TVET teachers at both secondary and post-secondary levels. This has repercussions on the quality of students that are produced. Furthermore, most of the educators do not have direct contact with the labor market (through short-term) periodic secondments which would modernize and upgrade their practical knowledge on the actual technologies being employed in the workplace, as well as offer them insight into the actual practical needs of the labor market. This knowledge could then be incorporated into lessons or be passed on to colleagues through peer-mentoring. [...] Quality and number of TVET institutions : In most developing countries, TVET institutions are fewer in number and have lower enrollments and graduates than their academic counterparts. Although more and more developing countries wish to increase their ratio of sciences-to humanities manpower base, the enrollments remain heavily skewed towards the social sciences. This is partly due to the poor societal image of TVET and to the fact that TVET education is more expensive to provide than education program in the humanities. In addition, due to insufficient training facilities, particularly at the tertiary level, TVET institutions have a small student absorption capacity and often have to refuse entry to many applicants, since overcrowding would compromise the standard of education being offered. Qualified students who applied to study in technical fields but did not get admitted often switch to the humanities, and that is a waste of talent to the technical field. Analysis of annual sector performance reports of Ministries of Education in various developing countries shows that most developing countries are doing their best to stretch the education budget that they have available to them to adequately provide for the needs of both general education and TVET. However, the budgets and investments remain small, relative to the work that needs to be done in order to improve the state of education, particularly TVET. A large share of the ministerial budgets (r 80% on average) covers necessary recurring costs. NICHE a, NICHE strategy on Technical and Vocational Education and Training (TVET), July 2010. a. NICHE (Netherlands Initiative for Capacity development in Higher Education) is a Netherlands-funded development cooperation program aimed at strengthening capacity in post-secondary education and training institutions in 23 countries (Afghanistan, Bangladesh, Benin, Bhutan, Colombia, Egypt, Ethiopia, Ghana, Guatemala, Indonesia, Kenya, Kosovo, Mozambique, Nicaragua, Rwanda, South Africa, South Sudan, Suriname, Tanzania, Uganda, Vietnam, Yemen and Zambia). 53 The TVET Sector in Developing Countries 54 Annexe
International Classification by Status in Employment The 15th International Conference of Labor Statisticians adopted (ILO, 1993), in January 1993, a resolution concerning the ICSE which states [extract] : II. THE ICSE-93 GROUPS1 4 The ICSE-93 consists of the following groups, which are defined in section III :
III. GROUP DEFINITIONS 5 The groups in the ICSE-93 are defined with reference to the distinction between "paid employment" jobs on the one side and self-employment jobs on the other. Groups are defined with reference to one or more aspects of the economic risk and/or the type of authority which the explicit or implicit employment contract gives the incumbents or to which it subjects them. 6 Paid employment jobs are those jobs where the incumbents hold explicit (written or oral) or implicit employment contracts which give them a basic remuneration which is not directly dependent upon the revenue of the unit for which they work (this unit can be a corporation, a non-profit institution, a government unit or a household). Some or all of the tools, capital equipment, information systems and/or premises used by the incumbents may be owned by others, and the incumbents may work under direct 1. For linguistic convenience the group titles and definitions have been formulated in a way which corresponds to the situation where each person holds only one job during the reference period. 55 supervision of, or according to strict guidelines set by the owner(s) or persons in the owners' employment. (Persons in "paid employment jobs" are typically remunerated by wages and salaries, but, may be paid by commission from sales, by piece-rates, bonuses or in-kind payments such as food, housing or training.) 7 Self-employment jobs are those jobs where the remuneration is directly dependent upon the profits (or the potential for profits) derived from the goods and services produced (where own consumption is considered to be part of profits). The incumbents make the operational decisions affecting the enterprise, or delegate such decisions while retaining responsibility for the welfare of the enterprise (in this context "enterprise" includes one-person operations.) 8.1 Employees are all those workers who hold the type of job defined as "paid employment jobs" (cf. paragraph 6). Employees with stable contracts are those "employees" who have had, and continue to have, an explicit (written or oral) or implicit contract of employment, or a succession of such contracts, with the same employer on a continuous basis. "On a continuous basis" implies a period of employment which is longer than a specified minimum determined according to national circumstances. (If interruptions are allowed in this minimum period, their maximum duration should also be determined according to national circumstances.) Regular employees are those "employees with stable contracts" for whom the employing organization is responsible for payment of relevant taxes and social security contributions and/or where the contractual relationship is subject to national labor legislation. 9.2 Employers are those workers who, working on their own account or with one or a few partners, hold the type of job defined as a "self-employment job" (cf. paragraph 7), and, in this capacity, on a continuous basis (including the reference period) have engaged one or more persons to work for them in their business as "employee(s)" (cf. paragraph 8). The meaning of "engage on a continuous basis" is to be determined by national circumstances, in a way which is consistent with the definition of "employees with stable contracts" (cf. paragraph 8). (The partners may or may not be members of the same family or household.) 10.3 Own-account workers are those workers who, working on their own account or with one or more partners, hold the type of job defined as "a self-employment job" (cf. paragraph 7), and have not engaged on a continuous basis any "employees" (cf. paragraph 8) to work for them during the reference period. It should be noted that during the reference period the members of this group may have engaged "employees", provided that this is on a non-continuous basis. (The partners may or may not be members of the same family or household.) 11.4 Members of producers' cooperatives are workers who hold a "self-employment" job (cf. paragraph 7) in a cooperative producing goods and services, in which each member takes part on an equal footing with other members in determining the organization 56 of production, sales and/or other work of the establishment, the investments and the distribution of the proceeds of the establishment among their members. (It should be noted that "employees" (cf. paragraph 8) of producers' cooperatives are not to be classified to this group.) 12.5 Contributing family workers are those workers who hold a "self-employment" job (cf. paragraph 7) in a market-oriented establishment operated by a related person living in the same household, who cannot be regarded as a partner, because their degree of commitment to the operation of the establishment, in terms of working time or other factors to be determined by national circumstances, is not at a level comparable to that of the head of the establishment. (Where it is customary for young persons, in particular, to work without pay in an economic enterprise operated by a related person who does not live in the same household, the requirement of "living in the same household" may be eliminated.) 13.6 Workers not classifiable by status include those for whom insufficient relevant information is available, and/or who cannot be included in any of the preceding categories. 57 Annexe
Self-employment and Treatment Of Particular Cases The following text is part of the resolution concerning statistics of employment in the informal sector, adopted by the Fifteenth International Conference of Labor Statisticians in January 1993 (ILO, 1993). 12 1. Different members of a household may be engaged as self-employed persons in different kinds of informal sector activities during a given reference period. In order to determine whether such activities should be regarded as separate enterprises or as parts of a single enterprise, due consideration should be given to the definitional requirements of an enterprise as specified in the International Standard Industrial Classification of All Economic Activities (ISIC, Rev.3). Where it is difficult in practice to apply these requirements, different activities carried out by different household members should be treated as separate enterprises if they are perceived as such by the household members themselves. 2. A household member or group of household members may be engaged as self-employed persons in different kinds of informal sector activities during a given reference period. For practical purposes, all activities carried out at a time by the same household member or group of household members should be treated as parts of a single enterprise rather than as separate enterprises. 13 In the case of informal sector units which are engaged in different kinds of production activities during a given reference period, efforts should be made to collect as much separate information as possible in respect of each activity, even when the enterprises concerned need not or cannot be partitioned into establishments as defined by the International Standard Industrial Classification of All Economic Activities(ISIC, Rev.3). In particular, such separate information should be collected in respect of all activities of the enterprise which are horizontally integrated (i.e. producing different kinds of goods or services for sale or exchange and carried out parallel with each other), irrespective of their share in the total value added of the enterprise. 14 Household enterprises, which are exclusively engaged in non-market production, i.e. the production of goods or services for own final consumption or own fixed capital formation as defined by the United Nations System of National Accounts (Rev.4), should be excluded from the scope of the informal sector for the purpose of statistics of employment 58 in the informal sector. Depending on national circumstances, an exception may be made in respect of households employing domestic workers as referred to in paragraph 19. 15 With account being taken of paragraph 14, the scope of the informal sector should include household enterprises located in urban areas as well as household enterprises located in rural areas. However, countries which start to conduct surveys of the informal sector may initially confine data collection to urban areas. Depending upon the availability of resources and appropriate sampling frames, the coverage of the surveys should gradually be extended to cover the whole national territory. 16 For practical reasons, the scope of the informal sector may be limited to household enterprises engaged in non-agricultural activities. With account being taken of paragraph 14, all non agricultural activities should be included in the scope of the informal sector, irrespective of whether the household enterprises carry them out as main or secondary activities. In particular, the informal sector should include secondary non-agricultural activities of household enterprises in the agricultural sector if they fulfill the requirements of paragraphs 8 or 9. 17 Units engaged in professional or technical activities carried out by self-employed persons such as doctors, lawyers, accountants, architects or engineers,should be included in the informal sector if they fulfill the requirements of paragraphs 8 or 9. 18 1. Outworkers are persons who agree to work for a particular enterprise, or to supply a certain quantity of goods or services to a particular enterprise, by prior arrangement or contract with that enterprise, but whose place of work is not within any of the establishments which make up that enterprise.
59 ployees according to paragraph 9(6), employee outworkers should be treated in the same way as other employees. Where relevant, employee outworkers may be identified as a separate sub-category of informal sector employees. 19 Domestic workers are persons exclusively engaged by households to render domestic services for payment in cash or in kind. Domestic workers should be included in or excluded from the informal sector depending upon national circumstances and the intended uses of the statistics. In either case, domestic workers should be identified as a separate sub-category in order to enhance international comparability of the statistics. 20 Activities excluded from the scope of the informal sector, such as domestic services, non-market production and agricultural activities, may be identified as separate categories outside the distinction between the informal and formal sectors.
60 Annexe
Résultats de la classification Graphique D.1 - Dendogramme de la
classification Graphique D.2 - Histogramme partiel des
valeurs propres 61 Graphique D.3 - Position des trois classes retenues après classification sur le graphe des individus (graphe sur les deux (2) premiers axes factorielles) Source : Auteur 62 Annexe
Représentation des graphes La relation entre une ou plusieurs variables discràtes peut être représentée à partir d'un graphe bayésien. Cette relation est dite directe (A -+ B, c'est- dire que la variable B dépend de la variable A ), ou indirecte (lorsqu'elle existe par l'intermédiaire d'autres variables). La représentation est basée sur le DAG (Directed Acyclic Graph), qui est un graphe dans lequel on exclut la possibilité A -+ ... -+ A (cycles) . La schématisation du graphe est basé sur les arcs. Chaque noeud du graphe est une variable. Lorsque deux variables sont reliées par d'autres variables, on dit que la liaison est un chemin (path). Il est important de canaliser l'interprétation : pour un arc donné, la variable de départ est appelée cause, et celle au bout de la flèche appelée effet. Cependant, l'arc n'indique qu'une dépendance entre les deux variables. Quelques hypoth£ses sont nécessaires sur le réseau bayé-sien construit pour étudier les relations causales. La structure du DAG est l'objet de notre enquête. Il est commun dans l'étude de la génétique et des systèmes la biologie, par exemple, de reconstruire des voies et des réseaux moléculaires sous-jacents de maladies complexes et les processus métaboliques. Un exemple remarquable de ce genre d'étude peut être trouvé dans Sachs et al. (2005). L'élaboration d'un DAG est une tâche complexe, pour deux raisons. Tout d'abord, l'espace des possibles est très grand; le nombre de DAGs possible augmente super-exponentiellement lorsque le nombre de noeuds augmente. Nous allons nous limiter à deux catégories de critères statistiques utilisés par les algorithmes pour évaluer un DAG : les tests de l'indépendance conditionnelle et les scores de réseau. Il y a plusieurs algorithmes qui savent rechercher le DAG qui maximise le score d'un réseau donné. Un des plus simples est le hill-climbing: à partir d'un DAG sans arcs, il ajoute, supprime et renverse un arc à la fois, ainsi de suite jusqu'à trouver le DAG qui maximise le score d'un réseau, à partir de données fournies. Le Bayesian Information Criteria (BIC) est le score par défaut. Pour plus de détails sur les tests d'indépendance bayésiens requis, voir l'ouvrage récent de Marco Scutari et Jean-Baptiste Denis (2015). Un utilitaire sur R adapté est le package bnlearn (Bayesian network learning). 63 Tableau E.1 - Variables retenues pour la modélisation bayésienne Variables et libellés sex Une variable dichotomique indiquant le sexe de l'individu b14 Une variable catégorielle indiquant la situa- tion financière du ménage de l'individu (facile, plutôt facile, dans la moyenne nationale, plutôt difficile, difficile) c01 Une variable dichotomique indiquant si l'in- dividu a reçu une éducation formelle urbrurf Une variable dichotomique indiquant le mi- lieu de résidence (rural ou urbain) FEGlobal Une variable catégorielle indiquant le niveau d'instruction le plus élevé atteint par le père (aucun, primaire, secondaire, universitaire, post-universitaire) MEGlobal Une variable catégorielle indiquant le niveau d'instruction le plus élevé atteint par la mère (aucun, primaire, secondaire, universitaire, post-universitaire) informal Une variable dichotomique donnant le type d'activité (formel ou non) de l'individu sex informal c01 b14 64 Graphique E.1 - Graphe bayésien
I urbrurf sex c01 informal b14 65 Graphique E.2 - Graphe bayésien
II urbrurf sex FEGlobal c01 b14 MEGlobal informal 66 Graphique E.3 - Graphe bayésien
III 67 Annexe
Spécification et vraisemblance du modèle Dorénavant, rappelons qu'il n'est pas nécessaire d'intégrer les pondérations des individus dans le modèle : un document récent addresse la question, il s'agit de celui de Gary Solon, Steven Haider, and Jeffrey Wooldridge (Février 2013). Nous restons dans le cadre de la spécification amorcée à la section présentant le modèle Tobit généralisé (5.3). Dans le modèle, on suppose que les deux erreurs ez et uz sont reliées par la distribution suivante : D(ez, uz) ti N(0, E) où E est une matrice symétrique définie positive. On peut donc lui appliquer une factorisation de Cholesky 1. Autrement dit, il existe une matrice D0, triangulaire supérieure, telle que E = D0D'0, avec : ? ? a1 a2 D0 = ? 0 a3 On peut écrire 6 = a1e1 + a2e2 u = a3e3 où e1 et e2 sont des variables suivant des lois normales centrées réduites, indépendantes. Ce qui implique pour les variables latentes :
Puisque nous nous intéressons seulement au signe de r*, sans perte de généralités, nous fixons a3 = 1. La matrice E donne : E
1. Toute matrice A symétrique définie positive possède une factorisation du type A = TT', où 0 est une matrice triangulaire supérieure. Le théorème principal est dû à André-Louis Cholesky (1875-1918). Les algorithmes de détermination de T les plus connus sont : l'algorithme de Cholesky (original), l'algorithme de Cholesky-Banachiewicz et l'algorithme de Cholesky-Crout. Il s'ensuit donc que cov(åi, ui) = a2. Pour des raisons de simplifications, nous posons a2 = ñ. Étant donné que ñ peut être nul, nous imposons a1 soit strictement positif pour conserver la qforme générale du modèle. Pour la suite, on pose : óå = a2 1 + a22. Le modèle se présente donc comme suit : (ui ?åi avec ñ ó )N(()(1 ñå E[yz |xi, wi, r = 1] = â'xi + E[åi|ui = á'iwi] = â'xi + (ñóå)[?(áwi)/ (áwi)] = â'xi + (ñóå)ë(áwi) et ë(·) = ?(·)/0(·) (l'inverse du ratio de Mills qui sera estimé dans le modèle), où 0 est la fonction de répartition d'une loi normale univariée, et ? sa densité. Si ñ est positif, on parle d'une sélection positive, dans le sens où l'espérance yz est augmentée. Un estimateur de ó2å peut être obtenu à partir de : Si n0 n0 ~2 = àç'àç P i + (b.ë)2
où çà est le vecteur des résidus obtenu par moindres carrés ordinaires de l'équation yz = â'xi + (ñóå)ë(â'xi) + çi , n0 est le nombre d'observations retenues pour la régression de cette équation, 68 et ri'ë l'estimateur du coefficient ñó. Un estimateur de la corrélation entre åi et ui est : ñà= :6ë/a. Pour une estimation par les moindres carrées, ñà peut être en dehors de l'intervalle [-1, 1], car sa valeur est basée sur une estimation de ë(·) 2 (Heckman, 1979, p.157). Ce qui n'est pas pertinent toutefois. Un estimateur convergent de la matrice de variance-covariance est donnée par : V[AR[àâ, â] = 6-2[X'ëXë]-1[X'ë(I - P2 Ô)Xë + Q][X'ëXë] où Q = àñ2(X'ë ÔXs)V[AR[â](X'sà0Xë) avec Xs, la matrice de toutes les observations wi, Xë est la matrice des observations xi et ),i, I 2. Ceci est valable pour la matrice de variance-covariance la matrice identité, Äà une matrice diagonale avec comme éléments les àäi, et V[AR[àá] la matrice de variance-covariance du modèle probit de sélection (Greene 1981, 2002). Pour obtenir la vraisemblance, la probabilité que yi ne soit observé est donnée par : P[ri = 1|xi, wi] = P[rz < 0|xi, wi] = P[ui < á'wi] = 1 - Ö(á'wi) où Ö est la fonction de répartition d'une loi normale centrée réduite. La distribution conditionnelle de y sachant r = 1 est : H(yi|ri = 1, xi, wi) = (P[yi < 0|ri = 1, xi, wi])1-yi x (P[yi > 0|ri = 1, xi, wi])yi = (P[åi < â'xi|ri = 1, xi, wi])1-yi x (P[åi > â'xi|ri = 1, xi, wi])yi
P[åi < â'xi, ui > á'wi|xi, wi] = Ö(á'wi) )1-yi P [åi > â'xi, ui > á'wi|xi, wi] !yi x Ö(á'wi) 69 Ce calcul invoque les intégrales pour plus de finesse. On vient donc de retrouver la probabilité conjointe suivante : P[ri = 1, yi] = Ö(á'wi) x H(yi|ri = 1, xi, wi) Puisque si r = 0, on a nécessairement y = 0, on en déduit : P[ri = 0, yi = 0|xi, wi] = P[ri = 0|xi, wi] = 1 - Ö(á'wi) La log-vraisemblance est donc donnée par : lnr(è) = Xn (1 - ri)ln(1 - Ö(á'wi)) + Xn riln(Ö(á'wi)) + Xn rilnH(yi|ri = 1, xi, wi) i=1 i=1 i=1 70 Annexe
Copula distributions Usually, D(åi, ui) is considered to be Gaussian. The classic bivariate probit model with non-random sample selection (which relies on bivariate normality and on linear or pre-specified non-linear covariate-response relationships) mainly consists of two equations, describing the underlying unobserved binary outcomes, which are linked through a standard bivariate Gaussian distribution where the correlation coefficient captures the presence of unobservables influencing the two decision-makers 1. But, data can possibly require another distribution approach. To account for non-Gaussian dependence between treatment (ri) and outcome (yi), Winkelmann (2011) discussed the use of copula. Radice, Marra, and Wojtys (2015) proposed an approach to make it possible to deal simultaneously with unobserved confounding, non-linear covariate effects and non-Gaussian dependence between treatment and outcome 2. It is possible in fact to run a selection model for binary data which allows for Gaussian and nonGaussian dependencies through copulae and for the mean and association parameters to be heterogeneous by employing several types of smooth functions of covariates ; this work extended the scope of the approaches presented in Marra and Radice (2013) and McGovern, Barnighausen, Marra, and Radice (2015). The probability of event (y1i = a, y2i = b), for a, b E {0, 1}, can be defined as 3 :
where D E {0°, 90°, 180°, 270°}, P(yvi = 1) = 0(çvi for v = 1, 2. 0 is the cumulative distribution function (cdf)of the standard univariate Gaussian distribution. çvi E 118 is a linear regressor, C00 is a two-place copula function (Sklar 1959, 1973), èi is an association parameter measuring the dependence between P(y1i = a) and P(y2i = a), and : C900(ui, vi) = vi - C00(1 - ui, vi; èi) C1800(ui, vi) = ui + vi - 1 + C00(1 - ui, 1 - vi; èi) C2700(ui, vi) = vi - C00(ui, 1 - vi; èi)
71 avec ui = P(y1i = a) and vi = P(y2i = b) The marginal cdfs are conditioned on covariates (through r71i and 172i), but for notational convenience we have suppressed this when expressing them. Since the strength and direction of the association between the two marginals may, for instance, vary across groups of observations, the dependence parameter is specified as a function of a linear predictor : ei = m(ri3i), where m is a one-to-one transformation which ensure that ei lies in its range. Phi2 is the cdf of a standard bivariate normal distribution with correlation coefficient e. Quantity e is set to the machine smallest positive floating-point number multiplied by 106, and is used in some cases to ensure that the dependence parameters lie in their respective ranges. Tableau G.1 - Definition of copulae with corresponding ranges of association parameter Oi
72 Annexe
Les fonctions d'influence du Modèle estimé en deux étapes Nous restons avec les hypothèses énoncées au paragraphe de la robustesse de Zhelonkin. La fonction d'influence de l'estimateur en deux étapes du modèle de sélection est donnée par : (IF(z; T, F) = M-1 Ø2(z(2); h(z(1); S(F)), T(F) + f ? Ø2(z(2); è, T(F)) ?ç ? h((z(1); ç)dF(z).IF(z; S, F)) avec M = - f 4Ø2(z(2); è, î)dF(z), Ø2(z(2); h(z(1); S(F)),T(F)) = ?logf2 ?â avec f2 la vraisemblance du modèle à l'étape 2, S une fonctionnelle de la distribution des observations z, de telle sorte que S(F) = á, S(FN) = àá, h(z(1); S(F)) étant l'inverse du ratio de Mills. La log-vraisemblance de la première étape (première régression) étant donnée par : N E [ylog{Ö(á0w)} + (1 - y)log{1 - Ö(á'w)}] i=1 et donc on a : IF(z; S, F) = M(Ø1, F)-1Ø1(z(1); S(F)), avec : Ø1(z(1); S(F )) = ?logf1 ?á y - Ö(á0w) = , et M(Ø1, F) = [(á'w){1 (á'w)2f - Ö(á w)}J Ce calcul peut être fait pour la deuxième étape également en remplaçant dans la log-vraisemblance le terme /3'x par /3'x + /3Ah(z(1); S(F)). La variance asymptotique a pour formule : fV (T, F ) = IF(z; T, F)IF(z; T, F)TdF(z) et la fonction de changement de variance1 qui mesure l'influence de la moindre contamination sur la variance de l'estimateur (et donc par conséquent l'influence sur l'amplitude de l'intervalle de confiance de l'estimateur) est donnée par : [CV F (z; T, F ) = (a/aå)V (T, FE)]E=0 Pour borner la fonction d'influence, Zhelonkin et al. (2013) ont modifié la fonction score, dont les détails sont précisés dans leur thèse. 73 1. The change-of-variance function (CVF) (en anglais).
Tableaux générés pour l'analyse économétrique Dans cette partie, les abréviations TE et OE, signifiant Treatment Equation et Outcome Equation, désignent respectivement dans les régressions l'équation de sélection et l'équation de régression sur l'auto-emploi. Tableau I.1 - Modèle de sélection I avec dépendance gaussienne Variables Equation de Sélection Régression sur l'auto-emploi
Situation financière du Ménage Modalité de référence : Situation facile Plutôt aisée -0.8852*** (0.3359) -1.0878*** (0.3252) Dans la moyenne nationale Plutôt difficile -1.1835*** (0.3247) -2.636 0.2282*** 5.0050 5.2410 4.9570 (0.0456) -3.3450 0.2173*** (0.0415) -3.3460 0.2064*** (0.0416)
Niveau d'instruction Modalité de référence : Aucune éducation formelle
(0.0500) (0.0182)
(0.3246) (0.0446) Age Modalité de référence : 15-20 ans 20-25 -0.7804*** -15.5150 - - - - - - (0.0503) 25-29 -0.8498** -14.4310 - - - - - - (0.0589) sigma(ó) 0.3670*** 87.2760 ; rho(ñ) 0.1928*** 3.0560 (0.0042) (0.0631) 74 Nombre d'itérations = 10000
*** ( signif. au seuil de 1%) ** ( signif. au seuil de 5%) * ( signif. au seuil de 10%) 75 Tableau I.2 - Modèle de sélection II avec dépendance gaussienne Variables Equation de Sélection Régression sur l'auto-emploi
Situation financière du Ménage Modalité de référence : Situation facile
(0.2949) (0.0497)
Niveau d'instruction Modalité de référence : Aucune éducation formelle
(0.0502) (0.0202)
Sexe Modalité de référence : Homme Femme 0.3722*** 9.7090 0.0522*** 4.5090 (0.0383) (0.0116)
Age Modalité de référence : 15-20 ans 20-25 -0.5331*** -9.8620 - - - - - - (0.0541) 25-29 -1.0791** -19.6800 - - - - - - (0.0548) sigma(ó) 0.3980*** 47.08 ; rho(ñ) 0.6620*** 11.64 4.8720 Plutôt difficile -0.6239** (0.2761) -2.260 0.2173*** (0.0446) 4.7650 Difficile -0.1267 (0.2771) -0.4570 0.2167*** (0.0455) (0.0085) (0.0569)
*** ( signif. au seuil de 1%) ** ( signif. au seuil de 5%) * ( signif. au seuil de 10%) 76 Tableau I.3 - Modèle de sélection III avec dépendance gaussienne Variables Equation de Sélection Régression sur l'auto-emploi
Situation financière du Ménage Modalité de référence : Situation facile
(0.5668) (0.0555) Niveau d'instruction Modalité de référence : Aucune éducation formelle Primaire 0.5178*** (0.0435) Secondaire 0.8079*** (0.0460) Post-secondaire 1.0058*** (0.0819) 11.9140 0.1192*** (0.0180) 17.5640 0.0842*** (0.0158) 12.2760 0.1568*** (0.0261) 6.6420 5.3210 6.0100 0.7150 Plutôt difficile -0.7010 (0.5445) -1.2870 0.0360 (0.0503) 3.8190 Difficile -0.3405 (0.5449) -0.6250 0.1956*** (0.0512) Dans la moyenne nationale -0.6985 -1.2820 0.0918* (0.5446) (0.0503) 1.826 Migrant Modalité de référence : Non
(0.2157) (0.0799)
(0.5442) (0.0513) Age Modalité de référence : 15-20 ans
*** ( signif. au seuil de 1%) ** ( signif. au seuil de 5%) * ( signif. au seuil de 10%) 77 Tableau I.4 - Modèle de sélection IV avec dépendance gaussienne Variables Equation de Sélection Régression sur l'auto-emploi
Situation financière du Ménage Modalité de référence : Situation facile
(0.2896) (0.0432)
Niveau d'instruction Modalité de référence : Aucune éducation formelle
Sexe Modalité de référence : Homme Femme -0.0136 -0.3170 0.0225** 2.3140 (0.0428) (0.0097) Etat civil actuel Modalité de référence : Célibataire/jamais marié (e) 2.4570 -0.7170*** (0.2752) Dans la moyenne nationale -2.6050 0.0964** (0.0392) 2.6660 Plutôt difficile -0.5521** (0.2749) -2.0080 0.1046*** (0.0392)
Séparé(e)/divorcé(e) -0.0560 0.276 0.1046 2.6660 (0.2030) (0.0392) Veuf(ve) 0.1271 0.2930 0.5821 5.0130 (0.4335) (0.1161)
(0.2775) (0.0434) Age Modalité de référence : 15-20 ans 20-25 0.1172** 2.0390 - - - - - - (0.0575) 25-29 0.0460 0.6820 - - - - - - sigma(ó) 0.3491*** 54.0660 ; rho(ñ) 0.3085*** 4.2280 (0.0065) (0.0730)
*** ( signif. au seuil de 1%) ** ( signif. au seuil de 5%) * ( signif. au seuil de 10%) 78 Tableau I.5 - Modèle de sélection V avec dépendance gaussienne Variables Equation de Sélection Régression sur l'auto-emploi
Situation financière du Ménage Modalité de référence : Situation facile
(0.3211) (0.0390)
2.3370 Plutôt difficile -0.7194** (0.3081) -2.3350 0.0847** (0.0356) 0.6410 Difficile -0.3146 (0.3097) -1.0160 0.0231 (0.0360) -13.5550 Primaire 0.3843*** 6.9540 -0.1917*** Niveau d'instruction Modalité de référence : Aucune éducation formelle (0.0553) (0.0141)
Sexe Modalité de référence : Homme Femme 0.2688*** 5.9820 0.0335*** 3.8510 (0.0449) (0.0087) Etat civil actuel Modalité de référence : Célibataire/jamais marié (e)
38.2370 -0.5375*** (0.0594) Marié (e) (civil, religieux, coutumier) -9.0430 0.4494 *** (0.0118) Séparé(e)/divorcé(e) -0.3640* (0.1922) -1.8940 0.5845*** (0.0493) 11.868 Veuf(ve) -0.0186 (0.4097) -0.0450 0.5773*** (0.1020) 5.6580 Atacora 0.1992** 2.1610 -0.0262 -1.0350 Département Modalité de référence : Alibori (0.0922) (0.0253)
0.3170 -0.5800 -0.7610 Littoral 0.4415*** (0.1004) Mono 1.2475*** (0.1167) Ouémé 0.6504*** (0.0962) 4.3990 0.0078 (0.0245) 10.6860 -0.0152 (0.0261) 6.8240 -0.0185 (0.0244) Plateau 0.8676*** (0.0986) 8.7960 0.0279(0.0256)1.0870 Zou 0.7437*** (0.1043) 7.1320 -0.0686*** (0.0243) -2.8210 7.3300 Constante 0.7133** (0.3113) 2.2910 0.2932 (0.0400) 20-25 -1616*** -2.7210 - - - - - - Age Modalité de référence : 15-20 ans (0.0593) 25-29 -0.1216* -1.8610 - - - - - - sigma(ó) 0.3154*** 96.2000 ; rho(ñ) -0.6731*** -45.8100 (0.0033) (0.0147)
tions = 10000 *** ( signif. au seuil de 1%) ** ( signif. au seuil de 5%) * ( signif. au seuil de 10%) 79 - 4.6999e05 (0.0001) 1.6068e04 (0.0002) - 0.0968*** (0.0134) - 0.0366*** (0.0156) -0.0189 (0.0654) 0.1160 (0.0991) 2.4632e04 (0.0003) Post-secondaire -0.1975 (0.1465) 0.0872*** 0.1338 (0.1980) Femme 0.0553*** (0.0414) 4.4066e- 04** (0.0002) - 0.0247** (0.0096) 0.2665*** (0.0437) Tableau I.6 - Modèle de sélection VI Variables TE :Co- OE :Co- OE :Co- efficients (Ecart-type) efficients (Ecart-type) efficients (Ecart-type) TE :Coefficients (Ecart-type) Régression simple Régression robuste Situation financière du Ménage Modalité de référence Situation facile -0.0096 (0.2894) 0.1978*** -0.4045 (0.3727) (0.0433) -0.4985* (0.2720) 0.1898*** -0.7570** (0.3577) (0.0393) -0.8597** (0.3571) -0.1485 (0.2739) 0.1553*** -0.3620 (0.3589) (0.0401) Difficile Niveau d'instruction Modalité de référence Aucune éducation formelle Niveau d'instruction du pere Modalité de référence Aucune éducation formelle -0.0301 (0.0810) - 1.4696e04 (0.0002) Primaire - 0.0419*** (0.0159) -0.0867 (0.0831) Niveau d'instruction de la mere Modalité de référence Aucune éducation formelle - Post-secondaire 0.7937*** (0.2404) -0.0406 -0.5902 (0.3164) (0.0567) 0.2084 Secondaire (0.1462) 0.1695*** 0.1107 (0.1655) (0.0232) 1.7022e04 (0.0002) - 9.2809e04 (0.0008) Sexe Modalité de référence Homme Age Modalité de référence 15-20 ans 0.0762*** - 0.5094*** (0.0530) (0.0123) 0.4513*** - 0.4365*** (0.0518) (0.0132) 9.9350e- 01*** (0.0035) Constante 1.0095*** (0.2731) 0.0230 1.0267*** (0.3572) (0.0424) 0.2301 (0.2735) 0.3888* Oui (0.2332) 73.2260 (T-stat.); sigma(ó) 0.3485*** (0.0048) 5.1260 rho(ñ) 0.2749*** (0.0536) (T-stat.) Nombre d'itérations = 10000 Algorithme de maximisation SANN Robust IMR 7.4506e-03 ** (0.0033) Log-Likelihood -4433.6600 (dl=37) -0.2844*** (0.0551) -0.2439*** (0.0533) - 3.4499e04** (0.0002) 7.0565e04 (0.0012) Bénificaire de transferts d'argent Modalité de référence Non 20-25 25-29 *** ( signif. au seuil de 1%) ** ( signif. au seuil de 5%) * ( signif. au seuil de 10%) 0.1251*** Plutôt difficile (0.0394) - 0.5867** (0.2715) - 9.9403e01*** (0.0032) 1.4124*** (0.1391) 0.4590*** (0.0547) 1.1979*** (0.0607) - 9.9545e01*** (0.0026) - 9.9397e01*** (0.0032) - 0.0743*** (0.0171) Primaire 0.5628*** (0.0536) - 0.1714*** (0.0177) Secondaire 1.3818*** (0.0587) - 0.3071*** (0.0245) Post-secondaire 1.1332*** (0.1061) Primaire 0.2184*** (0.0648) 0.2345** Secondaire (0.0925) Plutôt aisée Dans la moyenne nationale - 1.3999e04 (0.0002) - 6.7968e04** (0.0003) - 8.8371e04** (0.0004) - 8.8371e04** (0.0004) 80 Tableau I.7 - Modèle de sélection VII avec dépendance gaussienne Variables Equation de Sélection Régression sur l'auto-emploi
Avoir reçu une formation professionnelle Modalité de référence : Non
(0.1932) (0.0351)
81 |
|