1° Echantillonnage
Après une descente sur terrain au niveau de
l'organisation nationale de l'emploi (ONEM) au niveau de la
ville de Goma, nous avons constaté que la base des données qui
renferme toutes les personnes plus précisément les jeunes qui
sont au chômage (qui cherchent d'être inséré)
contient des données manquantes, cela pour dire qu'il y a un bon nombre
des jeunes qui ne sont pas enregistré dans leur base.
Alors comme dans ce cas le nombre de la population
(N) n'est pas bien connu ; nous avons passé par
l'estimation d'une manière aléatoire de la taille de
l'échantillon (n) en passant par la formule
probabiliste tirée dans le livre de la statistique appliquée en
économie54. Qui sera de :
54 Déo BUGANDWA, sondage, cours inédit,
UNIGOM, 2017-2018, Pg.25
n = ??á2×??×??
e2
(1,96)2×0,5×0,5
n=
(0,08)2
44
3,8416×0,25
n=
0,0064
n = 150
2° source des données
L'objectif de cette étude est de saisir les facteurs
déterminants l'insertion des jeunes dans le secteur public ; parmi les
jeunes de la ville de Goma de 15-40 ans. Cette préoccupation va nous
conduire à la création d'une base de données de
l'enquête pour notre étude grâce au logiciel Excel.
3° collecte des données
La collecte de nos données s'est faite d'une
manière aléatoire au sein des entreprises publiques et de
Régie financière se trouvant dans la ville de Goma.
4° Présentation des variables
Dans cette étude, la variable dépendante voir
même réponse est l'insertion des jeunes dans le secteur public en
province du Nord-Kivu en général et dans la ville de Goma en
particulier. Nous avons retenu comme variables indépendantes ou
explicatives à savoir : le sexe, le statut matrimonial,
âge, carte de demandeur, effet de l'origine social, Religion, Niveau
d'étude, la connaissance, Grade, Test, préférence et la
tribu. Pour appréhender ces variables ; nous avons fait recours aux
travaux antérieurs car bien même il y en a d'autres qui peuvent
expliquer bien la variable réponse mais qui seront placées dans
le terme d'erreur
Tableau 1 : Opérationnalisation des variables
d'études
Source : travaux antérieurs
Le signe (+) pour le statut matrimonial, la connaissance et
l'effet de l'origine social veut dire que la relation entre ces
dernières et l'insertion des jeunes dans le secteur public est positif,
c'est-à-dire qu'à chaque fois que le nombre de jeunes augmente
dans ce secteur, ces dernières augmentent aussi selon nos
données. C'est pourquoi pour le modèle estimé, nous allons
retenir que ces variables qui ont un signe positif tandis que les autres seront
utilisées dans la statistique descriptive pour les effectifs.
5° Technique de collecte des
données
Pour recueillir les données, les techniques et
méthodes suivantes ont été utilisées :
La technique documentaire : Selon GRAWITZ,
M.55, cette dernière consiste en une fouille
systématique de tout ce qui est écrit ayant une liaison avec le
domaine de recherche. Il s'agit les ouvrages, les mémoires, les
rapports, et les notes de cours ainsi que les sites web, etc.
La technique d'interview : consiste à
faire des entretiens au cours desquelles le chercheur interroge des personnes
qui lui fournissent des informations relatives à son sujet de recherche.
La technique de questionnaire : est une série de
questions méthodiquement posées afin de définir un cas,
une situation, une demande parmi un grand nombre de possibilités.
Les logiciels SPSS 23.0 ; STATA 10
et Excel vont nous permettre de faire les analyses et
les traitements de nos données.
La méthode statistique : est
l'étude d'un phénomène par la collecte de données,
leur traitement, leur analyse, l'interprétation des résultats et
leur présentation afin de rendre les données
compréhensibles par tous.
La méthode inductive : est une
méthode scientifique qui tire des conclusions générales
à partir de prémisses particulières. C'est la
méthode scientifique la plus courante, dans laquelle on peut distinguer
quatre étapes essentielles : l'observation des faits à consigner
; la classification et l'étude de ces faits ; la dérivation
inductive, qui part des faits et permet une généralisation ; et
le contraste56.
Une double approche est adoptée dans ce travail en
fonction des objectifs assignés :
55 GRAWITZ, Z. : Méthodes des sciences
sociales, 4ème éd. Dalloz, Paris, 1979, p.571
56 Abbé LETAKAMBA, Initiation à la
recherche scientifique, cours inédit, UNIGOM, 2014-2015, Pg 25
47
? L'approche statistique : elle rendra
compte des combinaisons des différents éléments de
l'insertion des jeunes. De cette approche sera décelé du point
suivant : les déterminants liés à l'insertion des jeunes
de la ville de Goma.
? L'approche analytique permettra
d'interpréter les données relatives aux
Caractéristiques de l'insertion des jeunes et ses
déterminants.
6° Méthodes d'analyse
Le choix des méthodes d'analyse a été
guidé par les objectifs du travail, la nature des hypothèses
(descriptive ou explicative), la taille de l'échantillon et la nature
des variables (qualitatives ou quantitatives). Trois méthodes d'analyse
statistique complémentaires seront utilisées dans le cadre de
notre travail. Il s'agit de l'analyse descriptive (analyses univariées),
du test du Chi-carré (analyses bivariées) et la régression
logistique binaire (analyses multivariées).
Le logiciel Excel sera utilisé pour les
dépouillements tandis que le logiciel SPSS (Statistical Package for
Social Sciences) version 23.0 sera aussi utilisé pour les analyses des
données. Et enfin une discussion à la lumière de la
littérature existante de ces analyses statistiques.
7° Population d'étude
Notre population d'étude est composée des
individus répondant aux caractéristiques suivantes :
- Tranche d'âge : 15 à 40 ans ;
- Niveau d'étude : supérieur (universitaire) ;
- Milieu de résidence : la ville de Goma (secteur
public).
Ainsi, notre base des données sera constituée de
150 enquêtés.
8° Les techniques d'analyse
Pour traiter la masse et la complexité des
informations recueillies dans l'enquête sur le terrain, des
méthodes descriptives et explicatives devront être mises en
oeuvre. Les méthodes descriptives seront utilisées comme un
préalable aux méthodes explicatives.
Les analyses descriptives
a) Les analyses descriptives
univariées
L'objectif de ces analyses est de décrire
individuellement chaque variable dans la base de données. Ces analyses
permettront de voir le comportement des variables choisies pour notre
étude en termes de distribution des fréquences.
48
b) Les analyses descriptives
bivariées
Celles-ci, en utilisant le test de chi-deux, permettent
d'appréhender les significations statistiques des relations qui existent
entre l'insertion des jeunes et les autres variables de l'étude. Au
seuil de signification inférieur à 0,05 donné par le
logiciel SPSS 23, on dira qu'il y a lien significatif entre les variables. Au
cas contraire, on niera tout lien significatif en acceptant simplement
l'hypothèse nulle de la relation significative entre les variables. Et
pour les variables où les relations donneront une signification
statistique, nous ferons recours au test de khi pour mesurer la force du
lien.
Modélisation statistique : la
méthode explicative
Elle nous permettra d'évaluer la propension des
individus à risque de connaître le phénomène
étudié et de prendre en compte un certain nombre de variables
indépendantes pouvant influencer cette transition et les chances qu'ont
les jeunes diplômés de vivre cet événement.
Techniquement, la variable à expliquer de notre
modèle de régression est le risque instantané d'être
inséré après ses études universitaires. Ce risque
évolue au cours du temps de manière autonome mais la forme de
cette évolution n'est pas précisée.
9° Présentation du modèle
La variable à expliquer dans ce travail de recherche
est un événement dichotomique : sont insérés dans
une entreprise publique ou sont insérés dans une régie
financière. En d'autres termes, il s'agit d'un modèle de choix
binaires où il faut calculer la probabilité d'être ou de
n'est pas être inséré étant donné l'existence
des variables explicatives retenues.
Dans cette étude, la variable dépendante est
insertion chez les jeunes intellectuels en province du Nord-Kivu. Nous avons
retenu comme variables indépendantes ou explicatives à savoir :
le sexe, le statut matrimonial, âge, carte de demandeur, effet de
l'origine social, Religion, Niveau d'étude, la connaissance et la
tribu.
De ce qui précède, la forme linéaire du
modèle est :
Y=Xf3+...+å
Où Y est la variable à expliquer (insertion des
jeunes) ; f3 est le vecteur des coefficients à estimer. Puisque Y est
une variable binaire (Y=0 sont insérés dans l'entreprise publique
et Y=1 sont insérés dans la régie financière), nous
estimons commode de travailler avec un modèle à variables
limitées : le modèle Logistique.
a) Présentation théorique du modèle
général
Le modèle Logistique est l'un des modèles
à variables limitées c'est-à-dire des variables qui ne
peuvent prendre que certaines valeurs. A côté du modèle
Logit il y a aussi le modèle
49
Probit. Ces deux modèles sont une modélisation
non linéaire des modèles à variables limitées. La
spécification linéaire n'est pas appropriée pour ces types
de modèles pour entre autres trois raisons57 :
1. Lorsqu'on a un modèle linéaire simple
à une variable dichotomique, puisque la variable à expliquer ne
peut prendre que deux valeurs (0 et 1, ou autre codage), les coefficients 13
associés aux variables explicatives ne sont pas directement
interprétables.
2. Il est impossible d'ajuster de façon satisfaisante,
par une seule droite, le nuage de points associé à une variable
dichotomique qui, par nature, est réparti sur deux droites
parallèles.
3. a) sachant que la variable endogène dichotomique ne
peut prendre que deux valeurs 0 ou 1, la perturbation åi admet
nécessairement une loi discrète, ce qui exclut en particulier
l'hypothèse de normalité des résidus.
b) lorsque l'on suppose que les résidus åi sont
de moyenne nulle, la probabilité pi associée à
l'événement yi=1 est alors déterminée de
façon unique. En effet, lorsqu'on écrit l'espérance des
résidus:
E(ei) = pi(1 - xii3) - (1 - pi)xii3 = pi - xii3 = 0
On en déduit que
pi= xii3 = Prob(y1 =
1)
Ainsi la quantité xi 13 correspond à une
probabilité et doit par conséquent satisfaire un certain nombre
de propriétés et en particulier appartenir à l'intervalle
fermé [0,1]. 0 < xi13 < 1 pour tout i=1, ..., N. Or rien ne
rassure que de telles conditions soient satisfaites par l'estimateur des
moindres carrés utilisé dans le modèle linéaire.
c) ces modèles sont des modèles qui sont par
nature hétéroscédastiques et ce problème
d'hétéroscédasticité ne peut être
résolu par une méthode d'estimation des Moindres Carrés
Généralisés tenant compte de la contrainte
d'inégalité 0 < xi13 < 1.
Pour ces différentes raisons, la spécification
linéaire des variables endogènes qualitatives, et plus
spécialement dichotomiques, n'est pas utilisée, c'est pourquoi on
recourt notamment à des modèles Logit ou Probit pour
représenter ces variables.