2.3.3. Analyse descriptive
Nous avons effectué une analyse descriptive des
variables avec StataIC 15. Cette analyse porte sur la moyenne,
l'écart-type, le minimum et le maximum de nos variables de recherche.
2.3.4. Analyse
économétrique
o Spécification du modèle de
régression
Lorsqu'une étude porte sur un ensemble de plusieurs
pays ou régions, il devient peu commode d'utiliser un modèle de
régression linéaire multiple sur des séries temporelles.
D'où le recours à un modèle de panel.
Le modèlede panel part d'une fonction de production
Cobb-Douglas et s'écrit comme suit : ; Avec = le flux d'IDE entrant observé dans l'espace UEMOA ;t=
représente le temps (1996-2016) ;i= représente les pays
(Bénin, BurkinaFaso, Côted'Ivoire, Guinée-Bissau, Mali,
Niger, Sénégal, Togo) ; = vecteur des variables exogènes (Contrôle de la
corruption,taux d'ouverture commerciale, taux d'inflation et stabilité
politique) ; = représente le terme d'erreur et = paramètres du modèle(Greene, 2003a).
En insérant les variables de notre recherche, on
a :
Les facteurs, contrôle de la corruption, taux
d'ouverture commerciale, taux d'inflation et stabilité politiquepeuvent
varier entre les pays et les années considérées.
En cas d'homogénéité totale, l'équation devient :
Mais en présence
d'hétérogénéité partielle, seule on obtient un modèle avec des effets individuels :
Après estimation des paramètres du
modèle, le coefficient d'une variable explicative
précédé du signe (+) indique une relation positive entre
cette variableexplicativeet la variable expliquée alors que le signe (-)
indique une relation négative entre la variableexplicative et la
variable expliquée. Ce qui permet de prendre une position par rapport
aux hypothèses de recherche à savoir de les confirmer ou de les
infirmer.
o Technique d'estimation
1- Test de multicolinéarité : le
test variance inflation factor(VIF)
Dans une régression, la multicolinéarité
est un problème qui survient lorsque certaines variables de
prévision du modèle mesurent le même
phénomène. Une multicolinéarité prononcée
s'avère problématique, car elle peut augmenter la variance des
coefficients de régression et les rendre instables et difficiles
à interpréter. Les conséquences de coefficients instables
peuvent être les suivantes : i) les coefficients peuvent sembler non
significatifs, même lorsqu'une relation significative existe entre le
prédicteur et la réponse ; ii)les coefficients de
prédicteurs fortement corrélés varieront
considérablement d'un échantillon à un autre ; iii)
lorsque des termes d'un modèle sont fortement corrélés, la
suppression de l'un de ces termes aura une incidence considérable sur
les coefficients estimés des autres. Les coefficients des termes
fortement corrélés peuvent même présenter le mauvais
signe.
La matrice de corrélation construit une idée
claire sur le degré d'association entre les variables de recherche.
Cette matrice permet de savoir s'il existe une corrélation forte, due
à l'existence des variables liées linéairement, à
travers les coefficients de corrélation
élevés.L'étude des matrices de corrélations ne
permet pas certainement de détecter tous les problèmes de
multicolinéarité (Hamilton,2004).
L'approche la plus classique consiste à examiner les facteurs
d'inflation de la variance (FIV) ou variance inflation factor(VIF) en anglais.
Les FIV estiment de combien la variance d'un coefficient est augmentée
en raison d'une relation linéaire avec d'autres
prédicteurs.Au-delà de2,5 on peut considérer qu'il y a
multicolinéarité(Paul D.Allison).
2- Test d'homogénéité du
panel : HSIAO
Dans les études de données de panel, il apparait
nécessaire de s'assurer de la spécification homogène ou
hétérogène du processus générateur des
données(Doucouré, 2008). Cela revient à tester
l'égalité des coefficients et des constantes du modèle
étudié dans la dimension individuelleafin de déterminer la
structure du panel. Le test de spécification permet de déterminer
si lemodèle théorique est parfaitement identique pour tous les
pays ou s'il existe des spécificités propres à chaque
pays. Hsiao (1986) propose une procédure séquentielle de tests
permettant de définir le cas dans lequel nous nous situons.Ainsi, les
tests de spécification sont faitséquation par équation
afin de retenir la méthode d'estimation la plus appropriée pour
l'ensemble du modèle.
Trois cas de figure peuvent se présenter :
i-)Homogénéité totale ( ) ;ii-)Hétérogénéité partielle
( ; iii-)Hétérogénéité totale
( ). Dans ce dernier cas, on rejette la structure du panel.
3- Tests de spécification des effets
individuels
En cas d'hétérogénéité
partielle, pour tirer parti de la double dimension, spatiale et temporelle,
différents schémas de variation des paramètres sont
disponibles : les modèles à effets fixes et les modèles
à aléatoires.
* Le test de Fisher (Likelihood Ratio
Test)nous permet d'affirmer la présence ou non d'effets fixes.
Les hypothèses émises lors de ce test sont les suivantes :
H0 : Absence d'effets fixes
H1 : Présence d'effets fixes
Règle de
décision :
Il y a présence effective d'effets fixes lorsque la
probabilité associée à ce test est inférieure au
seuil conventionnel de 5 % (P ?0,05).
* Le test de Breusch et Pagan(Langrange Multiplier
test)est un test d'effets individuels aléatoires
effectué pourdétecter la présence ou non d'effets
aléatoires dans le modèle. Les hypothèses émises
lors de ce test sont les suivantes :
H0 : Absence d'effets aléatoires
H1 : Présence d'effets aléatoires
Règle de
décision :
Il y a présence effective d'effets aléatoires
lorsque la probabilité associée à ce test est
inférieure au seuil conventionnel de 5 % (P ? 0,05).
* Le test de spécification d'Hausman
(1978) est un test général qui s'applique à de
nombreux problèmes en économétrie. Dans ce travail, il
sert à discriminer les effets fixes et aléatoires. Nous utilisons
ce testpour valider définitivement le choix du modèle.
Hypothèsenulle : Le modèle est un
modèle à effets aléatoires ;
Hypothèsealternative : Le modèle est un
modèle àeffets fixes.
Règle de décision
L'on accepte l'hypothèse nulle de présence
d'effets aléatoires si P >0,05.
4- Test de Wald et de Wooldridge
On doit vérifier si lavariance des erreurs est la
même pour tous lesindividus : = .Pour la corrélation, on doit vérifier queles erreurs ne
sont pas autocorrélées, et ce, pour chaque individu.
Les tests de Wald et Wooldridge utilisent le premier
décalage des résidus de régression pour tester
respectivement la présence
d'hétéroscédasticité et
d'autocorrélation.
* Le test de Waldse formalise
commesuit :Hypothèsenulle :
Homoscédasticité ;Hypothèsealternative :
Hétéroscédasticité.
Règle de décision
Si la p-value du test est supérieur à 5 %
(P >0,05) nous concluons que les erreurs sont homoscédastiques.
Mais lorsqu'onacceptel'hypothèsealternative(P ? 0,05),il y
ahétéroscédasticité, la variance des termes
d'erreur de régression n'est pas constante dans le temps.
* Le testde
Wooldridged'autocorrélation de premier ordrese formalise comme
suit :Hypothèsenulle : Absence
d'autocorrélation ;Hypothèsealternative :
Présence d'autocorrélation.
Règle de décision
Si la p-value du test est supérieur à 5
%(P > 0,05) nous concluons que les erreurs sont non
corrélées en validant l'hypothèse nulle d'absence
d'autocorrelation. Dans le cas contraire oùP ? 0,05 c'est
l'hypothèse alternative qui est acceptée (la présence
d'autocorrélation).
5- La méthode des Moindres Carrés
Ordinaires (MCO) et la méthode des Moindres Carrés
Généralisés (MCG)
S'il n'y a aucun effet individuel, les estimateurs MCO usuels
sont valides. On effectue alors du « pooling»,c'est-à-dire
qu'on considère les données comme N*T observations
non-panéliséeset oneffectue une régression standard.S'il y
a des effets individuels, on utilise les modèles à effet fixe ou
aléatoire selon la nature des effets individuels discriminée par
le test d'Hausmann. Les effets individuels sont donc éliminés et
l'estimateur de MCO peut être utilisé sur les nouvelles variables.
Cependant si on conclut à la présence
d'hétéroscédasticité, on utilise alors les MCG (GLS
enanglais) où :
Il revient à appliquer les MCO sur le modèle
transformé :
où
· Outils d'analyse
Les tests de spécifications ainsi que les estimations
sont faits sous le logiciel StataIC15. Les données sont
constituées à partir du logiciel Excel.
Dans la suite, la présentation et l'analyse des
résultats obtenus d'après cette méthodologie.
Chapitre 3 : Présentation et analyse des
résultats
|