2.2.1 Simple ou multiple ?
La régression linéaire simple permet
d'étudier et de mesurer la relation mathématique qui peut exister
entre deux variables quantitatives : Une variable expliquée (Y) et une
variable explicative (x). La force d'association entre les deux variables est
estimée par le coefficient de corrélation (r). Ce coefficient
peut aller de -1 à +1. S'il est compris entre 0,8 et 1 (en valeur
absolue), la force d'association entre les deux variables est importante, entre
0,5 et 0,8 elle est modérée, entre 0,2 et 0,5 elle est faible, et
très faible en dessous. Un signe positif traduit une association
positive : la valeur moyenne de y croît avec x. Une association
négative traduit l'opposé : la valeur moyenne de y
décroît lorsque x croît.
La régression linéaire multiple est une
généralisation du modèle linéaire simple dans
lequel figurent plusieurs variables. En réalité, il
est rare que l'on puisse expliquer correctement
1 Ouellet E., « Guide d'économétrie
appliquée pour Stata, ECN et FAS », Université de
Montréal, Canada (Québec), (Août 2005) pp : 16 - 20
L'efficacité technique des banques et ses facteurs
explicatifs : application à la Commercial Bank - Cameroun
|
2010
|
|
|
les variations d'une variable par celles d'une seule autre
variable. En général, l'étude d'un phénomène
met en jeu plusieurs variables explicatives.
2.2.2 Régression linéaire multiple :
Spécification et hypothèses
Soit Y la variable endogène (variable expliquée)
et x1, x2,... xk les variables exogènes (variables explicatives).
Åi est le terme de l'erreur, ai le coefficient de la variable
explicative, k le nombre
de variables explicatives et n le nombre d'observations. Le
modèle de régression multiple s'écrit :
Yi = a0 + a1x1i + a2x2i +... +
akxki + åi.
Le modèle se répète n fois, avec i = 1,... n
:
Y1 = a0 + a1x11 + a2x21 +... +
akxk1 + å1 ;
Y2 = a0 + a1x12 + a2x22 +... +
akxk2 + å2 ; ...
Yn = a0 + a1x1n + a2x2n +... +
akxkn + ån.
Pour gérer les termes de l'erreur, l'on pose un certain
nombre d'hypothèses. L'on distingue généralement 05
hypothèses dites stochastiques (qui portent sur les l'erreur et les
variables) et 03 hypothèses dites structurelles (qui portent sur les
caractéristiques du modèle) :
Les hypothèses stochastiques s'énumèrent de
H1 à H5 : elles s'énoncent ainsi :
H1 : L'espérance de l'erreur est nulle ;
H2 : la variance de l'erreur est constante ;
H3 : Les erreurs sont non corrélées ;
H4 : L'erreur est indépendante des variables explicatives
;
L'efficacité technique des banques et ses facteurs
explicatifs : application à la Commercial Bank - Cameroun
|
2010
|
|
|
H5 : X est certaine, c'est-à-dire que les valeurs
xit sont observées sans erreur. Les hypothèses
structurelles quant à elles s'énumèrent de H6 à
H8
H6 : Absence de colinéarité entre les variables
explicatives ;
H7 : soit X la matrice des variables explicatives. X'X/n tend
vers une matrice finie non singulière ;
H8 : n > k + 1, le nombre d'observations est supérieur
au nombre de variables explicatives
|