IV-1-2 L'estimation
A l'instar de Matambalya et Wolf (2001) ou de Chowdyuru (2006),
la technique que nous emploierons pour évaluer les paramètres
aj est la technique dite des
moindres carrés ordinaires (MCO). La problématique
est :
· D'estimer les paramètres aj en
exploitant les données ;
· D'évaluer la précision de ces estimations
;
· De mesurer le pouvoir explicatif du modèle.
L'approche des MCO consiste à rechercher les valeurs des
paramètres qui
N
minimisent la somme des carrés des erreurs, à
savoir ??
S =
i 1
|
c . En adoptant la forme
2 i
|
|
matricielle, nous minimisons donc S = ???
.
? S
Ce qui revient à rechercher les solutions de = 0 . Nous
disposons de
? ?
p + 1 équations, dites normales, à
résoudre ; avec p désignant le nombre de variables
explicatives.
66
La solution obtenue est l'estimateur des MCO. Il s'écrit
:
?à = (XX ?
)-1(X'Y)
X est la matrice des variables explicatives et
Xt sa transposée ; Y est le vecteur colonne de la
variable dépendante.
Cet estimateur possède d'excellentes
propriétés lorsque les hypothèses de base
sont respectées. Il est alors sans biais (ici, E
(a à ) = a), convergent
c'est-à-dire que la variance des estimateurs tend vers zéro
lorsque le nombre d'observations tend vers l'infini ; BLUE (meilleur estimateur
linéaire sans biais) c'est-à-dire que la variance de cet
estimateur est la plus petite dans la famille de tous les estimateurs
linéaires sans biais.
Toutefois, rien n'assure que ces hypothèses seront
toujours vérifiées. Ces hypothèses, qui permettent de
déterminer les propriétés des estimateurs (biais et
convergence), et leur loi de distributions (pour les tests
d'hypothèses), sont de deux catégories :
Hypothèses stochastiques :
· H1 : Les variables explicatives sont certains ;
· H2 : E (e i ) = 0 , le
modèle est bien spécifié en moyenne ;
· H3 : ? 2 ? 2
E ? i = ? , la variance de l'erreur est
constante : homoscédasticité ;
· H4 : E (eie i? )
= 0 pour tout i ~ i? , absence d'autocorrélation des
erreurs ;
· H5 : COV (Xi , j , ?
i? = 0, les erreurs sont indépendantes des variables
exogènes ;
· H6 : e i N( O,
ae ) , le terme d'erreur est supposé i.i.d.
67
Hypothèses structurelles
· H7 : absence de colinéarité entre les
variables explicatives, c'est-à-dire que la matrice
XX? est régulière, dét
(XX? ) ~ 0 , de sorte que ( ) - 1
XX? existe ;
· H8 :
|
XX?
|
tend vers une matrice finie non singulière lorsque N
--* ? ;
|
N
|
· H9 : N >- p + 1 , le nombre
d'observation est supérieur au nombre de variables +1.
Le recours aux MCO pour estimer la productivité des
TIC peut conduire à des résultats peu satisfaisants, car
certaines des hypothèses ci-dessus peuvent, à priori, ne pas
être vérifiées. C'est le cas notamment de
l'hypothèse 5 et l'on parle du problème
d'endogénéité.
En général, le problème
d'endogénéité, dont la conséquence principale est
de biaiser les résultats, a trois sources :
· L'erreur de mesure ;
Une mauvaise mesure des variables explicatives peut
créer un problème de corrélation entre ces variables et le
terme d'erreur. Or, la mesure des TIC n'est pas toujours évidente en
raison de l'insuffisance de l'information statistique fournie par les PME dans
leurs déclarations.
· L'omission des variables
Certaines variables déterminantes,
corrélées avec les TIC sont omises dans le modèle. Par
exemple, les PME peuvent décider du montant de leurs investissements en
TIC en fonction de la qualité de la main d'oeuvre qu'elles utilisent.
Ainsi, plus les travailleurs seront qualifiés, plus la PME sera
incitée à adopter les TIC. La prise en compte de la structure de
qualification dans l'analyse peut permettre de contrôler cette source de
biais. De plus, les investissements complémentaires tels que la
restructuration de la structure organisationnelle, les qualifications de la
main d'oeuvre et les actifs intangibles jouent un rôle fondamental dans
l'ampleur des retombées des TIC.
68
· La simultanéité
On parle de simultanéité lorsqu'une variable
explicative est déterminée en même temps que la variable
dépendante.
Dans le cas de notre étude, le biais de
simultanéité est possible, puisqu'en général, le
choix des inputs est souvent fonction du niveau d'output que la firme souhaite
réaliser et par conséquent, le stock de capital et la
productivité sont corrélés. Pour contrôler cette
source potentielle de biais, nous considèrerons les inputs de
début de période et l'output de fin de période.
Cependant, il est très difficile de pouvoir
contrôler correctement toutes les sources potentielles de biais dans une
estimation par les MCO. Dans cette perspective, d'autres estimateurs sont
proposés. On peut citer par exemple l'estimateur des moments
généralisés en système (MMGS). Mais, cet estimateur
est encore plus exigeant en matière de données, puisqu'il
requiert des données de panel. Si sa supériorité en terme
de qualité des estimations, par rapport à l'estimateur des MCO a
été démontrée, son implémentation dans le
cas présent reste difficile vue la rareté des données. La
méthode des MCO sera donc appliquée.
|