WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Impact de l'adoption des indices Masi et Madex sur la capitalisation boursière de la bourse de Casablanca : utilisation de la régression segmentée

( Télécharger le fichier original )
par SAHIBI Youness - AMINE Amar
Université Hassan II - Rapport de stage  2010
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

Chapitre 3: Etude d'impact

1) Présentation des données

Afin d'étudier l'impact de la création des deux nouveaux indices Masi et Madex en 2002 nous aurons besoin des données de la capitalisation boursière. Pour cela nous avons eu recours à une base de données riche en terme d'information statistique et accessible au niveau de la Direction de la Statistique

i. La série sur la capitalisation boursière :

Dans notre étude, nous avons utilisé les données de la capitalisation boursière. On a opté pour des données mensuelles associées à la période allant de 1997 à 2009.

2) Vérification empirique

i. Technique utilisé : La régression segmentée

La régression segmentée est une technique statistique utilisée pour mesurer l'effet d'un ou plusieurs évènements sur une série de mesures répétées dans le temps, surtout dans le cas où il n'est pas possible d'avoir un groupe contrôle en parallèle.

L'évènement survenu peut être :

· Intervention volontaire (ex : mise en vente d'un vaccin pour la prévention d'un cancer sur l'incidence des dépistages de ce cancer.).

· Imprévu (ex : un attentat du World Trade Center sur l'indice du Dow Jones).

La variable d'intérêt doit être mesurée à intervalles réguliers dans le temps. Elle peut être quantitative :

ü Continue (ex : Taux d'infections)

ü Discrète (ex : Nombre de naissances)

La régression segmentée est une méthode qui peut être appliquée pour étudier plusieurs phénomènes que ça soit dans l'agriculture, la pêche, la médecine ,la finance ou autres .Par exemple, Yeh et al (1983), en utilisant ce concept de la régression segmentée, a discuté l'idée d'un «seuil anaérobie » où les muscles d'une personne qui effectue un travail ne peuvent pas obtenir suffisamment d'oxygène. Dans ce cas, un modèle à deux segments est suggéré. Des exemples de ce genre dans des contextes différents sont donnés par Sprent (1961), Dunicz (1969), Schuize (1984).

Dans certaines situations, même si un modèle de segmentation est considéré comme adapté, le nombre approprié de segments peuvent ne pas être connue.

En générale la régression segmentée présente les avantages suivants :

· Simple à mettre en place

· La technique étant non paramétrique on est peut contraint par la nature des données.

· On obtient d'office la sélection des variables à utilisées en tenant compte d'éventuelles interactions.

· Résultats éligibles dans la mesure où les coefficients représente variation immédiate dans le temps

· Obtention des intervalles de confiance pour les variations associées au facteur influent

· La méthode est très extensive : on peut ainsi avoir deux segmentation ou plus, et en cas de relation non linéaire on peut appliqué des transformations sur les variables.

· Cette régression peut prendre en compte plusieurs éléments lors de la construction du modèle, notamment l'inspection visuelle des données, effets retardés, autocorrélation et la saisonnalité.

· Elle permet d'avoir une robustesse vis-à-vis des données erronées ou des valeurs aberrantes.

Enfin pour appliquer la régression segmentée, nous aurons besoin d'effectuer les étapes de développement suivantes :

Ø Observer graphiquement les données

Ø Construire un modèle complet

Ø Supprimer les variables non significatives

Ø Ajouter les variables d'ajustement

Ø Tester autocorrélation et ajouter un terme si besoin

Ø Vérifier autres points de contrôles spécifiques au modèle (résidus, normalité...)

ii. Construction du modèle

Le modèle de régression linéaire segmentée fait l'hypothèse d'un lien linéaire entre le temps et la variable d'intérêt ; capitalisation boursière dans chaque segment.

Considérons une seule intervention : la création de deux nouveaux indices : le MASI et le MADEX.

Le modèle s'écrit sous la forme :

Où :

: Capitalisation boursière

: Numéro du trimestre

: Variable binaire qui vaut 0 avant l'intervention et 1 au début de l'intervention.

: Numéro du trimestre depuis le début de l'intervention

Pour mettre en pratique l'approche adoptée, nous utilisons le logiciel R.

iii. Interprétation des résultats

Call:

lm(formula = CB ~ t + intervention + après)

Residuals:

Min 1Q Median 3Q Max

-602527 -96473 -11935 56922 623409

Coefficients:

EstimateStd. Error t value Pr(>|t|)

(Intercept) 562079 106987 5.254 7.44e-06 ***

t -8876 8931 -0.994 0.327

intervention -85604 148150 -0.578 0.567

après 132985 13146 10.116 6.27e-12 ***

---

Signif. codes: 0 `***' 0.001 `**' 0.01 `*' 0.05 `.' 0.1 ` ' 1

Residual standard error: 230300 on 35 degrees of freedom

Multiple R-squared: 0.9151, Adjusted R-squared: 0.9078

F-statistic: 125.8 on 3 and 35 DF, p-value: < 2.2e-16

dwtest(reg)

Durbin-Watson test

data: reg

DW = 0.3919, p-value = 2.404e-13

alternative hypothesis: true autocorrelation is greater than 0

251658240les résultats montrent que le modèle de la régression segmentée explique bien les données de la capitalisation boursière (un R2 de l'ordre de 91% et un test de significativité de Fisher qui montre la validité du modèle globale) .

Le test de durbinwatson montre la non autocorrélation des résidus. Les graphiques Q-Q plot et les points de levier montrent la validité des hypothèses du modèle. Plus concrètement, on peut conclure que l'instauration des deux indexes a permis d'expliquer une grande part de la tendance haussière de la capitalisation boursière. Les raisons économiques de cet effet sont expliquées dans la partie précédente.

Nous rappelons qu'un point levier dans la régression est une observation i qui influence considérablement les estimations parce que ses valeurs par rapport aux variables explicatives diffèrent beaucoup du reste des données.

Ainsi, les observations qui présentent un grand effet de levier correspondent à des points isolés du groupe principal des données.

Dans la pratique, une observation est considérée comme point levier s'elle dépasse 2P/n.

Le Q-Q Plot (ou Quantile to Quantile Plot) est un graphique dont l'objectif est de tester la conformité entre la distribution empirique d'une variable et une distribution théorique données. Nous l'appliquerons au test de conformité à la distribution normale.
Si qj est le jème quantile (pour rappel, le qème quantile est le nombre qui excède q pourcents des observations effectuées) et qu'il y a T quantiles observés, alors :

ou

La procédure de construction du graphique est la suivante:

1. Standardisation des observations
2. Tri des valeurs obtenues
3. Détermination des quantiles qi de chaque observation
4. Comptage du nombre d'individus par quantile
5. Détermination de la fréquence observée fi par quantile
6. Cumul des fréquences observées par quartile Fi
7. Détermination de la fréquence théorique cumulée par quantile zi selon une loi Normale(0,1)
8. Construction d'un graphique pour représenter les couples (zi,Fi)

Plus la répartition empirique se rapproche de la répartition d'une loi normale, plus les points apparaissent alignés le long d'une droite appelée droite de Henry.

Le test de durbinwatson est utilisé pour détecter la présence d'autocorrélation des résidus dans l'analyse d'une régression.

On peut dire que le risque d'autocorrélation des résidus augmente surtout dans les modèles estimés sur des séries chronologiques et sera encore plus grand si la périodicité est courte.

Si åt est le résidu associé à l'observation au moment t, alors la  statistique de test est :

Depuis d est approximativement égale à 2 (1 -r), où R est l'autocorrélation échantillon des résidus, d = 2 indique qu'il n'ya pas d'autocorrélation. La valeur de d est toujours comprise entre 0 et 4. Si d > 2 ça veut dire, qu'il y a autocorrélation négative, ce qui peut impliquer une sous-estimation au niveau du modèle.

iv. Améliorations de l'approche utilisée

Le modèle de régression segmentée fait une hypothèse d'indépendance entre les observations. Cette hypothèse est peu réaliste, surtout pour des données longitudinales. En plus, elle surestime la significativité des estimateurs.

L'autocorrélation peut être testée soit par :

ü Le biais de la visualisation graphique, en représentant les résidus Vs le temps. Ainsi, une tendance suggère une autocorrélation.

ü La statistique de Durbin-Watson.

Pour prendre en considération l'autocorrélation et l'introduire dans le modèle (si nécessaire), il faut estimer le paramètre correspondant.

Une limite de l'approche adoptée est le liée au fait que la variable d'intérêt peut être influencée par des facteurs autres que l'intervention et le temps :

ü Ex : Nombre d'interventions chirurgicales est lié au taux d'infections

ü L'effet des co-variables d'ajustement.

Le modèle peut être amélioré par l'introduction de plusieurs interventions, ainsi que par le fait d'effectuer des analyses stratifiées en sous-groupes.

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Les esprits médiocres condamnent d'ordinaire tout ce qui passe leur portée"   François de la Rochefoucauld