WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Application des méthodes de l'analyse de données sur l'évolution du parc automobile algérien

( Télécharger le fichier original )
par Mohamed Adel BOUATTA
USTHB Universitédes sciences et de la technologie Houari Boumediene - Ingéniorat d'état en probabilités et statistiques 2011
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

3. Principe de la méthode : Il s'agit de procéder en six étapes.

A. Stationnarisation de la série :

L'analyse des séries chronologiques est basée sur l'hypothèse de stationnarité.

Effectivement, nous ne pouvons identifier clairement les caractéristiques d'une chronique que si elle est stationnaire.

Pour cela, on commence tout d'abord par la détection de la saisonnalité (à l'aide du test graphique et/ou du test d'ANOVA). Dans le cas où il s'avère que la série est affectée de celle-ci, il convient (d'après Box & Jenkins) de l'enlever. Vient ensuite la détection de la tendance. Si les tests de stationnarité de Dickey-fuller augurent que la série est déjà stationnaire, on entamera dans ce cas la phase d'identification. Sinon, notre série est affectée d'une tendance de type DS ou TS. Dans ce cas, on doit la stationnariser.

Une fois la série stationnaire, on passe à la deuxième étape.

B. Identification du modèle :

On détermine une valeur plausible pour l'ordre des parties AR et MA, ainsi SAR et

SMA s'il existe une composante saisonnière, cette phase est fondée sur l'étude des fonctions d'autocorrélation simple et partielle.

C. Estimation des paramètres du modèle : Pour cela, les méthodes les plus utilisées sont :

méthode du maximum de vraisemblance méthode des moindres carrés ordinaires

d. Validation du modèle :

Afin de s'assurer de la robustesse et la pertinence du modèle, on vérifie ses qualités prédictives au moyen de tests :

1) Test concernant les paramètres : (test de Student)

Afin que le modèle soit valide, il faut que tous les coefficients soient significativement différent de zéro (leurs probabilités critiques soient inférieures à 0,05). Pour vérifier cela, on applique le test de Student. Si un coefficient n'est pas significativement différent de zéro, on envisage une nouvelle spécification du modèle en supprimant l'ordre AR ou MA qui n'est pas valide et en vérifiant à chaque fois les conditions de stationnarité et d'invérsibilité.

Chapitre VI Méthodologie de Box & Jenkins

? i ; = 2(n ? 2) ; =16 n ? 29

La règle de décision :

Si (au seuil = ), on acceptera l'hypothèse , tel que

var( p )

H 1 : « Les paramètres significativements déférents de zéro »

2) Tests concernant les résidus :

· Test de points de retournement :

Il teste la nature aléatoire des résidus, on dira que la suite des données

,,..., présente un point de retournement à la date i si :

Soit la variable aléatoire tel que :

?

?

=

S'il présente un point de retournement à la date S'il présente un point de retournement à la date t ? ??

 

inn Sinon

La variable aléatoire suit la loi Bernoulli de paramètre 2/3.

Si T désigne le nombre total des points de retournement alors on a :

3 90

.

1

n

T=

2

i?

Sous l'hypothèse que () forment une suite de variables aléatoires Indépendantes et identiquement distribuées :

T ? E(T)

La statistique U=

var(T

N (0,1) , pour n>50

Donc on accepte l'hypothèse : « les sont non corrélés» si U 1.96 et cela au

?

Soit

?E(? )?m seuil

· Test de nullité de la moyenne :

var(?t)??

2 et ? :la moyenne calculée des résidus

?

t

.

USTHB Page 75

L'hypothèse à tester est :

Chapitre VI Méthodologie de Box Z Jenkins

Pour n suffisamment grand ce qui implique que :

? tn ? 1

 

:

si :

à

 
 

Et comme est inconnue, on l'estime par

D'où

:

On accepte l'hypothèse au seuil

 
 

S

n

?

1

 

? Test de Box Ljung :

Ce test est basé sur la statistique définie par :

5%

?

Où : n : la taille de la série

h : l'écart entre les résidus

L'autocorrélation empirique d'écart h entre les résidus.

Avec Q suit asymptotiquement une loi Khi-deux à (h-p-q) degré de Liberté où : ( ? ??) ( ? ? ? )

t t?h

n?h

(? ? ? )

H :" F ? F " contre H :" F ? F "

0 0 1 0

n?h

?

t

?

à

? ?

1

(h)

?

USTHB Page 76

?

 

t

1

t

?

Ce test concerne les K premières autocorrélations , où K est égale au quart de la taille de la sérier (K=n/4) , un modèle est cohérent si ces résidus se comportent comme une réalisation d'un bruit blanc , il s'agit de tester l'hypothèse nulle :

: " Les résidus sont un bruit blanc "

Contre : " les résidus ne forment pas un bruit blanc ".

On accepte au seuil si Q X (K-p-q-P-Q)

? Test de normalité : (test de Kolmogorov-Smirnov)

Pour calculer des intervalles de confiance prévisionnels et aussi pour effectuer les tests de Student sur les paramètres, il convient de vérifier la normalité des erreurs.

On veut tester , où est la fonction de répartition de la

Loi normale.

Chapitre VI Méthodologie de Box Z Jenkins

?

D ? ? max ? F 0 ( x i ) ?

n i ?

i ? ? n ?

Soit l'écart maximum entre la fonction de répartition empirique et la fonction de

Répartition . Où :

0

si x

<x

(1)

 

si x

(1

si x

(

~ x < x

) (2)

~ x < x

i ) ( i ~ 1)

1

n

F X

n ( )

I ? I I I

1

i

n

si x

? x

(n)

USTHB Page 77

Etape du test :

Ranger les n observations par ordre croissant soit :

On calcule la fonction de répartition empirique .

.

Calculer

Déterminer à partir de la table, la valeur critique C en fonction de n et du risque. Règle de décision :

Si

Et si

? Test de Von-Neuman : (indépendance)

C'est un test valide dans le cas où les résidus sont gaussiens, sous les hypothèses : H0 : « les résidus sont indépendants et identiquement distribués » contre

H1 : « au moins deux observations successives tendent à être corrélées » Il est fondé sur les deux estimateurs suivants :

1 n ? 1 n

2 2 2

? ?? 1 ?

D ? ( ) 2

( ? ? S

) ? ? ?

t ? 1 t t t

n ? 1 n ? 1

t ? 1 t ? 1

? D ?

E ? ? ? 1

? 2 2

S ?

(D2 n-2

2 2

? 2 S ) n - 1

,

2

Sous H0 :

var 1=

Chapitre VI Méthodologie de Box Z Jenkins

La statistique utilisée est :

D 2

? ?

? ? ? 1

2

I 2 S ? asymptotiquement suit une

VN ?

n

?

2

n

2 ?

1

Si

< avec on accepte H0.

? Test de Durbin et Watson :

Les modèles ajustés à des séries chronologiques manifestent parfois un certain degré de corrélation entre les valeurs successives des erreurs. En terme probabiliste, cela signifie que les erreurs sont autocorrélées, ou encore qu'une erreur produite en t-1 à une influence sur l'erreur en t. Le test de Durbin et Watson (1951) permet de détecter

l'autocorrélation des résidus pour un ordre un (corrélation entre et ) sous la forme :

où on teste

H0 : « » (absence d'autocorrélation à l'ordre 1 des résidus).Contre

H1 : « » (présence d'autocorrélation à l'ordre 1 des résidus).

La statistique de Durbin et Watson, notée DW, est donnée par :

avec : sont les résidus de l'estimation du modèle.

(S ? S

t t ? 1)

2

?

t

?

2

DW

n

2

t

1

n

?

S

t

?

USTHB Page 78

De par sa construction, cette statistique varie entre 0 et 4 et nous avons DW=2 lorsque (est l'estimateur de) on a :

, il existe une autocorrélation positive ;

, il existe une autocorrélation négative ;

, indique l'absence d'autocorrélation.

? Test d'hétéroscédasticité : (l'existence d'effet ARCH)

Pour ce faire, on utilise les corrélogrammes des carrés des résidus, si un ou plusieurs termes sont significativement différents de zéro, on déduit qu'il y a effet ARCH qui est détecté par la statistique de Box et Ljung, ceci est confirmé par la statistique du Multiplicateur de Lagrange LM=n R2 avec n = le nombre d'observations servant au calcul de la régression.

R2= le coefficient de détermination.

Soit une spécification de type ARCH pour les erreurs tel que :

Chapitre VI Méthodologie de Box Z Jenkins

USTHB Page 79

avec et Soit

l'hypothèse H0 : « » contre H1 : « non tous nul »

Si LM < on accepte H0, la variance de l'erreur est constante

Dans le cas contraire LM > à p degrés de libertés compris entre 1 et 3, on rejette

H0 et le processus est justifiable d'un modèle ARCH (p).

Si p >3 le modèle sera justifié d'un modèle de type GARCH.

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Soit réservé sans ostentation pour éviter de t'attirer l'incompréhension haineuse des ignorants"   Pythagore