WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Etude prévisionnelle de la consommation nationale du gaz en Algérie


par Maher GUENNOUN
Université des Sciences et de la Technologie Houari Boumediene - Ingénieur d'état en Recherche Opérationnelle 2004
  

Disponible en mode multipage

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

Etude prÈvisionnelle de la consommation

nationale du gaz naturel

Faouzi Chaibi & Maher Guennoun

FacultÈ de MathÈmatiques,

UniversitÈ des Sciences et de la Technologie Houari Boumediene,

U. S. T. H. B..

i

Table de MatiËres

Chapitre 1 : PrÈsentation gÈnÈrale 1

1.1. PrÈsentation de la SONELGAZ 1

1.2. Origine et caractÈristiques du gaz 4

Chapitre 2 : problÈmatique 6

2.1. Introduction 6

2.2. MÈthodologie 6

Chapitre 3 : Processus stochastiques et SÈries chronologiques 8

3.1. Introduction 8

3.2. DÈÖnitions 9

3.3. ClassiÖcation des processus stochastiques 9

3.4. CaractÈristiques díun processus stochastique 10

3.5. Les processus stationnaires 10

3.6 Fonction díautocovariance 12

3.7. Fonction díautocorÈlation 12

3.8. Fonction díautocorÈlation partielle 13

3.9. SÈries chronologiques 14

Chapitre 4 : MÈthodologie de Box & Jenkins 38

4.1. IdentiÖcation du modËle 39

4.2. Estimation 49

4.3. Validation 40

ii

4.4. PrÈvision 46

Chapitre 5 : Application de la mÈthodologie de Box & Jenkins 48

5.1. Etude de la sÈrie consommation des distributeurs publics (7C ) 49

5.2. Etude de la SÈrie consommation des centrales Èlectriques (6 8) 67

5.3. Etude de la sÈrie consommation industrielle (6 < ) 79

Chapitre 6 : ModËle VAR 91

6.1. Introduction 91

6.2. ModËles multivariÈs 92

6.2.1. Fonction díautocovariance 92

6.2.8. ModËle autoregressif I 4E']( 95

Chapitre 7 : Application de la modËlisation multivariÈe 106

7.1. Etude des sÈries de consommation '6 8F4/ 7?7C F4/ 6 8F4( 106

7.1.1 IdentiÖcation du modËle 106

7.1.2. Estimation du modËle 106

7.1.3 Validation 119

7.1.4. PrÈvision 126

7.2. Conclusion 130

Chapitre 8 : Conclusion gÈnÈrale 133

ANNEXE [A] MÈthodes díestimation 136

ANNEXE [B] Tableaux statistiques 136

ANNEXE [C] PrÈsentation du logicel EVIEWS 4.0

iii

ó ó ó ó ó ó ó ó ó ó ó ó ó ó ó ó ó ó ó ó ó ó ó

4YYN 5N_NXNaV 8? ?NUV

Chapitre 1

PrÈsentation gÈnÈrale

1.1 PrÈsentation de la SONELGAZ

1.1.1 Historique

1947 : CrÈation de "ElectricitÈ et Gaz díALGERIE " : EGA

1969 : CrÈation de la SociÈtÈ Nationale de líElectricitÈ et du Gaz : Sonelgaz

Par ordonnance n!6959 du ,6 juillet 1969 parue dans le journal ocents ciel du 1er ao°t 1969,

la Societe Nationale de líElectricite et du Gaz (Sonelgaz) est creee en substitution ‡ EGA (19.1 1969) dissout par ce même decret. Líordonnance lui assigne pour mission generale de síintegrer de faÁon harmonieuse dans la politique energetique interieure du pays. Le mono- pole de la production, du transport, de la distribution, de líimportation et de líexportation

de líenergie electrique attribue ‡ Sonelgaz a ete renforcee. De même, Sonelgaz síest vue at-

tribuer le monopole de la commercialisation du gaz naturel ‡ líinterieur du pays, et ce pour tous les types de clients (industries, centrales de production de líenergie electrique, clients domestiques). Pour ce faire, elle realise et gËre des canalisations de transport et un reseau

de distribution.

1983 : Restructuration de Sonelgaz

Toutes les unites de travaux et de fabrication de materiels, crees pour palier au manque

de capacites nationales se sont transformees en 1983 en entreprise autonome.cíest ainsi que

KAHRIF : Travaux díelectriÖcation.

1

KAHRAKIB : Montage des infrastructures et installations électriques.

KANAGAZ : Réalisation des canalisations de transport et de distribution du gaz.

INERGA : Travaux de génie civil.

ETTERKIB : Montage industriel.

AMO : Fabrication des compteurs et des appareils de mesure et de contrOle. Ont été crées.

1991 : Nouveau statut de Sonelgaz

Sonelgaz : Société Nationale díElectricité et du Gaz change de nature juridique et devient

un établissement Public ‡ CaractËre Industriel et Commercial (décret exécutif n!91-475 du

14 décembre 1991).

1995 : Sonelgaz (EPIC)

Le décret exécutif n!95-280 du 17 septembre 1995 conÖrme la nature de Sonelgaz en tant quíétablissement public ‡ caractËre industriel et commercial. Sonelgaz est placé sous tutelle

du Ministre chargé de líénergie, est doté de la personnalité morale et jouit de líautonomie ÖnanciËre, est régie par les rËgles de droit public dans ses relations avec líétat. et est réputé commerÁant dans ses rapports avec les tiers

Le même décret déÖnit (en son article 6( les missions de Sonelgaz :

ñAssurer la production, le transport et la distribution de líénergie électrique, ñAssurer la distribution publique du gaz,

dans le respect des conditions de qualité, de sécurité et au moindre co°t, dans le cadre

de sa mission de service public.

2002 : Sonelgaz.Spa

le décret présidentiel N! 02-195 du 1 juin ,* * , Öxe les statuts de la société algérienne de líélectricité et du gaz Sonelgaz.spa, ayant pour missions :

1- La production, le transport, la distribution et la commercialisation de líélectricité, tant en Algérie quí‡ líétranger,

2- Le transport du gaz pour les besoins du marché national,

3- La distribution et la commercialisation du gaz par canalisations tant en Algérie quí‡ líétranger,

4- Le développement et la fourniture de toutes prestations en matiËre de service énergétiques,

5- Líétude, la promotion et la valorisation de toutes formes et sources díénergie

6- Le développement par tout moyen de toute activité ayant un lien direct ou indirect avec les industries électriques et gaziËres et de toute activité pouvant engendrer

un intérêt pour "Sonelgaz.Spa" et généralement toute opération de quelque nature quíelle soit pouvant se rattacher directement ou indirectement ‡ son objet social, notamment la recherche, líexploration, la production et la distribution

díhydrocarbures,

7- Le développement de toute forme díactivités conjointes en Algérie et hors díAlgérie avec des sociétés algériennes ou étrangËres,

8- La création de Öliales, les prises de participation et la détention de tous porte feuilles díactions et autres valeurs mobiliËres dans toute société existante ou ‡ créer en Algérie et ‡ líétranger.

Le même décret consacre la mission de service public conÖée ‡ Sonelgaz.Spa.

2004 : Un groupe síannonce

En application de la loi sur líélectricité et la distribution du gaz par canalisations, Sonel- gaz a transformé les directions de production, de transport électrique et de transport gaz en trois nouvelles Öliales sous formes de sociétés par actions : SPE (Sonelgaz Production Elec- tricité), GRTE (Gestionnaire du Réseau Transport Electricité) et GRTG (Gestionnaire du Réseau Transport Gaz). Préparant la transformation du métier de la distribution en quatre Öliales di§érentes, Sonelgaz a mis en place quatre directions générales pour la région díAlger,

la région Centre, la région Est et la région Ouest. Ces directions générales sont chargées de

réunir toutes les conditions pour réussir ce passage dés janvier ,* * 6.

1.2 Origine et caractÈristiques du gaz

Le gaz naturel a été découvert au Moyen-Orient au cours de líantiquité. Il y a de cela quelques milliers díannées. Líapparition soudaine de gaz naturel síenáammant brutalement était assimilé ‡ des sources ardentes. En Perse, en GrËce ou en Inde, les Hommes ont érigé

des temples autour de ces feux pour leurs pratiques religieuses. Cependant ils níévaluËrent pas immédiatement líimportance de leur découverte. Cíest la Chine qui autour de 9* * avant Jésus-Christ, comprit líimportance de ce produit et fora le premier puits aux alentours de

,11 avant Jésus Christ. En Europe, il fallut attendre jusquíen 16/ 9 pour que la Grande- Bretagne découvre le gaz naturel et le commercialise ‡ partir de 119* . En 12 ,1, ‡ Fredonia (Etats-Unis), les habitants ont découvert le gaz naturel dans une crique par líobservation de bulles de gaz qui remontaient jusquí‡ la surface. William Hart est considéré comme le "pËre

du gaz naturel". Cíest lui qui creusa le premier puits nord-américain.

1.2.1 CaractÈristiques techniques

Le gaz naturel est incolore, inodore, insipide, sans forme particuliËre et plus léger que líair. Il se présente sous sa forme gazeuse au-dessus de -161!Celssus. Pour des raisons de sécurité, un parfum chimique, le mercaptan, qui lui donne une odeur díúufs pourris, lui est souvent ajouté de sorte quíune fuite de gaz puisse ainsi être détectée.

Le gaz naturel est un mélange díhydrocarbures comprenant du méthane, de líéthane,

du propane, des butanes et des pentanes. Díautres composants tels que le CO2, líhélium,

le sulfure díhydrogËne et líazote peuvent également y être trouvés. La composition du gaz naturel níest jamais la même. Cependant, on peut dire que son composant principal est le méthane (au moins 9* & ). Il possËde une structure díhydrocarbure simple, composée díun atome de carbone et de quatre atomes díhydrogËne '6 ; .(. Le méthane est extrêmement ináammable. Il br°le facilement et presque totalement et níémet quíune faible pollution. Le gaz naturel níest ni corrosif ni toxique. . En outre, en raison de sa densité * .6* , inférieure ‡ celle de líair (1.** ), le gaz naturel a tendance ‡ síélever et peut, par conséquent, disparaÓtre facilement du site ocents il se trouve par níimporte quelle Össure.

1.2.2 Evolution du gaz naturel en tant quíÈnergie

Le gaz naturel est la source díénergie fossile qui a connu la plus forte progression depuis

les années 1* . En e§et, elle représente le cinquiËme de la consommation énergétique mondiale.

En raison de ses avantages économiques et écologiques, le gaz naturel devient chaque jour plus attractif pour beaucoup de pays. Les propriétés de ce produit, comme par exemple

le faible intervalle de combustion le caractérisant, en font líune des sources díénergie les plus Öables connue a ce jour. Actuellement, il représente la deuxiËme source díénergie la plus utilisée aprËs le pétrole. DíaprËs líEIA, du département américain de líénergie, la part du gaz naturel dans la production énergétique mondiale était de ,- & en 1999 et les perspectives de développement de la demande sont excellentes. Il est considéré comme le combustible fossile

du siËcle, comme le pétrole líétait lors du siËcle précédent et le charbon il y a deux siËcles.

Le gaz naturel présente un avantage concurrentiel par rapport aux autres sources díénergie car, seuls 1* & (environ) du gaz naturel produit sont perdus avant díarriver chez le consom- mateur Önal. En outre, les progrËs technologiques améliorent constamment líecents cacité des techniques díextraction, de transport et de stockage ainsi que le rendement énergétique des équipements fonctionnant ‡ base de gaz naturel.

1.2.3 Les rÈserves du gaz naturel

Ces réserves sont trËs importantes et les estimations concernant leur taille continuent de progresser ‡ mesure que de nouvelles techniques díexploration ou díextraction sont décou- vertes. Les ressources de gaz naturel sont abondantes et trËs largement distribuées ‡ travers

le monde. On estime quíune quantité signiÖcative de gaz naturel reste encore ‡ découvrir.

Chapitre 2

ProblÈmatique

Introduction

étant donné que líAlgérie est en plein développement social, culturel et économique, ce qui ináue sur la consommation nationale du gaz naturel, il est intéressant pour la SONELGAZ

de faire une étude scientiÖque et rigoureuse sur líévolution dans le temps de cette matiËre stratégique dans ses di§érents aspects, et ce tant pour des prises de décisions que pour les planiÖcations futures.

Cíest dans ce but que la compagnie nous chargé díélaborer un modËle prévisionnel sur la consommation nationale du gaz naturel.

Cette derniËre se présente sous trois aspects : la consommation publique, la consommation industrielle et la consommation des producteurs díélectricité.

MÈthodologie

Pour líobjectif assigné, il existe un axe important dans les séries chronologiques, de l‡ nous modélisons la consommation publique, la consommation industrielle et la consommation des producteurs díélectricité comme des séries temporelles.

Les modËles de séries chronologiques identiÖées, estimés et diagnostiqués adéquats aux séries

de consommation publique, industrielle et les producteurs díélectricité, seront par la suite exploités pour établir la prévision ‡ court et ‡ moyen terme. AÖn díétablir une relation tendancielle entre les di§érentes séries de consommation ‡ moyen et ‡ long terme, une étude

du vecteur multivarié, dont les composantes sont des séries chronologiques des trois types de consommation sera envisagée. La relation tendancielle éventuelle entre les trois séries de est aussi envisagé.

6

CHAPITRE 2. PROBL...MATIQUE 7

Cette étude fait appel ‡ des concepts en analyse des séries temporelles, ‡ savoir les modËles

I 4E et la méthodologie de Box & Jenkins.

Chapitre 3

Processus stochastiques et sÈries chronologiques

3.1 Introduction

Les processus aléatoires décrivent líévolution díune grandeur aléatoire en fonction du temps (ou líespace). Il existe de nombreuses applications des processus aléatoires notam- ment en physique statistique, en biologie et bien entendu dans les sciences de líingénieur et

les domaines économiques et Önanciers.

Líétude des processus stochastiques síinsËre dans la théorie des probabilités dont elle consti-

tue líun des objectifs les plus profonds, elle soulËve des problËmes mathématiques intéres- sants et souvent trËs dicents ciles. Ce chapitre présente quelques notions et aspects des processus aléatoires utiles ‡ la statistique chronologique.

8

CHAPITRE 3. PROOESSUS STOOHASTIQUES ET S...RIES OHRONOLOGIQUES 9

3.2 DeÖnitions

Soit '2 , A , F ) un espace probabilisé et 12 , A un espace probabilisable

DeÖnition 1

On appelle une variable aleatoire notee K toute application mesurable, telle que

K : '2 , A ) ' '2 , A ), tel que / 5 E A ) K %'5) E A

DeÖnition 2

Un processus aleatoire ou encore stochastique note 3 KK, a E G 4 est une famille

de variables aleatoires indicees par a, deÖnies sur un mÍme espace probabilise

'2 , A , F ) et a valeurs dans 12 , A ocents 12 , A est appele "espace díetats du pro- cessus aleatoire"

3.3 ClassiÖcation des processus stochastiques

Nous distinguons les processus suivants :

ó 1. Si G est dénombrable, alors le processus 3 KK, a E G 4 est dit ‡ temps discret, sinon

il est dit ‡ temps continu .

ó ,. Si 2 est dénombrable, alors le processus 3 KK, a E G 4 est ‡ espace díétats discret, sinon il est ‡ espace díétats continu.

ó - . Si 2 6 RF alors le processus est dit multivarié.

Remarques

ó 1. Une réalisation díun processus est appelée trajectoire. Donc, cíest une suite des réalisations des variables aléatoires KK. Les réalisations díune même variable aléatoire pouvant être di§érentes, les réalisations díun même processus peuvent donner des

trajectoires di§érentes.

ó ,.Dans ce qui suit on síintéresse aux processus aléatoires ‡ temps discret, autrement dit G 6 Z.

3.4 Caracteristiques díun processus stochastique

Soit le processus aléatoire3 Xt, a E Z4 , alors la moyenne (espérance mathématique), la variance et la covariance de ce processus Xt sont données respectivement par :

1) E (Xt) 6 % t (moyenne de Xt),

& "

2) I N_ (Xt) 6 E ! (Xt % t)

(variance de Xt)

et la covariance entre Xt et Xs est déÖnie comme suit :

- ) 6 \b (Xt, Xs) 6 E 8 (Xt % t) (Xs % s)] (covariance entre Xt et Xs),

3.5 Les processus stationnaires

La notion de stationnarité joue un rOle central dans la théorie des processus. Deux types

de stationnarité sont généralement considérées. Et dans ce qui suit nous passons en revue

les déÖnitions de bases liées ‡ ces deux types de processus stationnaires.

3.5.1 Processus strictement stationnaire (la stationnarite forte)

Soit un processus stochastique3 Xt, a E Z4 , le processus est dit strictement (ou forte-

ment) stationnaire si : / (a%, a& *..., aF) E ZF et / U E Z, alors la suite (Xt # @, ..., Xt

# @) a la

1 "

même loi de probabilité que la suite (Xt1 , ..., Xt" ), autrement dit :

F (Xt1 $ c %, ..., Xt" $ c F) 6 F (Xt1 # @ $ c %, ..., Xt" # @ $ c F) ,

/ (a%, a& *..., aF) E ZF, / (c %, c & *..., c F) E RF et / U E Z.

De cette déÖnition découle que tous les moments díordre (síils existent), díun processus stochastique strictement stationnaire sont invariants pour toute translation dans le temps,

or cette déÖnition est rarement vériÖée en pratique, cíest ainsi que nous proposerons un autre

type de stationnarité, dite stationnarité du second ordre.

3.5.2 Processus faiblement stationnaire (second ordre)

Le processus 3 xt, t E Z4 est dit faiblement stationnaire si :

ó 1. E (xt) 6 % (constante), / t E Z,

M

ó 2. I N_ (xt) 6 ) &

6 ! $

(constante), / t E Z,

ó - . 6 \ b (xt, xt# @) 6 E 8 (xt % t)(xt# @ % t] 6 ! M (U), / t, U E Z,

! M (U) est la fonction díautocovariance du processus3 xt, t E Z4 .

Remarques

ó 1. La covariance dun processus faiblement stationnaire depend seulement de la di§erence entre les instants.

ó 2. Dans les processus stochastiques du second ordre, la stationnarite stricte implique

la stationnarite faible (la reciproque est fausse sauf pour les processus gaussiens).

ó - . Desormais, le terme stationnaire renverra au concept de stationnarite du second ordre, sauf mention contraire

Implication de la stationnarite

La stationnarite signiÖe que le degre de relation entre deux termes díune serie depend uni- quement de líintervalle temporel entre eux et non du temps. Cela signiÖe que la fonction de generation du processus ne change pas au cours du temps. Ainsi, si par exemple xt est genere

par líequation xt 6 - t ) b (t)- t 1 et que le paramétre b (t) áuctue avec le temps, alors la serie

níest pas stationnaire. Cette deÖnition de la stationnarite implique aussi que la variance de

la serie est invariante avec le temps.

3.5.3 Processus bruit blanc (white noise process)

Un bruit blanc3 - t, t E Z4 est une suite de variables aleatoires non correlees de moyenne nulle et de variance Önie constante. Un processus bruit blanc veriÖe les proprietes suivantes :

* E (- t) 6 * ,

I (- t) 6 E (- & ) 6 ) & . / E

t Z

t (

Et en consequence sa fonction díautocovariance est donnee par :

* ) & , U 6 * ,

! (U) 6 E (- t - t# @) 6

* , U 6 * .

Remarques

ó 1. Les bruits blancs sont des processus stationnaires particuliers sans "memoire". Le niveau de la serie consideree aujourdíhui nía aucune incidence sur son niveau de demain, tout comme le niveau díhier nía aucune incidence sur le niveau díaujour- díhui.

ó 2. Le terme bruit blanc provient de líanalogie dans le domaine des frequences entre la

densite spectrale díune variable i.i.d (constante) et le spectre de la lumiére blanche dans le spectre des couleurs.

ó - . Par rapport ‡ un processus bruit blanc, un processus stationnaire peut se caracte-

1

riser par une certaine non correlation de ses termes. Quand le processus est un bruit blanc, le coecents cient díautocorrelation est nul des le premier decalage. Dans un pro- cessus stationnaire, la moyenne níest pas forcement nulle.

3.6 Fonction díautocovariance

La fonction díautocovariance du processus 3 Xt, t E Z4 notee 7 (h) est deÖnie par :

7 (h) 6 6 \b (Xt, Xt h) 6 E 8 (Xt E (Xt)) (Xt h E(Xt h))] , V h, t E Z.

On remarque que pour h 6 * ; I N_(Xt) 6 7 (* )

Proprietes

7 ( h) 6 7 (h) , V h E Z, (la fonction díautocovariance est symetrique)

5 7 (h)5 $ 7 (* ) 6 I (Xt) , V h, t E Z,

Estimateur

Considerons (X1, ...., X: ), líestimateur de la fonction díautocovariance est donne par :

1

: h

: ( (

7 (h) 6

>

T h tl 1

Xt X t

1

Xt# h X t# h ,

: h :

:

avec X t h 6

T h tl 1

Xt et X t 6

: Xt

T tl 1

3.7 Fonction díautocorrelation

La fonction díautocorélation de h, (h E Z), díun processus stationnaire du second ordre

de moyenne E (Xt) 6 % , notée p (h) est déÖnie par :

p (h) 6

6 \b (Xt, Xt h)

C 6

I N_ (Xt) B I N_(Xt h)

7 (h)

V E

, h Z,

7 (* )

avec p (h) E 8 1, 1]

Proprietes

p (* ) 6 1, V h E Z,

5 p (h)5 < 1, V h E ZI

Estimateur

7 (h)

p (h) 6 >

> 7 (* )

>

Remarques

ó 1I La représentation graphique de p (h) est appelée îcorrelogrammeî

ó 2I Si la fonction díautocorélation p (h) décroÓt rapidement quand le nombre de retards augmente, cela signiÖe que la série est stationnaire.

3.8 Fonction díautocorrelation partielle

La fonction díautocorrélation partielle mesure la corrélation entre Xt et Xt h, líináuence

des variables Xt h i (pour i < h) ayant été retirée. Notons p (h) et + hh les fonctions respecti- vement díautocorrélations et díautocorrélation partielle de XtI Soit p h la matrice symétrique

formée des (h 1) premieres autocorrélations de Xt :

0

I I

I

p 6 I

h I

I

6

1

1

I

2 I I

' I I I I

I

I

I

p h

7

1

p 1

p 2

I

I

p h

p 1

1

I

I

I

p h

p 2

p 1

1

I

I

p h

I

I

I

I

I

 

I

I

I

I

I

 

I

p h 1 p h 2

% %

% %

% p %

h

La fonction díautocorrélation partielle est donnée par : + hh 6 %

% , ocents % p

% est le déterminant

% % % h %

% p h%

% %

de la matrice p

h

et p

h

est donnée par :

0

I I

I

p 6 I

h I

I

I

I

I

1

6

1

I I I I I I

7

1

p 1

p 2

I

I

p 1

p 1

1

I

I

I

p 2

p 2

p 1

1

I

I

p '

I

I

I

I

I

I

I

I

I

I

I

I

p h 1 p h 2

p est la matrice p

h h

dans laquelle on a remplacé la derniere colonne par le vecteur 8 p 1, IIIIII, p h] # ,

la fonction díautocorrélation partielle síécrit :

2 + 11, ` i i 6 1,

)5 Pi : + i 1*a p i a

+ ii 6

53

i 1

1 :

a l 1

+ i 1*a p a

, ` i i 6 2, >

Cet algorithme est connu sous le nom díalgorithme de Durbin (196* ). Il est basé sur les

équations de Yulle-Walker.

3.9 Series chronologiques

Líapproche de modélisation par les séries chronologiques est utilisée pour faire des prévi- sions, elle consiste ‡ exploiter líinformation contenue dans les valeurs passées díune variable

et des perturbations aléatoires (on aura besoin de collecter des informations sur une assez longue période pour avoir des prévisions Öables), de faÁon ‡ déterminer les caractéristiques intrinseques et la nature de líévolution dans le temps de la série ; nous pourrons alors pré- voir les valeurs futures de la variable. A titre díexemple, nous citerons quelques domaines díapplication :

ó 1I Líéconométrie (prédiction de quantités économiques, les prix de ventes et díachats..)

ó 2I La Önance (évaluation des cours de la bourse au cours díune séance.....)

ó - I La météorologie (analyse des données climatiques, prévision ......)

DeÖnitions

Une serie chronologique dite aussi chronique ou serie temporelle (time series en terminologie anglaise) est une suite díobservations 3 c t, t E T 4 indexees par un ensemble ordonnee T .

Suivant líensemble des indices T nous distinguons deux types de chroniques, ‡ savoir :

Serie continue : une série est continue lorsque líensemble des valeurs possibles de t est non dénombrable. Nous pourrons rencontrer ce genre de séries en physique quantique.

Serie discrËte : une série est discrete lorsque líensemble des valeurs possibles de t est

un ensemble dénombrable .Nous distinguons deux types de variables constituant une série discrete.

ó Les variables de áux : elles représentent le mouvement intervenu durant un certain intervalle de temps (le nombre díaccidents durant líannée en cour, le traÖc aérien - quotidien).

ó Les variables de niveau : elles représentent un état ‡ un moment donné.(taux de - chOmage, température ‡ un lieu Öxe...).

Une série chronologique peut être représentée graphiquement en plaÁant les instants (ti , 1 <

i < [ ) en abscisses et les observations (d i , 1 < i < [ ) en ordonnées.

3.9.1 Operateurs sur les chroniques

Operateur retard et avance

Pour formaliser le déplacement dans le temps de la série temporelle, nous déÖnissons une application, quí‡ partir díune observation prise ‡ une date donnée nous permet díexprimer

les observations passées ou futures.

Ainsi, nous introduisons líopérateur retard (Backward) noté B comme líapplication

Xt ' BXt 6 Xt 1

Nous pourrons alors établir une relation de récurrence selon :

B2 Xt 6 Xt 2 5 IIIIIIIIII5 BFXt

6 Xt F

De maniere analogue, nous déÖnissons líopérateur avance (Forward) noté F tel que :

9 Xt 6 Xt# 1. IIIIIIII5 9 FXt 6 Xt# F.

Líavantage de ces opérateurs est de permettre une expression formelle plus simple des modeles

de séries chronologiques et de líétude de leurs propriétés.

Ainsi nous pourrons écrire Yt 6

H

H

:

i l $

ai Xt i selon Yt 6

( H

:

i l $

)

ai Bi

Xt ce qui déÖnit une

nouvelle application 4

:

i l $

ai Bi , qui síapplique aux séries temporelles. Cette application met

en évidence les propriétés suivantes :

ó 1. B$ Xt 6 Xt,

ó 2. Bi Ba Xt 6 Bi # a Xt 6 Xt i a ,

ó - . B i Xt 6 Xt# i V i E e , B 1 6 F ,

ó .. Bi # a Xt 6 Bi Xt ) Ba Xt.

Notons que ces propriétés síappliquent également ‡ líopérateur F .

Operateur de di§erence ordinaire

Líopérateur de di§érence ordinaire noté V, associé au processus 3 Xt, t E Z4 est tel que :

V t E Z, VXt 6 (1 B) Xt 6 Xt Xt 1.

Et par construction, nous obtiendrons líopérateur de la d? E ? di§érence noté V> tel que :

V t E Z, V> Xt 6 (1 B)> Xt

Operateur de di§erence saisonniËre

Líopérateur de di§érence saisonniere díordre ` , noté Vs associé au processus3 Xt, t E Z4 est

tel que : V t E Z, VsXt 6 (1 Bs) Xt et par construction nous obtiendrons líopérateur de la

s

d? E ? di§érence díordre ` , noté V>

s

V t E Z, V> Xt 6 (1 Bs)> Xt.

telle que :

3.9.2 Analyse des series chronologiques

Líanalyse des séries chronologiques a pour objectif de décrire les principales caractéris- tiques du processus générateur de la série, líajustement du modele adéquat, la prévision et

le contrOle.

Les composantes díune serie chronologique

Les premieres études sur les séries chronologiques ont amené ‡ considérer que la chronique

peut se mettre sous la forme fonctionnelle suivante : L t 6 S (Tt, Ft, 6t, - t) ocents

Tt : représente la tendance de la chronique

Ft : représente la saisonnalité,

6t : représente le cycle conjoncturel,

- t : représente les áuctuations irrégulieres(erreurs)

Donnons pour chacune de ces composantes, quelques déÖnitions.

- La tendance(Trend en terminologie anglaise) notée T décrit le mouvement ‡ long terme

de la série, ce mouvement est traditionnellement représenté par des formes : polynomial, logarithmique, exponentielle ..., elle est en fonction du temps et marque líallure générale du phénomene.

- Le cycle conjoncturel regroupe les variations autour de la tendance avec des alternances díépoques ou des phases díexpansion et de contraction.

- Les variations saisonniËres ;beaucoup de séries chronologiques díorigine économique comportement une composante saisonniere, cela se manifeste par la répétition díun proÖl particulier avec une certaine périodicité. Parmi les causes de la saisonnalité, nous retrouvons

les variations météorologiques qui accompagnent le rythme des saisons, les habitudes (fêtes

de Ön díannée, le ramadan, les congés annuels...

- Les variations accidentelles ou erreurs, rassemblent tout ce que les autres composantes níont pas pu expliquer du phénomene observé, elles contiennent donc de nombreuses áuc- tuations, en particulier accidentelles dont le caractere est exponentiel et imprévisible.

Ces di§érents composantes peuvent être combinées selon un des trois modeles suivants :

modËle additif :

L 6 Tt ) Ft ) - t

Pour bien séparer la tendance de la composante saisonniere et pour des raisons díunicité

G

dans la décomposition proposée, on impose :

a l 1

` a 6 *

modËle multiplicatif :

L 6 Tt(1 ) Ft)(1 ) - t)

L‡ encore on impose

modËle mixte :

G

:

a l 1

` a 6 * ,

Il síagit l‡ de modeles, ocents addition et multiplication sont utilisés. Nous pouvons supposer par

exemple que la composante saisonniere agit de faÁon multiplicative alors que les áuctuations irrégulieres soient additives :

L 6 Tt(1 ) Ft) ) - t

(toutes les autres combinaisons sont également possibles).

3.9.3 Modelisation des series chronologiques

Líobjectif de la modélisation est de construire des modeles permettant de décrire le comportement díune chronique, et de ce fait résoudre les problemes liés ‡ la prévision.

Decomposition de wold

Le théoreme de Wold (19-2 ) est le théoreme fondamentale de líanalyse des séries chrono- logiques.

TheorËme

Tout processus stochastique du second ordre 3 Xt, t E M 4 , possËde une decompo- sition unique donnee par Xt 6 H t ) It tel que :

ó 1 ces deux processus (H t, It) sont orthogonaux de plus H t est purement déterminable

et It est purement indéterminable (aléatoire)

ó 2 le processus 3 It, t E M 4 peut être représenté sous forme díune combinaison linéaire inÖnie du présent et du passé du processus bruit blanc 3 - t, t E M 4 .

Cette expression devait être convergente en moyenne quadratique cela veut dire que I a_(It)

doit être Önie cíest ‡ dire

2

) It 6

:$

a l 1

a! - $ !

3 I a_(It) 0 +

ModËle autoregressif moyenne mobile & / , & (: , ; )

Les modeles 4E@ 4 (Auto Regressive Moving Average) ont été introduits par Box et Jen-

kins (191* ). Líobjet est de modéliser une série temporelle en fonction de ses valeurs passées, mais aussi en fonction des valeurs présentes et passées díun bruit.

ModËle autoregressif & / (: )

DeÖnition :

Le processus stationnaire 3 Xt, t E Z4 satisfait une representation & / díordre : , note & / (: ), síil est solution de líequation aux di§erences stochastique suivante :

- t 6 Xt

p

z

j l 1

+ j Xt j

Xt 6 + 1Xt 1 ) + 2 Xt 2 ) ......... ) + p Xt p ) - t

- t 6 Xt + 1Xt 1 + 2 Xt 2 ......... + p Xt p

p

- t 6 Xt + 1 Xt + 2 2 Xt ......... + p Xt

p

- t 6 (1 + 1 + 2 2 ......... + j

)Xt

- t 6 # ( )Xt avec # ( ) 6

6

j

z + j

j l $

V W 0 ], + j

E R, + $ 6 1

et + p E R oü # ( ) représente le polynOme de retard et - t est un bruit blanc de moyenne

(

nulle et de variance ) 2 .

Remarque

Le modele autoregressif díordre(]) explique la valeur de la chronique ‡ líinstant t comme une combinaison linéaire de ] observations antérieurs. Il apparaÓt aussi comme une régression multiple oü líon explique les valeurs de la série chronologique aux instants t 1, t 2, .......t ], cíest pour cela que nous líappelions autoregressif díordre (]).

ModËle moyenne mobile @ 4(^ )

DeÖnition :

Le processus stationnaire 3 Xt, t E Z4 satisfait une representation moyenne mobile díordre ; , note , & (; ), síil est solution de líequation aux di§erences stochastique

suivante :

Xt 6 - t

H

z

j l 1

# j - t j

En introduisant le polynOme de retard on obtient :

Xt 6 ! ( )- t

oü ! ( ) 6

H

z

j l $

# j j , # j E R , oü # $ 6 1 et # H E R , V W 0 q ,

(

- t est un bruit blanc de moyenne nulle et de variance ) 2 .

Remarque

Le modele moyenne mobile díordre q , @ 4(q ) explique la valeur de la série ‡ líinstant t

par une moyenne pondérée díaléas - t jusquí‡ la q ? E ? période qui sont supposés générés par

un processus de type bruit blanc.

ModËle mixte 4R@ 4

Le processus stationnaire 3 Xt, t E Z4 satisfait une representation & / , & díordre :

et ; , note & / , & (: , ; ), síil est solution de líequation aux di§erences stochastiques suivante :

Xt

ou encore :

p

z

j l 1

+ j Xt j 6 - t

H

z

j l 1

# j - t j

# ( )Xt 6 ! ( )- t.

Remarque

ó 1 Le modele 4R@ 4 est une composition díun modeles autoregressif 4R et díun modeles moyenne mobile @ 4.

Causalite et Inversibilite

DeÖnition

Un modËle de serie chronologique (lineaire ou non lineaire) de la forme :

Xt 6 T (Xt 1, Xt 2 , ... Xt p 5 - t, - t 1, - t 2 , ... - t H ) ,

ocents - t est un bruit blanc, est dit causal si, et seulement si, on peut exprimer

le processus stochastique Xt sous forme combinaison lineaire (Önie ou inÖnie)

convergente, en moyenne quadratique, du present et du passe du bruit blanc - t.

ConnaÓtre la causalité díun modele níest pas une tche facile, une raison pour laquelle

on doit imposer une condition de causalité, qui nous permet díacents rmer ou díinÖrmer sa

causalité.

TheorËme :

Soit 3 Xt, t E Z4 un modËle 4R@ 4 (], q ) deÖni par

# (B) Xt 6 ! (B) - t.

tel que les polynÙmes # (.) et ! (.) díordres respectifs ] et q níont pas de racines communes. Alors, le modËle est causale si et seulement si les racines de # sont

de module strictement superieure a líunite, i.e : # (e ) 6 * , V e E M , 5 e 5 < 1.

Remarque

La causalité est une notion qui ne concerne pas le processus 3 Xt, t E Z4 seul, mais la relation

qui lie 3 Xt4 et 3 - t4 ..

DeÖnition

Un modËle de serie chronologique (lineaire ou non lineaire) de la forme

Xt 6 T (Xt 1, Xt 2 , ... Xt p 5 - t, - t 1, - t 2 , ... - t H ) ,

ocents 3 - t4 est un bruit blanc, est dit inversible si, et seulement si, on peut exprimer

le processus 3 - t4 comme combinaison lineaire (Önie ou inÖnie) convergente, en moyenne quadratique, du present et du passe du processus stochastique 3 Xt4 .

Le théoreme suivant établi une condition nécessaire et sucents sante pour quíun modele moyenne mobile díordre q , soit inversible.

TheorËme

Soit 3 Xt, t E Z4 un modËle & / , & (: , ; ) deÖni par # ( )Xt 6 ! ( )- t tel que les polynÙmes # (.) et ! (.) díordres : et ; respectivement, níont pas de racines com- munes. Alors, 3 t est inversible si et seulement si les racines de ! sont de module strictement superieur a líunite.

Remarque

Un processus 3 Xt, t E Z4 satisfait une représentation 4R(]), est toujours inversible.

3.9.4 Fonction díautocorrelation

Fonction díautocorrelation díun & / (: )

Soit le modele autoregressif díordre ] vériÖant líéquation 1

Xt 6 2 1Xt 1 ) 2 2 Xt 2 ) ......... ) 2 p Xt p ) 6 t V t E Z.........(1)

avec :

1) E(Xt) 6 0 (processus centré) ,

2) E(Xt h6 t) 6 0 (comme 6 t est indépendant de 6 t 1, 6 t 2 ,...., alors 6 t est indépendant

du passé constitué par les variables Xt 1, Xt 2 ....Xt h pour h 2 0 )

Equations de Yule-Walker

Multiplions líéquation (1) par Xt h et prenons líespérance des deux cotés, on obtient :

E(XtXt h) 6 2 1E(Xt 1Xt h) ) 2 2 E(Xt 2 Xt h) ) ... ) 2 p E(Xt p Xt h) ) E(6 tXt h)

Pour h 6 0 on obtient :

(

7 $ 6 2 17 1 ) 2 2 7 2 ) ...... ) 2 p 7 p ) ) 2

Pour h 2 0 on obtient :

7 h 6 2 1 7 h 1 ) 2 2 7 h 2 ) .......... ) 2 p ! 7 h p , .........(2)

En divisant (2) par 7 $ on obtient :

p h 6 2 1p h 1 ) 2 2 p h 2 ) ........... ) 2 p p h p , ...........(3 )

Si nous réitéronslíéquation (3 ) pour h 6 1, ] nous obtenons le systeme de Yule-Walker sui- vant :

p 1 6 2 1 ) 2 2 p 1 ) ....... ) 2 p p p 1

p 2 6 2 1p 1 ) 2 2 ) ........ ) .2 p p p 2

4

p p 6 2 1p 1 ) 2 2 p 2 ) ..... ) .2 6

Díou líécriture matricielle suivante :

0 p 1 1

0 1 p 1 p 2 . . p p 1 1 0

2 1 1

I p 2 I I

.

I I I

6

I I I

.

I I I

I I I

.

I I I

6 7 6

p p

p 1 1 p 1 . . p p 2 I I

I I

.

. . 1 . . . I I

I I

.

. . . 1 . . I I

7 6

. . . . 1 . I I

.

.

.

.

1

p p 1

2 2 I I I I I

I

7

.

2 p

Donc estimer les parametres du modele 4R(]) revient ‡ résoudre le systeme linéaire (ou ma-

tricielle) des ] équations de Yulle-Walker ‡ ] inconnus 2 1, 2 2 , ..........2 p et les valeurs estimées

>

de p h, sont p h

Remarque

ó 1. Le corrélogramme díun modele 4R est un corrélogramme dont les valeurs abso- lues diminuent, jusquí‡ quíelles deviennent nulles.

ó 2. Il níest toujours facile díidentiÖer un modele autoregréssif par sa fonction díauto- corrélation, sauf dans le cas 4R(1), cíest la raison pour laquelle nous avions eu

recours aux autocorrélations partielles.

Fonction díautocorrelation díun MA(q)

Considérons le modele @ 4(1) vériÖant líéquation suivante :

Xt 6 6 t # 16 t 1

2 O ov (X , X

) 6 O ov (6

# 6 , 6

# 6 )

) t t 1

t 1 t 1 t 1

1 t 2

O ov (Xt, Xt 1) 6 O ov (6 t # 16 t 1, 6 t 1 # 16 t 2 )

3 O ov (Xt, Xt 1) 6 7 1

2

)

7 h 6

3

(1 ) # 2 )) 2 , h 6 0

# 1) 2 , h 6 1

0 , h 2 1

Ainsi, par récurrence on trouve que la fonction díautocovariance díun @ 4(q ) síécrit comme

suit :

1

2 (1 ) # 2

)5

2

) # 2

H

) ....... ) # 2 )) 2 , h 6 0 ,

7 h 6

( # h ) # 1# h# 1 ) ....... ) # H h# q ))

0 , h 2 q ,

2 , 0 0 h 0 q ,

Díoü la fonction díautocorrélation :

2

7 h 5)

1, h 6 0 ,

( # h ) # 1# h# 1 ) ....... ) # H h# q )

7

p h 6 6

$ 5

1

(1 ) # 2

2

H

) # 2

) ....... ) # 2 ) , 0 0 h 0 q ,

0 , h 2 q

On remarque que la fonction díautocorrélation síannule ‡ partir díun décalage supérieur ‡

q , on dit quelle est tronquée au-del‡ du retard q . Donc on peut identiÖer un @ 4(q ) ‡ partir

du corrélogramme qui síannule ‡ partir díun retard supérieur ‡ q .

Fonction díautocorrelation díun & / , & (: , ; )

Pour calculer les autocorrélations díun modele 4R@ 4, on procede comme dans le cas des modeles 4R. A partir de líéquation

Xt 2 1Xt 1 2 2 Xt 2 ......... 2 p Xt p 6 t t # 1t t 1 # 2 t t 2 ......... # q t t q

1

On peut, en multipliant les deux membres par Xt h et en introduisant líespérance, on obtient líéquation suivante :

! Xt

7 $

1

2 1E(Xt 1

Xt h

) ........ 2

p E(Xt p

Xt h

)" 6

8 E(t tt t h) # 1E(t t 1t t h) ........ # q E(t t q t t h)]

7

$

Comme t t est un bruit blanc, et par conséquent non corrélé avec le passé du processus Xt,

donc E(t tXt h) 6 0 , on obtient

V

p h 2 1p h 1 ........ 2 p p h p 6 0 , h 2 q ,

p

p h 6

z

i l 1

2 i p h i , V h 2 q

3.9.5 Fonction díautocorrelation partielle

Fonction díautocorrelation partielle díun 4R(])

On considere le modele 4R(X), les équations de Yule-Walker :

p j 6 2 k 1p (j 1) ) 2 k 2 p (j 2) ) ...... ) p (j X), j 6 1, >

oü 2 k j est le j? E ? coecents cient du modele autoregréssif díordre X.

2

2 k k est la fonction díautocorrélation partielle díordre X.

Líautocorrélation partielle entre X1et Xk mesure la corrélation entre X1et Xk lorsque nous avions supprimé líe§et de X2 , X3 , X4 , ....., Xk 1.

Soit le systeme suivant :

0 p 1 1

0 1 p 1 p 2 . . p k 1 1 0 k 1 1

.

I I I I I I

6

Donc :

p 2 I I

I I

6

I I

.

I I

I I

I I

7 6

.

p k

p 1 1 p 1 . . p k 2 I

I

. . 1 . . . I

I

. . . 1 . . I

7

. . . . 1 . I

.

.

.

.

1

p k 1

I 2 k 2 I

.

I I

I I

.

I I

I I

.

I I

6 7

2 k k

2 k k 6

% 1 p 1 p 2 ......... p k 1 %

%

%

%

%

% p 1 1 p 1......... p k 2 %

%

%

% ..................... %

%

%

% p k 1 p k 2 ............p k %

%

%

% 1 p 1 p 2 ......... p k 1 %

%

%

% p 1 1 p 1......... p k 2 %

%

%

%

%

% ..................... %

Avec

% p k 1 p

k 2 .............1 %

%

% 1 p 1 p 2 ......... p k 1

%

% p 1 1 p 1......... p k 2

%

% .....................

%

%

%

%

% 6 0

%

%

%

% p k 1 p

k 2 .............1 %

On peut donc lire líordre ] díun modele autoregréssif sur le corrélogramme 2 des autocorré- lations partielles, ce dernier síannule ‡ líordre ] ) 1

Ainsi, si la fonction díautocorrélation partielle díune série est calculée et si elle parait tronquée, on peut modéliser la série par un modele autoregréssif.

Fonction díautocorrelation partielle , & (; )

AÖn de calculer les autocorrélations partielles díun modele @ 4, nous utilisons líalgorithme

de Durbin. Contrairement au modele 4R(]), la fonction díautocorrélation díun modele @ 4

nía pas díexpression explicite.

Xt 6 t t & t t 1

avec t t est un bruit blanc et 5 & 5 0 1. La fonction díautocovariance de ce processus est :

7 $ 6 E(XtXt) 6 E 8 (t t & t t 1) (t t & t t 1)] 6 (1 ) & 2

2

2

) ( , h 6 0 ,

7 1 6 E(XtXt 1) 6 E 8 (t t & t t 1) (t t 1 & t t 2 )] 6 & ) ( , h 6 1,

7 h 6 E(XtXt h) 6 E 8 (t t & t t 1) (t t 1 & t t h 1)] 6 0 , h % 2,

On en déduit la fonction díautocorrélation

2

5)

p h 6

53

1, h 6 0

&

1 ) & 2 h 6 1,

0 , h > 2

Les autocorrélations partielles sont donc données récursivement par líalgorithme de Durbin.

Nous avons :

2

I 2 11 6 p 1 6

I

9

2

1 ) 9 2 ,

2 22

p 2 2 11p 1 p 1

6 6 2

1 2 11p 1

I

1 p 1

I p 3 2 2 1p 2 2 22 p 1

2 22 p 1

2 33 6

1 2 2 1p 1

6

2 22 p 2

1 2 22 p 1

Comme nous avons :

2 2 1 6 2 11 2 22 2 11(1 2 22 ) 6

p 1 ,

1

1 p 2

Nous déduisons la valeur de líautocorrélation partielle 2 33

p 3

2 33 6

1

1

1 p 2

Nous pourrons par la suite poursuivre les calculs pour déterminer les autocorrélations par- tielles díordre supérieur, en exprimant les autocorrélations en fonction de 9 pour obtenir une

suite récurrente on a :

2 22 6

p 2

1

1

1 p 2

9 2

et p 1 6

9

1 ) 9 2

2 33 6

1 ) 9 2 ) 9 4

On remarque que

*

(1 ) 9 2 ) 9 4 ) 6 1 9

donc 2 22 6

1 9 2

9 2 (1 9 2 )

1 9 *

En raisonnant de la même maniere pour 2 33 on trouve

9 3 (1 9 2 )

2 33 6

1 9 ,

La formule de récurrence pour les autocorrélations partielles díun modele @ 4(q ) est alors

donnée par :

2 k k 6

9 k (1 9 2 )

1 9 2 ! k # 1)

3.9.6 Series non stationnaires

Les chroniques économiques sont rarement des réalisations de processus aléatoires sta- tionnaires. La non stationnarité des processus peut concerner aussi bien le moment du pre- mier ordre (espérance mathématique) que celui du second ordre (variance et covariance du processus). Celle-ci peut être repérée graphiquement (tendance, cycle long, saisonnalité ex- plosive, modiÖcation de structure...) ou encore au moyen de la fonction díautocorrélation (fonction díautocorrélation lentement décroissante). Mais la plupart des résultats et des mé- thodes utilisées dans líanalyse des séries temporelles repose sur la notion de stationnarité

du second ordre, ce qui nous mene ‡ appliquer ‡ la chronique non stationnaire certaines

transformations(di§érence ordinaire, di§érence saisonniere, la formule de Box-Cox...). Parmi

les processus aléatoires non stationnaires, on peut distinguer deux grandes classes, ‡ savoir

les processus T F et les processus 7F.

DeÖnition et description des processus 1 0 et ( 0

DeÖnition

Un processus 1 0 (trend stationnary) represente une non stationnarite de type deterministe, il síecrit sous la forme Xt 6 S t ) t t ocents S t est une fonction polyno- miale qui depend du temps, lineaire ou non lineaire, et t t est un processus de

type & / , & .

Le processus T F le plus simple est représenté par une fonction polynomiale de degré 1. Le processus síécrit :

Xt 6 a$ ) a1t ) t t

Si t t est un bruit blanc, les caractéristique de ce processus sont alors :

2

) E8 Xt] 6 a$ ) a1t ) E8 t t] 6 a1t ) a$

#

I a_8 Xt] 6 0 ) I a_8 t t] 6 ) 2

3 O ov (Xt, Xt ) 6 0 pour t 6 t#

Nous constatons que le processus T F est caractérisé par une espérance mathématique ‡ ten-

dance déterministe, une variance constante au cours du temps et par des covariances nulles, dans un tel modele la réalisation des prévisions níest pas une tche facile.

DeÖnition

Les processus ( 0 (di§erncy stationnary) sont des processus non stationnaires

aleatoires quíon peut rendre stationnaire par líutilisation díun Öltre aux di§e- rences : (1 B)> Xt 6 B ) t t5 oü t t est un processus bruit blanc, B est une constante reelle, et Q est líordre du Öltre aux di§erences.

Ces processus sont souvent représentés en utilisant le Öltre aux di§érences premieres (Q 6 1)

le processus est dit alors du 1?I ordre il síécrit :

(1 B)Xt 6 B ) t t

Un processus 7F síécrit sous la forme suivante :

Xt 6 p Xt 1 ) ) t t oü t t est un processus stationnaire. Nous pouvons écrire ce processus sous une autre forme :

Xt 6 p 2 Xt 2 ) p ) p t t 1

) ) t t,

Xt 6 p 3 Xt 3 ) p 2 ) p 2 t t 2

Par récurrence on obtient :

) p ) p t t 1

) ) t t.

Xt 6 p r Xt r ) z r 1 p 3 ) z r 1 p 3 t t 3

3 l 0

3 l 0

Nous supposons que 5 p 5 6 1 et que * 6 t nous aurons donc

3 l 1

Xt 6 X0 ) t ) z t t 3

oü X0 désigne le premier terme de la série Xt.

Passons maintenant ‡ líétude des caractéristiques de ce processus

3 l 1

a) E (Xt) 6 E & X0 ) t ) z t

t 3 ' 6 E(X0 ) ) t ,

b ) I (Xt) 6 E (Xt E (Xt))2

0

6 E & z

1

2

t

3 l 1

t 3 '

, t

6 E z t i

i l 1

t -

z t 3 ,

3 l 1

t

6 E I z

t

t 2 ) z

t

z t i t 3 I

t

6 z E (t 2 ) ) 0 6 t) 2 ,

6 i l 1 i

i l 1 3 l 1

i l 3

7 i l 1 i (

P ) O ov (Xt, Xs) 6 E 8 (Xt E (Xt)) E (Xs E (Xs))] ,

. ( t

6 E z t 3

i l 1

) , t - /

z t 3 ,

3 l 1

(

6 @ i[ (t, ` ) ) 2

V t 6 `

Nous constatons que le processus 7F est caractérisé non seulement par une non station-

narité de type déterministe, provenant du fait que son espérance est une fonction évolutive

dans le temps, mais aussi par une non stationnarité de nature stochastique par le biais des perturbations dont la variance est une fonction acents ne du temps dont le coecents cient est la variance du processus bruit blanc ; de ce fait nous pouvons conclure que dans ce type de pro- cessus, chaque perturbation aléatoire est persistante et possede un e§et durable et cumulatif

sur le comportement de la série.

Connaissant les di§érences qui existent entre les processus T F et 7F, nous concluons que la distinction entre ces deux types de processus est díune grande importance, puisque si líon est en présence díun processus T F et que líon traite comme un processus 7F, et vice versa, on aboutie ‡ une mauvaise stationnarisation.

3.9.7 Test de Dickey-Fuller

Test de Dickey-Fuller simple (DF)

Les modeles suivant de base ‡ la construction de ces tests sont au nombre de trois, et dans ce qui suit t t est un processus bruit blanc

8 1] : Modele sans constante ni tendance déterministe

Xt 6 p Xt 1 ) t t

8 2] : Modele avec constante et sans tendance déterministe

Xt 6 c ) p Xt 1 ) t t

8 3 ] : Modele avec constante et avec tendance déterministe

Xt 6 c ) b t ) p Xt 1 ) t t

On teste líhypothese nulle ;0 de présence de racine unitaire (Xt est intégré díordre 1,< (1), donc non stationnaire) contre líhypothese alternative ;1 en líabsence de racine unitaire (Xt

est intégré díordre 0 , cíest ‡ dire que Xt est stationnaire). Líhypothese du test comme suit 4

* ;0 4 p 6 1

;1 4 5 p 5 0 1

En síinspirant du modele 1.

Xt 6 p Xt 1 ) t t ...(1)

retranchons Xt 1de chaque coté de líéquation (1)

Xt Xt 1 6 p Xt 1 Xt 1 ) t t

Xt 6 (p 1)Xt 1 ) t t

En pratique et en posant b 6 (p 1) on estime les modéles suivants :

modéle8 .] :

Xt 6 b Xt 1 ) t t

modéle8 / ] :

Xt 6 c ) b Xt 1 ) t t

modéle8 6] :

Xt 6 c ) b t ) b Xt 1 ) t t

Ce qui revient ‡ dire que le test de racine unitaire repose sur le test de líhypothése nulle

b 6 0 (non stationnaire) contre líhypothése alternative 5 b 5 6 0 (stationnaire), et donc le systéme díhypothése devient :

* ;0 4 b 6 0

;1 4 5 b 5 6 0

Principe des Tests de Dickey-Fuller

Sous líhypothése ;0 , le processus Xt níest pas stationnaire quelque soit le modéle retenu. Les régles habituelles de líinférence statistique ne peuvent donc pas être appliquées pour tester cette hypothése, en particulier la distribution de Student du paramétre p . Dickey et Fuller

ont étudiés la distribution asymptotique de líestimateur du paramétre p sous líhypothése ;0

‡ líaide des simulations de Monte-Carlo, ils ont tabulé les valeurs critiques pour des échan- tillons de tailles di§érentes.

Soit la t-statistique notée (t'b

critique tt; < L D ? :

) tel que t'b 6

)

ç 'b

1

, on compare alors la t'b

avec la valeur

ó Si t'b

% tt; < L D ?

alors on accepte líhypothése ;0 , il existe une racine unitaire.

ó Sinon on rejette líhypothése ;0

Remarque

ó 1 Ces tests révélent líexistence díune racine unitaire mais restent insucents sants pour

discriminer entre les processus T F et 7F, cíest ainsi quíon adopte un algorithme

en trois étapes.

ó 2 On dit que la tendance est signiÖcativement di§érente de 0 ssi t'b

% tt; < L D ?

alors

la tendance existe sinon elle est dite non signiÖcativement di§érente de 0 .

ó 3 On dit que la constante est non signiÖcativement di§érente de 0 :

ssi sa t-statistique 0 valeur critique sinon elle est dite signiÖcativement di§érente

de 0.

Enonce de líalgorithme

Etape (1) : dans cette étape on estime le modéle 8 3 ] , et on teste la signiÖcativité de la tendance.

ó Si la tendance níest pas signiÖcativement di§érente de 0 , aller ‡ líétape (2).

ó Sinon (la tendance est signiÖcativement di§érente de 0 ) on teste líhypothése nulle

;0 (on compare t'b

avec les valeurs critiques de 7F )

ó Si ;0 est acceptée, Xt est non stationnaire donc de type 7F, on di§érencie Xt et on recommence les tests précités sur la série aux di§érences premiéres.

ó Sinon (;0 rejetée), Xt est stationnaire donc de type T F ; on peut directement analyser cette série.

Etape(2) : cette étape níest e§ectuée que si la tendance níest pas signiÖcativement

di§érente de 0 , on estime le modéle8 2] (avec constante et sans tendance).

ó Si la constante níest pas signiÖcative, aller ‡ líétape 3

ó Sinon (la constante est signiÖcative) on teste líhypothése ;0 .

ó Si ;0 est acceptée, Xt est non stationnaire on di§érencie Xt et on recommence.

ó Sinon (;0 rejetée), Xt est stationnaire.

Etape(3) : cette étape níest e§ectuée que si la constante níexiste pas, on estime dans ce cas le modéle[1] et on teste ;0

ó Si ;0 est acceptée, Xt est non stationnaire on doit la di§érencie.

ó Sinon, Xt est stationnaire, dans ce cas on analyse la série.

3.9.8 Test de Dickey-Fuller augmente

Transformation des modËles de base

Dans les modéles précédents, utilisés par les Tests de Dickey-Fuller simple, le processus t t est par hypothése un bruit blanc. Or il níy a aucune raison pour que ‡ priori, líerreur soit non corrélée ; on appelle tests de Dickey-Fuller augmentés (47F , 192 1) la prise en compte de

cette hypothése. Les tests 47F síe§ectuent exactement comme les tests 7F sur les modéles suivants :

modéle 8 .] :

Xt 6 b Xt 1 )

modéle 8 / ] :

p

z

j l 1

b j - Xt j ) t t

Xt 6 b Xt 1 )

modéle 8 6] :

p

z

j l 1

b j - Xt j ) t t ) C

Xt 6 b Xt 1 )

p

z

j l 1

b j - Xt j ) t t ) C ) b t

On pratique nous allons utiliser les tests de 47F

Remarques

ó 1 Avant díappliquer le test 47F il faut préciser líordre de décalage ] en utilisant le critére díAkaÔke.

ó 2 Les principaux logiciels díanalyse de séries temporelles calculent automatiquement

les valeurs critiques ‡ líinstar de EVIEWS 4.0.

3.9.9 Analyse de la saisonnalite

Une série chronologique saisonniére est une série dont les données relatives ‡ une même période (la période est plus courte quíune année) de di§érentes années ont tendance ‡ se situer

de faÁon analogue par rapport ‡ la moyenne annuelle. Elle peut se relier ‡ des observations trimestrielles et mensuelles aussi bien que díheure en heure ou aux observations quotidiennes.

Il est possible de détecter cette saisonnalité par un examen graphique de la série, qui se

manifeste par la répétition díun certain phénoméne dans chaque période. Ou par un examen fait sur le corrélogramme de la série étudiée, qui laisse apparaÓtre des pics trés marqués aux retards 1, S, 2S, ....

On en déduit une saisonnalité de périodicité S (S 6 3 , 6, 12, ..).

3.9.10 Test de Fisher sur la saisonnalite

On a recours ‡ ce test pour détecter líexistence díune éventuelle saisonnalité dans une série ‡ partir de líanalyse de la variance, soit :

N 4 Le nombre díannées.

P 4 Le nombre díobservations dans líannée (périodicité), pour des données mensuelles P 6 12,

trimestrielles P 6 ..

La procédure du test est comme suit :

Calcul de la somme des carrees : ST

4 6

ST 6 < <

(c i a c )2

Avec :

i l 1 a l 1

c i a 4 est la valeur de la série pour la i? E ? année et la j ? E ? période.

c 4 est la moyenne générale de la série sur les N ! P observations.

4

c 6 1 z

6

z c i a

N ! P

6

Calcul de la somme des carres annuels : SA

i l 1 a l 1

4

SA 6 P z

(c i c )2 avec c i 6

1

<

c i a est la moyenne de líannée i

i l 1

P

a l 1

Calcul de la somme des carres periodiques : 0 6

S6 6 N

6

<

a l 1

(c a c )2 avec c a 6

4

1 < c

N i a

i l 1

est la moyenne de la période j .

Calcul de la somme des carres residuels : SR

SR 6

4

<

i l 1

6

< (c i a c i c a ) c )2

a l 1

Calcul des variances :

SA

Variance de líannée : I 4RA 6 N 1

S6

Variance de la période : I 4R6 6 P 1

SR

Variance des résidus : I 4RR 6

(P 1)(N 1)

ST

Variance totale : I 4RT 6

N (P 1)

Le test de saisonnalité est construit ‡ partir des hypothéses suivantes :

* H0 : Pas de saisonnalité

Hi : Il existe une saisonnalité

On a : F . 6

I 4R6

I 4R

R

Si F . > F a (P 1, (N 1) x (P 1)), alors on accepte líhypothése Hi selon laquelle la série

est a§ectée díune saisonnalité

Le test de tendance est construit ‡ partir des hypothéses suivantes :

* H0 : Pas de tendance

Hi : Il existe une tendance

On a : F . 6

I 4RA

I 4R

R

Si F . > F a (P 1, (N 1) x (P 1)), alors on accepte líhypothése Hi selon laquelle la série

est a§ectée díune tendance.

Desaisonnalisation

Pour exprimer ce quíaurait été líináuence de la série sans líináuence saisonniére, on utilise

la série corrigée des variations saisonniéres X

Dans le modéle additif : Xt 6 Xt St

Si : Coecents cient saisonnier brut pour chaque saison j (Si 6 moyenne des di§érences de la saison j ). Si 6 Si Si : coecents cient saisonnier

Dans le modéle multiplicatif : Xt 6 Xt/ St

Si : Coecents cient saisonnier brut pour chaque saison j (Si 6 moyenne des rapport de la saison j )..........Si 6 Si / Si : coecents cient saisonnier.

3.9.11 Extension des modËles 4R@ 4

Líhypothése de stationnarité, présente-sous certaines conditions dans les modéles 4R@ 4, níest que rarement vériÖée pour les séries économiques ; Elles comportent également une ten- dance, une saisonnalité ou même une structure plus complexe. Par conséquent, líintérêt des modéles 4R@ 4 semble assez limité.

ModËles autoregressif moyenne mobile integre díordre (: , 6 , ; ) : & / * , & (: , 6 , ; )

Un processus Xt est un modéle 4R< @ 4(], Q , q ) síil vériÖe une équation de type :

# (B)(1 B)> Xt 6 ! (B)t t pour tout t % 0

* # (B) 6 1 b iB b 2 B2 .... b 6 B6 oü b 6 6 0

! (B) 6 1 9 iB 9 2 B2 .... 9 q Bq oü 9 q 6 0

Sont des polynOmes dont les racines sont de module supérieurs ‡ 1 et aucune des racines de

# (B) níest égale ‡ une racine de ! (B).

Les coecents cients réels b i , i 6 1, ..., ] et 9 i j 6 1, ..., q , sont Öxés et 3 t t4 est un bruit blanc.

La famille 4R< @ 4 désigne parfois la classe de tous les modéles, stationnaires et non sta- tionnaires, en convenant que les 4R< @ 4 (], 0 , q ) sont les 4R@ 4(], q ).

Propriete : Soit Xt un modéle 4R< @ 4(], Q , q ) alors le processus(8 > Xt) converge vers un modéle 4R@ 4(], q ) stationnaire.

ModËles & / * , & saisonnier, 0 & / * , &

Une classe plus générale de modéles est constitué par les S4R< @ 4 qui permettent de rendre compte des phénoménes périodiques et de non stationnarité.

On dit quíun processus Xt suit un modéle S4R< @ 4(], Q , q ) x (P, 7, D )9 si :

9

V t, # p (B)# 6 *9 (B9 )8 > 8 / Xt 6 ! q (B)! 7 *9 (B9 )t t,

Oü S est la période de la saisonnalité, 8 > est líopérateur de di§érence ordinaire

9

de degrés Q , 8 /

est líopérateur de di§érence saisonniére de degrés 7 ;

# p (B) est un polynOme de degré ] en B, appelé polynOme autoregressif ordinaire ;

! q (B) est un polynôme de degré q en B, appelé polynôme moyenne mobile ordinaire ;

# P ,S (BS ) 6 1 b 1,S BS b 2 ,S B2 S .... b P ,S BP S est appelé polynôme autoregressif saisonnier ;

! Q ,S (BS ) 6 1 ) & 1,S BS & 2 ,S B2 S .... & Q ,S BQ S est appelé polynôme moyenne mobile saisonnier ;

S

Xt est déÖni aussi comme un modéle S4R< @ 4(], Q , q ) x (P, 7, D )S díordre S si 8 > 8 / Xt

est un modéle S4R@ 4(], q ) x (P, D )S . En pratique Q 6 0 , 1, 2 et 7 6 0 , 1.

ModËles & / , & saisonnier, 0 & / , &

Un processus Xt satisfait une représentation 4R@ 4 saisonniére (ou S4R@ 4), notée 4R@ 4S ,S (], q ), si :

p

<

i l 0

b i S Xt i S 6

q

<

i l 0

b i S t t i S ( ) #

p ,S

(BS )8

/

S Xt 6 !

q ,S

(BS

)t t

(

Avec V j 0 ], b i E R, V j 0 q , & i E R, b 0 6 & 0 6 1 et (b P , & q ) E R, , t t est iid (0 ,) 2 ) et oü

` désigne la période de la saisonnalité de la composante 4R et ` désigne la période de la saisonnalité de la composante @ 4 ; ] et q indiquent líordre respectif des deux modéles 4R

et @ 4 combinés.

3.9.12 Transformation des donnees

Diverses transformations peuvent être apportées aux données avant toute modélisation, aÖn de prendre en compte des tendances exponentielles, des ruptures, des points aberrants,

des phénoménes saisonniers. Ainsi pour certaines séries, on ne pourra pas atteindre la sta- tionnarité en appliquant juste líopérateur de di§érence.

Parmi ces transformations nous avons les données transformées par fonction puissance :

8 (Xt)% ) a] / b , a E R, b E R, A E R .

La classe de transformation la plus répandue en économétrie, est celle de Box-Cox dans un trés célébre article, correspond a cette famille, avec a 6 1 et b 6 A

X %

B(Xt, A ) 6

* t 1

A

quand A 6 0

oü Xt doit être positif 0 < A < 1

? B= (Xt) quand A 6 0

Une des raisons de la popularité de la transformée de Box-Cox est quíelle incorpore a la

fois la possibilité díaucune transformation (quand A 6 1) et la possibilité díune transforma-

X %

tion logarithmique quand (A 6 0 ; Lim

t 1 6 Log (X )).

t

% " 0 A

En générale, on choisit le logarithme des valeurs pour atténuer une croissance exponen- tielle ou amoindrir le phénoméne de saisonnalité.

Chapitre 4

MÈthodologie de Box et Jenkins

La méthodologie de Box et Jenkins (1910 ) permet de trouver en plusieurs étapes, un modéle 4R@ 4 susceptible de représenter une série chronologique. Elle níest en fait que líapplication de la méthode scientiÖque aÖn díobtenir le modéle 4R@ 4 réel générant la série. Rappelons que la méthode scientiÖque consiste a formuler des suppositions sous forme díun modéle a les mettre a líépreuve et a réviser le modéle en conséquence. Ces étapes étant répétées autant de fois que nécessaire. Une fois le modéle 4R@ 4 connu, on peut déterminer mécaniquement les prévisions. Comme il faut encore pouvoir représenter la tendance et la saisonnalité, on étend la classe des modéle 4R< @ 4 et S4R< @ 4. Cette méthode síe§ectue

en trois grandes étapes a savoir : líidentiÖcation du modéle, líestimation des paramétres et

la validation.

38

4.1 IdentiÖcation du modËle

Cette étape consiste a identiÖer le modéle 4R@ 4 susceptible de représenter la série, cíest pour cela quíil est important de se familiariser avec les données en examinant le graphe

de la série chronologique (présence de saisonnalité, stationnarité,...) qui permet de faire une analyse préliminaire qui consiste par exemple a corriger les données aberrantes, transfor- mer les données (transformation logarithmique, inverse, racine carrée,...) puisquíil faut se ramener a un modéle 4R@ 4 stationnaire, le recours aux di§érence premiére ordinaire, dif- férence premiére saisonniére, di§érence ordinaire et saisonniére voir en di§érence seconde est primordiale. Le choix est dicté par líallure graphique de la série. Díailleurs le choix de la transformation des données est plus facile aprés avoir appliquer les opérateurs de di§érence adéquats.

Il est conseillé de comparer les variances des di§érentes séries. La série avec la plus petite

variance conduit souvent a la modélisation la plus simple. Comme líinspection des autocor- rélations partielles (P 4O ) donne une idée sur líordre du modéle autoregréssif et celle des autocorrélations simples (4O ) donne une idée sur líordre du modéle moyenne mobile, líétude

des corrélogrammes sera díun apport important dans cette étape.

4.2 Estimation

Líobjectif est de trouver les estimateurs des paramétres de la partie 4R et @ 4 du modéle de la chronique. Líestimation du modéle 4R@ 4 repose sur la méthode de maximum

de vraisemblance. Plus spéciÖquement la technique consiste a construire une fonction appelée fonction de vraisemblance et a maximiser son logarithme par rapport aux paramétresb i et & i (avec i : 6 1, ] et j : 6 1, q ) permettant de trouver la valeur numérique la plus vraisemblable pour ces paramétres

Líétape díestimation achevée, líétape suivante va nous permettre de valider le(s) modéle(s)

estimé(s).

4.3 Validation

A líétape de líidentiÖcation, les incertitudes liées aux méthodes employées font que plu- sieurs modéles en générale sont estimés et cíest líensemble de ces modéles qui subissent alors líépreuve des tests, Il existe de trés nombreux permettant díune part de comparer les per- formances entre modéles, on peut citer les tests sur le modéle, les tests sur les paramétres et

les tests sur les résidus.

4.3.1 Tests sur le modËle :

Il faut vériÖer si :

ñLes coecents cients estimés satisfont aux conditions de stationnarité et díinvesrsibilité.

ñLes composantes AR et M A de líARM A níont pas de racine communes.

Ces questions ont une réponse immédiate puisque le logiciel utilisé fournit les inverses des racines des deux polynômes AR et M A, il sucents t de voir si les racines sont :

Strictement supérieure a 1 (a líextérieur du disque unité, les inverses a líintérieur).

Sont distincts, au cas contraire, on peut alors se ramener a une représentation minimale excluant ces racines, dont les degrés de la représentation ARM A seront strictement inférieurs

a ceux de la représentation initiale. Cette représentation sera préférable selon le principe de parcimonie.

4.3.2 Test de Student sur les paramËtres

Le premier test que líon peut mener consiste a tester líhypothése nulle p1 6 p 1 et q 1 6 q

On regarde si líon peut diminuer díune unité le nombre de retards intervenants dans la partie

AR Ce test est trés simple a mettre en oeuvre puisquíil síagit díun test de signiÖcativité usuel

bç p

sur le coecents cient b p ) On calcule donc la statistique de Student du coecents cient (t'b# 6

)

ç 'b#

) que

líon compare a la valeur critique lue dans la table de la loi de Student. La régle de décision est alors :

%

%

Si % t

% 0 ti

, on accepte líhypothése nulle de modéle ARM A(p 1, q ),

% 'b# % 2

%

Si % t

%

% > ti ,líhypothése nulle est rejetée et on retient un modéle ARM A(p, q ),

% 'b# % 2

i

a

Oü t

2

est le quantile díordre (1

2 ) de la loi de Student (T h) degrés de liberté, h étant

le nombre de paramétres estimés.

Bien entendu, on peut appliquer un raisonnement similaire au test de líhypothése nulle p1 6 p

et q 1 6 q 1.

Remarque

De faÁon symétrique, il est possible de mener un deuxiéme test de líhypothése nulle de processus p* 6 p ) 1 et q * 6 q .

4.3.3 Tests sur les residus

Le processus estimé est évidemment de bonne qualité si la chronique calculée suit les évolutions de la chronique empirique. Les résidus entre les valeurs observées et les valeurs calculées par le modéle, doivent se comporter comme un bruit blanc normal.

Pour montrer que les t t sont un bruit blanc, on doit vériÖer si :

ñLa moyenne des résidus est nulle, sinon il convient díajouter une constante au modéle.

ñ Le graphe des résidus en fonction du temps semble approximativement compatible avec une suite de variables aléatoires non corrélées.

Cíest ainsi que nous proposerons une multitude de tests concernant les caractéristiques du

résidu souhaité.

Test de normalite

Le test de Jarque & Bera (192 .) peut síappliquer pour tester la normalité des résidus. Ce dernier est fondé sur la notion skewness (moment díordre 3 , líasymétrie de la distribution) et Kurtosis (moment díordre . et líaplatissement - épaisseur des queues de distribution). Soit

% k le moment empirique díordre X du processus

ç

Skewness

ç

4

t t E 8 t t]] K 6

1 <

N

tl i

ç

(t t t t)

Le skewness est une mesure de líasymétrie de la distribution de la série autour de sa moyenne.

% 3

Le coecents cient du skewness (Sk )est déÖni par : (Sk )i+ 2 6

4

3 + 2

%

2

& N (0 , C * ).

4

" $

Le skewness díune distribution symétrique, telle que la distribution normale est nulle. Le

skewness positive signiÖe que la distribution a une queue allongée vers la droite et le skew- ness négative signiÖe que la distribution a une queue allongée vers la gauche.

Kurtosis

Le Kurtosis mesure le caractére pointu ou plat de la distribution de la série. Le coecents cient

du Kurtosis (ku ) est déÖni par : ku 6

&

% 4

4

% 3 " $

N (3 ,

C 24

4 ). Le Kurtosis de la distribution

normale est 3 . Si le Kurtosis est supérieure a 3 , la distribution est plutôt pointu relativement

a la normale ; si le Kurtosis est inférieure a 3, la distribution est plutôt plate relativement a

la normale.

On construit alors les statistiques centrées réduites correspondantes a (Bk )i+ 2 et ku que líon compare aux seuils díune loi normale centrée réduite

(Bk )i+ 2

4

. C *

4

& N (0 , 1)

" $

ku 3

4

C 24

4

& N (0 , 1)

" $

Si la statistique centrée réduite de (Bk )i+ 2 est inférieure au seuil 1, 96 a 5 % , on accepte líhy-

pothése de symétrie et líhypothése de normalité. Si la statistique centrée réduite de ku est inférieure au seuil 1, 96 a 5 % , on accepte líhypothése de queue de distributions plates et líhypothése de normalité.

Jarque-Bera

Le Jarque-Bera est une statistique de test pour examiner si la série est normalement distri- buée. La statistique mesure la di§érence du skewness et du Kurtosis de la série avec ceux de

la distribution normale. La statistique est calculée comme suit :

J B 6

N

6 Bk )

N

&

(ku 3 )2

2. 4 " $

x 2 (2)

Oü Bk est le skewness, ku est le Kurtosis. Sous líhypothése nulle díune distribution normale,

i a

la statistique de Jarque-Bera suit asymptotiquement une loi de x 2

avec deux degrés de

i a

liberté ( 6 5 % ), aussi, si J B > x 2

(2) on rejette líhypothése HO de normalité des résidus

au seuil . La probabilité rapportée associée a cette statistique est la probabilité que la statistique de Jarque-Bera dépasse (en valeur absolue) la valeur observée. Une probabilité faible conduit a rejeter líhypothése nulle díune distribution normale.

Test de Durbin Watson

Le test de Durbin Watson permet de détecter une autocorrélation des résidus díordre 1, sous

la forme t t 6 p t t 1 ) " t oü " t s N (0 , )

Le test díhypothése síécrit :

2 )e

* HO : p 6 0 (absence de corrélation)

H1 : p 6 0 (présence de corrélation)

Pour tester líhypothése HO , la statistique de Durbin Watson utilisée est

F

2

< (t t ç )

7J 6

ç

tl 2

F

t t 1

< t 2

ç t

tl 1

t

Oü t sont les résidus de líestimation du modéle.

ç

De part sa construction, cette statistique est comprise entre 0 et .. On peut aussi montrer

p =0 (p étantp observée). AÖn de tester HO , Durbin Watson ont tabulé

que 7J 6 2 lorsque ç ç

des valeurs critiques7J au seuil de 5 % oü on présentera la table dans líannexe appropriée,

ainsi que le mécanisme du test.

Test de Box - Peirce (1970) (portementeau)

Ce test, encore appelé "test portmenteau", a pour objet de tester le caractére

non autocorrélé des résidus. Le test de Box- Peirce établi a partir de la statistique de que-

p 2

1

nouille Q 6 T z

ç h(t )e

hl 1 ç

p 2

ç

oü : ç h(t ) est le coecents cient díautocorrélation díordre h des résidus estimés, et H est le nombre

maximal de retards sous les hypothéses suivantes :

* HO : p (1) 6 p (2) 6 eeeee 6 p (h) 6 0

H1 :0 j tel que b i 6 0

! 1 a )

Cette statistique Q en líabsence díautocorrélation obéit a un x 2

(H p q ) degrés de

liberté oü : p est líordre de la partie AR (saisonnier ou non), q est líordre de la partie M A

et H est le nombre de retards choisis pour calculer les autocorrélations.

4

Pour e§ectuer ce test il est conseillé de choisir H 6 T (díaprés Box et Jenkins). Líhypothése

HO est rejetée au seuil de 0 e05 si Q est supérieur au quantile 0.95 de la loi x 2 , autrement dit

les régles du test portemanteau sont :

! 1 a )

ñSi Q < x 2

! 1 a )

ñSi Q > x 2

(H p q ) on accepte HO 6 ) les p h

(H p q ) on rejette HO 6 ) les p h

forment un bruit blanc.

ne forment pas un bruit blanc.

Test de Ljung-Box

Ce test est a appliquer, de préférence au test de Box - Peirce, lorsque líéchantillon est de petite taille. La distribution de la statistique du test de Ljung-Box est en e§et plus proche de celle de Khi-deux en petit échantillon que ne líest celle du test de Box - Peirce. La statistique

ç h(6 )

p

1 2

de test síécrit : LB(h) 6 T (T ) 2)< ç

T h

hl 1

Sous líhypothése nulle díabsence díautocorrélation :

p 2 6 t).

6 2 ) 6 ....... 6 ç h( ç

La statistique LB(h) suit une loi de Khi-deux a (H p q ) degrés de liberté.

Test de nullite de la moyenne des residus

Un bruit blanc est díespérance mathématique nulle. On e§ectue donc sur les résidus 6 t prévi- sionnels du modéle un test de nullité de leur moyenne. Pour [ sucents samment grand ([ > 30 )

6 N (m 5 a 8 ) et 6 m

' 7 [ a 8

7 [ ' N (0 5 1). Sous líhypothése HO de nullité de la moyenne et un

a 8 a 8

seuil díacceptation a 95 % , líintervalle de conÖance de 6 est : 1, 96 7 [ < 6 < 1, 96 7 [

Remarque

[ est le nombre díobservations de la chronique des résidus.

Dans la construction des séries temporelles, on estime souvent plusieurs spéciÖcations. Il peut arriver que deux ou plusieurs modéles soient adéquats, dans ce cas, des tests supplé- mentaires devraient être utilisés pour déterminer la meilleure spéciÖcation, cíest ainsi que nous introduisons les critéres de pouvoir prédictifs portant sur la qualité de líinformation et

du modéle.

CritËre de pouvoir predictif

Dans un modéle ARM A, líerreur de prévision a horizon 1 dépend de la variance du résidu.

On peut alors choisir le modéle conduisant a la plus petite erreur de prévision. Plusieurs indicateurs sont alors possibles :

1 La variance du résidu a 2 ,ou la somme des carrés des résidus 8C R.

2 Le coecents cient de determination R2 , correspond a une normalisation de la variance.

3 Le coecents cient de determination modife R2 .

. La statistique de Fisher.

Le but est de minimiser 1 ou de maximiser 2,3 ou ..

CritËre díinformation

Cette approche a ete introduite par Akaike en 1969, cette mesure de líecart entre le modèle propose et la vraie loi peut être obtenue a líaide de la quantite díinformation de Kullback , cette mesure etant inconnue on essayera de minimiser son estimateur.

Plusieurs estimateurs de la quantite díinformation ont ete propose :

A< C (p, q ) 6 Yo g a 2 ) 2p ) q ,

n

8C (p, q ) 6 Yo g a 2 ) (p ) q ) ? B= n , cet estimateur a ete introduit par Schwarz.

n

Remarques

En pratique, il faut toujours síassurer que le modèle le plus simple est applique Cíest

le principe de parcimonie de la methode de Box & Jenkins. Cíest a dire quíil est parfois preferable de choisir un modèle juge moins bon mais qui contient moins de paramètres. Le modèle obtenu níest pas necessairement le vrai modèle mais cíest celui qui síen approche le plus.

Les tests qui suivent ne fgurent pas dans la demarche de Box & Jenkins, mais nous les utilisons comme complementaires aux tests de validation de cette demarche.

Test de stabilite

Pour examiner si les paramètres du modèle estime sont stables a travers divers sous echan- tillons de líensemble des donnees. La technique empirique recommande le partage de líen- semble des observations n , en 2 sous ensembles :

n 1 líensemble díobservations a employer pour la reestimation du modèle trouve pour líen- semble n et líevaluation.

n 2 (n 2 6 n n 1) líensemble des informations a employer pour les comparer aux valeurs prevues.

Employer toutes les observations disponibles de líechantillon pour líevaluation favorise la recherche des specifcations avec les meilleurs ajustements de líensemble des donnees speci-

fques, mais ne permet pas de tester les previsions du modèle avec les donnees qui níont pas

ete employees en líestimant, ni de determiner la constance, la stabilite et la puissance des paramètres du rapport estime.

Dans le travail de serie chronologique on prend habituellement les premières observations pour líevaluation et les dernières pour le test. Une règle generalement utilisee, est díem- ployer 25 % a 90 % des observations pour líevaluation et le reste pour tester.

4.4 Prevision

Líobjectif de la methode de Box & Jenkins est de realiser des previsions. une fois que

le modèle AR< M A(p, Q , q ) a ete choisi, estime et valide pour les observations X1, ...., Xt, on calcule les previsions.

On suppose quíon se trouve a líinstant t, et quíon desir prevoir la valeur de x t+ h, tel que alors on utilise líestimateur XX t(h) líesperance conditionnelle de Xt+ h, tel que :

X

x t(h) 6 E[ Xt+ h/ Xt, Xt 1, ..., X1]; oü XX t(h) est la prevision, t est líorigine de la previson, et

h líhorizon de prevision.

Sous les hypothèses suivantes :

E[ Xt j / Xt, Xt 1, ..., X1] 6 Xt j , V ) > 0 ;

E[ Xt+ j / Xt, Xt 1, ..., X1] 6

XX t() ), V ) > 1;

E[ 6 t j / Xt, Xt 1, ..., X1] 6 6 t j , V ) > 0 ;

E[ 6 t+ j / Xt, Xt 1, ..., X1] 6 0 , V ) > 1.

4.4.1 Prevision a líaide díun modËle autorogressif moyenne mobile integre ARIMA

On considère un modèle AR< M A(p, Q , q ) ecrit sous forme canonique tel que :

# p (B)8 > Xt 6 ! q (B)6 t. Oü # p (B) 6

p

z

i l 1

b i Bi , ! q (B) 6

q

z

i l 1

& i Bq et 8 > 6 (1 B)>

On peut ecrire : Xt 6

p + >

z

i l 1

$ i Xt j ) 6 t

q

z

j l 1

& t j 6 t j

Oü W (B) 6 # p (B)8 > et donc Xt+ h 6

p + >

z

i l 1

W i Xt h+ j ) 6

t+ h

q

z &

j l 1

t j 6

t+ h j

Il síensuit que la prevision optimale a la date t ) h, faite compte tenu de toute líinformation

t

disponible jusquía la date t, notee x (h); est donne par :

X

X

x t(h) 6 E[ Xt+ h/ Xt, Xt 1, ..., X1, M 1] alors : XX t(h) 6

p + >

z

i l 1

W i XX t(h i) ) 0

q

z

j l 1

6 t

& t j X

(h ) )

Oü XX t(h i) 6 Xt+ h i pour h > q , on obtient une relation de recurrence de la forme :

p + >

XX t(h) 6

z

i l 1

W i XX t(h i)

Conclusion

Avantages

ñFournit des previsions inconditionnelles.

Peut être entièrement faite automatiquement. en employant des systèmes experts pour líidentifcation des modèles.

ñLes modèles sont parcimonieux en ce qui concerne les coecents cients.

Incovenients

Exige un grand nombre díobservations pour líidentifcation du modèle. Compliquee a expliquer et interpreter aux utilisateurs inities.

Ne prend pas en consideration les dependances croises entre les di§erentes series.

Chapitre 5

Application de la mÈthodologie de

Box-Jenkins

Presentation generale des donnees :

La consommation du gaz naturel en Algerie se presente sous trois aspects di§erents

a savoir :

Consommation des distributeurs publics : elle represente la consommation des menages y compris celles des petites entites commerciales tel que les boulangeries, les res- taurants, etc.

Consommation industrielle : elle englobe la consommation des usines de production

et de transformation tel que les briqueteries...

Consommation des producteurs díelectricite : la production díelectricite en Algerie provient essentiellement du gaz naturel, on peut citer comme centrale electrique celle díEL HAMMA.

Chacune de ces consommations est etudiee separement, cíest ainsi que nous obtenons trois

series de consommation :

La consommation des distributeurs publics a la date t : DPt

La consommation industrielle a la date t : C It

La consommation des producteurs díelectricite a la date t : C Et

Remarques :

- La modelisation et par suite la prevision sont faites sur la base de donnees mensuelles pour une duree de 2 ans.

- Ces donnees ont pour unite de mesure le mètre cube.

48

5.1 Etude de la serie de consommation des distribu- teurs publics (DP)

5.1.1 IdentiÖcation

La série DPt représente líévolution mensuelle de la consommation nationale du gaz na- turel des distributeurs publics sur une période allant de janvier 1991 a décembre 20 0 ..

Avant toute analyse de série temporelle, il est indispensable díétudier avec soin le graphe représentant son évolution, car ce dernier fournit a priori une idée globale sur la nature et

les caractéristiques du processus générant cette série a savoir : tendance, saisonnalité,....etc.

Representation de la serie brute ( . t :

FIG.I.1ó Graphe de la sÈrie brute DP t

Globalement, la représentation graphique (Fig.I 1) de la série présente les caractéristiques suivantes :

Une non stationnarité en variance, caractérisée par un accroissement de la variabilité par

rapport au temps.

Une légére tendance a la hausse due a líaugmentation du nombres de foyers alimentés en

gaz de ville obéissant au programme national du gaz (PNG).

Un phénoméne périodique caractérisé par des mouvements ascendants suivis par díautres descendants autour des valeurs 10 , et 6.10 , , ces mouvements sont dus au rythme des saisons

car la consommation gaziére accroÓt durant líhiver oü le citoyen se penche vers líutilisation

des chau§ages fonctionnant au gaz qui sont beaucoup plus attractifs que les chau§ages électriques en terme de factures de consommation, puis la consommation décroÓt durant líété.

b-Introduction du logarithmique

Pour analyser la série DPt par líapproche proposée par Box-Jenkins, une modifcation doit être apportée sur les données afn díatténuer la variabilité qui a§ecte la série chronologique,

la série LDPt est générée par líintroduction du logarithme népérien a la série brute DPt. Cíest a dire

LDPt 6 Log (DPt) pour tE 3 1, 2, .....964

FIG.I.2ó Graphe de la sÈrie LDPt

On remarque que la représentation graphique de la série (FIG.I .2) LDPt garde la même allure que celle de la série DPt mais avec des pics moins importants, amortis suite a la transformation logarithmique appliquée. En e§et, líéchelle de mesure est réduite, elle áuctue

de 12 , 1 a 20 , 2. Ce qui est de la saisonnalité, celle-ci est toujours apparente, líexamen du corrélogramme de la série LDPt nous permettra de conforter nos observations.

a-Analyse preliminaire de la serie + ( . t

Examen du correlogramme de la serie LDPt

Líanalyse du corrélogramme simple et du corrélogramme partiel de la série LDPt (Fig.I .3 )

donné par le logiciel EVIEWS 4.0, nous indique une non stationnarité de la série en terme

de la saisonnalité, tel que le montre bien le corrélogramme simple.

En e§et, la fonction díautocorrélation simple estimée (colonne AC ) ne décroÓt pas de ma- niére rapide vers zéro, et de plus elle est caractérisée par un mouvement sinusoÔdal apparent quíon soupÁonne de périodicité 8 6 12 , ce qui nous pousse a e§ectuer une etude sur la saisonnalité de la série.

FIG.I .3 Corrélogramme de la série LDPt

Etude de la saisonnalite de la serie LDPt

Les résultats du test de saisonnalité sont regroupés dans le tableau ci-dessous, oü :

8C : représente la somme des carrés.

M C : moyenne des carrés.

Source des variations

8C

d.liberté

M C

F

P _o b

F critique

Lignes

23 50 1.5

11

20 71.7

6.64

1.93 E 05

1.8 7

11

On a F = 6 6.64 > F O ) O)

6 1.8 7, donc on peut dire que la série LDPt est a§ectée díune

saisonnalité.

Desaisonnalisation de la serie LDPt

Etant donné que la stationnarité de la série ne dépend pas uniquement de la présence

ou non de la tendance, mais aussi du phénoméne saisonnier, une désaisonnalisation de la série LDPt síimpose pour la suite de notre étude, cíest ainsi quíon obtient une série corrigée

de líe§et saisonnier LDP 8At par líintroduction díune di§érentiation díordre 12 sur la série

LDPt.

FIG.I .4 ó Graphe de la sÈrie LDP 8At

En observant le graphe de la série LDP 8At (Fig.I .5 ), nous remarquons que la saisonna- lité été absorbée.

Examen du correlogramme de la serie LDP 8At

Líexamen du corrélogramme de la série LDP 8At (Fig.I .4) nous confrme le succés de la désaisonnalisation de la série LDPt puisque celle-ci a été absorbée. Concernant la station- narité de la série, nous ne pouvons dire quíelle est stationnaire. Un recours au test de racine unitaire permet díacents rmer ou díinfrmer la stationnarité de la série en question.

FIG.I .5 ó Corrélogramme de la série LDP 8At

Test de racine unitaire (Dickey-Fuller) sur la serie LDP 8At

A partir du logiciel EI I EJ 8 4.0 , on procéde a líestimation par la méthode des moindres carrées avec p 6 1 des trois modéles [ 4] , [ 5 ] , [ 6] de DickeyñFuller sur la série LDP 8At (car

les résidus forment un bruit blanc), dont les résultats díanalyse sont représentés ci-dessous

Modèle[6] A LDP SAt 6 LDP SAt 1 ) b j A LDP SAt j ) b t ) 6 t

Le test montre que la statistique t' 6 7.68 8 9 est inférieure aux di§érentes valeurs critiques relatives aux seuils 1% , 5 % et 10 % . Líhypothése HO est rejetée, donc la série LDP SAt ne posséde pas de racine unitaire.

La probabilité de nullité du coecents cient de la tendance qui est égale a 0 .0 2 est infé- rieure au seuil de 5 % , aussi la valeur empirique de la statistique de Student relative a la tendance(7 T REN D) qui est égale a 2.33 67 est supérieure aux valeurs tabulées (1.95 ) au seuil 5 % et (1.64) au seuil 10 % . On rejéte donc líhypothése du nullité du coecents cient de la ten- dance (il est signifcativement di§érent de zéro). Ce qui concerne la constante on remarque

la t-statistic associée qui est égale 0 .00 742 est inférieure aux valeurs tabulées relatives aux

seuils 5 % et 10 % , donc la constante est non signifcativement di§érente de zéro.

Sachant que la série ne posséde pas de racine unitaire et que la tendance est signifcativement di§érente de zéro, on peut acents rmer que le processus est de type T S (trend stationnary), une regression de la série LDP SAt sera entreprise pour la stationnariser.

Test de racine unitaire (Dickey-Fuller) sur la serie di§erenciee ( (+ ( . 0 & t)

Modèle[6] A D(LDP SAt) 6 DLDP SAt 1 )

2

z

j l 1

b j A D(LDP SAt j ) ) b t ) 0 ) 6 t

Modèle[5] A D(LDP SAt) 6 D(LDP SAt 1) )

2

z

j l 1

b j A D(LDP SAt j ) ) 0 ) 6 t

Modèle[4] A D(LDP SAt) 6 D(LDP SAt 1) )

2

z

j l 1

b j A D(LDP SAt j ) ) 6 t

Les statistiques empiriques t' associées aux trois modéles sont inférieures aux valeurs cri-

tiques aux seuils 1% , 5 % et 10 % , donc il níexiste pas de tendance stochastique (DS). Dans

le modéle [6], nous avons la t-statistic associée a la tendance, qui est égale a 0 .0 74, est inférieure a toutes les valeurs tabulées aux seuils 1% , 5 % et 10 % avec une probabilité (prob6 0 .94 > 0 .05 ), donc le coecents cient de la tendance du modéle [6] níest pas signifca- tivement di§érent de zéro, le processus níest pas de type T S. La série D(LDP SAt) níadmet

ni tendance déterministe, ni tendance stochastique, elle est donc stationnaire.

Correlogramme de la serie ( (+ ( . 0 & t)

FIG.I .6 ó Corrélogramme de la série D(LDP SAt)

SpeciÖcation des modèles

Líanalyse du corrélogramme partiel de la série stationnaire D(LDP SAt) (Fig.I .6) montre quíaux retards (k 6 1, 2, 3 , 5 ,6, 8 , 11, 12) les termes sont signifcativement di§érents de zéro et

ce qui concerne le corrélogramme simple, on remarque quíaux retards (k 6 1, 2, 7, 8 , 11, 12)

les termes sont aussi a líextérieur de líintervalle de confance, par conséquent nous avons plusieurs modéles candidats (SARI M A(0 , 1, 1), SARI M A(0 , 1, 2),

SARl M A(12, 1, 0 ), SARl M A(10 , 1, 11),......) parmi lesquels nous avons estimé les modéles

SARl M A(0 , 1, 12) x (0 , 1, 1), SARl M A(12, 1, 12) x (1, 1, 1).

Choix du modèle

Entités statistiques

0 & / * , & (! " , ! , ! " ) x (! , ! , ! )

0 & / * , & (! " , ! , ! ) x (! , ! , )

R2

0 .70 20

0 .4971

2

R

0 .68 40

0 .48 98

Al O

1.4919

1.3 78 7

F

1.33 26

1.00 26

SO R

0 .8 122

1.465 9

Suivant les critéres de pouvoir prédictif et les critéres díinformation mentionnés dans le

tableau ci-dessus, le modéle SARl M A(12, 1, 12) x (1, 1, 1) sera choisi pour représenter le processus 3 D(LDP SAt)4 t.

5.1.2 Estimation du modèle SARl M A(12, 1, 12) x (1, 1, 1)

Líestimation des coecents cients du modéle SARl M A(12, 1, 12) x (1, 1, 1) est donnée par la table ci-dessous

0 & / * , & (! " , ! , ! " ) x (! , ! , ! )

Remarque

1-Le modéle SARl M A(12, 1, 12) x (1, 1, 1) est le modéle qui presente les meilleurs critéres

de pouvoir predictif (a savoir R2 , R2 , statistique de Fisher : maximum ; et SSR, Al O , SO :

minimum.

2- La statistique de Durbin-Watson=2.08 presage un bon ajustement.

5.1.3 Validation du modèle

Tests sur le modèle

Les racines des deux polynômes autoregressif et moyenne mobile sont superieures en module

a 1, car leurs inverses calculees par EVIEWS sont tous inferieurs a 1, ainsi les conditions

de stationnarite et díinversibilite sont verifees. Les composantes AR et M A de líARM A níont pas de racines communes (leurs inverses sont distinctes), il en resulte donc que notre representation SARl M A(12, 1, 12) x (1, 1, 1) est minimale par le principe de parcimonie. Tests sur les estimations

Les coecents cients des paramétres du modéle SARl M A(12, 1, 12) x (1, 1, 1) sont signifcative-

ment di§erents de zero ( 0 .69, 0 .16, ) 0 .3 9, 0 .41, 0 .70 ), díailleurs le test de Student le confrme puisque les t-statistic associes aux paramétres du modéle ( 6.03 , 2.80 , 8 .70 , 3 .10 ,

6.28 ) en valeurs absolues, sont superieurs aux valeurs theoriques (1.64) au seuil 5 % et (1.95 )

au seuil 10 % .

Representation graphique des series : residuelle (6 t), actuelle et estimee

FIG.l .7. G. des SÈries estimÈ, rÈelle et rÈsiduelle

En analysant la représentation graphique (FIG.l .7) , nous constatons que le graphe de la série estimée est presque semblable a celui de la série réelle, a quelque pics prés. Mais globalement

le modéle SARl M A(12, 1, 12) x (1, 1, 1) explique bien le processus 3 D(LDP SAt)4 t

FIG.I .8 OorrÈlogramme des rÈsidus

Test de Ljung-Box

Líanalyse du corrélogramme des résidus, associé a la fgure l .8 montre que tous les termes sont a líintérieur de líintervalle de confance (illustré par des pointillés sur le logiciel Eviews),

ce qui est confrmé par la Q s tat pour tous les retards en particulier Q s tat 6 24.3 4 (au

O ,O5

retard > 6 27) 0 x 2

(22) 6 33 .92, donc les residus se comportent comme un bruit blanc.

Donc le modèle est valide et il síecrit comme suit :

D(LDP SAt) 6 D(LDP SAt 1) ) 0 .3 1D(LDP SAt 12 ) 0 .3 1D(LDP SAt 13 )

) 0 .69D(LDP SAt 24 ) 0 .69D(LDP SAt 25 ) ) 6 t ) 0 .76 t 1

) 0 .416 t 2 0 , 3 96 t 7 ) 0 .166 t 12

Test de stabilite

Pour faire ce test nous sommes amenes a reestimer le modèle choisi sur les 79 premières observations de la serie D(LDP SAt), donc de Decembre 1997 a Juin 20 0 4.

EVIEWS nous donne líestimation suivante :

On constate que :

Tous les coecents cients du modèle estime sont signifcativement di§erents de zero au seuil

5 % .

Les conditions díinversibilite et de stationnarite sont verifees.

On calcule maintenant les previsions de la consommation publique sur la periode de Avril

20 03 a Decembre 20 0 4 que nous comparons avec les observations reelles sur la même periode.

Representation graphique

Fig.I .8 .Graphe des previsions D(LDP SAF t) (0 4/ 20 03 12/ 20 0 4)

On remarque que les previsions de la consommation publique sur la periode 0 4/ 20 03 au

12/ 20 0 4 (en couleur bleu) donnees par le modèle SARl M A(12, 1, 12)x (1, 1, 1) appartiennent

a líintervalle de confance (en pointilles rouges, voir Fig.l .8 ), ce qui acents rme la stabilite du modèle precite et donc il peut être generateur de la serie D(LDP SAt).

Test de normalite

Les tests sont e§ectues a partir des valeurs empiriques des coecents cients de Skewness, Kurtossis

et la statistique de Jarque-Berra donnees par le logiciel EVIEWS. En utilisant le logiciel on a líhistogramme suivant :

% (Sk )1+ 2 %

Test de Skewness : (SK )1+ 2 6 0 .03 4 ' 7 1 6

% %

A 6

,4

6 0 .1272 0 1.96

Test de Kurtossis : ku 6 4.495 1 ' 7 2 6

ku 3

A 24

,4

6 2.7970 > 1.96

Donc, díaprès le resultat du test, nous rejetons líhypothèse de normalite en ce qui concerne

líaplatissement de la distribution, ce qui est confrme par la statistique de Jarque-Berra :

J B 6

8 4

6 SK )

8 4

0 ,05

(ku 3 )2 6 6.62 > x 2

24

(2) 6 5 .911

Conclusion : Les residus ne forment pas un bruit blanc gaussien.

5.1.4 Prevision

Après avoir choisi le meilleur modèle, on passe aux previsions pour un horizon h.

Le modèle est represente par líequation suivante :

D(LDP SAt) 6 D(LDP SAt 1) ) 0 .3 1D(LDP SAt 12 ) 0 .3 1D(LDP SAt 13 )

) 0 .69D(LDP SAt 24 ) 0 .69D(LDP SAt 25 ) ) 6 t ) 0 .76 t 1

) 0 .416 t 2 0 , 3 96 t 7 ) 0 .166 t 12

Pour faire les previsions, nous avons quía remplacer dans líequation du modèle

SARl M A(12, 1, 12) x (1, 1, 1), t par t ) h

Nous aurons donc : Pour h 6 1

D(L\DP SAt)(1) 6 D(LDP SAt) ) 0 .3 1D(LDP SAt 11) 0 .3 1D(LDP SAt 12 )

) 0 .69D(LDP SAt 23 ) 0 .69D(LDP SAt 24 ) ) 0 .76 t ) 0 .416 t 1

X X

0 , 3 96 t 6 ) 0 .166 t 11

X X

Pour h 6 2

D(L\DP SAt)(2) 6

D(LD\P SAt)(1) ) 0 .3 1D(LDP SAt 10 ) 0 .3 1D(LDP SAt 11)

) 0 .69D(LDP SAt 22 ) 0 .69D(LDP SAt 23 ) ) 0 .416 t 0 , 3 96 t 5

Pour h 6 12

X X

X

) 0 .166 t 10

D(D\P SAt)(12) 6

D(LD\P SAt)(11) ) 0 .3 1D(LDP SAt) 0 .3 1D(LDP SAt 1)

X

) 0 .69D(LDP SAt 12 ) 0 .69D(LDP SAt 13 ) ) 0 .166 t

Pour h > 12

D(D\P SAt)(h) 6

D(LDP\SAt)(h 1) ) 0 .3 1D(LDP SAt+ h 12 ) 0 .3 1D(LDP SAt+ h 13 )

) 0 .69D(LDP SAt+ h 24 ) 0 .69D(LDP SAt+ h 25 )

FIG.I .9 -Graphe des previsions de la consommation publique

Les previsions de la consommation publique pour líexercice 20 0 4/ 20 05 sont donnees dans le tableau ci-dessous

Mois

Previsions (m 3 )

Jan

55 622773 25 .05 6

Fev

460 2773 25 .113

Mar

3 983 77783 .88 6

Avr

30 5 95 2699.0 2

Mai

25 0 946120 .7

Jui

13 3 77920 9.425

Juil

123 297767.964

Aou

1114200 3 6.05 8

Sep

12298 95 95 .977

Oct

15 143 48 0 4.0 74

Nov

42765 28 5 1.78 3

Dec

58 670 4969.141

Nous pouvons dire que les previsions obtenues sont en harmonie avec líallure generale de la serie, puisque le phenomène de periodicite est reproduit mais avec une certaine augmentation, ceci est explique du faite que le nombre díabonnes dans la classe des consommateurs publics accroÓt avec un taux annuel de 27% .

5.2 Etude de la Serie de consommation des centrales electriques (CE)

5.2.1 IdentiÖcation

La série O Et représente líévolution mensuelle de la consommation nationale du gaz na- turel des centrales électriques sur une période allant de janvier 1997 a décembre 20 0 4.

a-Representation graphique de la serie brute O Et

FIG.II.1ó Graphe de la serie brute O Et

La représentation graphique de la série présente les caractéristiques suivantes :

Une tendance a la hausse avec des valeurs áuctuant autour de 4, 4.E ) 0 8 et 9.E ) 0 8 . Une non stationnarité en moyenne, témoignée par la tendance .

Un mouvement périodique caractérisé par des áuctuations ascendantes et descendantes tout au long de la période allant de Janvier 1997 a Décembre 20 0 4.

b-Examen du correlogramme de la serie O Et

FIG.II.2ó Corrélogramme de la série O Et

Les corrélogrammes simple et partiel font apparaÓtre un "pic" important au retard k 6 12

ce qui laisse supposer que la série est a§ectée díune saisonnalité et par suite nous poussera a dire quíelle est non stationnaire, cíest ainsi quíun recours au test de Fisher nous permettera

de verifer nos hypothèses.

Etude de la saisonnalite de serie O Et

Source des variations

SO

d.liberté

M O

F

P _o b

F critique

Lignes

1950 1.5

11

10 5 4.7

4.3 4

1.03 E 03

1.8 7

Le test confrme nos doutes concernant la présence díune saisonnalité puisque F 6 6.64 >

F 0 ) 05

11 6 1.8 7.On procède a la désaisonnalisation de série par líapplication de líopérateur de

di§érence saisonnière V S 6 (1 B12 ), líopération e§ectuée, la nouvelle série générée est

O ESAt

Analyse preliminaire de la serie O ESAt

Examen du correlogramme de la serie

FIG.II.3ó Corrélogramme de la série O ESAt

Líanalyse du correlogramme simple et correlogramme partiel de la serie O ESAt (Fig.l l .3 ) nous indique prealablement que la serie est non stationnaire, puisque la fonction díautocor- relation (visible sur la colonne AO ) ne decroÓt pas de manière rapide. Afn de verifer cette hypothèse, il convient díappliquer le test de racine unitaire.

Test de racine unitaire (Dickey-Fuller) sur la serie O ESAt

A partir du logiciel EVIEWS 4.0, on procède a líestimation par la methode des moindres carrees avec p 6 0 des trois modèles [ 4] , [ 5 ] , [ 6] de DickeyñFuller sur la serie O ESAt (car les residus forment un bruit blanc), dont les resultats díanalyse sont representes ci-dessous

, 9 6 7 8 7 [ % ] A O ESAt 6 b O ESAt 1 ) O ) b t ) 6 t

A la lecture de tableau ci dessus, on remarque que la statistique t' 6 5 .78 est inferieure

aux di§erentes valeurs critiques relatives aux seuils 1% , 5 % et 10 % : Líhypothèse H0 est rejetee, donc la serie O ESAt ne possède pas de racine unitaire, elle est donc stationnaire.

La probabilite de nullite du coecents cient de la tendance 0 .83 74 est superieure au seuil de 5 % , aussi la valeur empirique de la statistique de Student relative a la tendance(7 T REN D)

qui est egale a 0 .20 5 9 est inferieure aux valeurs tabulees (1.95 ) au seuil 5 % et (1.64) au seuil 10 % . On accepte donc, líhypothèse du nullite du coecents cient de la tendance (il níest pas signifcativement di§erent de zero), le processus níest pas de type T S (trend stationnary).De

la on estime le modèle [ 5 ]

, 9 6 7 8 7 [ $ ] A O ESAt 6 b O ESAt 1 ) O ) 6 t

Contrairement a la tendance, la probabilite de nullite de la constante est nulle et elle est inferieure au seuil 5 % , aussi la valeur empirique de la statistique de Student (t-statistic) relative a la constante O qui est egale a (4.763 4) est superieure aux valeurs tabulees (1.95 )

au seuil 5 % et (1.64) au seuil 10 % . On rejette donc, líhypothèse de nullite de la constante

(elle est signifcativement di§erente de zero).

Le fait que la statistique t' 6 5 .8 141 est inferieure aux di§erentes valeurs critiques relatives aux seuils 1% , 5 % et 10 % : líhypothèse H0 est rejetee, donc la serie O ESAt ne possède pas de racine unitaire, elle est donc bien stationnaire. Líestimation des paramètres sera entamee a la base du modèle[ 5 ] .

SpeciÖcation du modèle

Líanalyse du correlogramme partiel de la serie O ESAt (Fig.l l .3 ) montre quíaux retards

(k 6 1, 12, 22) les termes sont a líexterieur de líintervalle de confance et ce qui concerne le correlogramme simple, globalement, on remarque que les valeurs des fonctions díautocorrela- tion simples sont elevees au di§erents retards (k 6 1, 2, 3 , 4, 7, 12, 27, 28 , 29, 30 ....), ce qui nous amène a avoir plusieurs modèles candidats : SARM A(1, 1), SARM A(2, 0 ), SARM A(3 , 12), .. ect. Après une selection nous allons representer le modèle le plus adequat estime a líaide du logiciel EVIEWS 4.0 a savoir : SARl M A(p, Q , q ) x (P, D, Q ).

5.2.2 Estimation des paramètres

0 & / * , & (! , , ! " ) x ( , ! , ! )

Remarque

1 Le modèle SARI M A(1, 0 , 12) x (0 , 1, 1) a été choisi, car il présente des critères de pouvoir prédictif meilleur que ceux des autres modèles estimés (a savoir : R2 , R, statistique de Fisher : maximum ; et SSR, AI O , SO : minimum.

2 La statistique de Durbin-Watson 6 1.96, présage un bon ajustement.

5.2.3 Validation du modèle

Tests sur le modèle

Les racines des deux polynômes autoregressif et moyenne mobile sont supérieures en module

a 1, car leurs inverses calculés par EVIEWS sont tous inférieurs a 1, ainsi les conditions de stationnarité et díinversibilité sont vérifées.

Les composantes AR et M A de líARM A níont pas de racines communes (leurs inverses sont distinctes), il en résulte donc que notre représentation SARI M A(1, 0 , 12) x (0 , 1, 1) est minimale par le principe de parcimonie.

Tests sur les estimations

Les coecents cients des paramètres du modèle SARI M A(1, 0 , 12) x (0 , 1, 1) sont signifcative- ment di§érents de zéro, díailleurs le test de Student le confrme.

Test sur les residus

Representation graphique des series : residuelle (6 t), actuelle (O ESAt) et estimee

FIG.I I .4 Graphique des series estimee, reelle et celle des residus

Test de Ljung-Box

Le corrélogramme des résidus ne fait apparaÓtre aucun terme en dehors de líintervalle de confance au seuil 5 % , ce qui est confrmé par la Q s tat pour tout les retards en particulier

0 ) 05

Q s tat 6 25 .28 2 (au retard K 6 29) 0 x 2

(26) 6 3 8 .92, on peut donc assimilé les résidus

a un bruit blanc.

FIG.II.5 Oorrelogramme des residus

Líestimation du modèle SARI M A(1, 0 , 12) x (0 , 1, 1) est donc validée, la série G ESAt peut être valablement représentée par un processus de type SARI M A(1, 0 , 12) x (0 , 1, 1) et il síécrit :

G ESAt 6 3 940 478 9 ) 0 .47G ESAt 1 ) G ESAt 12 0 .47G ESAt 13 ) t t ) 0 .8 7t t 12

Test de stabilite

Réestimons le modèle obtenu précédemment sur les 66 premières observations, cíest a dire sur la période (1997 : 0 1 20 03 : 0 6).

Les coecents cients du modèle sont signifcativement di§érent de zéro pour un seuil de 5 % (les valeurs empiriques t-statistic sont toutes supérieures aux valeurs tabulées au seuil 5 % ), et

les conditions de stationnarité et díinversibilité sont vérifées.

Fig.II.6.Graphe des previsions (C ESAF t) (0 7/ 20 03 12/ 20 0 4)

On remarque que les valeurs obtenues sont a líintérieur de líintervalle de confance, par

conséquent le modèle est stable.

Test de normalite

Les tests sont e§ectués a partir des valeurs empiriques des coecents cients de Skewness, Kurtossis

et la statistique de Jarque-Berra données par le logiciel EVIEWS. En utilisant le logiciel on

a líhistogramme suivant :

% (Bk )1/ 2 %

Test de Skewness : (BK )1/ 2 6 0 .0 1 ' 7 1 6 %

ku 3

%

A

6

,3

6 0 .33 88 < 1.96.

Test de Kurtossis : ku 6 3 .16 ' 7 2 6

A 24

,3

6 0 .2975 < 1.96.

Donc, díaprès le résultat du test, nous acceptons líhypothèse de normalité en ce qui concerne

la symétrie et líaplatissement de la distribution, ce qui est confrmé par la statistique de

Jarque-Berra :

J B 6

83

6 BK )

83

0 ,05

(ku 3 )2 6 0 .0 9 < x 2

24

(2) 6 5 .911.

Conclusion : Les résidus forment un bruit blanc gaussien.

5.2.4 Prevision

Líéquation du modèle BARI M A(1, 0 , 12) x (0 , 1, 1) représentant la série C EBAt est don-

née par :

O ESAt 6 3 940 478 9 ) 0 .47O ESAt 1 ) O ESAt 12 0 .47O ESAt 13 ) t t ) 0 .8 7t t 12

Les prévisions seront calculées a líaide de líEVIEWS pour un horizon h 6 12 mois depuis líorigine 12/ 20 0 4

Soit O\ESAt(h) la prévision a líorigine t, a un horizon h :

Pour h 6 1 :

X

O\ESAt(1) 6 3 940 478 9 ) 0 .47O ESAt ) O ESAt 11 0 .47O ESAt 12 ) 0 .8 7t t 11

.

X

O\ESAt(12) 6 3 940 478 9 ) 0 .47O\ESAt(11) ) O ESAt 0 .47O ESAt 1 ) 0 .8 7t t

Pour h > 12 :

O\ESAt(h) 6 3 940 478 9 ) 0 .47O\ESAt(h 1) ) O ESAt+ h 12 0 .47O ESAt+ h 13

Fig.II.6-Graphe des previsions de la consommation des centrales electriques

Les prévisions sont données dans le tableau suivant :

Mois

Previsions (m 3 )

Jan

8 905 6640 1

Fev

8 24114942

Mar

83 60 73 93 4

Avr

73 38 03 203

Mai

740 4700 3 1

Jui

83 53 45 929

Juil

88 5 95 9278

Aou

913 7777162

Sep

8 140 77793

Oct

7915 9475 2

Nov

7925 5 73 97

Dec

8 15 78 78 2649

5.3 Etude de la serie de consommation industrielle (CI)

5.3.1 IdentiÖcation

La série O It représente líévolution mensuelle de la consommation nationale du gaz naturel

de líindustrie algérienne sur une période allant de janvier 1997 a décembre 20 0 4.

a-Representation graphique de la serie brute ' * t

FIG.III.1ó Graphe de la serie brute O It

Globalement, la représentation graphique de la série présente des variations montrant un mouvement ascendant suivis par díautres descendants áuctuant entre des valeurs 10 , et

1, 9E ) 08 ainsi que de nombreux pics compensés souvent par des creux. Pour absorber le

phénomène de variabilité líintroduction díune transformation logarithmique est nécessaire pour la suite de notre étude.

b-Introduction du logarithmique

FIG.III.2ó Graphe de la serie brute LB : O It

Cette représentation, a une allure similaire a celle de la série brute O It, mais la transformation logarithmique a amorti les pics et les creux, líéchelle de mesure est réduite (les valeurs áuctuent entre 18 .4 et 19.1), on peut remarquer que la série est a§ectée díune tendance qui peut être stochastique ou déterministe.

c-Analyse preliminaire de la serie + - ) ' * t

Examen du correlogramme de la serie

Líanalyse du corrélogramme simple et partiel nous indique une non stationnarité de la série. Pour la saisonnalité, le corrélogramme ne montre aucun signe de sa présence, néanmoins un test de saisonnalité sera entrepris pour e§acer équivoque.

En e§et, la fonction díautocorrélation simple ne décroÓt pas de manière rapide vers zéro

et le premier terme du corrélogramme partiel est très important (0 .5 90 ) ceci nous mène a tester líexistence díune tendance déterministe ou stochastique par líemploi du test de racine unitaire.

FIG.III.3ó Corrélogramme de la série + - ) ' * t

Etude de la saisonnalite de la serie LB : O It

Source des variations

SO

d.liberté

M O

F

P _o b

F critique

Lignes

1250 .5

11

15 2.1

1.3 2

1.23 E 4

1.8 7

11

Etant donné que F 6 1.3 2 < F 0 ) 05

6 1.8 7, nous pouvons dire que la série en question

est dépourvue díun caractère saisonnier. La consommation industrielle, contrairement a la

consommation publique et celle des centrales électriques níobéÓt pas au phénomène saison- nier, elle est plutôt tributaire de líétat socio-économique du pays.

Test de racine unitaire (Dickey-Fuller) sur la serie + - ) ' * t

Donc a líaide du logiciel EVIEWS, les paramètres des modèles [ 4] , [ 5 ] et [ 6] sont estimés par la méthode des moindres carrés ordinaires avec p 6 0 , les résultats díanalyse sont repré- sentés ci-dessous.

, 9 6 7 8 7 [ % ] A LB : O It 6 b LB : O It 1 ) O ) b t ) t t

, 9 6 7 8 7 [ $ ] A LB : O It 6 b LB : O It 1 ) O ) t t

Les statistique tX' associées aux modéles [ 5 ] et [ 6] respectivement sont supérieurs a toutes

les valeurs critiques relatives aux seuils 1% , 5 % et 10 % : líhypothése H0 est rejetée la série + - ) ' * t ne posséde pas de racine unitaire, elle est donc stationnaire.

La probabilité de nullité du coecents cient de la tendance est supérieure au seuil 5 % , la va- leur empirique t-statistic est inférieur aux valeurs critiques tabulées par Dickey-Fuller. On accepte donc líhypothése de nullité du coecents cient de la tendance et le processus níest pas de type T S. La probabilité de nullité de la constante est inférieure au seuil 5 % , et sa valeur em- pirique t-statistic est supérieure aux valeurs critique tabulées par Dickey-Fuller. On rejette donc líhypothése de nullité de la constante.

La série + - ) ' * t níadmet ni tendance déterministe ni stochastique donc le processus est stationnaire.

SpeciÖcation du modèle

Díaprés le corrélogramme nous sommes amenés a avoir plusieurs modéles candidats ARM A(1, 1), ARM A(4, 4), ARM A(6, 6), ...., suivant les Critéres de pouvoir prédictif et les critéres díin- formations nous avons choisi le modéle ARM A(1, 12)

5.3.2 Estimation des paramètres du modèle ARM A(1, 12)

ARM A(1, 12)

Remarques

1-Le modéle ARM A(1, 12) est le modéle qui présente les meilleurs critéres de pouvoir prédictif (a savoir R2 , R2 : maximum ; et SSR, AI O, SO : minimum)

2- La statistique de Durbin-Watson 6 2.14, présage un bon ajustement.

5.3.3 Validation du modèle

Tests sur le modèle

Les racines des deux polynômes autoregressif et moyenne mobile sont supérieures en mo- dule a 1, car leurs inverses calculés par EVIEWS sont tous inférieurs a 1, ainsi les conditions

de stationnarité et díinversibilité sont vérifées.

Les composantes AR et M A de líARM A níont pas de racines communes (leurs inverses sont distinctes), il en résulte donc que notre représentation ARM A(1, 12) est minimale par

le principe de parcimonie.

Tests sur les estimations

Les coecents cients des paramétres du modéle ARM A(1, 12) sont signifcativement di§érents

de zéro, díailleurs le test de Student le confrme.

Test sur les residus

Representation graphique des series : residuelle (t t), actuelle et estimee

FIG.III.4 Graphique des series estimee, , reelle et celle des residus

Test de Ljung-Box

Líanalyse du corrélogramme des résidus (Fig.I I I .5 ) montre que tous les termes sont a líintérieur de líintervalle de confance (illustré par des pointillés sur le logiciel Eviews), ce qui

est confrmé par la Q s tat pour tous les retards en particulier Q s tat 6 17.0 7(au retard

0 ,05

K 6 27) < x 2

(22) 6 3 3 .92, donc les résidus se comportent comme un bruit blanc

Díoü le modéle est validé, et il síécrit comme suit :

LB : O It 6 18 .76 ) 0 .5 9LB : O It 1 ) t t 0 .41t t 5 ) 0 .29t t 8 0 .33 t t 12

FIG.III.5ó Corrélogramme des résidus

Test de stabilite

On résetime le modéle ARM A(1, 12) sur les 65 premiéres observations de la série LB : O It ,

de Janvier 1997 a Avril 20 03 .

Le logiciel EVIEWS donne líestimation suivante

Les coecents cients du modéle estimé sont signifcatifs au seuil 5 % .

Les conditions de stationnarité et díinversibilité sont vérifées.

On remarque que les valeurs obtenues sont a líintérieur de líintervalle de confance, par conséquent le modéle est causal et inversible.

Fig.III.6.Graphe des previsions (LO G O I F t) (05 / 20 03 12/ 20 0 4)

Test de normalite

Les tests sont e§ectués a partir des valeurs empiriques des coecents cients de Skewness, Kurtossis

et la statistique de Jarque-Berra données par le logiciel EVIEWS. En utilisant le logiciel on

a líhistogramme suivant :

% (Sk )1/ 2 %

Test de Skewness :(SK )1/ 2 6 0 .5 163 ' 7 1 6

% %

A 6

-5

6 0 .95 677 < 1.96.

Test de Kurtossis : ku 6 3 .48 93 ' 7 2 6

ku 3

A 24

-5

6 0 .223 6 < 1.96.

Donc, díaprés le résultat du test, nous acceptons líhypothése de normalité en ce qui concerne

la symétrie et líaplatissement de la distribution, ce qui est confrmé par la statistique de

Jarque-Berra :

J B 6

95

6 SK )

95

0 ,05

(ku 3 )2 6 4.08 14 < x 2

24

(2) 6 5 .911 .

Conclusion : Les résidus forment un bruit blanc gaussien.

5.3.4 Prevision

Líéquation du modéle síécrit comme suit :

LO G O It 6 18 .73 ) 0 .5 1LO G O It 1 ) t t 0 .38 t t 5 ) 0 .3 2t t 8

0 .35 t t 12 .

Les prévisions seront calculées a líaide de líEVIEWS pour un horizon h 6 12 mois, Soit

L\O G 0 1 (h) la prévision a líorigine t, a un horizon h

L\O G 0 1 (1) 6 18 .73 ) 0 .5 1LO G 0 1t 0 .38 t t 4 ) 0 .3 2t t 7

X X

X

0 .35 t t 11.

.

X

L\O G 0 1 (12) 6 18 .73 ) 0 .5 1LO\G 0 1t(11) 0 .35 t t.

Pour h > 12 :

L\O G 0 1 (h) 6 18 .73 ) 0 .5 1LO\G 0 1t(h 1).

Fig.III.7-Graphe des previsions de la consommation industrielle

Le tableau des prévisions sera donné comme suit :

CHAPITRE 5. APPLIOATION DE LA M...THODOLOGIE DE BOX-JENKINS 90

Mois

Previsions (m 3 )

Jan

15 55 0 68 28

Fev

13 43 3 10 40

Mar

13 85 24238

Avr

15 80 77120

Mai

1638 038 58

Jui

1433 98 25 2

Juil

13 71210 27

Aou

13 5 4660 35

Sep

14478 40 5 7

Oct

14610 25 0 9

Nov

145 7458 67

Dec

14618 23 95

5.3.5 Conclusion

Líanalyse des trois séries représentant les di§érents types de consommation, suivant la démarche de Box & Jenkins, nous a permis de mettre en évidence les remarques suivantes : Les séries de consommation publique et industrielle exhibant une certaine variabilité ont nécessité une transformation logarithmique qui nía fait quíamortir les pics et les creux qui caractérisent ces séries.

Les chroniques associées aux consommation publique et celles des centrales électriques carac-

térisées par un mouvement saisonnier de périodicité annuelle, ont nécessité une di§érentiation díordre 12.

Mis a part la série de consommation publique qui a nécessité une di§érence ordinaire pour être

stationnaire, les autres séries Aprés transformations ont aboutis a des séries stationnaires. Pour chaque série nous avons spécifé des modéles bien précis tel quíon a :

Modéle SAR1 M A(12, 1, 12) x (1, 1, 1) pour la consommation publique.

Modéle SAR1 M A(1, 0 , 12) x (0 , 1, 1) pour la consommation des centrales électriques. Modéle ARM A(1, 12) pour la consommation industrielle.

Ces modéles sont les plus adéquats et ils sont caractérisés par des résidus de type bruit blanc

gaussien a líexeption de la premiére série associée a la consommation publique.

Nous souciant de la qualité des prévisions obtenues, et sachant que la méthodologie de Box

& Jenkins ne prend pas en considération la corrélation entre les séries, nous allons essayer díintroduire les modéles I AR a la base de nos séries pour une amélioration éventuelle.

Chapitre 6

MODELES VAR

6.1 Introduction

Dans le chapitre précédent ont été intéressé par líétude de líévolution des séries chronolo- giques des trois types de consommation du gaz naturel a savoir la consommation publique, la consommation des centrales électriques et la consommation industrielle. Les modéles de sé- ries chronologiques univariés leurs associés ont été identifés, estimés et validés. Ces modéles ont été exploité par la suite pour líobtention des prévisions a court terme.

Les mécanismes engendrant les séries observées individuellement ne peuvent pas fournir

des informations et de renseignement sur plusieurs questions intéressantes pour une variété díobjectifs comme a titre díexemple la relation de líévolution de la consommation industrielle avec celle des centrales électriques. La théorie économique nous informe que ces facteurs sont

liés dans le cadre du développement díun pays.

Dans le chapitre présent nous développons les modéles de séries chronologiques multiva- riés I ARM A, en particulier les modéles I AR,qui peuvent répondre a plusieurs préoccupa- tions liées aux comportement simultanés des trois séries sous-jacentes.

91

6.2 Processus multivaries

DeÖnition

un processus3 Xt, t E Z4 multivarié est une famille de variables aléatoires vectorielles défnies sur RF.

Comme dans le cas univarié, la stationnarité joue un rôle important dans la théorie des processus, cíest ainsi quíon síétalera a étudier les processus multivariés sationnnaires dans

ses di§érents champs.

6.2.1 Fonction díautocovariance díun processus multivarie

Considérons un processus multivarié 3 Xt, t E Z4 de moyenne % , la covariance entre Xt

et Xs est donnée par

7 (t, s ) 6 0 ov (Xt, Xs) 6 E ! (Xt % ) (Xs % ) " , V t, s E Z.

6.2.2 Processus multivarie fortement stationnaire

Soit un processus multivarié3 Xt, t E Z4 , le processus est dit fortement (ou stricte- ment) stationnaire si : V n E N , V (t1, t2 ,..., tF) et V h E Z, le vecteur (Xt1 + h, ..., Xt" + h) a

la même loi de probabilité que la suite (Xt1 , ..., Xt" ), autrement dit :

P (Xt1 < x 1, ..., Xt" < x F) 6 P (Xt1 + h < x 1, ..., Xt" + h < x F) ,

V (t1, t2 ,..., tF) E ZF, V (X1, X2 ,..., XF) E RF, V h E Z.

Ainsi tous les moments díordre, díun processus multivarié strictement stationnaire sont in- variants pour toute translation dans le temps, or cette défnition est rarement vérifée en pratique, cíest ainsi que nous nous intéressons a un second type de stationnarité des proces-

sus multivariés, dit du second ordre.

6.2.3 Processus multivarie faiblement stationnaire

Le processus multivarié 3 Xt, t E Z4 est dit faiblement stationnaire (du second ordre) si

sa moyenne est fnie indépendante du temps et de plus le processus est stationnaire en sa

covariance, ie :

ó 1. E (Xt) 6 E (Xt+ h) 6 % (constante) , V t E Z,

ó 2. 0 o v (Xt, Xt+ h) 6 E ! (Xt % t)(Xt+ h % t+ h)1 " 6 F (h) , V t, h E Z,

oü F (h) est la fonction díautocovariance matricielle du processus{ Xt, t E Z} .

Proposition

Si { Xt, t E Z} stationnaire alors V i E { 1, .., n } (Xi t,) stationnaire. La reciproque est fausse.

Remarque

Dans ce qui suit le terme stationnaire, sauf mention contraire signifera la stationnarite du second ordre.

6.2.4 Processus bruit blanc multvarie

Un vecteur bruit blanc multivarie { t t, t E Z} est une suite de variables aleatoires non correlees de moyenne nulle et de matrice de covariance " , ie :

* E (t t) 6 0 ,

E(t tt t) 6 " . V

t E Z

Et en consequence sa fonction díautocovariance est donnee par :

* " , h 6 0 ,

F (h) 6 E (t t t t+ h) 6

0 , h 6 0 .

Remarque

On suppose que " est non singuliére.

Proprietes

F ( h) 6 F (h) , V h E Z, (la fonction díautocovariance níest pas symetrique)

Estimateur

En pratique la fonction díautocovariance est estimee a líaide de líestimateur suivant :

1

T h

z ( (

FX (h) 6

T h tl 1

Xt X t

1

Xt+ h X t+ h ,

T h

z

avec X t h 6

Xt

T

T h tl 1

et X t 6

1 z X

t

T tl 1

6.2.5 Fonction díautocorrelation

La fonction díautocorrélation díun processus stationnaire multivarié faiblement station- naire de moyenne % et de matrice de covariance F (h) , notée Ah 6 (p i j (h)) est défnie par

7 i j (h)

Ah 6

A ,

7 ii (0 )7 j j (0 )

6.2.6 Decomposition de Wold -Cramer

Le théoréme de Wold, est également valable dans le cas multivarié.

Theorème de Wold :

Tout processus stationnaire { Xt, t E Z} peut se decomposer en la somme díune composante regulière previsible (deterministe) et díune expression lineaire sto- chastique tel que :

z$

Xt 6 H t )

j l 0

Oj 6 t j

oü Oj est une suite de matrices carrees de taille n x n avec O0 6 1F et { 6 t} E RF

avec 6 t bruit blanc de matrice de covariance z .

z$

Etant donné que la série

j l 0

Oj 6 t j doit être convergente, cíest a dire que les termes Oj 6 t j 6 0

lorsque j -- + , donc la décomposition de Wold peut être approximée par une représentation

vectorielle moyenne mobile I M A(+ ), et comme le passage díune représentation moyenne mobile vers une représentation autoregressive est possible, on peut approximer la décompo- sition de Wold par une représentation vectorielle autoregressive I AR(+ ).

6.2.7 Modèle autoregressif moyenne mobile Multivarie I ARM A(p, q )

Le processus stationnaire satisfait une representation & / , & multivarie, note

2 & / , & díordre (: , ; ), síil est solution de líequation aux di§erences stochastique suivante :

p

Xt z

j l 1

b j Xt j 6 6 t

q

z

j l 1

& j 6 t j

Le modéle I ARM A(p, q ), síécrit sous la forme suivante

Xt 6 b 0 ) b 1Xt 1 ) .... ) b p Xt p ) 6 t ) & 16 t 1 ) .... ) & q 6 t q

Soit encore :

# (L)Xt 6 ! (L)6 t ) b 0

oü # (L) 6 I

p

z

i l 1

# i Li et ! (L) 6 I

q

z

i l 1

# j Lj

Ou encore # est un polynôme matriciel díordre p et ! un polynôme matriciel díordre q .

Dans la suite, on síintéresse a un type particulier de modéles I ARM A(p, q ), a savoir les modéles I AR(p)

6.2.8 Modèle Autoregressif Multivarie I AR(p)

Les modéle I AR(p) (vector autoregressif) constituent une généralisation des modéle AR

au cas multivarié

DeÖnition

Le processus du second ordre n -varie admet une representation I AR (au- toregressif vector) díordre p note (I AR(p)) síil est solution de líequation aux di§erences stochastique suivante :

Xt 6 b 0 ) b 1Xt 1 ) .... ) b p Xt p ) 6 t.

oü {6 t}est un bruit blanc vectoriel.

En introduisant líopérateur de retard L, on peut réécrire líéquation précédente sous la forme symbolique suivante :

# (L)Xt 6 b 0 ) 6 t

oü # (L) 6 I

p

z

i l 1

# i Li

avec Lj Xt 6 Xt j

Remarque 1

Tout modéle I AR (p) peut síécrire sous la forme díun I AR (1), mais de dimension supérieur

(n p au lieu de n ).

Soit le modéle I AR(p) :

# (L)Xt 6 q 0 ) 6 t

Posons :

On peut écrire alors :

0

I

5 t 6 I

I

6

Xt 1

.

Xtt1 I I I

7

Xttp p t1)

avec :

5 t 6 q 5 tt1 )

qA 0 ) 6 t

A

0

q 1 q 2 .. q p 1

0

I

I

qA 0 6 I

q 0 1

I

0 I

. I

0 6 t 1

I

I 0 I

t

I

.

6 6 I

A I

I In 0 .. I

I

I

I 0 In 0 I

q

I I

6 . 7

0

6 . 7

0

I . . . I

.

6 7

0

oü In désigne la matrice identité de dimension n x n . En e§et :

0 Xt 1

0 q 1 q 2 .. q p 1 0

I In 0 .. I

Xtt1 1

6

0 q 0 1 0 t 1

I

5 t 6 I

I

Xtt1

.

I I 0 In 0

6

I I

I I

I I Xttt2 I I

I I I I

.

)

I I I I

0 I I 0 I

I

I

I

. I ) I . I

I

.

6 . 7 .

Xttp p t1) 6 0

. . .

I 6 . 7

7 Xttp

6 . 7

0

6 . 7

0

est alors un I AR (1) de dimension n p.

6.2.9 Caracteristiques des modèles I AR

Etudions les principales caractéristiques des modéles I AR. Concidérons un modéle I AR (1)

Xt 6 q 0 ) q 1Xtt1 ) 6 t

Oü 6 t & BB(0 , " )

Esperance

On a

E[ Xt] 6 E[ q 0 ) q 1Xtt1 ) 6 t]

Le processus étant stationnaire, on a : E[ Xt] 6 E[ Xtt1] . On peut donc écrire (sachant que

E[ 6 t] 6 0 ) :

Díou

E[ Xt] 6 q 0 ) q 1E[ Xt]

E[ Xt] 6 (I q 1)t1q 0

Fonction díautocovariance

Considérons le processus centré : 5 t 6 Xt E[ Xt] , soit :

5 t 6 q 15 tt1 ) 6 t

La fonction díautocovariance F est donnée par :

F (0 ) 6 E[ 5 t5 t ] 6 E[ q 15 tt15 t ) 6 t5 t ] (" )

Or

E[ 6 t5 t ] 6 E[ 6 t(5 tt1q 1 ) 6 t)] 6 q 1E[ 6 t5 tt1] ) E[ 6 t6 t]

Comme 6 t est BB alors

E[ 6 t5 tt1] 6 0

On a donc

E[ 6 t5 t ] 6 E[ 6 t6 t] 6 "

On remplaÁant dans (" ) on aura

F (0 ) 6 q 1E[ 5 tt15 t ] ) "

On remarque que E[ 5 t5 tt1] 6 F (1), on en déduit :

F (0 ) 6 q 1F (1) ) "

On calcule la matrice díautocovariance díordre 1 :

F (1) 6 E[ 5 t5 tt1] 6 E[ (q 15 tt1 ) 6 t)5 tt1] 6 q 1E[ 5 tt15 tt1] 6 q 1F (0 )

On en déduit la formule de récurrence suivante pour la matrice díautocovarinace díordre h

díun modéle I AR (1) :

F (h) 6 q 1F (h 1) V h > 1

Representation canonique

Considérons un modéle I AR centré, cíest a dire avec q 0 6 0

on peut écrire :

# (L)Xt 6 6 t

DeÖnition

# (L)

1 A

Xt 6 # t (L)6 t 6

; < D # (L)

6 t.

Si toutes les racines du déterminant de # (L) sont du module supérieur a 1, alors líéquation

# (L)Xt 6 6 t défnit un unique modéle I AR(p) stationnaire. On dit que Xt est en représen- tation canonique et 6 t est appelé résidu du processus.

Remarque 1

Si les racines de Q R t # (L) sont de module inférieur a 1, on peut changer les racines en leurs inverses et modifer le bruit blanc associé afn de se ramener a la représentation canonique. Remarque 2

Si au moins une des racines de Q R t # (L) est égale a 1, le processus níest plus stationnaire et

on ne peut pas se ramener a une représentation canonique.

Remarque 3

En représentation canonique, la prévision síécrit :

E[ Xt+ 1 5

t ] 6

p

z

i l 1

# i Xt+ 1ti

Xt désigne le passé de X jusquía la date t incluse.

6.2.10 Estimation des paramètres díun I AR (p)

Les paramétres díun modéle I AR ne peuvent être estimés que sur les séries temporelles

stationnaires (sans saisonnalité et sans tendance) par la méthode M O O . Pour les modéle

I AR non contraints-ou plus généralement par la technique du maximum de vraisemblance.

Estimation par la methode des moindres carres ordinaires des modèle 2 & /

non contraints

Considérons le modéle I AR (p) :

# (L)Xt 6 6 t

Oü 6 t & BB(0 , " ).

Déterminons tout díabord le nombre de paramétres a estimer.

n (n ) 1)

paramétres a estimer dans "

2

n 2 p paramétres a estimer dans # .

Au totale, on a donc n 2 p ) n (n ) 1) paramétres a estimer pour un I AR (p)

2

Décomposons líécriture du I AR (p). La j i e E e équation síécrit :

I

0 X0 X1 p 1

0

I I

j

6 I I

Xj 1 1

I

I

X

.

Xj 2 I 1

.

I

6

I

I I

t

X2 tp

I I I

I

I W j ) 6 j ; avec j 6 1, 2, .., p

.

I

I

. I

I

I

6 . 7

I Xtt1 Xttp I

.

I

I

Soit encore

Xj T

6

XT t1

7

XT tp

X j 6

W j ) 6 j

0

I

I

.

6 j 6 I

I

I

6

6 j 1 1

.

.

6 j 2 I I I I I

7

6 j T

La variable X j contient T observations. La matrice X est de format (T , n p).

Soit une ligne Xt de cette matrice :

Xt 6 (X1tt1X2 tt1 Xntt1X1tt2 Xntt2 X1ttp Xnttp )

Le modéle est un modéle I AR (p) a n composantes indicées par le temps t. W j est de di- mension (n p, 1). On a

0

I I I

q

I

W j 6 I

I

I

I

I

6

1

q

1

1j

q

2

1j I

.

. I

I

I

n I

I

1j

I

n

q

I

2 j

. I

. 7

q

n p j

0

I

I

6 j 6 I

I

I

6

6 j 1 1

.

.

6 j 2 I I I I I

7

.

6 j T

La matrice X ne dépend pas de j :

X j 6

W j ) 6 j

.

On empile les n équations pour retrouver le I AR :

0 X 1 1

I X 2 I

0 X11 1

I X12 I

I . I

0

0 0 0 1

I

W 1 1

W 2 I

0 6 11 1

I 6 22 I

I . I

I

I I I

.

6

I I I

.

I

I I I

.

I I I

6 7 I

6

X n I

. I

6

I

X1T I

6

I

X2 T I

I

.

I

7

XnT

0 X 0 I I

I

I

I

.

. . I I

I

7 I

X 6

I

I I

.

)

I I

I

I

. I I

I

. 7 I

W n 6

. I

I

6 1T I

.

I

6 2 T I

I

I

7

.

6 nT

On cherche a estimer (W 1W 2 . . . W n ) .

La matrice de variance-covariance des erreurs devient un peu plus compliquée et síécrit :

0 0 a 11 0 . . . 0

I I 0 . .

1 0 a 12 0 . . . 0 1 1

I I . . I I

I 6 .

7 6 0 . 7 I

I

I 0 a 11

0

I

I a 2 1 0 . . . 0 1 0

I I

I 0 . . I I

0 a 12 I

I

I

a 12 0 . . . 0 1 I

I

. . I I

I 6 .

7 6 0 . 7 I

I

I 0 a 2 1

I

I

I

I

I

I

I

6

0 a 12

. . .

I

I

I

I

I

I

0 a nn 0 . . . 0 1 I

0

I

I . . . I I

6 7 7

0 a nn

Líobservation de cette matrice indique la présence díhétéroscédasticité (il y a en e§et, aucune

raison pour que a 11 6 a 22 6 6 a nn) et díautocorrélation.

Il se pose en conséquence un probléme pour líapplication de la méthode M O O . Rappelons en e§et que les estimateurs sont sans biais, mais ne sont plus de variance minimale. Il convient

dés lors díutiliser la technique des moindres carrés généralisés (M O G ) qui fournit un esti- mateur BLH E (Best Linear Unbiaised Estimator).

On peut réécrire la matrice de variance-covarince comme suit :

I [ 6 ] 6 " # I 6 2

oü " 6 (a i j ) et # désigne le produit de Kronecker. Rappelons que :

0

A # B 6 I

. 1

a B I

6 i j 7

.

Nous venons de voir que la matrice de variance-covariance des résidus est telle que

líon devait théoriquement appliquer la méthode M O G . Cependant, puisque la matrice des variables explicatives est bloc diagonale, on peut appliquer les M O O bloc par bloc. Le théo- réme de Zellner nous montre ainsi quíestimer chacune des n équations par les M O O est équivalent a estimer le modéle par la méthode M O G . Afn de le prouver, considérons le modéle suivant :

Oü 6 est un bruit blanc.

5 6 X a ) 6

Rappelons que líestimateur de la méthode M O O est donné par :

X

a3 . 5

6 (X X )t1X 5

et que líestimateur de la méthode M O G síécrit :

X

a3 . 0

6 (X 2 t1X )t1X 2

t15

oü 2 désigne la matrice de variance-covariance de 6 .

Dans notre cas, on a :

0

I

I

X 6 I

6

X 0 0 1

0 X 0 I

I

. . . I

7

X

6 I # X

oü I est la matrice identité.

Remarque

Avant díappliquer la méthode des M O G , rappelons que líon a les égalités suivantes concer- nant le produit de Kronecker :

(A # B)(O # D) 6 AO # BD

(A # B) 6 A # B

1

(A # B)

6 At1 # Bt1

Afn de calculer l1 estimateur des M O G , commenÁons par étudier la matrice X 2 t1X :

X 2 t1X 6 (I # X )(" t1 # I )(I # X )

6 " t1 # X X

avec 2 t1 6 " t1 # I .

On en déduit :

(X 2 t1X )t1 6 " t1 # ( X X )t1

pour le vecteur X 2 t15 , il vient :

X 2 t15 6 (I # X )(" t1 # I )5

6 (" t1 # X )5

on a donc :

X

a3 . 0

6 " # (X X )t1("

t1 # X )5

díou

6 (I # (

X )t1 X )5

0 1

0

X

7

a3 . 0 6 I

6

( X X )t1X 0 . . .

0 . . .

1

I

I I I

( X X )t1 X 6

5 1

I

5 2 I

I

.

. 7

5 n

0 ( X X )t1

.

t1

5 1 1

I

6

I (X X )

I

I

6

X 5 2

I

I

7

( X

)t1X 5 n

On retrouve líestimateur des M O O équation par équation.

Cependant, cette technique díestimation des I AR níest plus valable des lors quíil existe

des contraintes sur les paramétres. Il convient alors díutiliser la technique du maximum de vraisemblance.

Estimation par la methode du maximum de vraisemblance

Considérons un modéle I AR (p)

Xt 6 q 1Xtt1 ) .... ) q p Xttp ) 6 t

Oü 6 t est un bruit blanc de matrice de variance covariance " .

On écrit la vraisemblance conditionnellement a toute valeurs passées du processus :

L(q 1, q 2 , . . . , q p , _ 5 Xtt1) 6

T

;

tl 1

L(XtXtt1)

oü Xtt1 désigne tout le passé de Xt jusquía la date (t 1) incluse la vraisemblance síécrit alors :

L(q 1, q 2 , . . . , q p , _ 5 Xtt1) 6

T

;

tl 1

(7 2'

1

n 7

; < D _

T

2

x < E C [ 1 z

tl 1

(Xt q 1Xtt

<

1 .... q p Xttp )

(Xt

q 1Xtt1

.... q p Xttp )]

On en déduit líexpression de la log-vraisemblance :

? B= L(X1 . . . Xt) 6

T

T ? B= 2' T ? B= ; < D _ 1 z

L t_ t1L t.

2 2 2

tl 1

On maximise ensuite cette expression afn díobtenir les estimations q 1, . . . q p et de _ .

6.2.11 Validation : tests de speciÖcation

Test du rapport de maximum de vraisemblance

On peut e§ectuer des tests sur líordre p du I AR .Considérons le test suivant :

H0 : # p + 1 6 0 : Modéle I AR (p)

H1 : # p + 1 6 0 : Modéle I AR(p ) 1)

La matrice díinformation de Fisher est dicents cile a calculer, ce qui explique que líon uti-

lise un test du rapport du maximum de vraisemblance. La technique consiste a estimer un modéle contraint I AR (p) et un modéle non contraint I AR (p ) 1) et a e§ectuer le rapport

des log-vraisemblances. Rappelons que la log-vraisemblance díun modéle I AR síécrit :

T

? B= L(X1 . . . Xt) 6 n T ? B= 2' T ? B= ; < D _ 1 z

L t_ t1L t.

2 2 2

tl 1

T

z

tl 1

L t_ t1L t.est un scalaire, on a donc, on notant T _ la trace :

T

z

tl 1

T

L t_ t1L t 6 T _(z

tl 1

T

L t_ t1L t) 6 T _(_ t1 z

tl 1

L tL t)

T

T

6 T _(T _ t1 1 z

L tL t)

tl 1

6 T _(T _ t1_ ) 6 T _(T In) 6 n T

Soient l og Lc la log vraisemblance estimée du modéle contraint :

l og Lc 6 nT l og 2' T l og ; < D _X c 1 n T

2 2 2

Soient l og Lnc la log vraisemblance estimée du modéle non contraint :

l og Lnc 6 nT l og 2' T l og ; < D _X nc 1 n T

2 2 2

oü _X c (respectivement _X nc ) désigne líestimateur de la matrice de variance-covariance

des résidus du modéle contraint (respectivement non contraint).

On calcule la statistique de test & 6 T x RM I . Oü RM I désigne le rapport du maxi- mum de vraisemblance :

& 6 T l og

, ; < D _X c -

; < D _X nc

Sous líhypothése nulle, cette statistique suit une loi de khi-deux a _ degrés de liberté

oü _ désigne le nombre de contraintes.

Si líon accepte líhypothése nulle, on peut e§ectuer un deuxiéme test :

HO : # p 6 0 : Modéles I AR(p 1)

H1 : # p 6 0 : Modéles I AR (p)

Ce test síe§ectue de la même faÁon que précédemment. On a ainsi une séquence de tests emboÓtés dont le but est de déterminer líordre p du modéle I AR

Remarque

Dans le cas díun modéle AR, en plus des tests sur les paramétres, on e§ectue des tests

sur les résidus afn de valider le modéle. Dans le cas des modéles I AR, ces tests ne sont pas trés puissants et líon préfére réaliser un graphe des résidus. Notons cependant quíil convient díexaminer attentivement les résidus surtout lors díutilisation des modéles I AR

pour líanalyse de réponse impulsionnelle oü líabsence de corrélation des résidus est cruciale

pour líinterprétation.

Critères díinformation

Afn de déterminer líordre p du I AR, on peut également utiliser des Critéres díinformation. Ainsi, on estime un certain nombre de modéles I AR pour un ordre p allant de 0 a h, oü

h est le retard maximum. On retient le retard p qui minimise les Critéres AI O , SI O et

Hannan-Quinn (H Q ).défnis comme :

AI O 6 l og Q R t _X )

2n 2 p

T

SI O 6 l og Q R t _X

) n 2 p

l og T

T

H Q 6 l og Q R t _X

) n 2 p

2 l og (l o g T )

T

oü n est le nombre de variables du systéme, T est le nombre díobservations et _X

estimateur de la matrice de variance covariance des résidus.

Remarque

est un

Les Critéres SI O et H Q conduisent a des estimateurs convergents de p, le critére AI O

donnant des estimateurs ecents caces de p.

6.2.12 Prevision des modèles VAR

Considérons un modéle I AR (p)

Xt 6

qX 1Xtt1 ) .... )

qX p Xttp ) L t

On suppose que p a été choisi, que les qX i ont été estimés et que la matrice de variance-

covariance associée a L t a été estimée.

Afn de réaliser des prévisions, il est nécessaire de vérifer que le modéle est bien

en représentation canonique. Pour cela, on calcule le déterminant du polynôme # (L) et on regarde si les racines sont bien a líextérieur du disque unité. Si tel est le cas, alors la prévision

en (T ) 1) du processus est :

E[ XT + 1 5 XT ] 6

qX 1XT ) .... )

qX p XT tp + 1

T désigne le passé de X jusquía la date T incluse.

Chapitre 7

APPLICATION DE LA MODELISATION MULTIVARIEE

Suite a líapplication de la méthodologie de Box & Jenkins sur les di§érentes séries de consommation celles-ci sont rendues stationnaires, nous pouvons donc appliquer la modéli- sation multivarié I AR.

7.1 Etude multivariee des series de consommation

(O Et, DPt, O It)

Dans la suite de notre étude nous considérons le vecteur M t 6 (O ESAt, DLDP SAt,

LO G O It)

et L t 6 (R 1t, R 2 t, R 3 t) vecteur résiduel associée a M t de matrice de variance-covariance z

7.1.1 IdentiÖcation du modèle VAR(P)

A líinstar de la méthodologie de Box & Jenkins líidentifcation est une étape cruciale, pour mener a bien cette démarche on a recours aux critéres díinformations AI O, SO et le maximum de vraisemblance (LI ) pour déterminer le nombre de décalages p.

A cette fn, nous avons estimé divers modéles I AR pour des ordres de retards p allant de 1 a

14. Pour chaque modéle, nous avons calculé les critéres díinformations précédemment cités.

Le tableau TAB.I I.1 reporte les résultats obtenus. On constate que deux des trois critéres nous conduisent a retenir un modéle I AR(14).

106

TAB * 2 .!

p

LI

AI O

SO

1

140 9.75

3 7.67

35 .0 2

2

13 83 .28

3 7.67

35 .29

3

13 63 .68

3 6.8 4

35 .13

4

13 43 .96

3 6.0 1

3 6.18

5

13 19.45

35 .98

3 6.50

6

13 0 1.3 4

35 .58

3 7.0 1

7

1291

35 .3 4

3 7.74

8

1267.41

35 .23

3 7.74

9

125 4.65

35 .20

38 .65

10

1227.33

35 .17

38 .98

11

1205

35 .12

3 9.0 7

12

118 2.47

35 .0 7

3 9.5 4

13

1160

3 4.8 4

40 .42

14

113 1.0 2

3 4.43

40 .5 1

Líastérisque indique líordre p a retenir.

Les comparaison des modéles suivant les critéres AI O et LI nous pousse a choisir le modéle

I AR(14)

7.1.2 Estimation du modèle VAR(14)

a-Estimation du modèle 2 & / (! # ) avec constante

Le modéle I AR(14) avec constante síécrit sous la forme suivante

M t 6 # O ) # 1M tt1 ) ....... ) # p M tt14 ) L t

oü # O 6 (aO , aO , aO ) représente líestimation de la consatante et # p (p 6 1, ..., 14) sont des

1 2 3

0 a1 2 3 1

1p a1p a1p

a

2 p

matrices carrées díordre 3 tel que # p 6 6 1

a

1

3 p

les coecents cients estimés.

2 3

a

a

2 p 2 p

a

a

2 3

3 p 3 p

j (i, j 6 1, 2, 3 ) représentent

7 les ai p

X

Donc on doit estimer 9 paramétres pour z?

et 13 2 paramétres a estimer pour # p . On e§ectue

líestimation en utilisant le logiciel EVIEWS, nous obtenons le tableau qui sera présenté comme suit :

Le tableau contient 3 colonnes au nombre des variables du modèle I AR.

Ce tableau peut être décomposé en 3 blocs, chaque bloc est associé a une série

Chaque bloc contient p 6 14 lignes

La ligne i (i 6 1...14) díun bloc précis correspond a la série associée a líinstant t i. Chaque ligne contient les coecents cients au retard i (donnés en haut), ainsi que les t-

statistic associées (données en bas entre crochets).

TAB.I I.2 Estimation I AR(14) avec O

A la lecture du tableau TAB.I I.2 on constate que la constante est non signifcative aux seuils

1% , 5 % et 10 % puisque les t-statistic (données par les valeurs entre crochets) sont inférieures aux di§érentes valeurs critiques. De la on réestime le modèle I AR(14) sans constante.

b-Estimation du modèle VAR(14) sans constante

Líéquation du modèle I AR(14) sans constante síécrit :

M t 6 # 1M tt1 ) ....... ) # p M tt14 ) L t

Donc on doit estimer 14 matrices # p , ainsi que la matrice variance-covariance z?

associée au

résidu L t, nous obtenons le tableau suivant :

TAB.I I.3 Estimation I AR(14) sans O

A partir TAB I I.3 du tableau nous obtenons líéquation suivante :

0

M t 6 6

0 .68 75 50 6980 12779471

5 .43 E 11 0 .8 4 0 .28

1.0 6E 10 0 .0 7 0 .5 4

1

7 M tt1

0 0 .08 58 8 9470 94 23 15 63 70

) 6 7.5 7E 10 0 .91 0 .12

2.8 4E 10 0 .0 9 0 .26

0 0 .3 2 424661219 35 967265

) 6 4E 10 0 .72 0 .13

3 .75 E 10 0 .05 0 .0 2

0 0 .3 1 65 0 26921 73 8 170 42

1

7 M tt2

1

7 M tt3

1

) 6 9.58 E 10 0 .8 4 0 .0 2

3 .75 E 10 0 .20 0 .0 4

0 0 .18 1130 9124 2295 05 5

) 6 4E 10 0 .99 0 .41

3 .75 E 10 0 .22 0 .3 6

7 M tt4

1

7 M tt5

0 0 .11 10 8 1780 0 58 58 5 40

) 6 9.6E 10 1.05 70 75 0 .0 6

2.22E 10 0 .19 0 .11

0 0 .0 1 190 17111 18 27413 8

) 6 5 .4E 10 0 .83 0 .83

3 .46E 10 0 .15 0 .00 3

1

7 M tt6

1

7 M tt7

0 0 .03 12126647 7277478

) 6 8 .21 10 0 .71 0 .0 9

7.45 E 11 0 .26 0 .25

1

7 M tt8

0 0 .14 3 49608 25 2625 93 61

) 6 3 .18 E 10 0 .5 2 0 .0 2

1.26E 9 0 .3 4 0 .26

1

7 M tt9

0 0 .24 20 19618 4 274638 40

) 6 1.45 E 9 0 .5 1 0 .28

4.4E 10 0 .3 4 0 .16

1

7 M tt10

0 0 .3 1 20 3 1240 0 5 479955 9

) 6 7.75 E 10 0 .19 0 .05

9.24E 11 0 .22 0 .18

0 0 .41 25 42700 1 5 479955 9

) 6 7.73 E 10 0 .85 0 .11

2.26E 10 0 .24 0 .38

1

7 M tt11

1

7 M tt12

0 0 .3 2 5 143 5 408 5 485 5 771

) 6 1.0 2E 9 0 .45 0 .05

1.99E 11 0 .15 0 .18

1

7 M tt13

0 0 .2 430 8 40 77 5 93 3 65 70 6

) 6 1.64E 9 0 .19 0 .19

1.74E 10 0 .03 0 .26

1

7 M tt14 ) L t

Bien entendu cette écriture du modèle subira un remaniement après líépreuve des tests suite

a líétape de validation.

Nous obtenons également la matrice de variance-covariances suivante :

0

z? 6 6

1

7

5 .17E ) 14

0 .0 45

0 .13 5

0 .0 45

625 78 9

0 .0 11

0 .13 5 0 .0 11 5 .11E ) 11

7.1.3 Validation

Test sur le nombre de decalages p :

Afn de valider líordre p 6 14 du modèle I AR(14), on utilise en plus des critères díinforma- tions précédents, le critère de Hannan-Quinn qui est a minimiser. Ainsi on estime un certain

nombre de modèles I AR pour p allant de 1 a 14, on obtient le tableau suivant

P

H Q

1

124.41

2

10 5 .5 9

:

 

:

 

:

 

:

 

14

28 .8 1

Le résultat du test confrme líordre du décallage (p 6 14) jugé nécessaire.

Test sur les residus :

De la même faÁon que la méthodologie de Box & Jenkins, il convient de vérifer si les rési- dus forment un bruit blanc, une observation des corrélogrammes des résidus des trois séries síimpose.

FIG.I I.4 Corrélogramme des résidus de la série O ESAt

Líanalyse du corrélogramme des résidus de la série O ESAt (Fig.I I.4) montre que tous termes sont a líintérieur de líintervalle de confance, ce qui est confrmé par la Q s tat pour

0 ,05

tous les retards en particulier Q s tat 6 26.8 1 (au retard K 6 27) < x 2

(22) 6 33 .92,

donc les résidus se comportent comme un bruit blanc.

FIG.I I.5 Corrélogramme des résidus de la série DLDP SAt

Líobservation du corrélogramme des résidus de la série DLDP SAt nous montre que les

résidus en question forment un bruit blanc.

FIG.I I.6 Corrélogramme des résidus de la série LO G O It

Globalement, líanalyse des trois corrélogrammes nous montre que tous les termes sont a líintérieur de líintervalle de confance de la on déduit une absence de corrélation, donc les résidus des séries une a une forment un processus bruit blanc.

Etant donné que nous sommes dans líobligation díavoir un vecteur résiduel de type bruit blanc, líobservation des corrélogrammes simples ne sucents t pas, cíest ainsi quíon examinera les corrélogrammes croisés des résidus.

FIG.I I.7 Corrélogramme des résidus croisés entre DLDP SAt et O ESAt

En observant la fgure I I.7 on remarque que tous les termes sont a líintérieur de líin- tervalle de confance ce qui traduit une absence de corrélation entre les résidus des séries

DLDP SAt et O ESAt.

FIG.I I.8 Corrélogramme des résidus croisés entre DLDP SAt et LO G O It

De la même faÁon et pour les mêmes arguments, les résidus des séries DLDP SAt et

LO G O It sont non corrélées.

FIG.I .5 Corrélogramme des résidus croisés entre O ESAt et LO G O It

A la base de líétude des corrélogrammes simples et croisés des résidus, on déduit que les résidus associés au modèle I AR(14) forment un vecteur bruit blanc.

Tests sur les estimations :

En tenant compte du tableau des estimations (Tab I I.3 ) et le faite quíun coecents cient est signifcativement di§érent de zéro au seuil 5 % , si la t-statistic associée est supérieure a 1.96,

et en vertu des résultats des tests précédents, le modèle I AR(14) est validé et il síécrit de

la faÁon suivante :

11

2 O ESAt 6 7750 6980 DLDP SAtt1 5 .43 e t

I

O ESAtt1

I 4e t10

I

O ESAtt3

) 7.73 e

t10

O ESAtt12

) e 1t

I DLDP SAt 6 0 .8 4DLDP SAtt1 0 .91DLDP SAtt2 0 .73 DLDP SAtt3

)I 0 .8 DLDP SAtt4 0 .98 DLDP SAtt5 1.05 DLDP SAtt6

0 .83 DLDP SAtt7 0 .71DLDP SAtt8

I

I 0 .85 DLDP SAtt12 0 .45 DLDP SAtt13 ) e 2 t

I

I LO G O It

I

6 0 .3 4DLDP SA

tt9

0 .3 4DLDP SA

tt10

) 1.26e t9 O ESA

tt9

3 ) 0 .5 4LO G O Itt1 ) 0 .3 6LO G O Itt5 ) 0 .38 LO G O Itt12 ) e 3 t

Remarque

On constate que la série DLDP SAt síécrit uniquement en fonction de ses valeurs passées, ceci nous pousse a penser que líapproche multivarié níapportra en rien en terme de prévisions par rapport a líapproche univarié concernant la consommation publique.

7.1.4 Prevision

Le modèle étant validé, líexpression de la prévision pour un horizon h 6 1 a partir de líinstant présent t est donnée par :

2 ODESA(1) 6 7750 698 0 DLDP SAt 5 .43 e t11O ESAt

I

I 4e t10

I

D

I

O ESAtt2 ) 7.73 e

t10

O ESAtt11

I DLDP SA(1) 6 0 .8 4DLDP SAt 0 .91DLDP SAtt1 0 .73 DLDP SAtt2

0 .8 DLDP SAtt

3 0 .98 DLDP SA

tt4

1.05 DLDP SA

tt5

I 0 .83 DLDP SAtt6 0 .71DLDP SAtt7

I

I 0 .85 DLDP SAtt11 0 .45 DLDP SAtt12

I 9

I LDO G O I (1) 6 0 .3 4DLDP SAtt8 0 .3 4DLDP SAtt9 ) 1.26e t O ESAtt8

) 0 .5 4LO G O It ) 0 .3 6LO G O Itt

4 ) 0 .38 LO G O I

tt11

Pour un horizon h 6 12, on obtient :

2 D D

t11 D

O ESA(12) 6 7750 6980 DLDP SA(11) 5 .43 e

I

O ESA(11)

I 4e t

I

10 ODESA(9) ) 7.73 e

t10

O ESAtt1

I

I DLDDP SA(12) 6 0 .8 4DLDDP SA(11) 0 .91DLDDP SA(10 ) 0 .73 DLDDP SA(9)

)I 0 .8 DLDDP SA(8 ) 0 .98 DLDDP SA(7) 1.05 DLDDP SA(6)

I 0 .83 DLDDP SA(5 ) 0 .71DLDDP SA(4)

I

I 0 .85 DLDP SAt 0 .45 DLDP SAtt1

I

I LDO G O I (12) 6 0 .3 4DLDDP SA(3 ) 0 .3 4DLDDP SA(2) ) 1.26e t9 ODESA(3 )

3I ) 0 .5 4LDO G O I (11) ) 0 .3 6LDO G O I (7) ) 0 .38 LO G O It

Pour h > 12 on obtient le système díéquations suivant :

2 D D

t11 D

O ESA(h) 6 7750 6980 DLDP SA(h 1) 5 .43 e

I

O ESA(h 1)

I 4e t

I

10 ODESA(h 3 ) ) 7.73 e

t10

O ESAt+ ht11

I

I DLDDP SA(h) 6 0 .8 4DLDDP SA(h 1) 0 .91DLDDP SA(h 2)

I)I 0 .73 DLDDP SA(h 3 ) 0 .8 DLDDP SA(h 4) 0 .98 DLDDP SA(h 5 )

1.05 DLDDP SA(h 6) 0 .83 DLDDP SA(h 7) 0 .71DLDDP SA(h 8 )

I

I 0 .85 DLDP SAt+ ht12 0 .45 DLDP SAt+ ht13

I

I LDO G O I (12) 6 0 .3 4DLDDP SA(h 9) 0 .3 4DLDDP SA(h 8 )

I

I t9 D D D

) 1.26e

I

O ESA(h 9) ) 0 .5 4LO G O I (h 1) ) 0 .3 6LO G O I (h 5 )

3 ) 0 .38 LO G O It+ ht12

Les graphes des prévisions des trois séries de consommation ainsi que les tableaux asso-

ciés sont données ci-dessous :

FIG.I I.9 Graphe des prévisions de la série DPt

Les prévisions de la consommation publique pour un horizon díune année sont comme

suit :

Mois

Previsions (m 3 )

Jan

55 622773 25 .05 6

Fev

460 2773 25 .113

Mar

3 983 77783 .88 6

Avr

30 5 95 2699.0 2

Mai

25 0 946120 .7

Jui

13 3 77920 9.425

Juil

123 297767.964

Aou

1114200 3 6.05 8

Sep

12298 95 95 .977

Oct

15 143 48 0 4.0 74

Nov

42765 28 5 1.78 3

Dec

58 670 4969.141

FIG.I I.10 Graphe des prévisions de la série O It

Les prévisions de la consommation industrielle sont contenues dans le tableau suivant :

Mois

Previsions (m 3 )

Jan

1445 18 77.75 3

Fev

1605 538 5 6.698

Mar

13 8 93 40 61.38 3

Avr

15 93 0 1628 .8 7

Mai

170 608 15 6.0 65

Jui

16128 60 41.20 3

Juil

16773 40 08 .5 15

Aou

14423 1470 .35 2

Sep

15 63 0 190 7.5 92

Oct

163 298 43 9.196

Nov

1745 793 63 .261

Dec

1463 95 145 .53 1

FIG.I I.11 Graphe des prévisions de la série O Et

Les prévisions de la consommation des centrales électriques a partir de janvier 20 05

jusquíau mois de Décembre de la même année sont résumées dans le tableau suivant :

Mois

Previsions (m 3 )

Jan

8 98 12260 4

Fev

8 474198 20

Mar

83 2480 100

Avr

7743 90 419

Mai

77228 7470

Jui

80 0 95 473 4

Juil

97772190

Aou

93 8 7355 88

Sep

8 90 74173 1

Oct

8 7163 15 79

Nov

83 43 440 8 2

Dec

945 147935

7.2 Conclusion

Líétude multivariée achevée, nous pouvons tirer les enseignements suivants :

1 Le modèle I AR(14) a été retenu pour modéliser le vecteur composé des trois séries de consommation.

2 On constate que líordre du décallage retenu (p 6 14) pour la modélisation I AR(14) est

assez élevé ceci nous amène a estimer 13 2 paramètres.

3 Le modèle I AR(14) validé, il a été exploité pour e§ectuer des prévisions, en examinant

les équations liées aux prévisions et plus précisément celle de la série relative a la consom- mation publique, nous constatons que celle ci síécrit uniquement en fonction de ses valeurs passées.

4 Toujours concernant les prévisions, et ce qui concerne la consommation des centrales élec- triques, nous remarquons que durant le premier semestre de líannée 20 05 une consommation assez élevée est prévue, ce qui est visible sur le graphe des prévisions associé (Fig I I.11).

A cette étape bien précise nous sommes en possession de deux groupes de résultats associés

a deux approches di§érentes pour un objectif commun a savoir e§ectuer des prévisions. Pour choisir les meilleurs résultats une comparaison sera entreprise par la suite pour ne pas perdre

de vue le but de notre étude.

Comparaison

La comparaison des résultats prévisionnels obtenues par les deux méthodes a savoir la métho- dologie de Box & Jenkins et la modélisation I AR est basée sur la somme des carrées résidus

(RM SE) entre les observations prévues et les réalisations des séries de consommation.

Les prévisions díune méthode sont jugées plus fables son RM SE est la plus faible par rap- port a celle de líautre méthode.

h

Le calcul du RM SE est donné par la formule suivante :

RM SE(e ) 6

D 1

z (Xt

XX t)

Remarque

n tl 1

Faute de données réelles pour le premier semestre de líannée 20 05 , le RM SE a été calculé

a partir des valeurs prévues pour líannée 20 0 4 obtenues a partir du modèle réestimé pour la circonstance.

Le tableau suivant donne le RM SE calculée a partir de la modélisation I AR pour la consom-

mation industrielle :

Annee 2004

Valeurs reelles O Et

Valeurs prevues O@Et

Erreurs de prevision L t

Jan

848460874

846634885

1825989

Fev

746719220

799828686

-53109466

Mar

795301680

722915250

72386430

Avr

719928389

689394162

30534227

Mai

735060340

729374760

5685580

Jui

743660994

823665332

-80004338

Juil

853005290

892070433

-39065143

Aou

874196128

877568835

-3372707

Sep

797446831

800584608

-3137777

Oct

786482709

766451183

20031526

Nov

791780442

727083265

64697177

Dec

873030005

727083265

145946740

RMSE

/

/

51028390

Pour ce qui est de la méthodologie de Box & Jenkins, nous obtenons les résultats suivants :

Annee 2004

Valeurs reelles Xt

Valeurs prevues XX t

Erreurs de prevision L t

Jan

848460874

803232848

45228026

Fev

746719220

730444495

16274725

Mar

795301680

735636675

59665005

Avr

719928389

670431474

49496915

Mai

735060340

682643337

52417003

Jui

743660994

702716222

40944772

Juil

853005290

796989085

56016205

Aou

874196128

794207214

79988914

Sep

797446831

742553190

54893641

Oct

786482709

732049804

52632905

Nov

791780442

754378439

37402003

Dec

873030005

833417694

39612311

RMSE

/

/

144359199.3

Ainsi, la comparaison entre les deux méthodes utilisées síe§ectuera a partir du tableau sui-

vant :

Series/approches

RMSE1

RMSE2

RMSE (DP)

36677021

38664551

RMSE (CE)

144359199.3

51028390

RMSE (CI)

19705471

11444266

Remarque : RM 8E1 et RM 8E2 sont associées a la méthodologie de Box & Jenkins et la

modèlisation I AR respectivement.

Pour la consommation publique RM 8E1 > RM 8E2.

Pour la consommation industrielle RM 8E1 < RM 8E2.

Pour la consommation des centrales électriques RM 8E1 < RM 8E2.

Nous concluons que les prévisions obtenues par la modélisation I AR sont plus fables que celles obtenues par la méthodologie de Box & Jenkins pour la consommation industrielle et celle des centrales électriques, par contre pour la consommation publique la méthodologie de Box & Jenkins donne de meilleurs résultats.

Chapitre 8

Conclusion generale

Ces dernières décennies, une place importante a été consacrée au gaz en raison de ses caractéristiques économiques et écologiques.

En e§et, le gaz naturel représente une des sources díénergie la plus utilisée dans le monde, voir la plus prometteuse puisquíelle bénéfcie avec la montée des préoccupations environne- mentales díune considération importante. LíAlgérie est un pays producteur et exportateur de cette énergie, il a été donc primordial pour la SONELGAZ díanalyser líévolution temporelle

de la consommation nationale du gaz naturel dans ces di§érents aspects afn de comprendre

le mécanisme qui gère cette consommation et de tirer par la suite des informations et des conclusions utiles a la phase de prise des décisions liées aux di§érents projets et plus préci- sément le projet nommé programme national du gaz (PNG).

Notre étude a porter donc sur líanalyse des séries chronologiques représentant líévolution

de la consommation mensuelle du gaz naturel pour les distributeurs publics, les centrales électriques et de líindustrie. Líanalyse permet de construire un modèle mathématique qui explique le phénomène de líévolution de la consommation.

A travers cette étude, nous avons proposé dans un premier temps díétudier individuellement

les séries représentant la consommation publique, la consommation industrielle et celle des producteurs díélectricité.

Chaque série a été étudiée séparément, négligeant líe§et des autres séries suivant la métho- dologie de Box & Jenkins qui permet en plusieurs étapes de trouver un modèle susceptible

de représenter la série chronologique.

Líétude de la série représentant la consommation publique a révélé la présence díune sai-

133

sonnalité due aux rythmes des saisons, après désaisonnalisation et di§érentiation, la série obtenue était stationnaire, líanalyse du corrélogramme de la série a permis díidentifer plu- sieurs modèles candidats quíon a estimé et parmi lesquels nous avons choisi le meilleur, le modèle spécifé est de type 8ARM A(p, Q , q ) x (P, D, Q ).

Après estimation des paramètres, les tests relatifs a líétape de validation nous ont permis

de vérifer líadéquation de ce modèle aux données dont nous disposons. Une fois le modèle choisi, estimé et validé, nous avons calculé les prévisions pour un horizon de 12 mois.

De la même manière nous avons étudié la série représentant la consommation des centrales électriques oü líobservation du graphe représentant cette série et le corrélogramme associé nous a incité a e§ectuer le test de Fisher relative a líétude de la saisonnalité puisque que celle ci était caractérisée par un mouvement saisonnier apparent, tout comme la série de consommation publique une désaisonnalisation a été entreprise pour donné lieu a une série stationnaire, le modèle qui a généré cette série est de type 8ARI M A(p, 0 , q ) x (P, D, Q ) grce auquel on a pu faire des prévisions pour un un horizon díune année.

Le même cheminement a été suivi pour líétude de la série associée a la consommation in-

dustrielle oü celle ci a subit une transformation logarithmique pour atténuer les pics et les creux qui caractérisent cette série, la série est ainsi devenu stationnaire, le modèle retenu est

de type ARM A(p, q ) qui a été exploité pour e§ectuer des prévisions pour líannée 20 05 . Cependant la méthodologie de Box & Jenkins ne prend pas en compte líinterdépendance

des séries, pour cette raison nous avons proposé par la suite une approche multivariée pour

paraÓtre aux insucents sances de líapproche univarié.

Etant donné quía líissue de la méthodologie de Box & Jennkins les séries sont rendues sta- tionnaires, líapplication de la modélisation I AR(p) a la base de ces séries est possible, en utilisant les critères díinformations díAkaike et le maximum de vraisemblance nous obtenons

un ordre de décallage p 6 14, a líinstar de la méthode précédente, le modèle I AR(14) subira

líépreuve des tests pour quíil soit par la suite validé afn díêtre exploité pour les prévisions. Néanmoins líordre du décallage p 6 14 retenu est important, ce qui níest pas pour diminuer

le nombre de paramètres a estimer qui avoisine 13 2 paramètres, nous aurons pu diminuer líordre du décallage en introduisant une composante moyenne mobile mais le logiciel EVIWS

ne traite pas les modèles I ARM A.

Nous achevons notre étude par une comparaison entre les deux méthodes a la base du cri-

tère RM 8E qui permet de conclure que líapproche multivarié nous a permis díaméliorer les prévisions pour les séries de consommation industrielle et celles des centrales électriques par rapport a la méthodologie de Box & Jenkins et díacents rmer que cette dernière donne de bons résultats pour la consommation publique.

Toutefois une étude explicative sur la consommation du gaz naturel est très importante et par conséquent, trouvera un intérêt particulier dans cette étude, on peut citer a titre díexemple

les facteurs météorologiques qui ináuent sur les consommations industrielle, publique et les producteurs díélectricité.

Première partie

ANNEXE[A]

137

8.1 Methodes díestimation

8.1.1 Methodes des moindres carrees ordinaires (M O O )

E§ectuer une estimation au sens des moindres carrées, cíest choisir dans une famille de

modèles théoriques celui pour lequel la moyenne des carrés des écarts entre les données et le modèle est minimale.

La méthode des moindres carrés ordinaires (M O O ) est sans doute la plus commune parmi

les di§érentes techniques qui permettent díestimer les paramètres b i de líéquation suivante :

Y t 6 b 0 ) b 1Xt1 ) ....... ) b 1Xtp ) L t; t 6 1, ..., n (1)

Oü Y t variable quantitative a expliquer (variable exogène ou indépendante) ; Xt1,....., Xtp

sont p variables quantitatives explicatives

(variables endogènes ou indépendantes) ; b i paramètre du modèle (1), i 6 1, ..., p; L t : erreurs. Sous forme matricielle, le modèle (1) síécrit :Y 6 X b ) L ;

Avec X une matrice (n x (p ) 1)) de terme général Y t et les vecteurs L 6 (L 1, L 2 , ...., L p ) et

b 6 (b 1, b 2 , .., b p ) .

On suppose que les L t sont des termes díerreurs díune variable L indépendantes et identique- ment distribuées ;

8

E(L t) 6 0 ; I AR(LL 1 ) 6 a 2 I oü I est la matrice identité de dimension n x n

Estimation des coecents cients :

La méthode des moindres carrés consiste a choisir b de telle faÁon a minimiser la somme des

carrés des résidus :

m in

*

88R(b ) 6

n

z

tl 1

+

2

(Y t b 0 tb 1Xt1 ..... Xtp )

6 m > A

<

2

6 Y X b 6

6 m > A (LL 1 ) 6 # (Y X b ) (Y X b )$

<

Par dérivation matricielle (par rapport a b ) de la dérnière équation on obtient les Héquations normalesH : X Y X X b 6 0 , dont la solution correspond bien a un minimum car la matrice hessienne 2X X est défnie positive. Alors líestimation des paramètres b i est donnée par :

Xb 6 (X X )t1X Y .

Theorème :

Si le modèle est identiÖe, líestimateur des , ' - existe et il est unique : Xb 6 (3 3 )t13 Y.

Proprietes :

Les estimateurs des M O O b 0 , b 1, .., b p sont des estimateurs sans biais : E(Xb ) 6 b

La somme des carrés des résidus permet díestimer la variance et líécart-type de líaléa et des estimateurs des coecents cients.

Les estimateurs des M O O des coecents cients suivent une loi normale et permettent les tests

de signifcativité de Student, ainsi que le test de Fisher díhypothèses linéaires

8.1.2 Methode de maximum de vraisemblance (EM I )

Líestimation du maximum de vraisemblance sur la notion de vraisemblance díun en- semble donné díobservations relatives au modèle.

Plus spécifquement, la technique consiste a construire une fonction appelée fonction

de vraisemblance (construite a partir de la fonction de densité) et la maximiser par rap- port aux paramètres inconus, permetant de la valeur numérique la plus samblable pour ces paramètres.

Désignons parX1.....Xn les observations succesives e§ectuées sur un processus. Ces ob- servations sont indépendantes et chaqueXt a une densité de probabilité Lt(Xt, & ) connue analytiquement mais dont líun des paramètres & est inconu.

La fonction de vraisemblance, qui est défnie comme la fonction de densité conjointe des

n observations est calculée comme le produit des fonctions de densité des observations indé- viduelles (car les observations sont indépendantes) : L(X, & ) 6 Lt(Xt, & )

Dans la pratique on utilise la fonction de logvraisemblance Y(X, & ) 6 l o g (L(X, & )) plutôt que la fonction de vraisemblance (il est plus faÁile de maximiser une somme quíun produit).

X

On appel estimateur du maximum de vraisemblance toute solution & au problème m : E Y(X, & ).

$

Ainsi un EM I peut se défnire comme une solution aux équations de vraisemblance qui correspond précisément aux conditions du premier ordre suivantes

8(& ) 6

gradient.

3 Y(X, & )

6

3 &

n

<

tl 1

3 Y(Xt, & )

3 &

6 0 avec

3 2 Y(X, & )

3 & 2

< 0 ,oü 8 E RK est le vecteur

Proprietes

La méthode de maximum de vraisemblance présente díintéressantes propriétés díoptima- lité. Sous des hypothèses relativement larges, habituellement appelées condition de régularité

les EM V sont :

Consistants : cíest a dire quand la taille de líéchantillon augmente, LíEM V tend en pro- babilité vers la vrai valeur du paramètre. Díailleurs pour une grande dimension de líéchan- tillon, líestimateur du maximum de vraisemblance aura une distribution normale approxi- mativement centrée et tend vers la vraie valeur du paramètre.

Ecents cace : signife que les EM V auront une variance (asymptotique) plus petite que díautres estimateurs consistants.

Quand le modèle est spécifé, les estimateurs du maximum de vraisemblance peuvent perdre certaine de leur propriétés souhaitables. Cependant il a été montré que sous les hypo- thèses de régularité, les estimateurs du maximum de vraisemblance auront une probabilité limite bien défnie et seront approximativement normalement distribués.

8.1.3 Methode des moindres carres generalises (M O G )

Dans de nombreux cas, une hypothèse est violée : Líhypothèse díhomoscédasticité ou díindépendance des perturbations. Cette violation se produit, généralement, lorsquíil yía agrégation temporelle des données, ou auto corrélation des résidus. La matrice de covariance

des résidus, níest plus égale a a 2 I , mais plus généralement a E(LL ) 6 a 2 2 , oü 2 étant une matrice semi défnie positive.

Líestimateur des M O G de est solution du problème :

0

m > A { 8O RG ( ) 6 (Y X )1 2 t1(Y X )}

La matrice hessienne de 8O RG ( ) est défnie-positive, donc les conditions du premier ordre sont nécessaire est sucents santes :

" S . R 0 p )

t1 1

1 t1 1 t1

" 6 0 ( ) X 1 2 0 (Y X )

6 0 ( ) X 2 0 X

6 X 1 2 0 Y

et nous obtenons ainsi, líestimateur de :

1 6 (X 1 2 t1X )t1X 1 2 t1

0 0 Y

Theorème

Si le modèle est identifé líestimateur des M O G existe et est unique :

1 6 (X 1 2 t1X )t1X 1 2 t1

0 0 Y

Líestimateur des M O G est sans biais, on a :

E( 1 5 X ) 6 E((X 1 2 t1X )t1X 1 2 t1Y 5 X ) 6 (X 1 2 t1X )t1X 1 2 t1E(Y 5 X )

0 0 0 0

6 (X 1 2 t1X )t1X 1 2 t1

de plus :

0 0 X 0 6 0 ,

E(L 1 5 X ) 6 E(Y Y 1 5 X ) 6 E(Y 5 X ) E(Y 1 5 X ) 6 X 0 X 0 6 0 .

Cíest donc un estimateur sans biais, a variance minimale.

Deuxième partie

ANNEXE[B] Tableaux statistiques

142






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Soit réservé sans ostentation pour éviter de t'attirer l'incompréhension haineuse des ignorants"   Pythagore