WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Potentiel et dynamique des stocks de carbone des savanes soudaniennes et soudano- guinéennes du Sénégal

( Télécharger le fichier original )
par Cheikh Mbow
Université Cheikh Anta Diop de Dakar - Doctorat d'état en sciences 2009
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

II.2.7. Evaluation des modèles retenus

L'évaluation des modèles est un exercice délicat, dans la mesure où il n'y pas de méthode de procédure standard. Les étapes sont nombreuses et connexes et ne peuvent être déconnectées du processus de mise en place de modèles forestiers (Vanclay et Skovsgaard, 1996). Un modèle doit être évalué à travers des tests quantitatifs qui cherchent à prouver qu'il est suffisamment bon pour prédire un facteur donné. L'évaluation d'un modèle consiste alors à démontrer statistiquement ou empiriquement le caractère raisonnable des valeurs estimées à partir d'une régression. Il existe cependant quelques procédures de base consistant à examiner la structure du modèle pour identifier d'éventuels dysfonctionnements. D'autres approches passent par la collecte de données supplémentaires non biaisées (données de référence) à des fins de comparaison avec la prédiction du modèle en question. Ces approches ont toutes des limites et ceci fait dire à Vanclay et Skovsgaard (1996) que la qualité ou la performance d'un modèle ne peut être évaluée qu'en termes relatifs et sa capacité de prédiction est très révocable selon les cas. Toutefois, l'évaluation d'un modèle est un processus continu tout au long de son élaboration. Ainsi, pour évaluer un modèle il faut vérifier l'adéquation des équations utilisées ; la précision de ses constantes d'ajustement, la précision de la prédiction ; et voir si le modèle satisfait aux exigences de précision statistiques.

En outre, il faut tenir compte des considérations qualitatives qui permettent de se prononcer sur les possibilités d'améliorer le modèle pour les travaux futurs ou les efforts de révision du modèle proposé.

Le souci de précision a conduit à la prise en compte d'un certain nombre de précautions sur le choix des échantillons (distribution spatiale, et répartition dans les différentes classes de diamètre). Ce souci a été maintenu depuis le début du travail par l'examen de la forme de la courbe de la variable indépendante (DBH) et celle de la variable dépendante (Biomasse) pour avoir une idée sur la forme que va prendre le modèle. Des analyses complémentaires ont permis de compléter les tests de précision.

Les tests ainsi effectués permettent de mieux opérer le choix sur un modèle à partir de son coefficient de détermination R2. Le coefficient de détermination, aussi appelé coefficient de corrélation multiple, mesure la proportion de la variation de y expliquée par la variation de x (Scherrer, 1984). Ce coefficient est calculé de la façon suivante :

Si tous les points sont alignés, la dispersion expliquée par le modèle est égale à la dispersion totale et on a un modèle parfait avec un R2 égal à 1. Ainsi, théoriquement, les meilleurs modèles sont ceux dont le R2 est proche de l'unité. En outre, il existe d'autres tests statistiques très éprouvés pour compléter cette évaluation des modèles, il s'agit de l'analyse de la variance (ANalysis Of VAriance : ANOVA). L'analyse de variance ANOVA permet de vérifier la distribution autour de la pente de la régression. Il s'agit en termes simples d'une comparaison des moyennes entre la série expérimentale et les données prédites.

- Tests statistiques par comparaison de moyennes

Pour la comparaison entre la biomasse obtenue par mesure directe et celle issue des différents modèles, nous avons procédé à des tests statistiques pour évaluer la performance de chaque estimateur de biomasse. Il existe plusieurs tests statistiques. Les plus utilisées sont ceux qui procèdent par comparaison de moyennes. Pour des échantillons réduits de variances égales, on peut utiliser des tests simples comme le T-Test qu'on peut interfacer avec les outils d'analyse de « Excel-Macros Complémentaires ». T-Test est souvent appliqué sur de petits échantillons de moins de 30 observations. Ce test permet d'effectuer un T-Test de Student sur deux échantillons. Ce test, appliqué sur deux échantillons vérifie l'égalité des moyennes de populations de chaque échantillon. Ces tests utilisent pour ce faire des hypothèses différentes : les variances de population sont égales ; les variances de population ne sont pas égales ; les deux échantillons représentent, avant et après traitement, des observations sur les mêmes sujets.

L'application du T-Test suppose malheureusement que les deux séries de données proviennent de distributions aux variances identiques, ce qui n'est pas toujours garantie. On préfère l'ANOVA au T-Test dans plusieurs situations. L'analyse de la variance est une technique statistique permettant de comparer les moyennes de deux populations ou plus. L'analyse de la variance n'est pas une méthode qui permet d'étudier les différences de variances entre populations, mais une méthode pour étudier les différences de moyenne entre populations, pour ainsi caractériser les sources de variations sur l'ensemble des données (Scherrer, 1984). Néanmoins, cette méthode doit son nom au fait qu'elle utilise des mesures de variance afin de déterminer le caractère significatif, ou non, des différences de moyenne mesurées sur les populations (Wikipedia, 2008).

Comme le T-Test, l'ANOVA procède par un test d'hypothèses : H0 : Ji1 = t2 (les moyennes des deux séries sont égales)

H1 : ji1 ~ t2 (les moyennes de deux séries sont différentes)

L'analyse de la variance est un procédé qui permet de calculer la dispersion totale de l'ensemble des données et de les partager en composantes de différentes sources. On a la dispersion intergroupe appelée `factorielle' et la dispersion intragroupe appelée `résiduelle' ou dispersion due aux erreurs (Scherrer, 1984). Cette dernière est souvent utilisée dans l'évaluation de la performance des régressions. Le terme dispersion revoit alors à la somme des carrés des écarts entre une série de valeurs et leur moyenne.

Ainsi, la dispersion totale est représentée dans cette analyse par la somme des carrés des écarts à la moyenne générale de l'ensemble des données recueillies sans tenir compte de l'échantillon d'appartenance.

La dispersion à l'intérieur des groupes (échantillons) exprime les fluctuations
d'échantillonnage, représentées par les écarts entre les valeurs individuelles et la moyenne de
leur propre échantillon (xij-tj). Pour un groupe la dispersion est égale à la somme de ces

écarts élevée au carré [? (xij-tj)2] pour tout nij, i=1 (Scherrer, 1984).

La dispersion entre groupe exprime l'écart quadratique entre la moyenne d'un échantillon et

la moyenne générale (tj-Ji)2. La somme des dispersions intra et intergroupe donne la dispersion totale.

L'ANOVA permet surtout de faire des tests de comparaison pour accepter ou rejeter l'hypothèse principale (H0 : ji1 = t2) ou l'hypothèse secondaire (H1 : Ji1 ~ t2). Le facteur F (rapport entre la variance intergroupe et variance intragroupe) permet de comparer les deux variances et permet de décider quelle hypothèse retenir.

1. Si la valeur de F est inférieure à la Valeur Critique pour F (tableau 9), l'hypothèse principale est acceptée mais on ignore le risque d'erreur (erreur de type J3 ou Type II error).

2. Si la valeur calculée de F est supérieure ou égale à la valeur critique pour F, l'hypothèse principale est rejetée et le risque d'erreur présente un niveau connu (erreur de type a ou Type I error).

Le seuil de signification utilisé dans cette analyse est de 5%, c'est-à-dire que a = 0,05. Les résultats du test ANOVA sont précisés au tableau 9.

Tableau 9. ANOVA pour les différents modèles testés

Modèles

Source des
variations

Somme des
carrés

Degré de
liberté

Moyenne
des carrés

Valeur
calculée
pour F

Probabi-
lité

Valeur
critique pour
F

Puissance

Entre Groupes

5144,28

1

5144,28

0,163903

0,68

3,888374535

A l'intérieur
des groupes

6277223,97

200

31386,12

 
 
 
 
 
 
 
 
 
 
 

Growth

Entre Groupes

64055,89

1

64055,89

0,514684

0,47

3,888374535

A l'intérieur
des groupes

24891302,61

200

124456,51

 
 
 
 
 
 
 
 
 
 
 

Quadratique

Entre Groupes

14,057

1

14,05

0,000384

0,98

3,888374535

A l'intérieur
des groupes

7313779,43

200

36568,89

 
 
 
 
 
 
 
 
 
 
 

Cubique

Entre Groupes

2,32

1

2,32

0,000063

0,99

3,888374535

A l'intérieur
des groupes

7354503,26

200

36772,51

 
 
 
 
 
 
 
 
 
 
 

Exponentiel

Entre Groupes

85867,10

1

85867,10

0,630468

0,42

3,888374535

A l'intérieur
des groupes

27239139,25

200

136195,69

 
 
 
 
 
 
 
 
 
 
 

Compound

Entre Groupes

46888,04

1

46888,04

0,410232

0,52

3,888374535

A l'intérieur
des groupes

22859255,52

200

114296,27

 
 
 
 
 
 
 
 
 
 
 

Polynomial

Entre Groupes

0,72

1

0,72

0,000019

0,99

3,888374535

A l'intérieur
des groupes

7358519,95

200

36792,60

 
 
 
 
 
 
 
 
 
 
 

Logarithmique

Entre Groupes

74,67

1

74,67

0,002544

0,96

3,888374535

A l'intérieur
des groupes

5869947,57

200

29349,73

 
 
 
 
 
 
 
 
 
 
 

Linéaire

Entre Groupes

0,00056

1

0,00056

1,66005E

-08

0,99

3,888374535

A l'intérieur
des groupes

6792093,76

200

33960,47

 
 
 

Les résultats de l'ANOVA montrent et confirment que les meilleurs modèles sont le Quadratique, le Cubique et le Polynomial avec des valeurs de F très faibles, ce qui traduit la faiblesse des écarts entre les valeurs de ces modèles et les données observées.

Il faut ainsi noter que l'utilisation du coefficient de détermination ne suffit pas pour estimer la précision d'un modèle. La comparaison des moyennes, à travers des tests d'ANOVA, entre les valeurs projetées et des données réelles permet d'affiner le choix des modèles performants.

Toutefois, si le cubique et le polynomial sont des fonctions cubiques et se ressemblent du point de vue des résultats, le modèle quadratique fait une estimation différenciée en fonction de la taille des diamètres. On constate pour les tout-petits diamètres (5-7 cm) et les grands diamètres (> 17 cm), que le cubique et le polynomial sous estiment légèrement la biomasse, alors qu'ils rendent plus de biomasse pour les diamètres moyens (7-17 cm), figure 30. Ces différences entre les modèles peuvent donner des résultats similaires sur le total de biomasse si on a une distribution bien équilibrée des individus dans les différentes classes de diamètres. Par contre si une catégorie de classe de diamètre prédomine, les deux groupes de modèles peuvent rendre des estimations relativement différentes. Ces différences constatées peuvent être tout de même exploitées pour fixer des limites inférieures et supérieures d'estimation de biomasse pour chaque écosystème. Elles peuvent aussi permettre de faire un choix approprié d'un modèle en fonction des caractéristiques structurelles d'une formation pour laquelle on veut estimer la biomasse totale.

Figure 30. Différence entre les modèles quadratique et les fonctions cubiques

Sur le plan de la logique mathématique, le quadratique est une fonction très simple comparée au cubique et au polynomial, mais ces dernières expriment mieux la logique de croissance d'un arbre. Le tronc d'un arbre augmente en volume et suit une logique cubique. Cette logique est liée à une croissance de la surface du cylindre du fût (2 dimensions avec Surface= ð*r2) mais aussi une croissance verticale ce qui fait une troisième dimension expliquant la logique cubique (figure 31).

Figure 31. Schéma de la logique de croissance des diamètres de tronc.

On se gardera de recommander à cette étape un modèle au détriment des autres car nous estimons que chacun présente des avantages et des limites. Il s'agira de tenir compte de la structure du peuplement pour opérer un choix ou procéder à une combinaison des deux types de modèles ou même faire la moyenne des résultats issus de ces modèles

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Je ne pense pas qu'un écrivain puisse avoir de profondes assises s'il n'a pas ressenti avec amertume les injustices de la société ou il vit"   Thomas Lanier dit Tennessie Williams