II.2.7. Evaluation des modèles retenus
L'évaluation des modèles est un exercice
délicat, dans la mesure où il n'y pas de méthode de
procédure standard. Les étapes sont nombreuses et connexes et ne
peuvent être déconnectées du processus de mise en place de
modèles forestiers (Vanclay et Skovsgaard, 1996). Un modèle doit
être évalué à travers des tests quantitatifs qui
cherchent à prouver qu'il est suffisamment bon pour prédire un
facteur donné. L'évaluation d'un modèle consiste alors
à démontrer statistiquement ou empiriquement le caractère
raisonnable des valeurs estimées à partir d'une
régression. Il existe cependant quelques procédures de base
consistant à examiner la structure du modèle pour identifier
d'éventuels dysfonctionnements. D'autres approches passent par la
collecte de données supplémentaires non biaisées
(données de référence) à des fins de comparaison
avec la prédiction du modèle en question. Ces approches ont
toutes des limites et ceci fait dire à Vanclay et Skovsgaard (1996) que
la qualité ou la performance d'un modèle ne peut être
évaluée qu'en termes relatifs et sa capacité de
prédiction est très révocable selon les cas. Toutefois,
l'évaluation d'un modèle est un processus continu tout au long de
son élaboration. Ainsi, pour évaluer un modèle il faut
vérifier l'adéquation des équations utilisées ; la
précision de ses constantes d'ajustement, la précision de la
prédiction ; et voir si le modèle satisfait aux exigences de
précision statistiques.
En outre, il faut tenir compte des considérations
qualitatives qui permettent de se prononcer sur les possibilités
d'améliorer le modèle pour les travaux futurs ou les efforts de
révision du modèle proposé.
Le souci de précision a conduit à la prise en
compte d'un certain nombre de précautions sur le choix des
échantillons (distribution spatiale, et répartition dans les
différentes classes de diamètre). Ce souci a été
maintenu depuis le début du travail par l'examen de la forme de la
courbe de la variable indépendante (DBH) et celle de la variable
dépendante (Biomasse) pour avoir une idée sur la forme que va
prendre le modèle. Des analyses complémentaires ont permis de
compléter les tests de précision.
Les tests ainsi effectués permettent de mieux
opérer le choix sur un modèle à partir de son coefficient
de détermination R2. Le coefficient de détermination,
aussi appelé coefficient de corrélation multiple, mesure la
proportion de la variation de y expliquée par la variation de x
(Scherrer, 1984). Ce coefficient est calculé de la façon suivante
:
Si tous les points sont alignés, la dispersion
expliquée par le modèle est égale à la dispersion
totale et on a un modèle parfait avec un R2 égal
à 1. Ainsi, théoriquement, les meilleurs modèles sont ceux
dont le R2 est proche de l'unité. En outre, il existe
d'autres tests statistiques très éprouvés pour
compléter cette évaluation des modèles, il s'agit de
l'analyse de la variance (ANalysis Of VAriance : ANOVA). L'analyse de variance
ANOVA permet de vérifier la distribution autour de la pente de la
régression. Il s'agit en termes simples d'une comparaison des moyennes
entre la série expérimentale et les données
prédites.
- Tests statistiques par comparaison de
moyennes
Pour la comparaison entre la biomasse obtenue par mesure
directe et celle issue des différents modèles, nous avons
procédé à des tests statistiques pour évaluer la
performance de chaque estimateur de biomasse. Il existe plusieurs tests
statistiques. Les plus utilisées sont ceux qui procèdent par
comparaison de moyennes. Pour des échantillons réduits de
variances égales, on peut utiliser des tests simples comme le T-Test
qu'on peut interfacer avec les outils d'analyse de « Excel-Macros
Complémentaires ». T-Test est souvent appliqué sur de petits
échantillons de moins de 30 observations. Ce test permet d'effectuer un
T-Test de Student sur deux échantillons. Ce test, appliqué sur
deux échantillons vérifie l'égalité des moyennes de
populations de chaque échantillon. Ces tests utilisent pour ce faire des
hypothèses différentes : les variances de population sont
égales ; les variances de population ne sont pas égales ; les
deux échantillons représentent, avant et après traitement,
des observations sur les mêmes sujets.
L'application du T-Test suppose malheureusement que les deux
séries de données proviennent de distributions aux variances
identiques, ce qui n'est pas toujours garantie. On préfère
l'ANOVA au T-Test dans plusieurs situations. L'analyse de la variance est une
technique statistique permettant de comparer les moyennes de deux populations
ou plus. L'analyse de la variance n'est pas une méthode qui permet
d'étudier les différences de variances entre populations, mais
une méthode pour étudier les différences de moyenne entre
populations, pour ainsi caractériser les sources de variations sur
l'ensemble des données (Scherrer, 1984). Néanmoins, cette
méthode doit son nom au fait qu'elle utilise des mesures de variance
afin de déterminer le caractère significatif, ou non, des
différences de moyenne mesurées sur les populations (Wikipedia,
2008).
Comme le T-Test, l'ANOVA procède par un test
d'hypothèses : H0 : Ji1 = t2 (les moyennes des deux séries sont
égales)
H1 : ji1 ~ t2 (les moyennes de deux séries sont
différentes)
L'analyse de la variance est un procédé qui
permet de calculer la dispersion totale de l'ensemble des données et de
les partager en composantes de différentes sources. On a la dispersion
intergroupe appelée `factorielle' et la dispersion
intragroupe appelée `résiduelle' ou dispersion due aux
erreurs (Scherrer, 1984). Cette dernière est souvent utilisée
dans l'évaluation de la performance des régressions. Le terme
dispersion revoit alors à la somme des carrés des écarts
entre une série de valeurs et leur moyenne.
Ainsi, la dispersion totale est représentée dans
cette analyse par la somme des carrés des écarts à la
moyenne générale de l'ensemble des données recueillies
sans tenir compte de l'échantillon d'appartenance.
La dispersion à l'intérieur des groupes
(échantillons) exprime les fluctuations d'échantillonnage,
représentées par les écarts entre les valeurs
individuelles et la moyenne de leur propre échantillon (xij-tj). Pour
un groupe la dispersion est égale à la somme de ces
écarts élevée au carré [?
(xij-tj)2] pour tout nij, i=1 (Scherrer, 1984).
La dispersion entre groupe exprime l'écart quadratique
entre la moyenne d'un échantillon et
la moyenne générale (tj-Ji)2. La somme
des dispersions intra et intergroupe donne la dispersion totale.
L'ANOVA permet surtout de faire des tests de comparaison pour
accepter ou rejeter l'hypothèse principale (H0 : ji1 = t2) ou
l'hypothèse secondaire (H1 : Ji1 ~ t2). Le facteur F (rapport entre la
variance intergroupe et variance intragroupe) permet de comparer les deux
variances et permet de décider quelle hypothèse retenir.
1. Si la valeur de F est inférieure à la Valeur
Critique pour F (tableau 9), l'hypothèse principale est acceptée
mais on ignore le risque d'erreur (erreur de type J3 ou Type II
error).
2. Si la valeur calculée de F est supérieure ou
égale à la valeur critique pour F, l'hypothèse principale
est rejetée et le risque d'erreur présente un niveau connu
(erreur de type a ou Type I error).
Le seuil de signification utilisé dans cette analyse est
de 5%, c'est-à-dire que a = 0,05. Les résultats du test ANOVA
sont précisés au tableau 9.
Tableau 9. ANOVA pour les différents
modèles testés
Modèles
|
Source des variations
|
Somme des carrés
|
Degré de liberté
|
Moyenne des carrés
|
Valeur calculée pour F
|
Probabi- lité
|
Valeur critique pour F
|
Puissance
|
Entre Groupes
|
5144,28
|
1
|
5144,28
|
0,163903
|
0,68
|
3,888374535
|
A l'intérieur des groupes
|
6277223,97
|
200
|
31386,12
|
|
|
|
|
|
|
|
|
|
|
|
Growth
|
Entre Groupes
|
64055,89
|
1
|
64055,89
|
0,514684
|
0,47
|
3,888374535
|
A l'intérieur des groupes
|
24891302,61
|
200
|
124456,51
|
|
|
|
|
|
|
|
|
|
|
|
Quadratique
|
Entre Groupes
|
14,057
|
1
|
14,05
|
0,000384
|
0,98
|
3,888374535
|
A l'intérieur des groupes
|
7313779,43
|
200
|
36568,89
|
|
|
|
|
|
|
|
|
|
|
|
Cubique
|
Entre Groupes
|
2,32
|
1
|
2,32
|
0,000063
|
0,99
|
3,888374535
|
A l'intérieur des groupes
|
7354503,26
|
200
|
36772,51
|
|
|
|
|
|
|
|
|
|
|
|
Exponentiel
|
Entre Groupes
|
85867,10
|
1
|
85867,10
|
0,630468
|
0,42
|
3,888374535
|
A l'intérieur des groupes
|
27239139,25
|
200
|
136195,69
|
|
|
|
|
|
|
|
|
|
|
|
Compound
|
Entre Groupes
|
46888,04
|
1
|
46888,04
|
0,410232
|
0,52
|
3,888374535
|
A l'intérieur des groupes
|
22859255,52
|
200
|
114296,27
|
|
|
|
|
|
|
|
|
|
|
|
Polynomial
|
Entre Groupes
|
0,72
|
1
|
0,72
|
0,000019
|
0,99
|
3,888374535
|
A l'intérieur des groupes
|
7358519,95
|
200
|
36792,60
|
|
|
|
|
|
|
|
|
|
|
|
Logarithmique
|
Entre Groupes
|
74,67
|
1
|
74,67
|
0,002544
|
0,96
|
3,888374535
|
A l'intérieur des groupes
|
5869947,57
|
200
|
29349,73
|
|
|
|
|
|
|
|
|
|
|
|
Linéaire
|
Entre Groupes
|
0,00056
|
1
|
0,00056
|
1,66005E
-08
|
0,99
|
3,888374535
|
A l'intérieur des groupes
|
6792093,76
|
200
|
33960,47
|
|
|
|
Les résultats de l'ANOVA montrent et confirment que les
meilleurs modèles sont le Quadratique, le Cubique et le Polynomial avec
des valeurs de F très faibles, ce qui traduit la faiblesse des
écarts entre les valeurs de ces modèles et les données
observées.
Il faut ainsi noter que l'utilisation du coefficient de
détermination ne suffit pas pour estimer la précision d'un
modèle. La comparaison des moyennes, à travers des tests d'ANOVA,
entre les valeurs projetées et des données réelles permet
d'affiner le choix des modèles performants.
Toutefois, si le cubique et le polynomial sont des fonctions
cubiques et se ressemblent du point de vue des résultats, le
modèle quadratique fait une estimation différenciée en
fonction de la taille des diamètres. On constate pour les tout-petits
diamètres (5-7 cm) et les grands diamètres (> 17 cm), que le
cubique et le polynomial sous estiment légèrement la biomasse,
alors qu'ils rendent plus de biomasse pour les diamètres moyens (7-17
cm), figure 30. Ces différences entre les modèles peuvent donner
des résultats similaires sur le total de biomasse si on a une
distribution bien équilibrée des individus dans les
différentes classes de diamètres. Par contre si une
catégorie de classe de diamètre prédomine, les deux
groupes de modèles peuvent rendre des estimations relativement
différentes. Ces différences constatées peuvent être
tout de même exploitées pour fixer des limites inférieures
et supérieures d'estimation de biomasse pour chaque
écosystème. Elles peuvent aussi permettre de faire un choix
approprié d'un modèle en fonction des caractéristiques
structurelles d'une formation pour laquelle on veut estimer la biomasse
totale.
Figure 30. Différence entre les
modèles quadratique et les fonctions cubiques
Sur le plan de la logique mathématique, le quadratique
est une fonction très simple comparée au cubique et au
polynomial, mais ces dernières expriment mieux la logique de croissance
d'un arbre. Le tronc d'un arbre augmente en volume et suit une logique cubique.
Cette logique est liée à une croissance de la surface du cylindre
du fût (2 dimensions avec Surface= ð*r2) mais aussi une
croissance verticale ce qui fait une troisième dimension expliquant la
logique cubique (figure 31).
Figure 31. Schéma de la logique de
croissance des diamètres de tronc.
On se gardera de recommander à cette étape un
modèle au détriment des autres car nous estimons que chacun
présente des avantages et des limites. Il s'agira de tenir compte de la
structure du peuplement pour opérer un choix ou procéder à
une combinaison des deux types de modèles ou même faire la moyenne
des résultats issus de ces modèles
|
|