2.2. Méthodes de traitement et analyse des
données
Il s'agit des techniques d'étude, de l'analyse des
différentes données utilisées dans cette recherche. Elles
concernent aussi les traitements et l'analyse des données du travail
pour aboutir aux différents résultats.
2.2.1. Traitement et l'analyse des images satellitaires
Le traitement et l'analyse des satellitaires, après
leurs acquisitions s'est faite selon les étapes suivantes :
Le prétraitement des images
satellitaires
Le prétraitement consiste à faire une
calibration de l'image avant l'analyse principale et l'extraction de
l'information. Il s'agit essentiellement de faire une correction
atmosphérique (nettoyer les effets atmosphériques) et d'une
correction radiométrique (appliquer une équation de normalisation
afin de ramener le compte numérique entre 0 et 1 pour une
interprétation de
40
l'image). C'est en effet la conversion des luminances en
réflectance. Ces opérations améliorent la qualité
des images brutes, respectivement par l'étirement des contrastes pour
augmenter les distinctions des tons entre les différents
éléments d'une scène, par la correction des images
à cause des bruits et des effets atmosphériques.
Le traitement des images
satellitaires
Le traitement et analyse des images satellitaires ont
porté essentiellement sur le traitement des images dans le logiciel Envi
5.1, et leur intégration dans un environnement SIG pour leur
exploitation. De ce fait, une composition colorée « images fausses
couleurs » (O'Neill et al, 1996), pour mieux discriminer les
différents types d'occupation du sol et un choix des parcelles
d'entrainement basé sur les indices collectés par le GPS ont
été faites dans un premier temps.
Ensuite, une classification supervisée à travers
l'algorithme de « maximum de vraisemblance » (Bonn et al., 1992), a
été utilisé pour classifier les images dans cette
recherche. A travers cet algorithme, la distribution des pixels au sein de
chaque classe suit une loi normale (Konan et al., 2016). En effet, les pixels
sont affectés aux échantillons les plus proches selon la distance
bayésienne, qui calcule la probabilité qu'a un pixel d'appartenir
à une classe donnée. Le pixel est affecté à la
classe pour laquelle la probabilité est la plus forte. Cette
méthode classe tous les pixels sauf si on pratique un seuil de
probabilité en dessous duquel les pixels n'ont pas d'affectation. Enfin,
une élimination des pixels isolés par applications des filtres
3x3 a été faite afin d'homogénéiser les
différentes classes.
A la suite de ces traitements, deux grands thèmes sont
identifiés dans l'analyse de l'occupation du sol. Il s'agit des espaces
naturels et des espaces humanisés suivie de l'identification des objets
au sein de chaque grand thème. Au niveau des espaces naturels, six
niveaux de discrimination (forêt dense sèche, forêt galerie,
savane arbustive, savane herbeuse, plan d'eau et bas-fonds) ont
été obtenus. S'agissant des espaces occupés par l'homme,
deux niveaux ont été ressortis (culture / jachère et
habitat / sol nu). Au total, ce sont huit thèmes qui sont retenus dans
l'analyse et la cartographie de l'occupation du sol. La combinaison de ces huit
thèmes a permis de réaliser les cartes d'occupation du sol de
1998, et 2016.
D'autres analyses sont appliquées aux images issues de
la classification. Il s'agit de l'estimation de la qualité de la
classification. Ces analyses portent sur la matrice de confusion pour estimer
la qualité de la classification mais, surtout pour vérifier la
fiabilité de la méthode utilisée (Konan et al., 2016).
41
L'analyse de la matrice de confusion consiste à
déterminer la précision globale (pourcentages des pixels
correctement classés) et le coefficient de Kappa (réduction
proportionnelle de l'erreur obtenue par une classification comparée
à l'erreur obtenue avec une classification pseudo-aléatoire et
donne une estimation plus précise de la qualité de la
classification). Ils désignent le rapport entre le nombre de pixels bien
classés et le nombre total de pixels de référence.
Sur l'image de 1998, la précision globale de
classification est de 93, 42 % et le coefficient Kappa de cette image est de
0,92 soit 92 % (Tableau 3).
Concernant l'image de 2016, la précision globale de
classification est de 92, 88 % et le coefficient Kappa de cette image est de
0,9147 soit 91, 47 % (Tableau 4).
Tableau 3: Matrice de confusion de l'image de
1998 (classification de l'image Landsat TM, 1998)
Types
d'occupation du sol
|
Forêt Dense sèche
|
Forêt galerie
|
Savane arbustive
|
Savane herbeuse
|
Plan d'eau
|
Bas- fonds
|
Habitat/ Sol nu
|
Culture /jachère
|
Forêt
dense sèche
|
82.39
|
14.77
|
0.23
|
0.00
|
0.00
|
0.00
|
0.00
|
2.61
|
Forêt galerie
|
2.58
|
96.74
|
0.00
|
0.00
|
0.00
|
0.00
|
0.00
|
0.68
|
Savane arbustive
|
0.00
|
0.00
|
94.60
|
4.94
|
0.00
|
0.00
|
0.00
|
0.45
|
Savane herbeuse
|
0.00
|
0.00
|
2.53
|
94.96
|
0.00
|
0.00
|
2.79
|
2.51
|
Plan d'eau
|
0.66
|
0.48
|
0.00
|
0.00
|
97.53
|
1.99
|
0.00
|
0.00
|
Bas-fonds
|
0.00
|
0.22
|
0.00
|
0.00
|
0.94
|
98.50
|
0.00
|
0.34
|
Habitat/ Sol nu
|
0.00
|
0.00
|
0.00
|
2.11
|
0.00
|
0.00
|
97.49
|
0.40
|
Culture/jachère
|
4.58
|
0.00
|
0.96
|
3.57
|
0.00
|
0.00
|
0.00
|
90.89
|
42
Tableau 4: Matrice de confusion de l'image de
2016 (classification de l'image Landsat ETM+, 2016)
Types
d'occupation du sol
|
Forêt Dense sèche
|
Forêt galerie
|
Savane arbustive
|
Savane herbeuse
|
Plan d'eau
|
Bas-fonds
|
Habitat/ Sol nu
|
Culture /jachère
|
Forêt
|
93.98
|
3.56
|
0.96
|
0.00
|
0.00
|
0.00
|
0.00
|
1.10
|
Dense sèche
|
|
|
|
|
|
|
|
|
Forêt galerie
|
1.73
|
98.21
|
0.00
|
0.00
|
0.00
|
0.00
|
0.00
|
0.00
|
Savane arbustive
|
2.54
|
0.00
|
93.06
|
3.90
|
0.00
|
0.00
|
0.00
|
0.46
|
Savane herbeuse
|
0.00
|
0.00
|
3.47
|
93.37
|
0.00
|
0.00
|
2.79
|
0.33
|
Plan d'eau
|
0.66
|
1.20
|
0.00
|
0.00
|
96.34
|
1.80
|
0.00
|
0.00
|
Bas-fonds
|
0.00
|
8.92
|
0.00
|
0.00
|
18.04
|
70.00
|
0.00
|
3.01
|
Habitat/ Sol nu
|
0.00
|
0.00
|
0.00
|
4.26
|
0.00
|
0.00
|
95.58
|
0.00
|
Culture/jachère
|
0.97
|
0.00
|
0.00
|
2.01
|
0.00
|
0.00
|
0.00
|
97.10
|
L'examen des tableaux 3 et 4 montrent que les pixels issus des
classes de référence ont entièrement été
affectés à plus de 90 %. Cependant, on constate que ce sont les
pixels des classes des secteurs de forêt dense sèche (Tableau 3)
et de bas-fonds (Tableau 4) qui enregistrent les faibles taux (82.39 et 70).
Les résultats statistiques obtenus par le calcul de la
précision globale, du coefficient de Kappa et de la matrice de
confusion, montrent qu'il existe des erreurs, voire des imperfections dans les
produits cartographiques obtenus. L'opération finale consiste à
exploiter les données issues du traitement des images satellitaires dans
un environnement SIG pour corrigés ces erreurs dans la table
attributaire afin d'être conforme à la réalité. Tous
les traitements effectués et les informations recueillies ont permis de
mettre en place une base de données fiable pour l'élaboration
d'un SIG. A la fin donc du processus de classification, on a obtenu deux cartes
d'occupation du sol des années 1998 et 2016 de la sous-préfecture
de Nassian.
43
Ainsi, le croisement des données d'occupation du sol de
1998 et de 2016 a permis d'analyser les facteurs de la dégradation de la
diversité végétale.
|