Memoire Online - Impacts de l’anthropisation sur le paysage forestier et les variables climatiques dans la zone forestière de Yangambi. Recherche des scénarios à court, moyen et long terme.

Les données de température et des précipitations issues de la station climatologique sont prétraitées et organisées sous Excel. Trente colonnes correspondant à trente années regroupées en trois décennies ont été définies. Pour les précipitations, chaque colonne correspond à la somme annuelle des précipitations alors que pour la température, chaque colonne correspond à la moyenne annuelle.

Les données issues de l'enquête portant sur les moteurs de déforestation dans la zone d'étude sont saisies et organisées sous Excel. Les surfaces défrichées pour chaque moteur sont converties en hectare. Les données qualitatives sont quantifiées avec codification.

II.2.3. Traitement et analyse des données

Dans le cadre cette étude, la classification supervisée a été appliquée. Pour y arriver, 6 classes

d'occupation du sol ont été définies. Le tableau 4 ci-dessous décrit ces classes.

Classe agricole La classe agricole représente les surfaces du sol soumises aux activités d'agriculture. Il s'agit notamment des champs et des jachères.


Les bâtis et sols nus La classe des bâtis et sols nus représente les constructions humaines, les routes, et les sols nus.


Les plantations forestières La classe de plantations regroupe des grandes surfaces de terre occupées par de culture forestières plantées et/ou aménagées par l'homme. Elles occupent des grandes surfaces dans la région de Yangambi.


Les forêts secondaires La forêt secondaire représente l'ensemble des types forestiers qui succèdent à la régénération et qui constituent la phase transitoire à l'établissement de la forêt primaire.


Les forêts primaires Il s'agit précisément, des forêts denses humides de basse et moyenne altitude (forêt ombrophile sempervirente) caractérisée par une grande hétérogénéité en ce qui concerne les espèces végétales qui la composent.

Les cours d'eau Il s'agit de diverses voies fluviales (cours d'eau) traversant la zone. La plus vaste est le fleuve Congo.

La classe des plantations forestières est facilement identifiée grâce à son organisation spatiale ainsi que les points GPS pris sur terrain. Cependant, étant longtemps non aménagées, ces plantations sont envahies par des arbres non introduits par l'homme. En conséquence, elles prennent actuellement l'allure des forêts secondaires, certaines étant même confondues aux forêts primaires sur les images Landsat. Pour cela, cinq classes ont été enfin retenues, les plantations étant intégrées dans des classes à réflectance identique.

Pour chaque classe, un échantillonnage des RDIs (Régions d'intérêts) a été appliqué. L'évaluation de ces échantillons s'est faite à travers le coefficient de divergence transformée (DT) et de Jeffries-Matusita (J-M). Dans notre étude, les tableaux 1 (aux annexes), présente à titre illustratif les coefficients de DT et de J-M des échantillons définis pour l'images Landsat de 2018. Ce tableau montre que les valeurs de ces coefficients sont assez élevées ; elles indiquent une bonne séparabilité spectrale entre les classes de l'occupation du sol.

Le tableau 2 (aux annexes) présente à titre illustratif, la matrice de confusion ayant évalué la classification de l'occupation du sol de 2018. Les pixels bien classifiés correspondent aux nombres de pixels sur la diagonale. Les précisions individuelles fluctuent entre 98 et 100% pour 2018 et 2009. Elles vont de 97 à 100% pour 2000, de 99 à 100% pour 1995 et enfin de 88 à 100% pour 1986.

Les analyses ci-dessous sont réalisées afin de caractériser et quantifier la dynamique spatio-temporelle du paysage.

Plusieurs formules existent à l'heure actuelle pour estimer le taux de déforestation. Dans le cadre de cette étude, nous avons recouru à l'équation de catalan (1991) présentée ci-dessous :

Pour distinguer les différentes valeurs des taux de déforestation, Catalan (1991) propose la

L'estimation des changements d'occupation du sol dans la zone d'étude a été faite sur base de la formule suivante :

Si+t = Superficie à l'année terminale (ha) ; Si= Superficie à l'année initiale

Dans la structure spatiale du paysage, l'étude se concentre à deux niveaux : le niveau global du paysage et le niveau spécifique. Au niveau global, les analyses portent sur le nombre de taches par type (classe). Au niveau spécifique (tache par tache) les analyses portent sur :

? Le périmètre de tâche : le périmètre total, le périmètre moyen et le périmètre maximal) ;

? La dominance Dj (a) : indique la proportion d'aire occupée par la tache dominante dans la classe j.

Il s'agit de la part occupée dans l'aire totale par la plus grande tache de la classe j notée amax .J. Plus la valeur de la dominance est grande, moins la classe est fragmentée. (McGarigal & Marks, 1995) :

? La forme des tâches : Celle-ci est calculée par l'indice de la forme de tâche.

La forme est un élément difficile à quantifier et qui peut donner libre cours à différentes interprétations (Krummel et al., 1987). Plus les taches ont des formes allongées ou irrégulières, plus la valeur de l'IFj sera élevée et cette valeur décroîtra à mesure que les formes deviennent circulaires (Bogaert et al., 2000).

Afin d'évaluer la dispersion des superficies et des périmètres autour de leurs moyennes, nous avions calculé la variance, l'écart-type et le coefficient de variation.

? La variance ó² j(a) : représente la moyenne des carrés des écarts à la moyenne. Elle permet de caractériser la dispersion des valeurs par rapport à la moyenne.

? Le Coefficient de variation (CVj) : il est un indicateur de dispersion. Il est égal au rapport de la racine carrée de la variance par la moyenne de la classe j

Pour identifier les transformations spatiales, la typologie proposée par Bogaert et al. (2004) a été appliquée.

Pour cette étude, le Land Change Modeler (LCM) a été utilisé comme outil de Modélisation. Les étapes de la modélisation prédictive de l'occupation des sols à l'aide du module LCM sont donc structurées selon le cheminement présenté dans la figure 13.

Fig.13. Prédiction du changement de l'occupation du sol à l'aide LCM En effet, les changements historiques sont d'abord déterminés à partir d'une série multi-temporelle de cartes de l'occupation des sols. Puis, les facteurs les plus significatifs (variables explicatives) dans ces changements sont déterminés.

Le nombre de variables explicatives à intégrer aux modèles de simulation des changements des modes d'occupation et d'usage du sol est contraint par leur disponibilité ainsi que leur spatialisation. Le tableau 6 présente les variables explicatives retenues pour cette étude.


	Variables explicatives	Description
0.	Le réseau routier	Facilite l'accès aux ressources et leur évacuation
1.	Le réseau hydrographique	Influe sur la répartition des types d'occupation du sol	2.
Les pentes	Influe sur l'accessibilité à certaines ressources	3.
L'agriculture	Important facteur de déforestation	4.
Les agglomérations humaines	Accélèrent la déforestation	5.
L'aspect	Influe sur l'accessibilité et l'utilisation certaines ressources

Après avoir étudié les changements historiques, la première étape est ici consacrée à la construction du sous-modèle. Ceci permet ainsi l'introduction des variables sur lesquelles se produisent des transitions potentielles. Dans cette étude, nous avons déterminé 20 transitions possibles entre l'occupation des sols de 1995 et 2009.

Afin d'éviter les transitions impossibles dans le modèle, seules 6 transitions potentielles ont été retenues (tableau 7). Deux options pour la modélisation des transitions potentielles sont proposées : le Perceptron Multi-Couche (PMC) ou la Régression logistique (Reloger). Dans cette étude, le Perceptron Multi-couche a été appliqué.

La deuxième étape permet d'explorer la puissance potentielle des variables explicatives qui sont considérées comme importantes dans le processus de prédiction. Elle permet également de calculer l'indice de Cramer's V et la probabilité associée. La puissance potentielle des variables explicatives est évaluée à l'aide des outils de transformation variable. Ces outils lient les changements de l'occupation des sols observés aux variables explicatives. Celles-ci ont été sélectionnées en fonction de leur potentiel explicatif, et évaluées grâce au coefficient de Cramer's V, utilisé dans ce cas comme une valeur de probabilité associée à la variable explicative. Une valeur élevée de ce coefficient marque l'importance de cette variable explicative. Ainsi, une valeur supérieure ou égale à 0.15 est considérée comme acceptable. Au-delà de 0.4, les variables explicatives sont considérées comme très satisfaisantes.

Six variables explicatives ont été évaluées : la distance autour du réseau routier, la distance autour du réseau hydrographique, la distance autour des agglomérations, l'aspect du terrain, la pente ainsi que la distance aux champs. La figure 1 (aux annexes) présente les rendus visuels des variables explicatives retenues. La relation entre les variables explicatives et les principales transitions sont décrites dans le tableau 7 ci-dessous.

Légende : D.A.H : distances aux agglomérations humaines ; D.C : Distances aux champs ; P : la pente ; AT : Aspect du terrain ; RT : réseau routier ; RH : réseau hydrographique.

Variables	FP-TBN	FS-TBN	CL.A-TBN	FP-CL.A	FS-CL.A	FS-FP
D.A.H	0.25	0.25	0.24	0.25	0.25	0.26
D.C	0.25	0.25	0.25	0.25	0.24	0.25
P	0.23	0.23	0.24	0.26	0.23	0.24
AT	0.23	0.26	0.26	0.32	0.32	0.19
RT	0.18	0.18	0.18	0.18	0.18	0.18
RH	0.12	0.12	0.12	0.12	0.12	0.12

Le tableau 30 montre que les distances au réseau hydrographique constituent la variable explicative la moins importante pour les principales transitions retenues. Ses coefficients globaux de Cramer's V étant inférieurs à 0.15.

Dans l'ensemble, les distances aux agglomérations humaines, les distances aux champs, la pente et l'aspect du terrain, constituent des variables explicatives ayant de plus, influencé les transitions observées entre 1995 et 2009.

Les plus fortes corrélations avec les changements observés entre 1995 et 2009 se sont observées entre l'aspect du terrain et les transitions forêts primaires-classe agricole, forêts secondaires-classe agricole. L'aspect du terrain a en effet, enregistrés des coefficients globaux de Cramer's V les plus élevés (0.32). Ceci indique la forte contribution de l'aspect du terrain dans la répartition des champs dans la région de Yangambi.

Les évaluations vues dans le tableau 21 montrent que les variables explicatives étudiées et l'occupation du sol de la région de Yangambi, à l'exception du réseau hydrographique, sont relativement assez bien corrélées. Par conséquent, toutes ces variables, excepté le réseau hydrographique, ont utilisées dans le sous-modèle pour la modélisation prédictive de l'occupation du sol.

Afin de se passer de la subjectivité et du manque de précision d'une approche comparative purement visuelle entre une carte de référence (2018) et la simulation (2018), R. G. Pontius et al. (2004) montrent l'intérêt d'une comparaison statistique entre les cartes.

Les auteurs distinguent quatre catégories de pixels avec (i) les pixels corrects en raison d'une constance observée et prédite (null successes [N]), (ii) les erreurs en raison d'une constance observée mais prédite comme changée (false alarms [F]), (iii) les pixels corrects dus à un changement observé et prédit (hits [II]) et (iv) les erreurs dues à un changement observé mais prédit comme constant (misses [M]). Pour juger la précision de la prédiction globale des changements à travers l'ensemble du paysage, ils avancent une méthode permettant de mesurer les erreurs (en % du paysage) en raison de la quantité et de l'allocation en se basant sur les résultats de la budgétisation susmentionnée. Le tableau 8 ci-dessous montre les mesures des erreurs et des exactitudes.

L'erreur due à la quantité de changement prédite mesure le pourcentage d'imperfection de la correspondance entre la quantité de changement observée et prédite. L'erreur due à l'allocation mesure le degré d'approximation de la correspondance dans l'allocation spatiale des changements, compte tenu de la spécification de la quantité des changements dans les cartes de changements observés et prédits.

Les données climatiques (les données de température et celles des précipitations) prétraitées et organisées sous Excel, sont importées sous le logiciel Statistica dans le but de calculer les statistiques descriptives d'une part, et d'autres parts déterminer si la relation entre les variables dépendantes (température et précipitation) et indépendante (superficie forestière) est au moins approximativement linéaire afin de définir les équations de la prédiction climatique.

Pour chaque variable climatique, les courbes de fluctuation spatio-temporelle sont produites. Elles retracent les variations annuelles des précipitations et de la température. Les statistiques descriptives (la moyenne ; le maximum ; le minimum) et les statistiques de dispersion (la variance ; l'écart-type ; le coefficient de variation) viennent à l'appui des courbes d'évolution et décrivent la variabilité et les écarts autour des valeurs moyennes au courant de trois décennies en étude.

La prédiction climatique pour le court, le moyen et le long terme dans le cadre de ce travail s'est reposée sur la méthode de régression simple. En effet, trois modèles sont testés et comparés. Il s'agit du modèle linéaire, du modèle logarithmique et du modèle exponentiel.

De ce fait, les moyennes décennales des superficies forestières sont considérées dans le cadre de cette étude comme les seules variables indépendantes, desquelles dépendent la fluctuation de la température et les précipitations au.

Pour chaque modèle un diagramme de dispersion est produit. Ce diagramme permet de mesurer la corrélation « r » entre les variables et la dépendance (R²) de la variable Y à la variable X. Ces coefficients sont utiles dans la régression car ils permettent d'évaluer les modèles à travers leurs valeurs. Ils mesurent ainsi la force de la relation (association) entre les variables et la qualité du modèle.

L'impact de chaque facteur de déforestation est analysé sur une échelle annuelle. Ce qui a permis en définitive, de déduire le principal moteur de déforestation dans la zone d'étude. Chaque moteur de déforestation est pondéré au nombre d'enquêtés afin déduire l'activité autour de laquelle, la majorité de la population s'adhère.

Le recours aux statistiques descriptives a permis de décrire chaque moteur de déforestation. Pour cela, la moyenne, le maximal, le minimal et les paramètres de dispersion ont été appliqués.

Impacts de l’anthropisation sur le paysage forestier et les variables climatiques dans la zone forestière de Yangambi. Recherche des scénarios à court, moyen et long terme.

II.2.2. Prétraitement et organisation des données

II.2.3. Traitement et analyse des données