WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Modèle de fertilisation (npk) durable pour le riz en double culture irriguée dans la vallée du fleuve Sénégal

( Télécharger le fichier original )
par Oumar THIAM
Université Gaston Berger de Saint-Louis Sénégal - Diplôme d'études appliquées de statistiques pour l'Afrique Francophone et application au vivant ( STAFAV ) 2010
  

Disponible en mode multipage

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

Université Gaston Berger Centre du riz pour l'Afrique

MEMOIRE

pour l'obtention du

DEA de statistiques pour l'Afrique Francophone et Application au
Vivant(STAFAV)

UFR des Sciences Appliquées et Technologies
Section de Mathèmatiques Appliquées

modéle de fertilisation (NPK) durable pour le riz
en double culture irriguée
dans la vallée du fleuve Sénégal

Presenté par:

OUMAR THIAM

Directeur de stage : Dr BADO Vincent(AfricaRice) Encadreur: Pr DIOP Aliou (UGB)

Codirecteur de stage :AW Alassane(AfricaRice)

Remerciement

Je tiens à remercier mon directeur de stage, le Dr Vincent Bado et son assistant Aw Alassane qui ont su m'aider pour la rédaction de ce mémoire ainsi que l'ensemble des personnels administratifs et de recherche d'AfricaRice.

Je remercie également toute l'equipe pédagogique de l'UFR SAT et les intervenans prof-fesionnels responsables de la formation STAFAV et plus particulièrement au Professeur Aliou DIOP.

Mes remerciements vont à l'endroit de tout ceux qui m'ont aidé, plus particulièrement à Monsieur Abdoulaye THIAM, enseignant à NDIAYE ainsi que ses collègues.

Resumé

L' essai sur l'amélioration de la fertilisation minérale pour le riz (oryza sativa) a été mené dans les stations expérimentales de AfricaRice (NDIAYE et FANAYE). Les traitements portent sur differentes combinaisons de NPK ou NPmK dans un dispositif en bloc aléatoire complet randomisé avec 4 répétitions pour chaque site durant deux années successives. Cette étude porte sur l'utilsation des outils statstiques pour mieux expliquer les rendements obtenus pendant quatres saisons avec les différents traitements. Pour se faire, nous avons utilisés un modèle d'analyse de la variance à mesures répétées afin de mieux approcher ce problème. Ce modéle nous a permis de montrer une différence significative entre les différents traitements appliqués. Toutefois, les tests PPDS (Plus Petite Différence Significative) et le test de Van Der Waerden ont confirmé cette différence. Le résultat de ces deux tests ont montré que la combinaison NPKpm (Azote Phosphate de Matam et Potassium) est le meilleur traitement avec un rendement de 7.5tha-1. Ainsi pour ce traitement, les rendements ne difèrent pas selon le site. Le traitement est stable aussi bien à Ndiaye qu' à Fanaye. Par ailleurs, les traitements T2 (NPK-N) et T7 (NK-NPK) ont aussi des rendements satisfaisant de 7.2tha-1 et 7.3tha-1 qui dépassent significativement le traitement complet NPK (6.9tha-1).

Mots clés : Fertilisation, Phosphate de Matam, Riz, Sénégal

Abstract

The trial on the improvement of the fertilization of rice (oryza sativa) was undertaken in the experimental station of AfricaRice (Ndiaye and Fanaye). The treatments were different combinations of NPK or NPKpm (Matam rock Phosphate) in a RCBD (randomize complete block design) with four replications for each site during two years. This trial was on using some statistical tools to better explain the yield of these for seasons with the differnts treatments. To do thus, we have used a analysis of variance with repated measurement to better approch this problem. This model has allowed us to show a significant difference between treatments applied. However, the LSD test (Least Significant Difference) and Van Der Waerden test confirmed this difference. The results showed that the combination NPKpm is the best treatment with yield of 7.5tha-1.

Thus, for this treatment, the yields are not different between site. The treatment is stable as well as NDIAYE and FANAYE. In addition, the treatments T7 (NPK-N) et T7 (NK-NPK) give also good yield 7.2tha-1 and 7.3tha-1 significantly different than T1 (NPK) (6.9tha-1).

iv

Key words : Fertilization, Matam rock Phosphate, Rice, Senegal

TABLE DES MATIÈRES

Nomenclature vi

Table des figures vii

Liste des tableaux viii

Liste des tableaux viii

I Introduction genérale 1

I Problématique et Objectif 2

I.1 Description du probléme 2

I.2 Justifications 2

I.3 Objectif 3

II Matériels et Méthodes 4

I Materiels 4

I.1 Site 4

I.2 Materiel Végétal 4

I.3 Eléments minéraux utilisés 4

II Condition de l'expérimentation 5

II.1 Dispositif experimental 5

II.2 structure des données 7

III Analyse descriptive 8

III.1 Rendement en fonction des deux sites 8

III.2 Analyse par saison 9

III Modélisation 10

I Approche par les moindres carrés 10

I.1 Méthodologie générale 11

I.2 Analyse univariée 11

I.3 Analyse multivariée 12

I.4 Condition de sphèricité de Huynh et Feldt 13

I.5 Ajustement des degrés de libertés de la statistique de Fisher . . . 14

I.6 Choix de l'analyse appropriée 15

II Analyse par maximum de vraisemblance 15

II.1 Méthodologie 15

II.2 Le modèle mixte : Notations et hypothèses 15

vi TABLE DES MATIÈRES

II.3 Estimation des paramètres 16

II.4 Choix de la structure de covariance 17

II.5 Test sur les effets fixes 18

II.6 Analyse des contrastes 18

IV Applications 19

I Modèle d'analyse univariée 19

I.1 Analyse de l' effet des facteurs fixes 20

II Approche par maximum de vraisemblance 21

II.1 Choix du modèle 21

II.2 Validation du modèle 23

II.3 Estimation des paramètres du modèle 24

II.4 Test de Comparaison multiple des différents traitements 25

III Résultats et Discussions 27

III.1 Comparaison des traitements par site 27

III.2 Comparaison globale des traitements 29

IV Discussion 30

Bibliographie 35

vii

TABLE DES FIGURES

II.1 comparaison site 8

II.2 compraison saison 9

IV.1 Ndiaye LSD et Waerden 27

IV.2 Fanaye LSD et Waerden 28

IV.3 Comparaison global 29

viii

LISTE DES TABLEAUX

II.1 Tableau des différents types de traitements 6

III.1 Tableau d'analyse de la variance 12

IV.1 Tableau d'analyse de la variance univariée 20

IV.2 Comparaison de modèle 21

IV.3 Tableau de Shapiro 23

IV.4 Tableau d'estimation des traitements à NDIAYE 24

IV.5 Tableau d'estimation des traitements à FANAYE 25

ix

Présentation de AfricaRice

L

E centre du riz pour l'Afrique (AfricaRice) est une organisation de recherche panafricaine leader oeuvrant pour la réduction de la pauvereté et l'atteinte de la sécurité alimentaire en Afrique par des activités de recherche, développement et partenariat. Il est l'un des 15 centres internationaux de recherche agricole soutenus par le groupe consultatif pour la recherche internationale (GCRAI).

C'est aussi une association de recherche intergouvernementale composée de pays membres africains. Le centre a été créé en 1971 par 11 Etats africains.

Actuellement, il compte 24 pays membres couvrant les régions de l'Afrique de l'Ouest, du centre, de l'Est et du Nord, notamment le Bénin, le Burkina, le Cameroun, la Côte d'ivoire, l'Egypte, le Gabon, la Gambie, le Ghana, la Guinée, la Guinée Bissau, le Liberia, Madagascar, le Mali, la Mauritanie, le Niger, l'Ouganda, la République centre Afrique, la République démocratique du congo, le Sénégal, la Sierra Leone, le Tchad et le Togo.

En reconnaissance de l'importance stratégique du riz pour l'Afrique et de l'expansion géographique réelle du centre qui avait été crée en tant qu'association pour le développement de la riziculture en Afrique de l'Ouest (ADRAO) en 1971, le conseil des ministres de ses Etats membres a pris la décision historique en septembre 2009 de changer officiellement le nom en Centre du riz pour L'Afrique (AfricaRice) et de mettre fin à l'utilisation de l'acronyme ADRAO. Sa mission est de contribuer à la réduction de la pauvreté et à la sécurité alimentaire en Afrique par le biais d'activités de recherche, de développement et de partenariats visant à accroitre la productivité et la rentabilité du secteur rizicole de manière à assurer la durabilité de production.

x LISTE DES TABLEAUX

1

CHAPITRE I

Introduction genérale

D

Ans le monde le riz est l'une des céréales la plus consommée. La production mondiale

du paddy est 635 millions de tonnes produits dans 114 pays dont plus de 50 entre
eux ont une production annuelle supérieure à 100000 tonnes.

En Afrique de l'Ouest, la demande de riz des consommateurs ne cesse de grimper ce qui se traduit par une augmentation de 400% des importations de riz aucours des 25 dernières années, soit un coût d'un million de dollars (E.U) en 1995 (FAO, 2002).

Au Sénégal, à l'instar des autres pays de la sous région la production du riz reste toujours faible en raison des coûts de production élevés, liés aux intrants. Dans la vallée du fleuve, le riz est cultivé en deux saisons chaque année, cette pratique mène à un appauvrissement des sols, ce qui se traduit par une baisse considérable de la productivité. Pour y remédier, d'enormes efforts ont eté faits par les adeptes de la riziculture, ceci résulte une recommandation sur l'utilisation d'Azote, Phosphore et Potassium, fumures minérales essentielles pour le riz.

Entre temps, les sols de la vallée ont accumulé une quantité suffisante en Potassium et Phosphore, cette recommandation NPK complète a été remise en cause en proposant une méthode d'utilisation systématique de ces fumures une saison sur deux.

Avec les résultats satisfaisant du phosphate naturel de Matam sur les autres cultures suscite une question de substitution du DAP (Diamonium phosphate), coût elevé. En d'autres termes, ces deux approches pouraient permettre de réduire le coût de production tout en maintenant les sols en bon ètat avec des rendements meilleurs.

Ainsi, l'objet de cette étude est d'utiliser les outils statistiques pour faire une comparaison de ces trois approches :

- appliquer la recommandation compléte (NPK) chaque saison

- alterner le potassium (K) ou le phosphore (P) avec de l'azote (N) fixe, une saison sur deux

- appliquer la 1er méthode en substituant le Phosphore DAP par le phosphate naturel de Matam (Pm) ou bien appliquer la 2me méthode avec substitution du DAP par Pm.

Aprés avoir fait une description sur les matériels et méthodes descriptives, nous entamons donc la partie modélisation puis l'application pour tirer des conclusions sur les résultats obtenus.

2 CHAPITRE I. INTRODUCTION GENÉRALE

I Problématique et Objectif

I.1 Description du probléme

En Afrique, la consommation de riz augmente plus rapidement que celle toute autre culture et selon le centre du riz pour l'Afrique, sa croissance atteint une moyenne de 5% par an depuis 1960. « Nous pensons que le riz peut aider les populations à sortir de la pauvreté et non uniquement de l'insécutrité alimentaire..., » a indiqué Namanga Ngongi, président de l'alliance pour une révolution verte en Afrique (AGRA), un partenariat africain qui aide les petits agriculteurs à augmenter leur productivité et leurs revenus.

Bien que la production ait augmenté en Afrique subsaharienne pour passer à 14,2 millions de tonnes (riz paddy) en 2006 contre 8,6 en 1980, la demande reste plus importante que l'offre. L'Afrique subsaharienne est importatrice nette de riz, le Nigeria, l'Afrique du sud, le Sénégal et la côte d'ivoire se classent parmi les 10 pays importateurs de riz du monde. Cette dépendance chronique avec l'appauvrissement des sols cultivables constituent un axe de recherche cruciale pour les structures spécialisées dans la riziculture comme Afri-caRice.

Puisque le riz est une plante tributaire des éléments nutritifs tels que l'azote, le potassium et le phosphore, une bonne maitrise de l'utilisation de ces éléments contribue à un accroissement considérable de la productivité.

Dans une perspective d'augmenter les rendements, tout en maintenant les sols en bon état, une série de combinaison de ces éléments a été appliquée pendant quatres saisons de cultures. Par ailleurs, en statistique, cette problématique, entre dans le cadre des modèles d'analyse à mesures répétées dans une même unité expérimentale.

Description de la Recherche

- proposer un modèle pour expliquer les rendements obtenus - Tester les différents traitements appliqués.

Résultats attendus

Les meilleurs options de fertilisation pour augmenter la productivité durable des sols seront obtenus.

I.2 Justifications

Les essais de fertilisation du riz (Oryza sativa) dans la vallée du fleuve Sénégal ont démontrés le rôle moteur de l'Azote pour une bonne productivé. Par contre, les réponses du riz aux apports de Phosphore (P2O5 ) et Potassium (K2O) sont beaucoup moins tranchées. Elles sont faibles à nulles tant que les réserves du sol en ces éléments sont suffisantes pour les besoins de la culture. L'Azote, de par sa mobilité dans le sol a besoin d'être apporté en couverture à différents stades de développement du riz, tandis que le Phosphore et le Potassium peuvent au contraire s'accumuler progressivement en cas de double culture irriguée surtout quand les engrais comme le DAP (Diamonium phosphate) et le KCL (chlorure de potassium) sont apportés chaque saison (hivernage et contre saison chaude) continuellement.

Il existerait ainsi des possibilités d'economie considérables liées à l'utilisation d'une approche systématique en matère de gestion des apports nutritifs ou d'une utilisation des phosphates naturels de Matam à la place du DAP.

I. PROBLÉMATIQUE ET OBJECTIF 3

I.3 Objectif Objectif général

L'objectif principal de cette étude est de mettre en place une stratégie de gestion de la fertilisation minérale durable en double culture irriguée dans la vallée du fleuve Sénégal en réduisant les coûts de production liés aux engrais.

Objectifs spécifiques

- Valoriser le phosphate naturel de Matam dans la riziculture - Assurer la double culture en long terme

- Améliorer la productivité des sols

4

CHAPITRE II

Matériels et Méthodes

I Materiels

I.1 Site

L'expérimentation a été conduite en 2009 dans les deux fermes de AfricaRice à savoir :

NDIAYE

Le site est situé à 40Km de l'embouchure du fleuve Sénégal dans le delta et ses coordonnées sont : 16 o14 , Nord et 16 o14 , Ouest. Il se trouve sur la rive d'un défluant du fleuve Sénégal dénommé Lampsar, une position morphologique typique de périmètres rizicoles dans le delta. Son climat cotier est caractérisé par une température maximale élevée et une humidité de l'air plus forte pendant toute l'année.

FANAYE

Situé à 140Km de l'embouchure du fleuve Sénégal avec comme coordonnées géographiques 16 o33 , Nord et 15 o46 , Ouest, plus précisément le long d'un marigot dénommé Ngalanka. Le climat est caractérisé par une saison des pluies qui va de Juillet en Octobre avec une pluviometrie moyenne de 200 mm. La contre saison chaude va de Novembre à Fevrier et la saison froide de Mars á Juin, le climat est semi aride avec un temps continental.

I.2 Materiel Végétal

L'essai est réalisé avec une seule variété de riz dénommée Sahel 108 qui est la plus cultivée dans la vallée. C'est une variété à cycle court (110 jours) sélectionnée par AfricaRice (Miezan et Diack, 1994).

I.3 Eléments minéraux utilisés

Trois éléments minéreaux sont essentiels pour le riz (Marc Lacharme, 2001) Azote (N)

L'Azote permet une croissance vigoureuse du riz pendant la phase végétative (tallage trés important avec de nombreuses panicules). Son apport pendant cette phase se manifeste par un verdissement de la culture correspondant à un accroissement de teneur en chlorophylle et donc un accroissement de photosynthèse. Il est apporté sous forme d'urée.

II. CONDITION DE L'EXPÉRIMENTATION 5

Phosphore (P)

Le Phosphore permet une meilleure croissance racinaire, favorisant un tallage et agit sur le bon développement des grains en élevant leur valeur alimentaire. Dans cette étude, il est apporté soit sous forme de DAP soit sous forme de phosphate naturel de Matam.

Potassium (K)

Le Potassium favorise le tallage et accroît la taille et le poids des grains . Il permet à la plante de mieux resister à la verse et aux attaques de maladies et d'insectes (parois cellulaires plus epaisses) et à la secheresse. Enfin il accroit la réponse de la plante au phosphore, il est apporté sous forme de KCL.

II Condition de l'expérimentation

II.1 Dispositif experimental

Le dispositif experimental se refère aux règles qui régissent la répartition des traitements aux parcelles d'expérimentation (Gomez, 1972). Convenablement fait, il permet des comparaisons valables parmi les traitements et il contrôle la principale source de variation dans les experimentations au champ (hétérogénité du sol). Dans le cadre de cette expérimentation, le dispositif utilisé est un bloc aléatoire complet de Fisher qui présente beaucoup d'avantages du fait de sa souplesse, simplicité et d'adaptabilité. Chaque site est subdivisé en 4 blocs (répétitions) de 12 parcelles égales, dans chaque bloc, 12 traitements (fumures minérales) sont répartis aléatoirement sur les 12 parcelles. De plus l'expérience est répétée chaque saison pendant 2 années successives sur les deux sites.

La répétition

La répétition (Replication) de chacun des traitements considérés, un certain nombre de fois dans l'expérience, a pour objectif de permettre une estimation de la variabilité résiduelle (Estimate of error) c'est-à-dire de la variabilité qui n'est pas liée aux traitements étudiés. Elle est nécessaire dans cette expérimentation pour fournir une mesure de l'erreur expérimentale. En outre, l'augmentation du nombre de répétitions est l'un des moyens les plus simple d'augmenter la précision. En effet, dans cette expérimentation on a 4 répétitions de 12 traitements pour chaque site.

La randomisation

La randomisation est une répartition au hasard des différents traitements au sein des différentes unités expérimentales (Dagnelie, 2007). Elle constitue un apport principal de Fisher et permet d'obtenir des estimations non biaisées de la variabilité résiduelle et de l'influence des traitements (Validity of estimate)

Le block

Le block (Local control) est un regroupement planifié d'unités expérimentales (Dagne-lie, 2007). Il a pour but comme la répétition, d'augmenter la précision de l'expérience. Le bloc permet de diminuer considérablement l'hétérogénité du sol. D'où une mise en bloc correcte devrait produire de grandes différences entre les blocs, laissant les parcelles à l'intérieur d'un bloc plus homogène (Gomez, 1972).

Ainsi les fertilisants en fonction des saisons sont représentés par le tableau II.1

6 CHAPITRE II. MATÉRIELS ET MÉTHODES

Tableau II.1 - Tableau des différents types de traitements

N0

TRAITEMENTS

CSC 2009

HIV 2009

CSC 2010

HIV 2010

T1

NPK-NPK

NPK

NPK

NPK

NPK

T2

NPK-N

NPK

N

NPK

N

T3

NPK-NP

NPK

NP

NPK

NP

T4

NPK-NK

NPK

NK

NPK

NK

T5

N-NPK

N

NPK

N

NPK

T6

NP-NPK

NP

NPK

NP

NPK

T7

NK-NPK

NK

NPK

NK

NPK

T8

0-0-0

0-0-0

0-0-0

0-0-0

0-0-0

T9

N26PMK-N26PMK

N26PMK

N26PMK

NP26PMK

N26PMK

T10

N52PMK-N52PMK

N52PMK

N52PMK

N52PMK

N52PMK

T11

N52PMK-N

N52PMK

N

N52PMK

N

T12

N-N52PMK

N

N52PMK

N

N52PMK

N : Azote

P : Phosphore

K : Potassium

PM : Phosphate de Matam (28,7 P205)

Le 26PM représente une fumure uniforme apportant 26KgPha-1 sous forme de PM et le

52PM correspond à un double dose.

CSC : Contre saison chaude

HIV: Hivernage

II. CONDITION DE L'EXPÉRIMENTATION 7

II.2 structure des données

Le facteur principal est traitement (T) avec 12 niveaux présentés par le tableau II.1 et 3 facteurs secondaires dont :

- Le site : l'endroit ou l'essai est fait, il est représenté par L avec 2 modalités

- Le bloc ou répétition, dispositif dans le site qui regroupe une série de parcelles carrées, il est noté R avec 4 modalités.

- La saison, représentée par 4 niveaux (2 Contres saisons chaudes (CSC) et 2 Hivernages (HIV)).

Le facteur expliqué est le rendement en grain de riz exprimé en tha-1, il est obtenu aprés avoir éliminé les surfaces de bordure des quatres côtés d'une parcelle. La surface récoltée est 6m2 pour chaque parcelle conformément au norme standard puis les grains sont battus, néttoyés, séchés et pesés séparément. La phase finale correspond à la détermination du pourcentage d'humidité en ajustant le poids des grains à 14% d'humidité selon la formule:

Poids des grains ajustés = A × Z

où A est le coefficient d'ajustement et Z le poids des grains récoltés. Le coefficient A est donné par la formule :

A = 100-M

86

où M est le pourcentage d'humidité des grains.

Figure II.1 - comparaison site

8 CHAPITRE II. MATÉRIELS ET MÉTHODES

III Analyse descriptive

Dans cette partie, nous allons présenter les rendements en fonction des sites et des saisons de cultures.

III.1 Rendement en fonction des deux sites

L'analyse du graphique II.1 montre une légère différence du point de vue rendement entre ces deux sites. Par contre la moyenne des rendements est moins élevée à Fanaye qu'à Ndiaye, ce dernier a une étendue plus petite. Cela atteste du fait d'autres facteurs qui diffèrent des traitements appliqués peuvent être source de cette diffèrence. L'ecart moyen favorise le site de Ndiaye, mais le site de Fanaye présente des minima plus petits et des maxima plus grands que ceux de Ndiaye, ceci correspond à des valeures extrêmes qui sont des rendements rarement obtenues. D'où le site de Ndiaye est beacoup plus stable que celui de Fanaye du point de vue rendement.

III. ANALYSE DESCRIPTIVE 9

Figure II.2 - compraison saison

III.2 Analyse par saison

Le graphique II.2, montre que les rendements sont beaucoup plus élevés en contre saison chaude qu'en hivernage. Les maxima sont obtenus en contre saison et les minima en hivernage. Cela atteste que la contre saison est beaucoup plus favorable pour le riz au point de vue rendement.

10

CHAPITRE III

Modélisation

L

A modélisation peut se définir comme une technique qui permet d'établir une représentation explicative d'un phénomène ou comportement en recensant les variables ou facteurs explicatifs et l'importance relative de chacune de ces variables, afin d'en proposer une représentation interprétable, reproductible et simulable. Par ailleurs, un modèle est une théorie orientée vers l'action à laquelle, elle doit servir. En clair, elle permet d'avoir un apperçu théorique d'une idée en vue d'un objectif concret.

Dans le cadre de cet étude, elle consiste à établir une relation qui explique pour chaque site, le rendement du riz en fonction du traitement, du bloc et de la saison. En effet, pour cet essai un modèle additif a été proposé dans le mémoire (Dieng, 2009) :

Yijk = u + Si + Tj + cijk

avec Si niveau du facteur site et Tj niveau du facteur traitement.

c'est un modèle qui est fait sur une observation (la contre saison chaude), l'expérimen-tation est poursuivi jusqu'à quatre saisons sur les mêmes parcelles. Cela entraine un probléme de dépendance entre les cultures successives sur les mêmes parcelles. D'où la necessité d'améliorer ce modèle en tenant compte cette dépendance.

En effet l'analyse de variance classique (Dagnellie, 2003) nous permet d'idenfier les différents effets significatifs. Cette méthode montre que l'effet site est significatif. Pour mieux approcher les différences entre les traitements, on fera le modèle par site, du fait aussi de la cohésion avec la division géographique (le delta et la moyenne vallée). On est dans les conditions d'une analyse de variance à mesures répétées dans le temps. Cette méthode prend la place de l'analyse de la variance classique du fait que les observations au sein d'une même unité expérimentale ne sont pas indépendantes d'une saison à l'autre. Pour effectuer cette analyse de variance à mesures répétées on utilise deux approches à savoir : - Les moindres carrés qui est une démarche correspondante à l'approche classique souvent présentée dans les manuels d'introduction à l'analyse de la variance à mesures répétées.

- L'analyse par maximum de vraisemblance, conçue pour analyser les modèles à effets mixtes et les modèles linéaires standards.

I Approche par les moindres carrés

Cette approche comprend deux méthodes d'analyses à savoir : - Analyse univariée

- Analyse multivariée

I. APPROCHE PAR LES MOINDRES CARRÉS 11

L'approche par moindres carrés peut être aborder en six étapes, faisant état de la méthodologie générale, description des analyses univariées et multivariées en décrivant les notations, le modèle et les hypothèses, de la condition de sphéricité de Huynh et Feldt, des ajustements possibles aux degrés de libertés de l'analyse univariée et d'une discussion sur le choix de l'analyse appropriée.

I.1 Méthodologie générale

Différentes étapes à effectuer :

- Identifier les sujets;

- Identifier les effets fixes et aléatoires en les divisant en facteur intra-sujet et inter sujet.

- Choisir une matrice de contraste pour transformer les données. Le choix de la matrice n'a pas d'impact sur le résultat des tests sur les effets fixes comme tels.

Pour l'analyse du facteur inter-sujet (traitement), les approches univariée et multivariée conduisent à des résultats simulaires. En ce qui concerne le facteur intra-sujet (bloc) le respect ou non de la condition de sphéricité de la matrice de covariance des données transformées indiquera le type d'analyse appropriée.

I.2 Analyse univariée

Dans le cadre de cette étude les sujets sont repésentés par des blocs aléatoires à l'in-terieur desquels on randomise l'ordre des traitements. Il en résulte un modèle restreint, i.e. avec une contrainte sur la variance du terme d'interaction entre traitement et le sujet. En effet le traitement reste constant chaque année pour éviter le problème de l'effet du traitement précédent sur le traitement actuel connu sous le nom effet de « carry-over » (Crowder et Hand, 1990). Nous sommes en présence d'un modéle à deux facteurs fixes croisés, soient le facteur S intra-sujet repfesentant la saison (les mesures répétés), le facteur T pour traitement et leur interaction TS. Le facteur aléatoire B (T) représentant les blocs emboités dans le traitement. Ce plan d'expérience peut être vu sous l'angle univariée comme un plan à parcelles divisées (split-plot). Le traitement T constitue la parcelle dans laquelle sont emboités les blocs B (sous-parcelles) et la saison (S), le facteur appliqué à la sous-parcelle.

Dans le cas d'un plan équilibré, où on a p mesures sur chaque bloc et n blocs pour chacun des r niveaux du traitement, le modéle est :

Yijk = u + Ti + B(i)j + Sk + TSik + ?ijk (III.1)

avec

? i =

j = ? k =

?

1,

1,

1,

..., r :

..., n :

...p :

(niveaux du traitement) (identifiant du bloc) (mesures répétées)

- Yijk repésente la valeur de la variable réponse (rendement du riz) de la saison k pour

le jme bloc du groupe de traitement i;

- ?ijk est l'erreur aléatoire correspondante, avec une variance ?2 ?

- B(i)j qui tient lieu l'erreur parcelle (traitement) et à une variance ?2 B

Dans ce modéle on suppose que:

- Les variables aléatoires B(i)j r' N(0,?2 B) avec ?2 B la variance inter-bloc. - ?ijk - N (0,?2 ?).

12 CHAPITRE III. MODÉLISATION

Y = X13 + (III.2)

- B(i)j et ijk sont indépendants. On déduit de ce modèle que:

?

corr(Yijk, Yijk?) = ?2 B ? pour des mesures sur le même bloc ?2 B+?2

0 sinon

Les statistiques F sont basées sur les espérences des carrés moyens dont on forme le quotient approprié afin d'évaluer l'ampleur de la variabilité due au facteur qui nous intéresse. La table (III.1) résume les tests à effectuer dans cette situation.

Tableau III.1 - Tableau d'analyse de la variance

Sources

ddl

Carré moyen

F

Traitement

r-1

MST

MST/MSB(T)

bloc(Traitement)

r(n-1)

MSB(T)

 

saison

p-1

MSS

MSS/MSE

Traitement :saison

(r-1)(p-1)

MSTS

MSTS/MSE

Residuals

r(n-1)(p-1)

MSE

 

Interaction TS : Au seuil a, on rejette l'hypothèse selon laquelle il n y a pas d'inter-action entre la saison et les traitements si :

MSTS> F?,(r_1)(p_1),r(n_1)(p_1) MSE

Facteur traitement T : Au seuil a, on rejette l'hypothèse selon laquelle tous les traitements ont le même effet si :

MST

MSTB > F?,(r_1),r(n_1)

Facteur saison S :Au seuil a, on rejette l'hypothèse selon laquelle le rendement est le même pour chaque saison:

MSS

MSE > F?,(p_1),r(n_1)(p_1)

Ainsi, l'analyse univarié montre ses limites si la condition de sphéricité n'est pas satisfait d'où la necessité de recourir à l'analyse multivariée.

I.3 Analyse multivariée

Dans l'approche multivariée, les p mesures prises sur le mêmes blocs constituent un vecteur d'observations. On construit une matrice Y de dimension rn × p dont chaque ligne représente un bloc. Le modèle mutivariée se conçoit sous forme matricielle de la façon suivante:

I. APPROCHE PAR LES MOINDRES CARRÉS 13

{

Yrnp = matrice des observations

Xrnx(r+1) = matrice des indicatrices des niveaux du traitement /3(r+1)xp = matrice des effets du traitement pour chaque saison

Ernxp = matrice des erreurs aléatoires

?

y111 y112

... ... ? ?

y1n1 y1n2 ? ? y211 y212 ? ?

... ...

yrn1 yrn2

1 1 0... 0

1 1 0... 0

1 0 1... 0

.. .. .. ..

1 0 0... 1

u u
T
1S1 T1S2
T2S1 T2S2

.... ....

TrS1 TrS2

???111 ?112

? ... ... ?

? ?

+ ?E1n1 E1n2 ?

? ?

??211 ?212 ?

? ?

... ...

Ern1 Ern2

?

? ? ? ? ? ?

1[

?

?????

?

? ? ? ? ? ?

=

les rnp erreurs de la matrice e sont indépendantes d'un bloc à l'autre, mais pas entre les p variables d'un même bloc. Soit eij une rangé de la matrice e, i.e. le vecteur des erreurs pour le bloc B(i)j ; on suppose que :

?ij N N(0,E)

avec E la matrice pxp des covariances des mesures prises sur un bloc, considéré constante d'un bloc à l'autre, peu importe le traitement subi. Aucune structure n'est imposé à E ; le modèle comprend p(p+1)

2 paramètres de covariance.

L'analyse des mesures répétées diffère d'une analyse multivariée ordinaire par l'intérêt porté sur le facteur intra-bloc et à son interaction au facteur traitement, car il s'agit de la même variable mesuré p fois et non p variables différentes n'ayant que peu de liens entre elles.

Les hypothèses sur les effets fixes s'expriment de la forme générale :

H0 : L3M = 0

où L est la matrice cx(r+1) des contrastes d'intérêt, /3 est la matrice (r+1)xp des effets fixes et M est une matrice p x (p - 1) de transformation des données dont les colonnes forment une base orthogonale au vecteur formé de 1.

Interaction TS : Lcx(r+1) est la matrice de contrastes et Mpx(p_1) la matrice de contrastes sélectionnée.

Facteur traitement :Lcx(r+1) est la matrice de contrastes et Mpx1 = 1 p(1,1...,1)'

Facteur saison S : L1x(r+1) = 1 r+1(1,1...,1) et Mpx(p_1) est la matrice de contrastes sélectionnée.

I.4 Condition de sphèricité de Huynh et Feldt

Cette condition stipule que les différences entre paires d'observations sur un même bloc doivent avoir la même variance. En terme mathématique il faut que :

V ar(Yijk - Yijk') = U2Yijk_Yijk, = 2A, Vk =? k',pour un a > 0

Soit Ela matrice des covariances des mesures prises sur un même bloc. Puisque E

pxp

est homogène pour tous les blocs, nous omettons les indices i et j pour faire référence à

14 CHAPITRE III. MODÉLISATION

ses coefficients dans le but d'allèger la notation. Puisque :

2 2 2

?2 .2

= Uk + ?k, - 2?kk,

avec ?2k + ?2k, sont les éléments diagonaux de E et ?kk, la covariance entre les observations Yijk et Yijk, et :

?kk, =

?2k + ?2k,

?, Vk =? k?, pour un ? > 0

2

une matrice des covariances d'ordre 2 qui saisfait la condition de spéricité aura la forme générale :

? ?

2 ?i+?z

?1 2

?i+?2 2

2 ?2

En effet pour que les quotients des carrés moyens utilisés dans l'analyse de la variance univariée suivent une loi exact de Fisher, il faut et il suffit que la matrice des contrastes orthonormés soit sphérique, c'est-à-dire un multiple scalaire de la matrice d'identité d'ordre p - 1 (Crowder et Hand, 1990). Ainsi la condition de spéricité peut être vérifié à l'aide du test de Mauchly. Si cette condition n'est pas vérifié, l'analyse mulivariée s'impose ou bien une analyse univariée avec une statistique de Fisher dont les degrés de libertés seront corrigés par un facteur multiplicatif ?.

I.5 Ajustement des degrés de libertés de la statistique de Fisher

Si la condition de sphéricité est respectée, pour p observations successives, il y'a p - 1 degrés de libertés associés au facteur intra-sujet. Sinon l'information est réduite et le nombre de degrés de libertés devrait par conséquent être diminué. Il reste à savoir l'am-pleur de cette aténuation (Yandell, 1997).

Les ajustements proposés se basent sur une mesure de la déviation de la spéricité, ? présenté originellement par Box (1954). Les corrections ont été dévelopées pour des modèles à un seul facteur intra-sujet. Soit S la matrice des covariances échantillonnales pxp des mesures prises sur un même individu et Cp×(p-1) une matrice de contrastes orthonormés. Ainsi, A = C?SC

est l'estimation de la variance des contrastes pour laquelle on veut mesurer la sphèricité. Notons aij les éléments de A.

Cependant deux ajustements sont proposés :

Ajustement de Greenhouse-Heisser (1959) :

?à =

(?p-1

i=1 aii)2

(p - 1) x--`Pi ~~=1 aij)2

Ce coefficient devient le multiplicateur des degrés de libertés de la statistique F pour tester l'effet du facteur intra-sujet (saison). Le test pour la comparaison des traitements

reste inchangé. Au lieu de comparer la quantité MSA

MSE à la distribution F(p-1),r(n-1)(p-1),

on le compare avec Fà?(p-1),à?r(n-1)(p-1), sous la condition de sphèricité ?à = 1. Toutefois l'estimateur ?à serait passablement biaisé : les degrés de libertés sont trop réduits, et le test devient trop conservateur (Crowder et Hand, 1990).

II. ANALYSE PAR MAXIMUM DE VRAISEMBLANCE 15

Ajustement de Huynh et Feldt(1976)

Huynh et Feldt ont suggéré un nouvel estimateur de , moins biaisé et moins dépendant de la taille de l'echantillon. Leur ajustement ? est une fonction de :

? ?

1, rnà? - 2/(p - 1)

? = min r(n - 1) - (p - 1)à?

Ainsi, sans ajustement, on rejettera trop souvent l'hypothèse d'égalité des moyennes. En corrigeant à la baisse les degrés de libertés du test F de l'analyse de variance univariée, la valeur critique augmente, et il devient plus difficile de rejetter l'hypothèse H0. La probabilité de commettre une erreur de type I s'en trouve dimuniée.

I.6 Choix de l'analyse appropriée

En ce qui concerne les tests sur le facteur traitement, l'approche univariée et multivariée donne les mêmes résultats. Ces deux analyses se distinguent sur les tests du facteur intra-sujet. L'avantage de l'analyse multivariée est qu'elle ne suppose aucune structure pour la matrice de covariance des mesures répétées. Le problème est que si la condition de sphèricité est respecté, la puissance des tests multivariés est sensiblement inférieure à celle des tests F univariés.

Par ailleur, lorsque la condition de sphèricité de Huynh et Feldt est remplie, on privilégie l'analyse univariée sans corrections des degrés de libertés.

II Analyse par maximum de vraisemblance

L'analyse par maximum de vraisemblance comporte plusieurs avantages par rapport aux deux autres méthodes en raison de sa possibilités de tenir en compte les données manquantes sans les estimer et la modèlisation de la structure de la covariance. En effet, cette dernière étape est cruciale dans l'analyse, car les tests sur les effets fixes sont grandement influencés par le choix de la covariance (Stroup et Wolfinger, 1996) et (Verbecke et Molenbergs, 1997).

Nous allons traiter les aspects théoriques de cette méthode en précisant d'abord la démarche à suivre, le modèle mixte et l'estimation de ses paramétres, le choix de la structure de la matrice des covariances et les tests sur les effets fixes.

II.1 Méthodologie

On identifie d'abord le sujet (bloc) puis on sélectionne les effets fixes à évaluer ainsi que leur interaction.

L'étape suivante consiste à choisir les structures de matrices des covariances des facteurs aléatoires et du facteur intra-sujet.

Une fois la structure de covariance fixée, on regarde les tests sur les effets fixes afin de déterminer s'il y'a lieu de réduire le modèle proposé.

II.2 Le modèle mixte : Notations et hypothèses

Le modèle linéaire mixte est une généralisation du modèle linéaire standard. Il enrichit ce dernier d'une composante aléatoire et permet une structure beaucoup plus souple pour la matrice des covariances des observations. Les dimensions se rapportent à un modèle ayant un facteur fixe inter-bloc à r modalités (le traitement), un facteur fixe intra-bloc à p niveaux (saison) et leur interaction. Les rn blocs constituent un facteur aléatoire, dans le sens où on tient compte de la variabilité dû au bloc sans interesser aux modalités précises

16 CHAPITRE III. MODÉLISATION

de ce facteur mais bien à une population plus large d'individus. Ainsi la forme générale du modéle est :

Y = X3 + Z'y + (III.3)

? ?

y111

? y112 ?

? ?

? ... ?

? ?
? y11p ?

? ?

? ... ?

? ?
? yrn1 ?

? ?
? yrn2 ?

? ?

...
y
rnp

avec:

=

?

? ? ? ? ? ?

1 1 0 0 .. 0

1 1 0 0 .. 0

1 0 1 0 .. 0

.. .. .. .. .. ..

1 0 0 0 .. 1

?

? ? ? ? ? ?

?

? ? ? ? ? ? ? ? ? ? ? ? ? ?

u

T1 ... Tr ... 81

8p (T8)11 (T8)rp

?

? ? ? ? ? ? ? ? ? ? ? ? ? ?

+

?

???

1 0 0 .. 0

0 1 0 .. 0

.. .. .. .. ..

0 0 0 .. 1

? ?

? ?

? ?

? ?

'y1

'y2

... 'yw

?

???

? ?

111

? 112 ?

? ?

? ... ?

? ?
? 11p ?

+ ? ?

? ... ?

? ?

? rn1 ?

? ?
? rn2 ?

? ?

... rnp

?

??????

??????

yrnpx1 = vecteur des observations

Xrnpx(r+1)(p+1)= la matrice des coefficients(connus) effets fixes 3(r+1)(p+1)x1 = vecteur des paramètres (à estimer) des effetsfixes

Zrnpxw = matrice des coefficients (connus) des effets aléatoires

'yw1 = vecteur des coefficients(à estimer) des effets aléatoires

rnpx1 = vecteurs des erreurs aléatoires explicites

Hypothèses du modèle

Le modèle mixte retient les hypothèses suivantes :

'y ? J\I w(0, G)

'y et sont indépendants

? J\I rnp(0, R)

Il en découle de ces hypothèses que les observations suivent une loi normale multivariée avec une matrice de covariance appelée V :

Y J\Irnp(X3,V )

La matrice R des covariances a une forme bloc-diagonale, avec un bloc de covariance [Rij1 pour les p meusues pises sur le jime sujet du groupe i. Les blocs R11 à Rrn ont tous la même structure.

En effet la variance des observations V est fonction de Z, G et R :

V=Var(Y)=Var(X3 + Z'y + ) = V ar(Z'y + ) = ZGZ' + R

II.3 Estimation des paramètres

Estimation de 3 :

Pour estimer 3 on considère le logarithme de la fonction de vraisemblance :

II. ANALYSE PAR MAXIMUM DE VRAISEMBLANCE 17

n 1

l(?,V ) = -2 log(2?) - 2log|V | - 2(Y - X?)?V -1(Y - X?)

1

L'estimateur du maximum de vraisemblance de ? est donc obtenu par moindres carrés

généralisés :

à?GLS = (X'V -1X)-1X'V -1Y

Il reste à remplacer la matrice V = ZGZ' + R par son estimation. En effet on utilise la

méthode du maximum de vraisemblance restreint pour les estimations Gà et Rà

1

lR(G,R) = -2log|V | - 2loglX'V -1X| -1 r'V -1r

où r = Y - Xà?GLS

On obtient ensuite l'estimation finale de ? en remplaçant V par :

?GLS d'où

Và = Z àGZ' + Rà dans

?à = (X' Và-1X)-1X' Và-1Y

Estimation de ? :

Soit ?à cet estimateur de

?à=àGZ'V -1(Y - Xà?)

En effet les résultats dépendent des vraies valeurs des composantes de la variance, ainsi que le modèle ajusté. D'où l'importance de sélectionner la structure de la matrice des covariances pour tirer des bonnes conclusions.

II.4 Choix de la structure de covariance

Le choix d'une structure peut se faire de différentes façons. Plusieurs types de structures pouront être utilisés. Le type UN (Unstuctured) qui correspond à la méthode d'analyse univariée, le Compound symmetry plus utilisé dans l'analyse multivariée, les types auto-régressifs, les modèles à coefficients aléatoires et à corrélations spatiales. Aprés le choix des structures, on fait recours aux critèrs d'ajustement basés sur la méthode du maximum de vraisemblance restreint pour ressortir le meilleur modèle.

Malgré que la structure de la covariance ne soit pas toujours une question d'intérêt en soi, une modèlisation adéquate est nécessaire afin de porter des inférences valides sur les effets fixes du modèle. La structure choisie devrait donc être flexible, mais économique (Everitt, 1995). Cependant ces structures nous permet d'ajuster le modéle univarié avec ces différents modèles.

Yijk = u + Ti + Sk + TSik + ?ijk (III.4)

Ce modéle correspond à celui de l'analyse univarié privé du facteur bloc, avec les résidus associés à un même bloc corrélés entre eux selon les structures déjà citées.

Avec :

?i.k = [?i1k, ?i2k, ?i3k, ?i4k]

L'autre alternative de ce modèle est de supposer que la matrice de corrélation varie d'un groupe de traitement à l'autre.

18 CHAPITRE III. MODÉLISATION

II.5 Test sur les effets fixes

Une fois la structure de la matrice des covariances déterminée, on peut vérifier le niveau de signification des effets fixes. Cette méthode teste l'hypothèse bilaterale :

H0 : L? = 0

à l'aide de la statistique :

F0 =

? ?-1

à??L' L(X? Và -1X)-L' L?à

? Frang(L),z,

rang(L)

Lf×(r+1)(p+1) est une matrice de f contrastes sur les effets fixes (f < (r + 1)(p + 1)). Enfin, les effets fixes non significatifs seront retirés un à un du modèle pour un ajustement plus fin en revérifiant l'adéquation de la structure de covariance pour le modèle final (Wolfinger et Chang, 1995). On peut tester la signification de plusieurs effets fixes simul-tannément au moyen des tests d'hypothèses et d'intervalles de confiance sur les contrastes.

II.6 Analyse des contrastes

On dit que une fonction L?+K? est prédictible si la combinaison linéaire des effets fixes L? est estimable, car une combinaison linéaire d'effets aléatores est toujours estimable. Dans ce cas on peut tester l'hypothèse.

? ? ?

H0 : [L K] = 0

?

On parle d'espace inférentiel large lorsque K = 0, les conditions s'appliquent alors à toute la population parmi laquelle les effets aléatoires sont echantillonnées. Si tous les éléments de K son nuls, on parle d'inférence étroite et les résultats portent uniquement sur les modalités de sélection des effets aléatoires. Un espace inférentiel intermediaire est généré lorsque la matrice K ne fait appel qu'une portion des effets aléatoires (Tenenhaus, 1999). Avec ce modèle dun maximum de vraisemblance, On utilise l'inférence large. La matrice des covariances echantillonnées de L? à + Kà? est :

[L K]

Cà ? L? ? K?

où Cà est un estimateur de l'inverse généralisé de la matrice des coefficients des équations du modèle mixte. Alors la statistique est :

F0 = ? à?? à??? ? L? ? ? ? L? ??-1

K? K?

[L K] C à [L K]

rang(L) ? Frang(L),v sous H0

? ? ?

?

Toutefois, ces modèles méritent d'être appliqués sur les données réelles pour distinguer leurs différences et la validation des hypothéses du modèle sélectionné pour faire des estimations de différents traitements.

19

CHAPITRE IV

Applications

D

Ans cette partie, nous allons appliquer le modèle d'analyse univariée avec mesures

répétées de l'approche par moindres carrées et le modéle mixte du maximum de
vraisemblance. Pour chaque modèle nous présenterons ses avantages ainsi que ses limites puis déterminer le meilleur modéle. Une fois choisi, les hypothèses de validation seront vérifiées avant d'entamer les estimations des différents paramétres intéressant du modèle. Pour finir, nous allons proposer des tests de comparaisons de moyennes multiples pour départager les différents traitements afin de sélectionner le(s) meilleur(s) traitement(s).

I Modèle d'analyse univariée

Le modéle a été bien défini dans la partie modélisation il ne reste que son application dans les données de cette expérimentation. Comme nous l'avons suggéré dans la partie modélisation, l'étude se fait séparément par site à savoir Ndiaye, dans le delta et Fanaye, dans la moyenne vallée. En effet, pour se faire nous allons utiliser la procédure GLM du logiciel SAS (Version 9.00), dont le programme est :

proc glm data Ndiaye ;

class bloc trait annee ;

model rend=trait bloc(trait) annee trait*annee;

random bloc(trait) /test;

run;

Les résultats nous fournissent le table de l'analyse de la variance IV.1 que nous allons analyser.

20 CHAPITRE IV. APPLICATIONS

Tableau IV.1 - Tableau d'analyse de la variance univariée

Source

ddl

TypeIII SS

Carré moyen

F

Pr >F

trait

11

152.589517

13.871774

13.54

<.0001

MS(bloc(trait))

36

36.874400

1.024289

 
 

bloc(trait)

36

36.874400

1.024289

1.15

0.2908

saison

3

132.229262

44.076421

49.33

<.0001

trait :saison

33

46.821037

1.418819

1.59

0.0400

MS(Ereur)

108

96.498050

0.893500

 
 

I.1 Analyse de l' effet des facteurs fixes

Effet traitement

Le traitement a un effet significatif sur le rendement, cela signifie que les différents traite-mens appliqués ont une différence trés significative au niveau a = 5 avec une probabilité (Pr > F) < 0.0001.

Effet saison

La saison a un effet significatif sur le rendement, cela revient à dire que les cultures successives ont une différence significative du point de vue rendement. au seuil a = 5% avec une probabilité (Pr > F) < 0.0001.

Interaction traitement et saison

L'interaction traitement et saison est significative au seuil de 5%. Ceci indique que la saison a un effet différent pour chacun des traitements appliqués. Cela signifie que le traitement et la saison agissent simultannément sur le rendement du riz

Bloc dans traitement

La variabilité expliquée par l'unicité des blocs n'est pas significatif, puisque le terme aléatoire bloc dans traitement a un seuil observé de 0.29. Cette non significativité n'implique pas la non variabilité au sein d'un même bloc dans traitement d'où l'ouverture vers le modèle mixte.

II. APPROCHE PAR MAXIMUM DE VRAISEMBLANCE 21

II Approche par maximum de vraisemblance

Dans cette partie, nous allons essayer d'ajuster ce modéle d'analyse univarié afin de choisir un modéle approprié. Cela revient à utiliser les différentes structures de covariances pour sélectionner le meilleur modéle avec les critères AIC (Akaike Information Criterion) et BIC (Bayesian Information Criterion).

II.1 Choix du modèle

Le choix du modéle se refère à l'utilisation de l'un des critères suivantes : - AIC

AIC = -2 * log(L) + 2 * K

où L est la vraisemblance maximisée et k le nombre de paramètres dans le modèle. Avec ce critère la déviance (-2*log(L)) pénalisée par 2 fois le nombre de paramètres. L'application de ce critère est nécessaire que si les modèles à comparer dérivent tous d'un même modèle complet (Burnham et Anderson, 2002). Le meilleur modèle est celui qui a le plus petit AIC.

- BIC

BIC = -2 * log(L) + K * log(n)

n est le nombre d'individus (bloc) de l'echantillon.

le meilleur modèle est celui qui a le plus faible BIC.

Cependant dans ce contexte nous choisirons le critère BIC pour déterminer le meilleur

modèle.

Tableau IV.2 - Comparaison de modèle

Modèle

AIC

BIC

Pr>F(trait)

Pr>F(saison)

Pr>F(saison*trai)

modèle 1

467.9

471.6

<.0001

<.0001

0.04

modèle 2 UN

463.8

482.5

<.0001

<.0001

0.062

modèle 2 CS

467.9

471.6

<.0001

<.0001

0.04

modèle 2AR(1)

467.7

471.5

<.0001

<.0001

0.0395

modèle 3 CS

493.8

538.7

<.0001

<.0001

0.0069

modèle 3AR(1)

493.2

538.1

<.0001

<.0001

0.0032

22 CHAPITRE IV. APPLICATIONS

D'aprés les résultats du tableau IV.2, le modèle 3 AR(1) est le plus faible BIC d'où nous porterons le choix sur ce modèle décrit par :

Yijk = u + Ti + Sk + T Sik + ?ijk (IV.1)

où :

?i.k = [?i1k, ?i2k, ?i3k, ?i4k]

Avec la structure AR(1) de la matrice de corrélation des résidus associés au même bloc qui sera présenté dans l'Annexe 1. Cette structure a pour but de prendre en compte l'effet d'accumulation des cultures successives sur le même bloc.

Cependant ce modéle mérite dêtre validé pour pouvoir utiliser les résultats obtenus.

II. APPROCHE PAR MAXIMUM DE VRAISEMBLANCE 23

II.2 Validation du modèle

La validation est synonyme du respect des hypothèses déja supposées à savoir : La normalité des résidus, l'indépendance des résidus de deux blocs différents.

? r.,) Nrnp(0, R)

Cela revient à utiliser les tests de normalité et appuyer par les graphiques. Le test de shapiro wilks nous montre que les résidus suiivent une distribution normale d'aprés le tableau IV.3

Tableau IV.3 - Tableau de Shapiro

Shapiro-Wilk normality test
residuals

W = 0.9931, p-value = 0.07543

le graphique II.2 (nuage des points) combiné avec la droite de Henry confirme l'hypothèse de normalité anisi que l'histogramme des résidus

24 CHAPITRE IV. APPLICATIONS

Indépendance des résidus

L'indépendance des résidus entre les blocs est garantie du fait de la disposition des blocs dans chaque site d'aprés le protocole expérimental, les blocs sont bien séparés donc chacun est indépendant des autres d'où les erreurs résiduelles par saison dans deux blocs différents sont bien indépendants.

Ainsi ce modèle confirme les hypothèses déjà supposées, sa validation n'est plus à remettre en cause.

II.3 Estimation des paramètres du modèle

Dans cette partie nous allons présenter que les estimations des traitements. L'estima-tion nous permettra de faire un jugement du modèle par rapport à son ajustement des donnèes réelles. D'aprés le modèle IV.1, nous avons les estimations par site :

Tableau IV.4 - Tableau d'estimation des traitements à NDIAYE

 

Value

Std.Error

DF

t-value

p-value

(Intercept)

8.4750

0.4809917

141

17.619847

0.0000

T10

-0.5075

0.6798613

141

-0.746476

0.4566

T11

-0.3500

0.6798640

141

-0.514809

0.6075

T12

0.6925

0.6798647

141

1.018585

0.3101

T2

0.5850

0.5766341

141

1.014508

0.3121

T3

-1.0550

0.6525463

141

-1.616744

0.1082

T4

0.1775

0.6723107

141

0.264015

0.7922

T5

0.5650

0.6777536

141

0.833636

0.4059

T6

0.3975

0.6792731

141

0.585184

0.5594

T7

-0.1325

0.6796990

141

-0.194939

0.8457

T8

-3.4275

0.6798184

141

-5.041788

0.0000

T9

0.9250

0.6798519

141

1.360590

0.1758

II. APPROCHE PAR MAXIMUM DE VRAISEMBLANCE 25

?H0 : uj = uj? H1 : uj =?uj'

Tableau IV.5 - Tableau d'estimation des traitements à FANAYE

 

Value

Std.Error

DF

t-value

p-value

(Intercept)

7.3375

0.5959033

141

12.313239

0.0000

T10

-0.6800

0.7906813

141

-0.860018

0.3912

T11

-0.7400

0.7906813

141

-0.935902

0.3509

T12

-0.1825

0.7906813

141

-0.230814

0.8178

T2

0.0475

0.7678958

141

0.061857

0.9508

T3

0.2850

0.7894046

141

0.361032

0.7186

T4

-0.1450

0.7906088

141

-0.183403

0.8547

T5

-1.1825

0.7906771

141

-1.495554

0.1370

T6

0.1325

0.7906810

141

0.167577

0.8672

T7

-0.3400

0.7906812

141

-0.430009

0.6678

T8

-4.5225

0.7906813

141

-5.719751

0.0000

T9

0.3125

0.7906813

141

0.395229

0.6933

Remarque :

Sous R (Version 2.9.2), la paramétrisation par défaut se fait avec une cellule de référence ou niveau « contrôle ». L'ecart du niveau j au niveau 1 est donné par :

a = u - u1

où u1 est la moyenne de cellule de référence. On aura donc p - 1 paramètres à estimer.

II.4 Test de Comparaison multiple des différents traitements

L'objectif de cet essai est de déterminer le(s) meilleur(s) traitement(s). L'analyse de la variance du modèle nous donne une différence significative entre ces traitements. Une question suscite par rapport à cette différence, quels sont les traitements qui se diffèrent des autres? pour répondre à cette question, on fait recours aux tests de comparaisons de moyennes multiples. Diverses méthodes existent, dont le PPDS (Plus Petite différence si-gnificatve), Duncan, Newmans-Keuls, Tuckey, Dunett, Gupta et Van Der Waerden. Nous utiliserons le PPDS, test paramètrique et le test de Van Der Waerden, test non para-mètrique pour comparer les traitements qui sont significativement diffèrents d'aprés le modéle.

PPDS (plus petite différence significative) avec correction de Bonferroni Ce test est plus connu sous le nom LSD (Least Significant Difference), l'un des tests les plus utilisé en agronomie (Gomez and Arturo, 1984), pour une comparaison par paire de traitements dont les hypothéses sont :

xj - xj,

? Student

?SCRi-SCRi, ni+ni,+2 ( ni 1 +ni, 1 )

26 CHAPITRE IV. APPLICATIONS

On utilisera la quantité :

t.j =

qui fournie la p-value a' à comparer avec le risque de première espèce a si la p-value est plus petite que a, on rejette l'hypothèse nulle. Pour p > 2 traitements, il effectue p(p - 1)/2 tests, cela implique que, plus on multiplie les tests plus on augmente nos chances de conclure à tort. D'òu la necessité de recourir à des corrections telles que Bon-ferroni :

- Idèe : même principe (test t), en corrigeant le risque a en fonction du nombre de comparaisons

- Pour m comparaisons, on fixe? m, a = 0.05, comme risque de première espèce pour chacun des tests.

- Intérêt : rapide et simple à réaliser; donne un apperçu global de l'ensemble des différences de moyennes considérées comme significatives.

Test de Van Der Waerden

C'est un test non paramètrique qui transforme les rangs en quantile de la loi normale que l'on nomme scores normaux. Cette approche est utilisée lorsque la distribution des observations est proche de la loi normale. Aprés avoir rangé toutes les observations du plus petit au plus grand, calculé la somme des scores intra groupe par :

Ti =

?N k=1

8kak

avec

{ 1 si k E groupei 8k = 0 sinon

ak = ?-1( Rk

N + 1)

la statistique est :

Rejet de H0 : pas de différence entre les groupes au seuil a si

C > X2 ?,t-1

?t i=1(Ti - àE0[Ti])2/ri

C = S2

où :

àE0[Ti] = ria

S2 = 1

N - 1

?N k=1

?k(ak-)2

III. RÉSULTATS ET DISCUSSIONS 27

III Résultats et Discussions

III.1 Comparaison des traitements par site

Pour faire l'analyse, nous avons utilisé le test LSD et celui de Van Der Waerden - NDIAYE

LSD avec correction de Bonferroni

D'aprés le modéle, il y'a une difference entre les traitements, cette différence n'est pas significative si on prive le traitement sans engrais. D'apres le LSD, il y'a un seul groupe pour les traitements qui diffèrent du témoin absolu.

Van Der Waerden

C'est le même résultat que le LSD, pour les groupes de traitements d'aprés ce graphique IV.1

Figure IV.1 - Ndiaye LSD et Waerden

28 CHAPITRE IV. APPLICATIONS

- FANAYE

LSD avec correction de Bonferroni

De même que NDIAYE, le modèle montre une différence significative entre les traitements au seuil de 5%. Le LSD prouve cette diffèrence en subdivisant les traitements en 3 groupes par ordre décroissant, privé du groupe témoin sans engrais. Cela atteste que le traitement T9((NPKpm(26)/NPKpm(26)) du phosphate de Matam se distingue bien par rapport aux autres dans ce site.

Van Der Waerden

Ce test montre une légère différence des résultats avec celui du LSD. On a quatres groupes différents mais pas significative et le groupe témoin qui est significativement diffèrent des autres, le traitement avec phosphate de Matam T9((NPKpm(26)/NPKpm(26)) reste toujours dans les premiers rangs. Par contre les traitements NPK avec phosphate de Ma-tam à double dose ne donnent pas des rendements meilleurs par rapport au traitement NPK complet.

Figure IV.2 - Fanaye LSD et Waerden

III. RÉSULTATS ET DISCUSSIONS 29

III.2 Comparaison globale des traitements

Dans les deux sites, la fertilisation avec le phosphate de Matam dosé à 26P(200Kg/ha) pour chaque saison reste toujours parmi les meilleurs. Par contre les traitements (NPK/N) et (NK/NPK), ne sont pas trés différents du premier d'aprés le graphique IV.3 du test de Van Der Waerden non paramétrique. Ce test est utilisé pour mieux confirmer les résultats obtenus d'aprés le test LSD utilisant la somme des carrés moyens résiduels issu du modèle. Cela permet d'avoir un apperçu sur l'efficacité du modèle du fait que le test de Van Der Waerden est bien apprécié par rapport aux autres tests non paramètriques.

En effet, ces trois traitements pouront bien substituer le traitement NPK complet car leurs rendements sont meilleurs que celui de ce dernier. Pour faire la diffèrence entre ces trois traitements d'autres paramètres tels que la rentabilité économique doivent être prises en compte.

Figure IV.3 - Comparaison global

30 CHAPITRE IV. APPLICATIONS

IV Discussion

Le modèle du maximum de vraisemblance avec srtucture de covariance de type auto-régréssive permet de bien ajuster les données par site. La comparaison des résultats du test LSD construit à partir des sommes des carrés résiduelles du modéle et ceux du test non paramètrique de Van Der Waerden montre une légère différence surtout à Fanaye, par contre à Ndiaye ce sont les mêmes résultats.

Ce modèle comparé avec celui de l'analyse de la variance classique donne les meilleurs estimations du fait de l'effet d'accumulation pour chaque saison sur les mêmes blocs qui ne sont pas prise en compte dans le modèle classique. Cependant, lorsqu'on s'intéresse à la golabilité en tenant compte de l'effet site, d'autres alternatives seront proposées pour améliorer le modèle. Au lieu d'analyser en terme de split-plot, on pourait voir le split-split plot, ce qui change c'est le facteur site qui constitue la (Grande parcelle) et les autres restent intactes.

31

Conclusion

L'étude sur la conception d'un modèle de fertilisation durable en double culture irriguée dans la vallée du fleuve Sénégal prouve que la combinaison avec le phosphate de Matam (NPKpm (26)) donne des rendements meilleurs par rapport aux autres traitements. Par ailleurs la méthode avec alternance de N et de K (T2(NPK/N) et T7(NK/NPK)) une saison sur deux donne des rendements meilleurs par rapport au traitement complet T1 (NPK ). Ce résultat est le fruit de deux tests souvent utilisés dans la recherche en agriculture, le LSD et le Van Der Waerden. En effet, selon l'objectif fixé qui consiste à réduire les coûts de poduction, cette combinaison (NPKpm (26)) permet de faire une économie grâce à son coût moins èlevè par rapport aux autres. Par ailleurs, il serait intéressant de :

- tester l'effet du phosphate de MATAM granulé;

- faire l'évaluation économique de ces trois traitements

- essayer d'alterner le NPmK (pm = 200Kgha-1) une saison sur deux

- faire un essai long terme pour etudier la stabilité de ces trois traitements .

Annexe 1

Structure de covariance

Autoregressive d'ordre 1 avec 2 paramètres :

?

?

AR(1) = 0-2 ? ?

1 p p2 p3 p 1 p p2

I

p2 p 1 p

p3 p p2 1

UN =

?

? ? ?

2

U1 ?21 ?31 ?41

?21 Q22 ?32 ?42 31 ° 32 Q3 0

° 43

41 ° 42 0 43 u4

°

I

32

Compound Symetrie avec 2 paramètres :

CS =

?

? ? ?

U2 + 0-1 0-1 0-1 0-1

u1 U2 + Q1 u1 u1

Q1 Q1 U2 + Q1 Q1

Q1 Q1 Q1 U2 + Q1

I

Sans structure avec P(P+1)

2

33

Annexe 2

Ordre R

#Importation des données

donnees=read.table("rendement.txt",header=T)

#Analyse descriptive

boxplot(Rdtsite,dimnames=list(levels(site)),

xlab="Sites",ylab="Rendement ( t/ha )",notch=T)

boxplot(Rdtsaison,dimnames=list(levels(saison)),

ylab="Rendement (t/ha)",type="l",lty=1,xlab="saison")

#Extracton des deux sites

ndiaye=donnees[site=="ndiaye",]

ndiaye=donnees[site=="fanaye",]

#Modéle

library(nlme)

model=lme(RdtTrait-i-saison-i-Trait*saison,data=ndiaye,

random=1|Rep,correlation=corAR1())

#Test de normalité

shapiro.test(model$residuals)

#Graphe de normalité

f=function(t)

dnorm(t,mean=mean(model$residuals),sd=sd(model$residuals))

par(mfrow=c(1,2))

qqnorm(model$residuals)

qqline(model$residuals)

hist(model$residuals,proba=TRUE,col="lightblue",xlab="Résidus",main="Histogramme

des résidus")

curve(f,add=T,lwd=3)

#Test LSD

library(agricolae) compar=LSD.test(ndiaye$Rdt,ndiaye$Trait,df,Mserr,

p.adj="bonferroni",group=TRUE)

bar.group(compar,density=20,ylab="rendements(t/ha)",xlab="traitements",ylim=c(0,12)

#Test de Vander Waerden

comparw<-waerden.test(ndiaye$Rdt,ndiaye$Trait,group=TRUE)

bar.group(comparw,density=20,ylab="scores normaux",xlab="traitements")

34 CHAPITRE IV. APPLICATIONS

Ordres SAS

proc mixed data =ndiaye;

title'model 1' ;

class bloc trait saison;

model Rdt=trait saison trait*saison;

random bloc(trait) ;

proc mixed data =ndiaye;

title 'model AR(1)' ;

class bloc trait saison;

model=Rdt=trait saison trait*saison;

repeated saison /subject= bloc(trait) type=AR(1)

on change le type (CS ou UN) pour les modèles avec ces types

proc mixed data =ndiaye;

title'model3 AR(1)' ;

class bloc trait saison;

model=Rdt=trait saison trait*saison;

repeated saison /subject= bloc(trait) type=AR(1) group=trait;

on change le type (CS ou UN) pour les modèles avec ces types;

35

BIBLIOGRAPHIE

[1] Burnham, K.P.and D.Anderson.(1987). Model selection and multi-model inference. Springer-Verlag New York

[2] Crowder, M.J. et Hand D.J (1990). Analysis of Repeated Measures, Chapman and Hall, London.

[3] Dagnelie P.(2001). Principe d'expérimentation : Planification des expériances et analyse de leurs résultats. Gembloux, Presse agronomique de Gembloux, 398 p.

[4] Dagnelie P.(2006). Statistique théorique et appliquée. Tome 2. Inférence statistique à une et à deux dimensions. Bruxelles, De Boeck et Larcier, 734 p.

[5] Dagnelie P.(2007). Statistique théorique et appliquée. Tome 1. Statistique descriptive et bases de l'inférence statistique. Bruxelles, De Boeck et Larcier, 511 p.

[6] Danelie P.(2008). Expérimentation Agronomique et Expérimentation Industrielle

[7] Everitt, B.S.(1995). The analysis of repeated measures : a practical review with examples, Statistician, 44(1), 113-135.

[8] Gaël Millot.(2008). Comprendre et réaliser des tests statistiques à l'aide de R. Groupe de Boeck

[9] Kwanchai A. Gomez.(1972). Technique pour des expérimentations au champ sur le riz. Inter-national Rice Research Institute.

[10] Kwanchai A. Gomez, Arturo A. Gomez.(1984). Statiscal procedures for Agricultural research 680 p

[11] Madiop DIENG.(2009). Contribution pour l'élaboration d'un modèle de fertilisation (NPK) durable pour le riz. UGB-AfricaRice 34 p.

[12] Marc Lacharme.(2001). La fertilisation minérale du riz. Copération Française, 19 p

[13] Miézan KM, Diack S.(1994). Senegal releases three new cultivars selected by WARDA. West Africa rice development association, Annual report 1994, Bouake

[14] Tenenhaus, M.(1999). Analyse de la variance à effets mixtes. Utilisation de la Pro Mixed: mais que reste-t-il avec la Proc GLM?, Communication présentée au 31-ièmes Journées de Statistique, Grenoble.

[15] Verbeke, G. et Molenberghs, G.(1997). Linear Mixed Models in Practice

[16] Wolfinger, R. D. et Chang, M.(1995). Comparing the SAS GLM and MIXED Procedures for Repeated Measures, SAS Institute Inc., Cary.

[17] Yandell, B. S.(1997). Practical Data Analysis for Designed Experiments,Textsin Statistical Science Series, Chapman and Hall, London






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Les esprits médiocres condamnent d'ordinaire tout ce qui passe leur portée"   François de la Rochefoucauld