3.5 Nature, sources et instruments de mesure des
données collectées
Les données collectées sont à la fois
quantitatives et qualitatives. Elles portent sur :
- les caractéristiques socio-économiques des
producteurs (âge, niveau d'éducation/alphabétisation,
appartenance à une association/groupement, nombre d'années
d'expérience en matière de production rizicole, contact avec un
encadreur, taille du ménage.)
- les éléments du revenu de l'exploitant
(agriculture, commerce, élevage, etc.)
- les maladies prédominantes dans la zone et leurs liens
avec les activités des producteurs.
Ces données ont été collectées du
10/08/09 au 05/09/09 à l'aide d'un questionnaire standardisé,
d'entretiens semi-structurés (voir annexe). En outre, les données
secondaires relatives aux environnements biophysique et institutionnel ont
été collectées à travers la documentation de
différentes structures telles que BIDOC-FSA, INRAB, INSAE, PNUD, MAEP,
MSP, IRSP etc. La technique de la triangulation a prévalu tout au long
de la collecte afin de s'assurer de la fiabilité des données.
Méthodes et outils d'analyses
Les données collectées ont été
codées, dépouillées et saisies à l'aide du tableur
Excel. Access 2007 a servi à réaliser la base de données.
Le contrôle et le traitement des données ont été
réalisés avec le logiciel SPSS version 16.0 pour les
caractéristiques socio-démographiques des exploitants et pour
effectuer les régressions.
La méthode d'analyse utilisée est
essentiellement quantitative. Toutefois, elle fut complétée par
la méthode qualitative pour pouvoir expliquer certains faits d'ordre
institutionnel, sociologique et culturel.
Hypothèse 1
Les systèmes d'irrigation utilisés dans la
commune de Malanville pour la production rizicole ne sont pas
homogènes.
Ici, nous supposons qu'il existe plusieurs systèmes
d'irrigation utilisés pour la production du riz dans la commune de
Malanville. A partir de l'Analyse en Composante Principale (ACP), nous avons
décrit les relations existant entre les différentes variables qui
permettent de caractériser un système d'irrigation. Il s'agit des
sources de provenance de l'eau (point d'exhaure), du mode de distribution et de
la nature du matériel de distribution de l'eau. Après, nous avons
réalisé les groupes homogènes de systèmes
d'irrigation puis avons distingué les types d'irrigation
réalisés dans la commune de Malanville. L'hypothèse
formulée sera acceptée lorsque l'ACP présentera plusieurs
groupes homogènes.
Hypothèse 2
La productivité de la terre pour le riz dépend
du système de production mis en place par le producteur
Plusieurs modèles peuvent être utilisés
pour vérifier la relation qui existe entre la productivité de la
terre et les types d'irrigation. Nous pouvons utiliser une régression
linéaire qui mettra en relation les niveaux de rendements au type
d'irrigation qui sont des variables non métriques. On pourra par la
suite tester la signification des coefficients pour vérifier cette
relation. On peut aussi utiliser la fonction de production pour décrire
cette relation.
Pour cette hypothèse, nous avons deux (02) variables :
le type d'irrigation et le rendement. Le type d'irrigation est une variable non
métrique avec trois (03) modalités et le rendement reste une
variable métrique. Le test requis dans ce cas pour la comparaison des
moyennes est l'Analyse de variance (ANOVA) à un facteur.
Quand ce test révèle des différences
significatives entre les trois (03) catégories, alors il
est nécessaire d'aller plus loin pour déterminer les
catégories qui ont des moyennes différentes
pour cette caractéristique. On se retrouve alors dans
le cas de comparaison de moyennes entre deux (02) catégories, avec une
variable métrique et une variable non métrique. Le test le plus
adéquat dans ce cas est le test t de Student de comparaison de moyennes.
Le niveau de signification des résultats obtenus, nous permettra
d'accepter ou de rejeter l'hypothèse. Lorsque la statistique F
calculée a une probabilité inférieur à 5%, nous
accepterons au seuil de 5% que la productivité de la terre pour le riz
dépend du système de production mis en place par le
producteur.
Hypothèse 3
Les caractéristiques socio-économiques, le
revenu net, la superficie emblavée, la distance exploitation-habitation
et le système d'irrigation influencent significativement le niveau de
morbidité du ménage.
Plusieurs modèles économétriques peuvent
être utilisés pour la détermination des facteurs qui
influencent le niveau de prévalence des maladies hydriques liées
aux activités de production rizicole. La prévalence est
caractéristique du niveau de morbidité et donne une idée
exacte sur le niveau de risque sanitaire des populations. Les modèles
couramment utilisés pour de telles études sont les modèles
Tobit, Logit et Probit. Les deux (02) derniers modèles (Logit et Probit)
sont très proches du point de vue de leurs caractéristiques
(Amemiya cité par Honlonkou, 1999).
Initialement, le Logit et le Probit ont été mis
au point pour la description des modalités prises par une ou plusieurs
variables qualitatives, notamment en biologie. Mais ils ont eu une large
application aussi bien en sociologie, en psychologie qu'en économie.
Ainsi, le Logit a été utilisé dans plusieurs études
de choix entre deux ou plus de possibilités (Payong, 1999 ; Kemp, 2000 ;
Kouévi 2002). Cependant, la démarcation entre ces deux
modèles n'est pas très aisée. Amemiya (1981), Madala
(1983), Polson et Spencer (1991) cités par Honlonkou (1999), en sont
arrivés à la conclusion que les deux (02) modèles donnent
des résultats similaires.
Nous ferons recours au Logit dans cette étude parce
qu'elle a fait ses preuves dans plusieurs études similaires. Dans ce
cas, la variable dépendante peut prendre deux valeurs (0 lorsque la
prévalence des maladies est inférieure à 0 et 1
lorsqu'elle est supérieure à 0).
· Modèle théorique
Le modèle théorique se présente comme suit
:
Y = f(X, e) avec
Y = variable dépendante
X= matrice susceptible d'expliquer la variation de Y
e= erreur logistique de la distribution.
Nous analyserons les résultats du modèle qui
porteront sur la qualité du modèle ; le pouvoir de
prédiction du modèle et les signes des coefficients
estimés.
· La qualité du modèle
La qualité du modèle peut être
appréciée en utilisant la vraisemblance du modèle qui suit
une loi de Khi Deux. Le modèle est dit globalement significatif lorsque
la valeur de la vraisemblance est supérieure à celle du Khi-deux
au même degré de liberté, et à un seuil donné
(1%, 5% ou 10%). De façon plus directe, le modèle est dit bon
lorsque la probabilité du ratio de vraisemblance est inférieure
au seuil de signification choisi.
· Le pouvoir de prédiction du modèle
Le pouvoir de prédiction du modèle permet de
confirmer l'adéquation du modèle pour l'étude; il est
donné par le pourcentage de fausses ou vraies prédictions. Plus
il y a de vraies prédictions, mieux les résultats du
modèle peuvent être utilisés pour faire des estimations.
· Les signes de coefficients estimés
La valeur numérique des coefficients estimés
n'a pas vraiment d'intérêt en soi. Par contre, les signes de ces
coefficients sont importants. Ils indiquent si la vérification
associée influence la probabilité à la hausse ou à
la baisse. Autrement dit, ces signes indiquent dans quel sens la variation de
la variable explicative influence la variation de la variable expliquée.
A chaque signe des coefficients est associée une significativité
qui revêt une grande importance. Elle est donnée par une
probabilité qui indique dans quel intervalle de confiance le signe peut
être utile. Cette probabilité peut être de 90%, 95% ou de
99%.
· Modèle empirique Soit Pi la probabilité
qu'associe le Logit à l'unité d'enquête i
Pi = F(Ii) = 1/ 1 + e-Ii
Ii = 130 + 21xi1 + 132xi2 + 23xi3 + & + 13nxin
Ii est le vecteur qui représente les
caractéristiques de l'unité d'enquête, de son
environnement
et de l'objet de son choix.
On a : Ii= 130 + 131Sex + 132Part + 133Dprod + 134Atrav +
135Group + 136Dexhab + 137Sric + 138Typriz + 139Revenu + 1310Travh + 1311Bot
Les 13i représentent les coefficients des variables
explicatives.
· Signes des variables
o Niveau de morbidité (variable
dépendante)
La prévalence des maladies pourra nous permettre de
définir le niveau de morbidité. Elle se calcule en faisant le
rapport du nombre de personnes malades par saison de production par le nombre
total d'actifs agricoles intervenant dans la production du riz. Il s'agit de
toutes sortes de maladies.
Prévalence des maladies dans le
ménage i = nombre de personnes malades par saison de production dans
le ménage / nombre d'actifs agricoles dans le ménage
i
La prévalence prendra donc deux (02) modalités
que sont un faible taux de prévalence (p<0) ou un
fort taux de prévalence (p> 0). Ainsi, p=0
si prev<0 et p=1 si prev> 0. Ces indicateurs ont
été définis en tenant compte des travaux antérieurs
réalisés par Jeen & al. , (2009) qui
évaluaient les déterminants du niveau de morbidité des
ménages suite à l'utilisation des eaux usées en
agriculture en Inde. Les travaux de Asamoha (2007) traitant de
l'évaluation de niveau de morbidité des ménages agricoles
riverains de la Volta au Ghana par rapport au paludisme définit de la
même manière le niveau de morbidité. De plus, Ataboashi
(2006), évalue de la même manière l'impact de l'utilisation
des eaux usées en agriculture périurbaine à Accra au
Ghana. Il définit le niveau de morbidité par la prévalence
et utilise le logit binomial.
En prenant en compte les différents
éléments soulignés dans les facteurs déterminants
qui influencent le niveau de prévalence des maladies hydriques
liées aux activités de production rizicole, les variables
explicatives suivantes se libellent comme suit :
o Sex : En parlant de sexe, de l'influence du
sexe du chef de ménage, les hommes sont en général plus
exposés que les femmes du fait qu'ils travaillent plus longtemps dans
les casiers rizicoles Tiercelin (1998). Les hommes sont donc beaucoup plus
vulnérables que les femmes.
o Part : le niveau de revenus issu du riz peut
permettre de faire face aux dépenses engendrées par l'utilisation
de ces innovations.
o Typriz : type de riziculture. Nous avons
identifié trois (03) types de riziculture qui impliquent chacun une
certaine méthodologie d'utilisation de l'eau. Ainsi, le système
qui implique une forte présence de producteurs dans l'eau (riz
inondé) pourrait accroître le niveau de morbidité des
ménages qui le pratiquent. Nous avons distingué à ce
niveau trois (03) modalités.
o Atrav : Actif agricole travaillant dans le
riz. C'est une variable qui donne une idée sur le nombre de personnes du
ménage travaillant dans la riziculture.
o Dprod : l'ancienneté dans la
production du riz. L'ancienneté du producteur peut lui permettre de
prendre des dispositions pour éviter les maladies. Cette variable peut
influencer négativement le niveau de risques en le baissant.
o Sric : la superficie de riz
cultivé. La superficie est un facteur qui peut augmenter la durée
du travail dans l'exploitation rizicole. Donc, cette variable peut être
un facteur favorisant le niveau de morbidité des ménages
agricoles. On peut l'exprimer en disant que plus la superficie est grande, plus
le niveau de risques augmente (Jeen, 2007).
o Travh : la durée moyenne de travail
dans les casiers rizicoles par jour. Plus grande est la durée, plus
forte est l'exposition. Cette variable affectera positivement le niveau de
morbidité.
o Group : l'appartenance à un
groupement ou association de riziculteurs. Cette variable indique
l'intensité des contacts avec d'autres producteurs. Les producteurs
n'ayant pas de contact avec les agents de vulgarisation peuvent toutefois
être informés par les collègues (Adégbola et
Garderbroek, 2006). C'est une variable dichotomique et elle prend la valeur 1
si l'enquêté appartient à un groupement ou association de
riziculteurs et 0 si non. L'appartenance à un groupement est
supposée affecter positivement la connaissance des
variétés améliorées de riz.
o Dexab : Distance habitation exploitation.
La distance entre l'exploitation agricole et l'habitation du ménage peut
positivement augmenter le nombre de maladies liées à l'eau qui
peuvent affecter les actifs du ménage Delville et al. , (1996).
Ici trois modalités ont été définies à
partir de la littérature pour évaluer la distance entre les
exploitations et les habitations. Demont (2007), montre dans
son travail sur l'évolution des exploitations agricoles familiales en
Afrique de l'ouest que la distance moyenne entre l'exploitation et l'habitation
est de 2 km. En tenant compte de cet indice, nous avons défini trois
modalités. Les exploitations proches d<2 km, les exploitations
éloignés d>2 km qui prennent respectivement les
modalités 0 et 1. Cette variable affecte le niveau de morbidité
des ménages car plus proche se retrouve l'habitation de l'exploitation,
plus élevé est le risque de tomber malade.
o Bot : Cette variable exprime l'utilisation
des bottes comme outils de protection par les exploitants. Elle se
définit en deux (02) modalités : b=0 si l'exploitant ne dispose
pas de cet outil et b=1 si le contraire.
Les variables et leurs signes peuvent être
résumés dans le tableau n°2.
Tableau 2 : Nature code et
modalités attendues des variables
Nom de la variable
|
Type de variable
|
Code
|
Modalité
|
Signe attendu
|
Variable dépendante
|
Morbidité élevée
|
Binaire
|
Prev
|
1 si Prev > 0 et 0 si non
|
/
|
Variables indépendantes
|
Sexe
|
Binaire
|
Sex
|
1=Masculin ; 2 Féminin
|
+
|
Part du revenu provenant de la culture du riz dans le revenu
annuel
|
Continu
|
Part
|
/
|
-
|
Superficie de riz
|
Continu
|
Sric
|
/
|
+
|
Actif agricole intervenant dans la production du riz
|
Continu
|
Atrav
|
/
|
+
|
Appartenance à un groupement
|
Binaire
|
Group
|
1= Oui ; 2=Non
|
-
|
Distance habitation- exploitation
|
Binaire
|
Dexhab
|
1=<2km , 2=>2km
|
+
|
Type de riziculture
|
|
Typriz
|
1= riz totalement irrigué ; 2= riz inondé ; 3=
riz pluvial
|
|
Utilisation des bottes ou non
|
Binaire
|
Bot
|
1= Oui ; 2= non
|
+
|
Durée de travail dans l'eau
|
Binaire
|
Travh
|
1=<6h ; 2=6h
|
+
|
Ancienneté dans la production du riz
|
|
Dprod
|
1=<3 ans ; 2= 3-6ans ; 3= >3ans
|
-
|
|