4.3. Analyse des données
La présente étude est aussi bien qualitative que
quantitative. Les données d'ordre qualitatif sont utilisées pour
expliquer certains faits d'ordre institutionnel, sociologique et culturel.
Après la collecte, le dépouillement et la saisie des
données ont été réalisés à l'aide du
logiciel EXCEL et le traitement a été réalisé avec
le logiciel SPSS 10.0. La saisie du rapport final a été
réalisée grâce au logiciel Word.
4.3.1. Outils d'analyse des données
Plusieurs outils d'analyse ont été
utilisés dans cette étude. La statistique descriptive a
été utilisée pour décrire et caractériser
les riziculteurs et les différents services financiers offerts par les
IMF. Ensuite deux outils d'analyse spécifiques ont été
utilisés pour le test des deux hypothèses de notre recherche.
4.3.2. Outils d'analyse de l'hypothèse H1
L'hypothèse H1 a été analysée par
deux outils. Une analyse bivariée a été faite d'abord
à l'aide d'histogrammes pour voir l'influence de chacune des variables
explicatives prises
46
Léonie KOUMASSA : Thèse d'Ingénieur
Agronome, Décembre 2007
Contribution de la micro-finance à l'adoption de nouveaux
paquets technologiques de production de riz dans le département des
Collines
individuellement sur la variable dépendante. Puis s'en
est suivie une analyse multivariée réalisée avec un
modèle de Logit multinomial présenté ci-après.
4.3.2.1. Présentation du modèle Logit
multinomial ou Logit polychotomique
Divers modèles économétriques peuvent
être utilisés pour la détermination des
éléments caractéristiques de l'adoption des nouveaux
technologiques de riz par les populations du département des Collines.
Les modèles les plus utilisés couramment pour des études
à variables dépendantes qualitatives sont les modèles
Tobit, Logit et Probit. Les deux derniers modèles (Logit et Probit) sont
très proches du point de vue des caractéristiques (Amemiya, 1981
cité par Hurlin, 2003).
Les modèles dichotomiques Probit et Logit admettent
pour variable expliquée, non pas un codage quantitatif associé
à la réalisation d'un événement (comme dans le cas
de la spécification linéaire), mais la probabilité
d'apparition de cet événement, conditionnellement aux variables
exogènes. Ainsi, on considère le modèle suivant : pi =
Prob (yi = 1| xi) = F (xiâ) où la fonction F(.) désigne une
fonction de répartition. Le choix de la fonction de répartition F
(.) est à priori non contraint. Toutefois, on utilise
généralement deux types de fonction: la fonction de
répartition de la loi logistique et la fonction de répartition de
la loi normale centrée réduite. A chacune de ces fonctions
correspond respectivement un nom attribué au modèle ainsi obtenu:
le modèle Logit et le modèle Probit.
Initialement, le Logit et le Probit ont été mis
au point pour la description des modalités prises par une ou plusieurs
variables qualitatives notamment en biologie. Mais ils ont eu une large
application aussi bien en sociologie, en psychologie et en économie.
(Hurlin, 2003)
Ainsi, le Logit a été utilisé dans
plusieurs études de choix entre deux ou plus de deux possibilités
(Wilson et al., 1986; Payong, 1999; Kemp, 2000; cités par
Vodouhè 2003) ainsi que Kouevi (2002) et Avocèvou (2003) etc. La
démarcation entre ces deux modèles n'est pas très
aisée. Amemiya (1981), Maddala (1983) Polson et Spencer (1991)
cités par Honlonkou (1999) en sont arrivés à la conclusion
que les deux modèles donnent des résultats similaires.
47
Léonie KOUMASSA : Thèse d'Ingénieur
Agronome, Décembre 2007
Contribution de la micro-finance à l'adoption de nouveaux
paquets technologiques de production de riz dans le département des
Collines
Au delà, de cette similitude entre les lois logistiques
et normales, il existe en effet certaines propriétés du
modèle logit qui sont particulièrement utiles pour simplifier les
calculs ainsi que l'interprétation économique des
résultats d'estimation des paramètres â associées
aux variables explicatives (Hurlin, 2003). C'est fort de tout cela que nous
avons opté pour l'utilisation du modèle logit dans le cadre de
cette étude.
Ce modèle vise à estimer la probabilité
de choix d'une option compte tenu de certaines variables propres à
l'individu observé. Comme dans notre étude la variable
dépendante peut prendre plus de deux valeurs c'est le Logit multinomial
qui sera utilisé. En effet, 4 types d'adoptants ont été
distingués (exclue le niveau 0 car on considère que le niveau 0
d'utilisation de la technologique n'est pas une adoption).
Adoption 0 : Non utilisation des variétés
améliorées de riz, de fumure et d'herbicide pour la production du
riz.
Adoption 1 : Utilisation d'au moins une variété
améliorée de riz sans application de fumure ni d'herbicide;
Adoption 2 : Utilisation d'au moins une variété
améliorée de riz et application d'un seul type de fumure mais pas
d'herbicide ;
Adoption 3 : Utilisation d'au moins une variété
améliorée de riz et application des deux types de fumure mais pas
d'herbicide ;
Adoption 4 : Utilisation d'au moins une variété
améliorée de riz et application des deux types de fumure et
d'herbicide.
De façon mathématique, le modèle se
présente comme suit:
Y=f(x, e) avec
Y= variable dépendante pouvant prendre une des 3
modalités suscitées
X= matrice des variables susceptibles d'expliquer la variation de
Y e= erreur logistique de la distribution
Généralement, on présente les
modèles multinomiaux en termes de variables latentes ou
inobservées Y* i ; c'est une variable continue qui affecte la variable
polychotomique observée Yi ; la variable observée Y i
étant alors un indicateur des valeurs prises par Y* i.
La formulation mathématique du modèle se
présente alors dans notre cas comme suit :
48
Léonie KOUMASSA : Thèse d'Ingénieur
Agronome, Décembre 2007
Contribution de la micro-finance à l'adoption de nouveaux
paquets technologiques de production de riz dans le département des
Collines
Y* ij = 3j [Xij] +fli où
Xij désigne le vecteur des variables explicatives qui
affectent l'adoption des innovations de production de riz; i est l'individu ou
l'observation i (i =1,2,....n ) ; n étant la taille de
l'échantillon ; j est la modalité de la variable
dépendante (j = 0, 1, 2, 3, 4) ; Y* ij est la variable quantitative
auxiliaire c'est-à-dire la valeur estimée de Yij ; 3j est un
vecteur des k paramètres inconnus ; fli est l'erreur ou la perturbation
associée à la ième observation lorsque Y prend
la valeur j. Les probabilités associées au choix des diverses
modalités de l'adoption s'écrivent comme suit:
P (Yi = j) = Exp [3j Xij] / Exp [3j Xij] , avec k
correspondant au nombre de modalités de Y
L'estimation des coefficients 3j des variables du modèle
étant basée sur la notion de maximum de vraisemblance, la
fonction de cette dernière s'écrit :
L(Yij; 3j ;ó ) = [(â jXij ) / â
jXij )] où
Nij représente le nombre d'observations en dehors de
celles pour lesquelles Y prend la valeur j. L'analyse des résultats de
ce modèle porte essentiellement sur:
? La qualité du modèle
Plusieurs techniques sont utilisées pour juger de la
qualité du modèle. Ainsi, elle peut être donnée par
la vraisemblance du modèle qui suit une loi de Chi-deux. Le
modèle est dit globalement bon lorsque la valeur de la vraisemblance est
supérieure à celle du Chi-deux au même degré de
liberté à un seuil donné (1%, 5% ou 10%) ou directement
lorsque la probabilité du LR ( log de vraisemblance) est
inférieure au seuil de signification choisi.
? Le pouvoir de prédiction du
modèle
Avec le modèle logit, on peut faire un tableau de
prédiction du modèle pour évaluer sa qualité
à prédire les valeurs prises par la variable dépendante.
Le pouvoir de prédiction du modèle permet de confirmer
l'adéquation du modèle pour l'étude. Il est donné
par le pourcentage de fausses ou vraies prédictions. Plus il y a de
vraies prédictions, mieux on peut se servir des résultats du
modèle pour faire des estimations.
49
Léonie KOUMASSA : Thèse d'Ingénieur
Agronome, Décembre 2007
Contribution de la micro-finance à l'adoption de nouveaux
paquets technologiques de production de riz dans le département des
Collines
? Les signes
Les valeurs numériques des estimations n'ont pas
d'interprétation économique directe. Ainsi, retenons que la seule
information directe réellement utilisable est le signe des
paramètres, indiquant si la variable associée influence à
la hausse ou la baisse la probabilité de l'événement
considéré. Le seuil de probabilité des coefficients
donné par la valeur de Z (Z-Statistic) est nécessaire car elle
indique l'intervalle de confiance sur lequel les signes sont obtenus. Ainsi,
une variable est significative à un seuil donné si la valeur
absolue de son z-statistique correspondant est supérieure à celui
du z-statistique de la table au même seuil.
Dans le cadre de cette étude, on retient donc que
l'adoption des innovations technologiques de riz dépend de certaines
caractéristiques démographiques et socio-économiques des
exploitants rizicoles et aussi de certains facteurs institutionnels. Ces
caractéristiques sont entre autre: l'âge, le sexe, la religion, la
situation matrimoniale, le groupe socio-culturel, le nombre d'années
d'expériences en riziculture, le niveau d'instruction,
l'alphabétisation, le statut social, la taille du ménage, le
nombre d'actifs agricoles travaillant avec l'enquêté, la
superficie de terre possédée, l'accès au crédit, le
nombre de sources de revenus, le nombre de personnes scolarisés dont
l'enquêté assure la charge.
Les technologies de riz vulgarisées dans le milieu
concernent les semences améliorées de riz, les herbicides pour la
culture du riz et les itinéraires techniques innovants de la culture de
riz. Dans le cadre de cette étude seules les innovations concernant les
variétés améliorées de riz, l'utilisation des
engrais pour la fumure et le traitement à l'herbicide du champ de riz
ont été pris en compte.
|