3.4.2. Analyses
statistiques
Les analyses statistiques
descriptives et différentielles ont été conduites dans le
but de caractériser les sujets d'études. L'encodage et la
description statistique des données ont été
réalisés dans Excel 2007. Les données brutes
étaient introduites dans l'ordinateur. Le masque de saisie et la
codification des variables ont été effectués dans Excel
2007. Le dépouillement a été fait à l'ordinateur.
Les données ont été corrigées à l'aide des
outils tel que Pivot table dans Excel 2003. Avant de conduire les analyses,
les données brutes étaient introduites dans l'ordinateur. Les
questions fermées ont été codées, il en
était également pour les questions ouvertes. Les codes des
réponses aux différentes questions étaient affectés
pour les besoins de l'exploitation statistique. Le dépouillement a
été fait à l'ordinateur. L'analyse préliminaire des
données a commencé par une description statistique des variables
(calcul du pourcentage, fréquence, moyenne, écart-type,
coefficient de variation, etc.) avant les analyses différentielles.
Pour la présentation descriptive des statistiques, les fréquences
des distributions des échantillons étaient calculées et
les résultats y relatifs sont présentés sous forme de
fréquences, pour pourcentages, moyenne, écart-type, coefficient
de variation, minimum pour les variables quantitatives.
L'analyse des données d'enquête a commencé
par l'organisation des données en variables dépendantes et en
variables indépendantes. Pour l'ensemble des variables, des scores de
cotation et des critères d'appréciation étaient
préétablies.
Les analyses multi-variées réduites
étaient conduites et les modèles
généralisés linéaires (GLMs) étaient
construits pour déterminer la probabilité d'association des
facteurs indépendants aux facteurs dépendants. En
général, les tests de GLM sont appliqués à tel
enseigne que les variables dépendantes sont liées
linéairement aux facteurs et aux coaxiales à travers une
fonction spécifique de liaison. Les modèles peuvent être
utilisés même si la variable dépendante n'est pas
distribuée normalement. Les modèles GLMs intègrent les
autres types des modèles classiquement utilisés par les
chercheurs tels que les régressions linéaires pour les
variables dépendantes à la distribution normale, les
modèles logistiques pour des données binaires. Les modèles
GLM conviennent parfaitement aux données issues des enquêtes et
qui soient complexes suivant plusieurs modèles de distribution
(distribution normale de Gauss, distribution de Gamma, distribution de
Poisson, etc.).
Les données en séries de temps et les nombres
(comptes) ne sont pas appropriés dans GLM avec Gaussian models. Ce
qui entraine utilisé les modèles non linaires. Les
modèles logit, probit ou tobit peuvent être estimés par la
méthode de maximum de vraisemblance. En revanche, le
modèle tobit peut être estimé par la méthode
de maximum de vraisemblance s'il y a simultanéité des
effets sur la variable réponse( dépendante) sinon par la
méthode des moindres carrés partiels. Cette dernière
méthode donne aussi des estimateurs sans biais et convergents. La
présente étude utilise la méthode à deux
étapes consistant à estimer d'abord la probabilité avec
laquelle les facteurs influencent la variable réponse par la
méthode de maximum de vraisemblance en utilisant le modèle logit,
puisque la variable dépendante suit une loi normale (Gausian identity
model), ensuite son intensité par la méthode des moindres
carrés partiels en utilisant le modèle tobit, si la variable
réponse n'est influencée simultanément avec plusieurs
facteurs.
La décision concernant le type des tests
appliquer dépend des types des données (données
continuées et ou catégoriques) dans cette études, les deux
types des donnes étaient récoltées. Les analyses (GLM)
ont été effectuées avec le logiciel Stata version11(2013)
plus adapté à l'analyse des données aux variables
complexes en terme de distribution.
|