II. Qui connait le trachome ?
Nous disposons d'une multitude de réponses sur les
questions concernant les caractéristiques du trachome. La question qui
se pose est de savoir comment reconnaitre le profil des personnes ? Comment
distinguer les personnes qui connaissent réellement la maladie des
personnes qui ne la connaissent pas ? Pour cela, nous allons utiliser une
technique du data mining13, la classification, pour ressortir le
profil des individus.
13 « Le data mining ou fouille de données, est
l'ensemble des méthodes et techniques destinées à
l'exploration et l'analyse de (souvent grandes) bases de données
informatiques, de façon automatique ou semi-automatique, en vue de
détecter dans ces données des règles, des associations,
des tendances inconnues ou cachées, des structures particulières
restituant l'essentiel de l'information utile tout en réduisant la
quantité de données ».
Connaissance et comportement vis-à-vis du
trachome: la situation de la région de Diourbel en 2011
II.1. Méthode de classification et choix des
variables pertinentes sur la connaissance du trachome
La classification consiste à regrouper les individus en
blocs homogènes par rapport à un certain nombre de variables. Sa
finalité est de créer une variable nominale multichotomique
permettant de répartir les individus suivant les différentes
modalités qu'offre cette variable. Il y a plusieurs méthodes de
classification. Nous allons utiliser dans notre cas la Classification
Ascendante Hiérarchisée (CAH) suivie d'une optimisation à
l'aide du logiciel SPAD
Encadré 3 : Principe de la Classification
Ascendante Hiérarchisée (CAH)
Elle consiste en une suite de regroupements ou de partitions
emboitées allant de la partition en n classes
- où chaque individu constitue une classe - à la partition en 1
classe qui regroupe tous les individus. En voici le principe :
· A l'étape 0 : chaque individu est
une classe. On a n classes
· A l'étape 1 : les deux individus
les plus proches sont regroupés. On obtient
(n-1) classes. Les individus ainsi regroupés
sont remplacés par leur centre de gravité.
· Ainsi de suite...
· A l'étape k : on aura
(n-k) classes.
· ...
· A l'étape n-1 : qui est la
dernière étape, on obtient 1 seule classe regroupant tous les
individus.
Il faut alors se basant sur les objectifs de l'étude et
la notion d'inertie interclasse et intra-classe se prononcer sur la meilleure
partition.
Mémoire de fin de formation I5I Edem Kossi
Kludza, INEF 5AGEP, Février 2013
35
Nous disposons d'une panoplie de variables de type DUMMY
(encore appelée Indicatrice). Si nous prenons par exemple la «
variable » `Causes du trachome', elle est composée de
sous-variables de type dummy qui prennent la valeur 1 quand elle est
citée et 0 sinon. Ces sous-variables sont en réalité les
modalités de la principale.
Mémoire de fin de formation I5I Edem Kossi
Kludza, INEF 5AGEP, Février 2013
36
Connaissance et comportement vis-à-vis du
trachome: la situation de la région de Diourbel en 2011
Une question se pose donc : quelles variables choisir pour
l'analyse ?
i. Pour que le résultat de la classification ne soit pas
fortement influencé par les modalités à petit
effectif, nous allons procéder à des
regroupements. Ainsi par exemple la modalité «Laver le visage avec
l'eau et le savon » citée seulement par 4 personnes (sur 1020), au
niveau de la question «Les moyens de protection » sera
rattachée à la modalité «Lavage du visage». Un
simple tri à plat sur SPAD nous permet de connaitre les modalités
à redistribuer c'est à dire ayant un taux de réponse
inférieur à 2% car une ventilation de l'ordre de 2% sera
appliquée dans le paramétrage de SPAD. Cette réaffectation
nous permet de réduire considérablement les variables dummy
à retenir.
ii. Comme signalé plus haut, nous déduisons
certaines caractéristiques du trachome (causes, modes de
transmission, endroits où la transmission est plus rapide, moyens de
protection) de celles de la conjonctivite. Ainsi à ce niveau nous ne
retenons que les variables dummy qui sont caractéristiques du trachome
:
a. Au niveau des causes de la maladie, on ne retient que
« microbe ». Les autres réponses données
(lumière, poussière, changement brutal de température,
...) loin d'être fausses peuvent décrire d'autres types de
conjonctivite mais ne décrivent pas le trachome (Confère partie
trachome dans la littérature)
b. Au niveau des modes de transmission, on retient les
variables dummy : mouche, mains, objets de toilette sales et
vêtements.
c. Au niveau des endroits où la transmission est
rapide, on retient la variable dummy : maison au sein de la famille.
d. Au niveau des moyens de protection on retient : le lavage
du visage, le respect de l'hygiène, éviter les mouches, lavage
des mains
iii. Les variables dummy « Ne sait pas » seront
délaissées car elles sont fonctions des autres variables. Elle
prend la valeur 1 si et seulement si les autres ont pour valeur 0. De
même, la variable dummy « Autres » sera elle aussi
délaissée car n'apportant pas d'information spécifique
intéressante.
La mise en oeuvre de tous ces critères nous
ramène à 10 variables dummy que nous retenons pour la
classification automatique précédée d'une
Analyse Factorielle des Correspondances Multiple (ACM).
Mémoire de fin de formation I5I Edem Kossi
Kludza, INEF 5AGEP, Février 2013
37
Connaissance et comportement vis-à-vis du
trachome: la situation de la région de Diourbel en 2011
Encadré 4 : L'ACM
L'Analyse Factorielle des Correspondances Multiples ou tout
simplement l'Analyse des Correspondances Multiples est une méthode
d'analyse descriptive qui permet d'étudier l'association entre au
moins deux variables qualitatives.
Elle permet en effet d'aboutir à des cartes de
représentation sur lesquelles on peut visuellement observer les
proximités entre les catégories des variables qualitatives et
les observations.
Tableau 7: Récapitulatif des variables retenues
pour la classification sur la connaissance 14
Caractéristiques de la maladie
|
Variables dummy
|
Causes du trachome
|
Microbe
|
Mode de transmission
|
Mouche
|
Mains
|
Objets de toilette sales
|
Vêtement
|
Endroits où la transmission la transmission est rapide
|
Maison
|
Moyens de prévention
|
Lavage du visage
|
Respect des règles d'hygiène
|
Éviter mouche
|
Lavage des mains
|
Source : Construction propre
Résultats attendus : Nous nous attendons à 2 types
de partitionnements :
y' Une partition en en deux classes : une d'elles serait
constituée des personnes qui connaissent le trachome et l'autre des
personnes ne connaissant pas
y' Une partition en trois classes : En plus des deux classes
précédentes, on peut entrevoir une classe intermédiaire
comprenant des personnes ayant une connaissance plus ou moins bonne de la
maladie.
On s'attend donc à ce que nos meilleures partitions soient
en deux classes ou trois classes.
14 Nous n'avons pas pris en compte les variables
portant sur les manifestations, les personnes les plus exposées et les
traitements car très peu de personnes ont répondu à ces
questions. (moins de 6%)
Mémoire de fin de formation I5I Edem Kossi
Kludza, INEF 5AGEP, Février 2013
38
Connaissance et comportement vis-à-vis du
trachome: la situation de la région de Diourbel en 2011
|