VI. Présentation du logiciel STATlab
utilisé pour cette classification
Différents logiciels statistiques traitent les
méthodes de classification automatique que se soit les méthodes
hiérarchiques, les méthodes des nuées dynamiques et les
méthodes discriminantes. Il est en effet notoire que les méthodes
d'agrégations des classes et les algorithmes de classification
diffèrent d'un logiciel à un autre. Il faut cependant être
prudent lorsqu'on veut comparer les résultats des méthodes de
classifications issues de différents logiciels. Cette
différenciation s'accentue au niveau de la mesure de la distance entre
les individus et aussi en ce qui concerne le type des données
admissibles. En effet, certains logiciels sont performants lorsqu'on utilise un
tableau de contingence, d'autres en n'utilisant que des données binaires
et ainsi de suite. Notre choix s'est basé sur un logiciel
fréquemment utilisé pour le traitement des données
d'enquêtes.
Il s'agit de "STATlab" le fameux logiciel d'analyse des
données. Il comporte un module qui traite les méthodes
factorielles et les méthodes de classification. Dans cette
présentation, nous allons voir comment peut-on effectuer le recodage des
variables sur STATlab, quels sont les types de données admissibles par
ce logiciel ? Ensuite nous allons entamer une description des
différentes méthodes de classification offertes par ce logiciel.
VI.1. Recodage des variables sur STATlab
Le changement de codage des variables constitue une
étape déterminante pour la rentabilité d'une quelconque
analyse statistique. Le logiciel STATlab permet d'aboutir à ce but
primordial. En effet, il offre deux options pour le changement de codage :
v Le recodage dans la même variable :
Cette option consiste à changer le code d'une variable que se
soit quantitative ou qualitative en détruisant la variable dite
"source", et en la remplaçant par une nouvelle variable qui contient le
résultat du codage.
v Le recodage dans des variables différentes :
cette option, à l'instar de la première ne
détruit pas la variable "source" et permet de créer une variable
supplémentaire contenant le nouveau codage.
Dans la réalité on confronte, en
général, quatre types de changement de variables :
· Transformation quantitative - quantitative.
· Transformation quantitative - qualitative.
· Transformation qualitative - qualitative.
· Transformation qualitative - quantitative.
Ø La transformation quantitative - quantitative est
très importante dans la mesure où on veut éliminer l'effet
d'unité en centrant et en réduisant les variables
possédant des unités différentes. Cette transformation est
accessible dans le logiciel STATlab en utilisant la commande "recodages par
formules" comme suit : on retranche de la variable sa moyenne et on la
divise par son écart type. La formule de centrage - réduction
est :
X
Ø La transformation quantitative - qualitative : elle
consiste à transformer une variable quantitative continue en une
variable qualitative ayant un nombre limité de modalités. On
découpe la variable continue en r intervalles dont l'intersection est
l'ensemble vide, ensuite pour chaque intervalle on spécifie un code
numérique et un seul. Le logiciel STATlab permet de découper une
variable quantitative continue en utilisant deux commandes :
· Recodages par formules : cette commande est
utilisée lorsqu'on connaît les classes de découpage. Dans
ce cas on indique les bornes de chaque intervalle et le code correspondant.
· Recodages prédéfinis : Dans le cas
où on ne connaîtrait pas un découpage précis,
STATlab offre le choix entre 3 types de recodages :
1- Découpage par minimisation de la variance qui
consiste à chercher des classes dont l'inertie intra-classe est
minimale.
2- Découpage par intervalles égaux : on
considère la valeur maximale (M) et la valeur minimale (m) de la
variable quantitative à découper en k classes. La longueur de
chaque classe est égale à .
3- Découpage par effectifs égaux : Si on veut
éviter d'avoir des classes vides ou à faible effectif alors ce
type de découpage est approprié.
Ø La transformation qualitative - qualitative consiste
à transformer une variable qualitative ordinale8(*) en une variable qualitative
nominale9(*) ou l'inverse.
STATlab permet de mener cette transformation à l'aide de la commande
"Recodges par formules" on changeant les anciens codes par les nouveaux
codes.
Ø La transformation qualitative - quantitative
consiste à transformer une variable qualitative à r
modalités en r variables binaires. Le codage s'effectue de la
manière suivante : Si l'individu adopte la modalité en lui
affecte le code 1 sinon le code 0. STATlab permet facilement d'effectuer cette
opération à l'aide de la commande "recodage disjonctif
complet".
* 8 Une variable qualitative est
dite ordinale si l'ensemble de toutes les modalités est muni d'une
structure d'ordre total ( exemple: très satisfait, satisfait,
moyennement satisfait, pas du tout satisfait)
* 9 Une variable qualitative est
dite nominale si l'ensemble d'arrivée n'est pas muni d'un ordre total (
code géographique, catégorie socioprofessionnelle)
|