Chapitre IV : Conception et expérimentation du
système BIODM - 60 -
d'extraction de motifs fréquents ou de
construction de modèles permettent de découvrir des
propriétés sur les données. Néanmoins, ces
propriétés ne peuvent être considérées comme
de nouvelles connaissances tant qu'elles n'ont pas été
interprétées et validées par un expert du domaine. Ces
propriétés découvertes par les algorithmes peuvent
être non intéressantes, incomplètes voir même
provenir d'erreurs dans les données, mais seul le spécialiste du
domaine saura les interpréter. Les traitements de cette étape
sont décrits par le pseudo code suivant :
Algorithme : Production des règles
d'association Début
Entrée : table des gènes
(T_gene)
Sortie : fichier des règles d'association
(fichier_RA)
fichier_RA = Apriori (T_gene)
Fermer_fichier(fichier_RA ) Fermer_table(T_gene)
Fin
4eme étape : Transformation des règles
d'association
Les règles trouvées sont
transformées par élagage de toutes les informations inutiles puis
représentées selon un formalisme transitoire aidant par la suite
à la production d'un graphe d'induction, nécessaire au passage
à une modélisation par le principe booléen. Une
règle d'association Ri se verra traduite en une règle
transitoire Rti selon le schéma suivant :
( Ri , Antécédenti , Conséquenti
, support , confiance)
Rti , { Prémissei (
Antécédenti ) } , { Conclusioni ( Conséquenti )
}
Les traitements de cette étape sont décrits
par le pseudo code suivant :
Algorithme : Transformation_RA
Début
Entrée : fichier des règles d'association (
fichier_RA )
Sortie : fichier des règles transitoires (
fichier_RT )
chaine ligne_courante
Lire (fichier_RA)
Tant que (NFF fichier_RA)
faire
Num_regle= extraire_num_regle(ligne_courante)
Prémisse= extraire_antecedent(ligne_courante) Conclusion=
extraire_conclusion(ligne_courante) ecrire_fichier(Fichier_RT, Num_regle,
Prémisse, Conclusion)
Fin Tant que
Fermer_fichier(fichier_RA) Fermer_fichier(fichier_RT)
Fin
Chapitre IV : Conception et expérimentation du
système BIODM - 61 -
5eme étape : Production du graphe
d'induction
Les règles transitoires vont aider à
construire un graphe d'induction par un traitement approprié selon le
principe suivant : un sommet désigne un noeud sur lequel on fait un
test, avec les résultats possibles binaires ou multivalués.
L'algorithme suivant en pseudo code illustre la production de ce graphe. Les
traitements de cette étape sont décrits par le pseudo code
suivant :
Algorithme : Création_Graphe
Début
Entrée : fichier des règles transitoire
(Fichier_RT)
Sortie : fichier du graphe (Fichier_Graphe)
Chaine sommet1, sommet2
Fichier intermédiaire ( Fichier_inter)
Lire (fichier_RT)
Tant que (NFF Fichier_RT)
faire
P=Extraire_ prémisse (ligne_courante)
C=Extraire_conclusion (ligne_courante)
ecrire_fichier (fichier_inter, P, " ", C, "
")
Fin tantque
Initialiser_graphe (Fichier_Graphe)
Lire (fichier_inter)
Tant que (NFF fichier_inter)
faire
Sommet1=Calculer_noeud_depart (P)
Sommet2=Calculer_noeud_arrivée (C)
ecrire_noeud_graphe (sommet1, sommet2)
Fin tantque
Effacer (Fichier_inter)
Fermer (Fichier_RT)
Fermer (Fichier_Graphe)
Fin
6eme étape : Production des règles
cellulaires
(1) Génération des règles
cellulaires
A partir du graphe d'induction, on produira les
règles cellulaires sous la forme :
Rck : Si { Prémissek } Alors { Conclusionk ,
Sommetk }
où Prémissek et Conclusionk
sont composées des Items de la règle d'association, et
Sommetk
le noeud du graphe d'où est produite la
règle cellulaire.
(2) Représentation cellulaire
Les règles générées
auparavant (étape 6.1) sont représentées en couches
cellulaires. Les Items des Prémissek , des Conclusionk
et les Sommetk vont constituer les faits (CELFAIT) et les Rck
vont constituer les règles (CELREGLE).
Schématiquement nous aurons :
{ Rck } CELREGLE et { Prémissek , Conclusionk,
, Sommetk } CELFAIT
|