Conclusion générale
Nous avons abordé dans ce mémoire une nouvelle
problématique qui consiste à fouiller des données
biologiques avec post-traitement des règles extraites pour optimiser le
stockage et la gestion. L'objectif que nous nous sommes fixé
était de proposer une solution appuyée par des travaux
antérieurs de modélisation booléenne selon le principe
cellulaire de la machine CASI.
Nous nous sommes basés sur une fouille à l'aide
de l'algorithme Apriori qui fonctionne par itération, i.e., l'extraction
des k-itemsets fréquents à partir des k-1 Itemsets
fréquents. Alors, n itérations sont faites pour extraire la
totalité des itemsets fréquents, avec n-1 la taille du plus long
itemset fréquent. A chaque itération, un ensemble d'items
candidats est généré à partir des itemsets
fréquents du niveau précédent.
Ceci dit, l'objectif de ce mémoire était aussi
de présenter l'état de l'art de notre thème de recherche,
de faire une étude comparative afin de soulever la problématique
de la représentation des données biologiques qui ne sont en fait
dans une structure de donnée standard, connue et théorisée
en informatique. Nous avons alors consacré le premier chapitre pour
l'ECD biologiques qui travaille sur un nouveau type de donnés si l'on
peut dire « non usuel » et nous avons visé
particulièrement des données se rapportant à une
épidémie qui est la tuberculose afin de tester
ultérieurement en réel, ce qui nous à fait faire une
prospection de ces données et tirer des constatations utiles pour la
suite de notre étude surtout pour les étapes nettoyage et
prétraitement de l'ECD.
Ensuite, nous avons fait une étude comparative et avons
abordé l'extraction des règles d'association, et leur
optimisation par le module BRI qui constitue le support de notre solution pour
le post-traitement en fouille de données.
Notre étude se voulait être assez novatrice, dans
la mesure où nous avons été incités à
utiliser des techniques prouvées de la machine cellulaire CASI,
combinées à une fouille de données. De ce fait, deux
objectifs nous ont guidés dans la proposition d'un automate cellulaire
pour l'optimisation, la génération, la représentation et
la gestion d'une base de règles d'association. En effet, le premier
c'est d'avoir une base de règles optimisée et des temps de
traitements assez réduits grâce aux principes de
représentation booléenne, et le deuxième c'est d'apporter
une contribution à la construction des systèmes à base de
connaissances en adoptant une nouvelle technique
Conclusion générale - 72 -
cellulaire.
|