Abstract
The biological data processing is an
indispensable tool in medical researches and life sciences. Indeed, the
biological data are various types, and often complex, what led a search of new
exploitation processes because those existing are not any more enough or are
not any more adapted. A new approach : the Extraction of Knowledge from the
biological data is more and more envisaged. From there, our study which
concerns the Biological Data Mining on an experimental ground: an
epidemic.
The present research work is situated within the
framework of Knowledge Discovery from Biological Data, through study
comparative clauses of the existing tools and the proposition of a new approach
for the extraction of the association rules from biological data, there
management and the supply of a system of decision-making
support.
Where from, the problem approached by our study
which is the Data Mining of biological data assisted by a boolean modeling for
the obtained results.
We propose a rather innovative process of extraction
of patterns for generating a profitable and
exploitable association rules at two
levels:
· Profitable, to the specialist of the domain,
in particular through the rules of association which help to interpret better
the data.
· The result of the data mining process is
optimized by a boolean modelling of the extracted association rules. This
improvement is made by the machine BRI (Boolean Rules Rules
Induction).
First of all we shall present a state of the art,
follows a comparative study of the various existing tools and the methods to
benefit from it, and we shall continue to expose our approach and the obtained
results.
Key words: Cellular automaton, Biological data
mining, Rules Induction, Association Rules, Boolean
modelisation
Remerciements
Je remercie les membres du jury qui m'ont fait
l'honneur d'avoir accepté d'évaluer ce travail.
Je remercie vivement Monsieur Bouziane BELDJILALI,
qui m'a bien accueilli et m'a entretenu pour me diriger ensuite vers mon
encadreur. Ainsi que, Monsieur Baghdad ATMANI mon encadreur, pour m'avoir
dirigé pendant tout le long de ce travail, par ses précieux
conseils, ses pertinents commentaires, et ses orientations. De plus m'a fait
profiter de son expérience dans la direction de travaux de
recherche.
Mes remerciements vont aussi :
À Monsieur Abdelhafid HAFFAF, le chef du
département informatique de l'université d'Oran.
À Monsieur Karim BOUAMRANE pour m'avoir
facilité les démarches administratives au département
informatique.
Et Monsieur Smain MAAZOUZI, le chef du
département informatique de l'université du 20 Août 55 de
SKIKDA pour son grand soutien.
TABLE DES MATIERES
Résumé
Liste des figures
Liste des tableaux
Glossaire
Introduction générale 1
Chapitre I. L'Extraction de Connaissances à partir
de Données Biologiques 6
I.1 Définition de l'extraction de connaissances à
partir de données
biologiques 6
I.2 Le processus de l'ECD biologiques 7
I.3 Notre contribution 13
I.4 Etat de l'art de l'ECD biologiques 14
I.5 Les méthodes de fouille de données 20
I.6 Etude comparative 27
I.7 Discussion sur l'ECD Biologiques 30
I.8 Conclusion 31
Chapitre II. Extraction de règles d'association
33
II.1 Les règles d'association 34
II.2 L'induction et l'évaluation des règles 35
II.3 Les algorithmes d'extraction des règles d'association
37
II.4 Conclusion 42
Chapitre III. Modélisation booléenne des
règles d'association 44
III.1 Le moteur d'inférence cellulaire : architecture et
principe de 44
fonctionnement
III.2 La modélisation booléenne 47
III.3 Exemple d'illustration d'induction des règles
booléennes 48
III.4 La dynamique du moteur d'inférence cellulaire 50
III.5 Conclusion 52
Chapitre IV. Conception et expérimentation du
système BIODM 54
IV.1 Etude et choix des données biologiques pour
expérimentation 54
IV.2 Architecture du système BIODM (BIOlogical Data
Mining) 55
IV.3 Le processus de l'ECD biologiques 57
IV.4 Le logiciel réalisé 63
IV.5 L'expérimentation 66
IV.6 Conclusion 70
Conclusion générale 71
Références bibliographiques 73
Annexe B 77
Liste des figures
|