Memoire Online - Fouille de données biologiques. étude comparative et expérimentation.

En utilisant la base de test, le système BIODM donne des résultats intéressants et montre l'évolution exponentielle du temps d'exécution (voir tableau 4.4). Nous pouvons constater également que l'exécution de l'algorithme Apriori prend une part importante en temps d'exécution du système en totalité, i.e. dans ses phases les plus importantes de l'expérimentation à savoir : la génération des règles d'association par Apriori et la génération des règles booléennes par BRI.

Confiance %	Support %	Nombre de Gènes	Items générés	Nombre de règles	Temps d'exécution Apriori	Temps d'exécution global
10	70	15	41	69	*0.00 s*	*0.00 s*
30	50	15	41	*147701*	*0.86 s*	*2.23 s*
50	30	15	41	*147687*	*0.86 s*	*2.23 s*
70	10	15	41	*835284*	*4.92 s*	*10.26 s*

Tableau 4.4 : Nombre de règles et temps d'exécution d'Apriori sur l'échantillon Figure 4.6.

Nous constatons qu'à titre indicatif pour un ensemble de 147687 règles d'association, le fichier occupe un espace de stockage de 8.65 MO alors que pour les règles cellulaires correspondantes, le fichier est de 6.13 MO.

Nous constatons qu'une représentation cellulaire est plus intéressante du point de vue espace de stockage et que sur un ensemble de règles encore plus conséquent, nous aurons un gain en espace de stockage assez significatif qui se répercutera positivement sur la performance du système, et mentionnons là aussi que ce ne sont que des résultats partiels qu'il faudra consolider avec un échantillon plus important.

Nombre de règles d'association produites	Espace de Stockage (règles d'association)	Espace de stockage (représentation booléenne)
69	*1.78 KO*	*0. 81 KO*
*147701*	*8.65 MO*	*6.11 MO*
*147687*	*8.65 MO*	*6.12 MO*
*835284*	*48.8 MO*	*39.14 MO*

Chapitre IV : Conception et expérimentation du système BIODM - 70 -

IV.6 Conclusion

Nous avons défini un système qui permet à un spécialiste du domaine, en l'occurrence le biologiste, de procéder à la fouille de données dans un contexte biologique. Nous avons pu procéder à des tests selon une configuration machine bien modeste, néanmoins nous signalons qu'un problème de taille auquel nous étions confronté celui des données biologiques ciblés qui ne sont pas toujours disponibles en continue vu le problème d'annotation des génomes qui prend du temps. C'est pour cela que nous avons bien choisi nos échantillons de test et nous avons pu vérifier, combien même avec un échantillonnage réduit, le processus est couteux en temps de traitement.

Enfin, nous pouvons dire que le système prototype que nous venons de réaliser était dans un objectif expérimental. Nous avons proposé une interface simple qui montre les principales manipulations que peut faire un biologiste pour procéder aisément à une fouille de données biologiques.

Fouille de données biologiques. étude comparative et expérimentation.

Chapitre IV : Conception et expérimentation du système BIODM - 69 -

Chapitre IV : Conception et expérimentation du système BIODM - 70 -

IV.6 Conclusion