Chapitre IV : Conception et expérimentation du
système BIODM - 69 -
Temps de traitement.
En utilisant la base de test, le système BIODM
donne des résultats intéressants et montre l'évolution
exponentielle du temps d'exécution (voir tableau 4.4). Nous
pouvons constater également que l'exécution de l'algorithme
Apriori prend une part importante en temps d'exécution du système
en totalité, i.e. dans ses phases les plus importantes de
l'expérimentation à savoir : la génération des
règles d'association par Apriori et la génération des
règles booléennes par BRI.
Confiance %
|
Support %
|
Nombre de Gènes
|
Items générés
|
Nombre de règles
|
Temps d'exécution Apriori
|
Temps d'exécution global
|
10
|
70
|
15
|
41
|
69
|
0.00 s
|
0.00 s
|
30
|
50
|
15
|
41
|
147701
|
0.86 s
|
2.23 s
|
50
|
30
|
15
|
41
|
147687
|
0.86 s
|
2.23 s
|
70
|
10
|
15
|
41
|
835284
|
4.92 s
|
10.26 s
|
Tableau 4.4 : Nombre de règles et temps
d'exécution d'Apriori sur l'échantillon Figure
4.6.
Espace de stockage.
Nous constatons qu'à titre indicatif pour un
ensemble de 147687 règles d'association, le fichier occupe un espace de
stockage de 8.65 MO alors que pour les règles cellulaires
correspondantes, le fichier est de 6.13 MO.
Nous constatons qu'une représentation
cellulaire est plus intéressante du point de vue espace de stockage et
que sur un ensemble de règles encore plus conséquent, nous aurons
un gain en espace de stockage assez significatif qui se répercutera
positivement sur la performance du système, et mentionnons là
aussi que ce ne sont que des résultats partiels qu'il faudra consolider
avec un échantillon plus important.
Nombre de règles d'association
produites
|
Espace de Stockage (règles
d'association)
|
Espace de stockage
(représentation booléenne)
|
69
|
1.78 KO
|
0. 81 KO
|
147701
|
8.65 MO
|
6.11 MO
|
147687
|
8.65 MO
|
6.12 MO
|
835284
|
48.8 MO
|
39.14 MO
|
Tableau 4.5 : Evolution de l'espace de
stockage.
Chapitre IV : Conception et expérimentation du
système BIODM - 70 -
IV.6 Conclusion
Nous avons défini un système qui permet
à un spécialiste du domaine, en l'occurrence le biologiste, de
procéder à la fouille de données dans un contexte
biologique. Nous avons pu procéder à des tests selon une
configuration machine bien modeste, néanmoins nous signalons qu'un
problème de taille auquel nous étions confronté celui des
données biologiques ciblés qui ne sont pas toujours disponibles
en continue vu le problème d'annotation des génomes qui prend du
temps. C'est pour cela que nous avons bien choisi nos échantillons de
test et nous avons pu vérifier, combien même avec un
échantillonnage réduit, le processus est couteux en temps de
traitement.
Enfin, nous pouvons dire que le système
prototype que nous venons de réaliser était dans un objectif
expérimental. Nous avons proposé une interface simple qui montre
les principales manipulations que peut faire un biologiste pour procéder
aisément à une fouille de données biologiques.
Conclusion générale - 71 -
|