Fouille de données biologiques. étude comparative et expérimentation.

par Abdelhak MANSOUL
Université Ahmed Ben Bella Oran 1, Algérie - Magister Informatique et Automatique 2010

La solution que nous avons préconisée utilise Apriori couplé avec un post-traitement des règles d'association par une modélisation booléenne. La perspective que nous nous proposons est de tester le système avec d'autres algorithmes, tels qu'AIS et FP-Growth, afin de comparer les résultats du point de vue gain de temps. Ensuite on pourra aussi faire guider le processus de fouille par le spécialiste du domaine en introduisant par exemple ces préférence par un ou plusieurs paramètre qui seront pris en compte lors du processus de fouille, ceci afin de limiter la taille des résultats qui comme nous le savons est très volumineux. L'idée est de faire un processus d'ECD biologiques sous contrainte. Ce volet nous semble prometteur vu les travaux de recherches déjà faits avec ce concept.

Et finalement, nous pensons carrément à adapter la modélisation booléenne à l'algorithme Apriori, et proposer un automate cellulaire pour la fouille de données.

Références bibliographiques

Annexe B - 77 -

Souche du Mycobacterium Tuberculosis



1: Mycobacteriem Tuberculosis '98-R604 INH-RIF-EM' [Broad Institute] Strain for comparative analysis


draft assembly

2: Mycobacterium tuberculosis 02_1987 [Broad Institute] Strain being sequenced for comparative analysis


draft assembly

3: Mycobacteriem Tuberculosis 210 [TIGR] Causative agent of tuberculosis

Size: 4 Mb; Chromosome: 1


in progress

4: Mycobacteriem Tuberculosis 94_M4241A [Broad Institute] Isolate from China


draft assembly

5: Mycobacteriem Tuberculosis C [Broad Institute] Drug-susceptible strain


draft assembly

6: Mycobacteriem Tuberculosis CDC1551 [TIGR]

Causative agent of tuberculosis. Size: 4 Mb; Chromosome: 1



7: Mycobacteriem Tuberculosis EAS054 [Broad Institute] Sequenced for comparative analysis


draft assembly

8: Mycobacteriem Tuberculosis F11 [Broad Institute]

Predominant strain in South African epidemic Size: 4 Mb; Chromosome: 1



9: Mycobacteriem Tuberculosis GM 1503 [Broad Institute] Strain used for comparative genome analysis.


draft assembly

10: Mycobacteriem Tuberculosis H37Ra [Beijing Genomics Institute] An attenuated strain used in mycobacterial virulence research


draft assembly

11: Mycobacteriem Tuberculosis H37Ra [Chinese National HGC, Shanghai/Fudan University, P.R. China, Shanghai/Johns Hopkins University, Department of Molecular Microbiology & Immunology, Bloomberg School of Public Health, USA, Baltimore]

An avirulent strain derived from its virulent parent strain H37 Size: 4 Mb; Chromosome: 1


12: Mycobacteriem Tuberculosis H37Rv [Sanger Institute]

Causative agent of tuberculosis. Size: 4 Mb; Chromosome: 1



13: Mycobacteriem Tuberculosis KZN 1435 [Broad Institute] Multidrug-resistant clinical isolate


draft assembly

14: Mycobacteriem Tuberculosis KZN 4207 [Broad Institute] Drug-susceptible clinical isolate


draft assembly

15: Mycobacteriem Tuberculosis KZN 605 [Broad Institute] Extensively drug-resistant clinical isolate


draft assembly

16: Mycobacteriem Tuberculosis T17 [Broad Institute] Strain will be sequenced for comparative genome analysis


draft assembly

17: Mycobacteriem Tuberculosis T85 [Broad Institute] Susceptible strain


draft assembly

18: Mycobacteriem Tuberculosis T92 [Broad Institute] Clinical isolate


draft assembly

19: Mycobacteriem Tuberculosis str. Haarlem [Broad Institute] A drug resistant strain found in crowded human populations


draft assembly


Tableau 0.1 : Les différentes souches du Mycobacterium Tuberculosis. [Source NCBI]1.

(*) Draft assembly = Projet(Contingent) d'assemblage


Annexe B - 78 -





Date création

Date maj

Mt CDC1551




Oct 2 2001

Jul 18 2008

Mt F11




Jun 14 2007

Jul 25 2008

Mt H37Ra




Jun 6 2007

Jul 9 2008

Mt H37Rv




Sep 7 2001

Jul 18 2008

Tableau 0.2 : Tableaux informatif sur ls caractéristiques des souches du Mycobacterium
Tuberculosis complètement annotées. [Source NCBI]3.


Souches en cours d'annotation


Mt 10403-1



Mt 6404-1B


Mt 10403-10



Mt 6404-3B


Mt 10403-11



Mt 6404-A1


Mt 10403-4



Mt 7404-1


Mt 10403-7



Mt 7604-2


Mt 10403-8



Mt 7604-4


Mt 11105-2



Mt 7904-1


Mt 11105-3



Mt 7904-2


Mt 15304-1B



Mt 8104-1C


Mt 15304-3A



Mt 8104-2A


Mt 210



Mt subsp. tuberculosis

Tableau 1.3 : Les souches du Mycobacterium Tuberculosis en cours d'annotation.

[Source NCBI]

2 nt :nucléotide.


