Chapitre IV : Conception et expérimentation du
système BIODM - 55 -
3eme aspect d'étude : les RDs et
MIRUs
La génomique comparative a montré
l'utilité des MIRUs en tant qu'éléments qui renseignent
beaucoup sur les souches bactériologiques, et aussi l'existence des RDs
« Région de Différence », qui sont présentes
chez une souche et absentes chez une autre, ces régions codent pour de
petites protéines qui appartiennent à des familles reconnues par
leurs virulences [Yokoyama et al., 2007]. Dès lors, ces familles de
protéines sont très intéressantes du point de vue
préventif (antigène protecteur) et thérapeutique (cibles
de médicaments). Une confirmation a été faite
récemment que les gènes de ces régions RDs pourraient
être impliqués dans la virulence du Mycobacterium Tuberculosis
[Ferdinand et al., 2004]. Donc, les données sur les RDs et MIRU sont
très intéressantes, néanmoins, elles sont
écartées de notre étude à cause de la
complexité de ces types de données, qu'il faudra étudier
en profondeur, et aussi de la non disponibilité des données
à l'état brut en quantités suffisantes dans les banques de
données biologiques.
IV.2 Architecture du système BIODM ( BIOlogical
Data Mining)
Notre système est composé de deux grands
modules, le premier produit des règles d'association et les transmet au
deuxième module (BRI) pour générer des règles
booléennes.
NCBI
Sélection, Prétraitement
Séquences génomiques
Séquences protéiques
RD MIRU
Transformation Production
Evaluation.
Données structurées
Règles d'assoc- iation
Transformation Production Production de
Règles. Transit- oires
Graphe d'induction
Graphe d'induction
règles cellulaires
Boolean Rules Induction
CELRULE
CELFACT
REGLES
FAITS
Intégration
CASI Knowledge Base
Figure 4.1: Architecture du système
BIODM.
|