Introduction générale
Au cours des dernières années, la
bioinformatique [Gibas et Jambeck, 2002] a connu un grand développement
lié à l'aboutissement de nombreux travaux de
séquençage, lesquels ayant conduit à l'arrivée
d'énormes quantités de données biologiques qu'il faut
exploiter pour tirer un maximum de connaissances possibles [Chervitz et al.,
1999], [Tzanis et al., 2005]. Si dans un premier temps, les génomes
séquencés étaient ceux des procaryotes (unicellulaires :
Bactérie, ....), nous arrivons maintenant au stade où des
génomes d'eucaryotes (pluricellulaires : animaux, humains, ...) sont
disponibles. De ce fait, les quantités de données brutes
disponibles sont déjà trop importantes pour pouvoir être
analysées manuellement [Chervitz et al., 1999].
L'outil informatique et par la même les
méthodes informatiques se sont imposées d'elles mêmes en
biologie moléculaire: C'est la naissance de la bioinformatique. Son
développement a été rendu possible par les énormes
progrès réalisés en informatique (capacités de
calcul, stockage, nouveaux algorithmes,...), qui ont permis la constitution de
banques de données pour le stockage de l'intégralité des
données biologiques produites par les
expérimentations.
Dans un autre volet complémentaire, nous avons
l'épidémiologie, qui est basée sur l'utilisation des
méthodes de surveillance et d'analyse des données recueillies
concernant les diagnostics relatifs à des infections. Ces
méthodes classiques ne sont plus satisfaisantes comme elles
l'étaient autrefois, surtout quand il s'agit d'analyser et
détecter précocement une épidémie causée par
une maladie émergente.
Du fait de l'inefficacité de ces
méthodes, de la variété des données biologiques, et
de la nature même des épidémies [Labbe, 2007], une nouvelle
approche, exploitant des données biologiques relatives aux
épidémies, est utilisée afin de mieux comprendre les
maladies qui ont un profil épidémiologique : c'est la fouille de
données biologiques relatives aux épidémies [Remvikos,
2004], [Maumus et al., 2005], [Etienne, 2004].
Cette fouille de données permet d'extraire des
connaissances qui aideront à mieux connaître ou interpréter
les phénomènes biologiques liés à une
épidémie particulière et ainsi permettre la mise en oeuvre
de mesures de prévention et de lutte, par des traitements
appropriés, des vaccinations, des antibiotiques, etc.
Un autre aspect, la disponibilité de vastes
banques de données de santé publique relatives aux
épidémies issues des récents séquençages de
nouveaux agents pathogènes,
|