e. La haute
performance par la réplication
Bien que l'objectif principal de la réplication soit la
haute disponibilité, la haute performance peutêtre
réalisée en exploitant l'architecture distribuée du
système. Les requêtes des utilisateurs peuventpotentiellement
s'exécuter en parallèle, du fait que les données sont
dupliquées sur plusieurs sites. Les travaux menés dans ce sens
ont essayé de transposer les techniques de parallélisme,
employéesdans les bases de données fragmentées vers les
bases de données répliquées. Le parallélisme
inter-requêtes est la première issue explorée. En effet, la
réplication favorise naturellement ce type du parallélisme. Les
requêtes des usagers sont lancées simultanément sur des
sites distincts, aucuneforme de communication n'est requise, du moment
où la totalité de la base de données est
répliquée sur chaque site. Certes, le parallélisme
inter-requête améliore le débit du système en
servant plus de clients par unité de temps, mais le temps
d'exécution des requêtes individuelles reste intact, les
systèmes recevant des requêtes complexes ne peuvent pas tirer
profit de ce genre du parallélisme.Pour remédier à
ça, le parallélisme intra-requête est introduit.
Typiquement, le parallélisme inter-requête est
implémenté à l'aide d'une couche logicielle sous forme
d'un middleware, qui constitue le seul point d'accès au système
de réplication. Le middleware intercepte les requêtes soumises, et
les transformes en un ensemble de sous-requêtes, qui seront
exécutées parallèlement sur les différents sites,
les résultats locaux seront consolidés pour former le
résultat final.
|