I.4.3 Différence entre les
Systèmes OLTP et le Data Warehouse
Les Data Warehouse et les Systèmes OLTP (On Line
Transaction Processing) répondent à besoins très
différents. Les Data Warehouse conçu pour prendre en charge des
interrogations. La taille du Data Warehouse n'est pas connue à
l'avance. Par conséquent, celui-ci doit être optimisé pour
offrir de bonnes performances dans le cadre d'opérations d'interrogation
très diverses.
Les systèmes OLTP prennent généralement
en charge des opérations prédéfinies. Les applications
peuvent être réglées ou conçues
spécifiquement pour ces opérations. Un Data Warehouse est mise
à jour régulièrement par les processus ETL (Extraction,
Transformation and Loading), un système de chargement de données
en masse soigneusement défini et contrôlé. Il n'est pas
mise à jour directement par les utilisateurs.
Dans les systèmes OLTP, les utilisateurs
exécutent régulièrement des instructions qui modifient les
données de la base. La base de données OLTP est à jour en
permanence et elle reflète l'état actuel de chaque transaction.
Les Data Warehouse utilisent souvent des schémas
dénormalisés ou partiellement dénormalisés (tels
que le schéma en étoile) pour optimiser les performances des
interrogations. A l'inverse, les systèmes OLTP ont souvent recours
à des schémas totalement normalisés pour optimiser les
performances des opérations de mise à jour, d'insertion et de
suppression, et pour garantir la cohérence des données. Il s'agit
là des différences générales, elles ne doivent pas
être considérées comme des distinctions strictes et
absolues.
De manière générale, une interrogation
portant sur un Data Warehouse balaye des milliers voire des millions de lignes.
En revanche, une opération OLTP standard accède à quelque
enregistrement seulement. Le Data Warehouse contient généralement
des données correspondant à plusieurs mois ou années.
Cela permet d'effectuer des analyses historiques. Les systèmes OLTP
contiennent généralement des données quelque semaine ou
mois. Ils conservent uniquement des données historiques
nécessaires à la transaction en cours.
I.5. MODELISATION
DIMENSIONNELLE
|