II.2.2. Domaine problème posé
Tout d'abord, le résultat de la conception d'une base
de données informatisée est d'un premier ordre une description
des données. Compte tenu de la description on entend définir les
propriétés d'ensembles d'objets modélisés dans la
base de données et non pas d'objets particuliers.
Les objets particuliers sont créés par des
programmes d'applications ou des langages de manipulation lors des insertions
et des mises à jour des données. Il faut donc dire, que cette
description des données est réalisée en utilisant un
modèle de données qui du reste est un outil formel utilisé
pour comprendre l'organisation logique des données.
S'agissant de la gestion et l'accès à une base
de données, leurs rapprochements sont assurés par un ensemble de
programmes qui constituent le Système de gestion de base de
données (SGBD). Cela révèle d'un SGBD une
caractéristique par le modèle de description des données
qu'il supporte (hiérarchique, réseau, relationnel, objet).
Ce cadrage rappel que les données sont décrites
sous la forme de ce modèle, grâce à un Langage de
Description des Données (LDD). Cette description est appelée
schéma. D'où, nous consacrons une fois qu'une base de
données spécifiée, on peut y insérer des
données, les récupérer, les modifier et les
détruire. C'est ce qu'on appelle manipuler les données. Ces
données peuvent être manipulées non seulement par un
Langage spécifique de Manipulation des Données (LMD) mais aussi
par des langages de programmation classiques.
Sans prétendre à l'exhaustivité, il
s'agit là d'appréhender la place des bases de données avec
une spécificité importante en informatique, et
généralement dans le domaine de la gestion.
Cette manière de gestion a conduit à une
étude des bases de données qui consacre le développement
de concepts, méthodes et algorithmes spécifiques, notamment pour
gérer les données en mémoire secondaire (i.e. disques
durs).
Il nous faut esquisser ces éléments qui en
effet, dès l'origine de la discipline, les informaticiens ont
observé que la taille de la RAM ne permettait pas de charger l'ensemble
d'une base de données en mémoire. Cette hypothèse est
toujours vérifiée car le volume des données ne cesse de
s'accroître sous la poussée des nouvelles technologies du WEB.
27
géographiquement distribuées à
l'échelle d'Internet, par plusieurs dizaines de milliers d'utilisateurs
dans un contexte d'exploitation changeant (on ne sait pas très bien
maîtriser ou prédire les débits de communication entre
sites) voire sur des noeuds volatiles. En physique des hautes énergies,
on prédit qu'une seule expérience produira de l'ordre du
péta-octets de données par an.
Comme il est peu probable de disposer d'une technologie de
disque permettant de stocker sur un unique disque cette quantité
d'informations, les bases de données se sont orientées vers des
architectures distribuées ce qui permet, par exemple, d'exécuter
potentiellement plusieurs instructions d'entrée/sortie en même
temps sur des disques différents et donc de diviser le temps total
d'exécution par un ordre de grandeur.
|