2.2 Évolution des modèles de bases de
données
2.2.1 Les systèmes de gestion de fichiers
A l'origine, les informations étaient stockées
dans des fichiers directement sur les disques durs des ordinateurs.
L'accès ainsi que la manipulation se faisaient par
l'intermédiaire des SGF. Dans l'approche gestion de fichiers, ceux-ci
sont définis pour un ou plusieurs programmes de traitement. Les
données d'un fichier sont directement associées à un
programme (Basic, Cobol, DBase par exemple) par une description contenue dans
le programme de traitement lui-même. Il n'existe aucune
indépendance entre le programme et les données. Toute
modification de la structure des données nécessite la
réécriture du programme. La première difficulté
inhérente à cette approche est naturellement la lourdeur des
fichiers et la redondance de l'information qui y est contenue. Ajouté
à cela, l'approche SGF ne facilitait pas la manipulation (ajout,
suppression et mise à jour) de l'information contenue dans les fichiers.
Les requêtes simples (recherche de l'éditeur d'un article
donné par exemple) pouvaient être mises en oeuvre, cependant il
était impossible d'effectuer les requêtes faisant intervenir
plusieurs clés (comme la recherche de tous les articles d'un
éditeur donné). Face à ces lacunes, les acteurs du monde
informatique à l'époque vont penser à mettre en place des
systèmes de stockage d'informations beaucoup plus flexibles des avec des
liens entre les enregistrements. Ce fut la naissance des modèles
hiérarchiques et des modèles en réseau qui constituent la
deuxième génération de modèles de
données.
Brice Baem BAGOA, Elève Ingénieur des
Travaux Statistiques Page 16
2.2. Évolution des modèles de bases de
données
2.2.2 Des modèles hiérarchiques aux
modèles en réseau
Les modèles hiérarchiques font leur apparition
dans les années 1965. Ils sont basés sur une architecture
où certaines entités sont indépendantes (les racines), les
autres étant dépendantes des premières (les feuilles).
Dans ce type de structure, les données sont organisées sous la
forme d'arbres qu'on parcourt de la racine vers les feuilles. Chaque
enregistrement est composé donc récursivement d'autres
enregistrements et l'accès à l'information est conditionné
par la connaissance de son chemin d'accès. La compagnie
américaine IBM, précurseur de ces modèles a conçu
un SGBD nommé IMS (Information Management System) basé sur les
modèles hiérarchiques. Ce dernier développé dans le
cadre du projet Apollo 11 2 est encore utilisé de nos jours
dans la gestion de très grosses bases de données à haute
performances et à haute fiabilité, notamment dans le secteur
bancaire. Malgré sa popularité d'antan, IMS est de moins en moins
utilisé à cause de de son manque de flexibilité, sa
lourdeur et sa complexité. Les modèles hiérarchiques
seront ainsi progressivement délaissés au profit des
modèles en réseau.
Contrairement aux modèles hiérarchiques, les
modèles en réseau sont constitués d'entités
reliées les unes aux autres par un réseau de relations binaires.
Ils ont été développés par le groupe CODASYL DGTG
3 . Ici, les données sont organisées en
enregistrements dont les types sont bien définis. Les SGBD CODASYL
étaient dotés de compilateurs DDL (Data Description Language) et
DML (Data Management Language) permettant respectivement la définition
des schémas et la mise à jour des données via un langage
spécialisé. Ces SGBD ont largement été
utilisés pour la gestion d'applications batch et OLTP. Leur
simplicité d'usage - par rapport à leurs concurrents des
modèles hiérarchiques - ainsi que le langage très intuitif
leur ont valu une grande popularité dans le développement
d'applications complexes. Cependant les systèmes CODASYL souffrent d'un
manque de flexibilité pour ce qui est de l'évolution des
schémas ainsi que de l'absence d'un langage prédictif natif tel
que le SQL. En effet, Les langages proposés par les SGBD CODASYL
étaient tels que toute nouvelle requête devrait se traduire par un
nouveau programme. Ces aspects vont pousser leurs utilisateurs à les
remplacer par des SGBD relationnels.
|