1.2.1.3 Les grilles de données
Dans les grilles de données les ressources de stockage
et les échanges de données sont essentielles pour
l'efficacité de l'exécution des applications
[4].
Certaines applications, comme la physique des particules,
peuvent générer de larges ensembles de données pouvant
atteindre plusieurs téraoctets voir des pétaoctets. Ainsi il est
impossible de les stocker sur une seule et même machine, d'où la
nécessité de créer des espaces de stockage très
larges en mettant en commun les espaces de stockage de différentes
machines.
Une grille de données ne permet pas seulement de
fragmenter des fichiers et de les stocker dans plusieurs machines. Elle doit
également offrir des mécanismes de recherche, d'indexation,
d'intégrité et de sécurité pour assurer un
accès fiable et permanent aux données. Il faut aussi que la
répartition des données soit transparente pour l'utilisateur
final. En effet, il est impossible de savoir avec exactitude l'endroit
où chaque donnée est stockée. Par exemple un fichier peut
être découpé en plusieurs morceaux et réparti sur
plusieurs machines.
Pour une garantir meilleure disponibilité des
fichiers, il est possible de les répliquer sur plusieurs entités
du réseau. Il faudra alors avoir un mécanisme qui puisse à
la fois répartir la charge sur chaque serveur et garantir la
cohérence des différentes répliques d'un même
fichier.
Pour répondre à ces différentes
problématiques, un certain nombre de projets ont été
lancés à travers le monde. A titre d'exemple, nous pouvons citer
le projet DataGrid [18] qui est utilisé par le CERN,
l'agence spatiale européenne et le CNRS.
|