WOW !! MUCH LOVE ! SO WORLD PEACE !
Fond bitcoin pour l'amélioration du site: 1memzGeKS7CB3ECNkzSn2qHwxU6NZoJ8o
  Dogecoin (tips/pourboires): DCLoo9Dd4qECqpMLurdgGnaoqbftj16Nvp


Home | Publier un mémoire | Une page au hasard

 > 

Administration d'un big data sous mongodb et extraction de connaissance par réseau de neurones.


par Destin CUBAKA BENI
Université Pédagogique Nationale (UPN) - Licence 2019
  

précédent sommaire suivant

Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy

I.11.2. Bases de données orientées-colonne

Elles s'adaptent mieux au stockage des listes (messages, postes, commentaires, ...).

Figure 1.7:Illustration d'une donnée orientées-colonne.

Quelques SGBD orientées-colonnes :

· HBase : Utilise un API Java. Adopte un design CA. Présence de quelques SPOF.

· Cassandra : Beaucoup d'API disponibles. Adopte un design AP avec consistance éventuelle. Aucun SPOF car réplication master/master. Moins performant que HBase sur les insertions de données.

I.11.3. Bases de données orientées-graphe

12(*)Elles gèrent les relations multiples entre objets (comme des relations dans un réseau social). Les bases de données orientées-graphe sont celles qui stockent les enregistrements dans les noeuds et les relations entre les enregistrements par les arêtes. Elles sont modélisées à l'aide de la théorie des graphes.

C'est ainsi, une base de données orientées-graphe stocke les informations d'une manière très optimisée sous forme de graphe. Les liens entre différentes informations sont aussi faits de manière optimisée.

Ce type de base de données est très performant surtout dans des domaines où les données sont très nombreuses.

Figure 1.8: Illustration d'une base de données orientées-graphe. [KAMINGU Gradi L, Mémoire 2014].

Quelques SGBD orientées-graphe :

· Neo4J : Développé en Java. Supporte beaucoup de langages. Réplication master/slave. Propriétés ACID possibles. Langage de requêtes personnalisé «Cypher».

· Titan : Haute disponibilité avec réplication master/master. Prise en compte d'ACID avec consistance éventuelle. Intégration native avec le frameworkTinkerPop.

I.11.4. Bases de données orientées-clé-valeur

Les bases de données orientées-clé-valeur permettent de stocker une valeur, cette valeur peut être de tout type (entier, chaine de caractères, flux binaire, etc.). En revanche les requêtes ne portent que sur la clé associée à cette valeur. Ce système de base de données est conçu pour être très fortement répliqué de manière à augmenter la disponibilité et les performances. La réplication de données est plus ou moins partielle pour trouver un bon compromis entre nombre de serveurs, disponibilité et espace disque.

Elles permettent d'accéder rapidement aux informations pour la gestion des caches.

Clé

251657216

Clé2018

Valeur 2019

Valeur2018

Valeur 2017

Clé2019

Clé2017

251655168

Clé...

Figure 1.9:Illustration d'une base de données orientées-clé-valeur [Outil de modélisation Win'Design].

Quelques SGBD orientées-clé-valeur :

· DynamoDB : Solution d'Amazon à l'origine de ce type de base. Design de type AP selon le théorème de CAP mais peut aussi fournir une consistance éventuelle.

· Voldemort : Implémentation open-source de Dynamo. Il y a possibilité d'en faire une base embarquée.

Voici quelques sociétés qui utilisent les bases des données NoSQL et leur type de technologie :

Tableau 1.1: Les sociétés utilisant la technologie de NoSQL.[ Enjeux et usages du Big Data technologies, méthodes et mise en oeuvre]

Société

Technologie

Développée

Type de Technologie

 
 

Système de base de données propriétaire reposant sur GFS (Google File System).

Technologie non open source, mais qui a inspiré HBase qui est open source.

 

Plate-forme de développement pour traitements distribués.

 
 

Plate-forme Java destinée aux applications distribuées et à la gestion intensive des données. Issue à l'origine de Google Big Table, MapReduce et Google File System.

 
 

Plate-forme de développement dédiée aux applications de traitement continu des flux de données.

 
 

Base de donnée de type NoSQL et distribuée.

 

Logiciel d'analyse de données utilisant Hadoop.

 
 

Plate-forme de traitement de données massives.

 

Base de données distribuées de type graphe.

 
 

Système distribué de gestion de messages

 

Base de données temps réel distribuée et semi structurée.

 

Base de données distribuée destinée aux très grosses volumétries.


* 12KAMINGU Gradi L., 2014 Op cit.

précédent sommaire suivant






Bitcoin is a swarm of cyber hornets serving the goddess of wisdom, feeding on the fire of truth, exponentially growing ever smarter, faster, and stronger behind a wall of encrypted energy








"Des chercheurs qui cherchent on en trouve, des chercheurs qui trouvent, on en cherche !"   Charles de Gaulle