V.8.2.5 Sqoop
Sqoop est une brique pour l'intégration des
données. Il permet le transfert des données entre un cluster et
une base de données relationnelles.
V.8.2.6 Flume
Flume permet la collecte et l'agrégation des fichiers
logs, destinés à être stockés et traités par
Hadoop. Il s'interface directement avec HDFS au moyen d'une API native.
V.8.2.7 Oozie
Oozie est utilisé pour gérer et coordonner les
tâches de traitement de données à destination de Hadoop. Il
supporte des jobs Mapreduce, Pig, Hive, Sqoop, etc.
V.8.2.8
Zookeeper
Zookeeper est une solution de gestion de cluster Hadoop. Il
permet de coordonner les tâches des services d'un cluster Hadoop. Il
fournit au composants Hadoop les fonctionnalités de distribution.
V.8.2.9 Ambari
Ambari est une solution de supervision et d'administration de
clusters Hadoop. Il propose un tableau de bord qui permet de visualiser
rapidement l'état d'un cluster. Ambari inclut un système de
gestion de configuration permettant de déployer des services d'Hadoop ou
de son écosystème sur des clusters de machines. Il ne se limite
pas à Hadoop mais permet de gérer également tous les
outils de l'écosystème.
V.8.2.10 Mahout
Mahout est un projet de la fondation
Apache visant à créer des implémentations
d'algorithmes d'apprentissage automatique et de datamining.
V.8.2.11 Avro
Avro est un format utilisé pour la sérialisation
des données.
Le caractère open source de Hadoop a permis à
des entreprises de développer leur propre distribution en ajoutant des
spécificités.
|