II. Introduction
générale
Depuis les débuts d'internet jusqu'à 2003,
5 Exaoctets (1 exaoctet (Eo) =
1018 octets = 1 000 Po = 1 000 000 000 000 000 000 octets) de
données ont été générées. Avec la
venue du Web 2.0, la prolifération des réseaux sociaux, ...,
cette quantité de donnée était
générée en 2 jours. Actuellement, il
suffit de 10 minutes pour en produire autant. D'après
les prévisions, d'ici 2020 cette croissance sera supérieure
à 40 Zettaoctets
(1 zettaoctet (Zo) = 1021 octets =
1 000 Eo =
1 000 000 000 000 000 000 000 octets) et le
volume des données produites, diffusées et consommées en
l`espace d`une année, doublera tous les 2 ans.
Face à cette croissance exponentielle du volume de
données, les entreprises sont confrontées à certaines
problématiques qui sont celles de savoir comment collecter, stocker,
analyser et exploiter ces grands volumes de données pour créer de
la valeur ajoutée. Tout l'enjeu, pour les entreprises et les
administrations, consiste à ne pas passer à côté
d'informations précieuses noyées dans la masse. C'est là
qu'intervient la technologie du "Big Data", qui repose sur une
analyse très fine de masses de données.
Aujourd'hui, un fossé se creuse entre le potentiel
d'utilisation des données et l'utilisation actuelle. D'après
certaines sources, 23 % des données existantes
pourraient être valorisées, seulement 0,5% le
sont.
A l'heure où des technologies du Big Data sont en
gestation afin de répondre aux problématiques citées
ci-dessus, il est important pour les ESN qui veulent en tirer profit au moyen
de leur expertise, de faire d'ores et déjà de la veille
technologique. C'est dans ce contexte que ma mission dans le cadre du stage a
consisté à la réalisation d'un travail de Recherche &
Développement et de veille technologique des tendances et concepts
technologiques Big Data.
L'objectif était premièrement de monter en
compétence sur les technologies du Big Data afin de compléter la
documentation détaillée réutilisable à des fins de
présentation pour un client ou de formation interne. Le second objectif
était de réaliser une plateforme de démonstration en
exploitant les connaissances théoriques acquises afin de mettre en
oeuvre un cas d'utilisation du Big Data.
Ce travail permettra à CAPGEMINI de présenter
à ses clients des solutions (mises en oeuvre et expérimentions)
répondant à leurs besoins et donc il a la maîtrise de mise
en oeuvre de bout en bout et l'exploitation.
|