V. Les Big Data
V.1
Présentation
Après le très en vogue "cloud computing", un
nouveau concept émerge dans le secteur informatique, celui du "Big
data". A l'origine du concept de "Big data" se trouve l'explosion du volume de
données informatiques, conséquence de la flambée de
l'usage d'Internet, au travers des réseaux sociaux, des appareils
mobiles, des objets connectés, etc.
Selon le CXP, les Big Data désignent des
méthodes et des technologies (pas seulement des outils) pour des
environnements évolutifs (augmentation du volume de données,
augmentation du nombre d'utilisateurs, augmentation de la complexité des
analyses, disponibilité rapide des données) pour
l'intégration, le stockage et l'analyse des données
multi-structurées (structurées, semi structurées et non
structurées).
V.2
Caractéristiques des Big Data
Le Big Data se caractérise par la problématique des
3V :
§ Volume, c'est le poids des
données à collecter. Confrontées à des contraintes
de stockage, les entreprises doivent aussi gérer le tsunami des
réseaux sociaux. La montée en puissance des réseaux
sociaux a accentué cette production de données.
§ Variété, l'origine
variée des sources de données qui sont
générées. premièrement, l'époque où
les entreprises s'appuyaient uniquement sur les informations qu'elles
détenaient dans leurs archives et leurs ordinateurs est révolue.
De plus en plus de données nécessaires à une parfaite
compréhension du marché sont produites par des tiers.
Deuxièmement, les sources se sont multipliées : banques de
données, sites, blogs, réseaux sociaux, terminaux
connectés comme les smartphones, puces RFID, capteurs, caméras...
Les appareils produisant et transmettant des données par l'Internet ou
d'autres réseaux sont partout, y compris dans des boîtiers aux
apparences anodines comme les compteurs électriques.
§ Vélocité, la vitesse
à laquelle les données sont traitées simultanément.
à l'ère d'internet et de l'information quasi instantanée,
les prises de décision doivent être rapides pour que l'entreprise
ne soit pas dépassée par ses concurrents. La
vélocité va du batch au temps réel.
A ces « 3V », les uns rajoutent la
visualisation des données qui permet d'analyser les
tendances ; les autres rajoutent la variabilité
pour exprimer le fait que l'on ne sait pas prévoir l'évolution
des types de données.
V.3 Les Big Data en
chiffres
Après le siècle du pétrole, nous entrons
dans l'ère de la donnée. Les chiffres ci-dessous permettent de
présenter la quantité de données
générées jusqu'ici et la croissance dans les prochaines
années.
« 12 zettaoctets de
données ont été créés dans le monde
en 2011 118 milliards
d'emails sont envoyés chaque
jour 235 téraoctets de
données ont été collectés
par The Library of Congress en avril
2011 30 fois plus de données seront
générées
d'ici 2020 Le télescope "Square
kilometers away" produira plus d'1 téraoctet de
données par minute en
2024 Twitter génère 7
téraoctets de données par
jour Facebook génère 10
téraoctets de données par jour
Facebook traite 50 milliards
de photos 30 milliards de contenus sont
échangés chaque mois sur Facebook »
(Saulem, Définition de Big Data trois V variété,
volume, vélocité - Le big data.htm, 2013)
Nous pouvons bien constater que nous nageons dans un
océan de donnée où le niveau de la mer augmente
rapidement.
|