V.6 Limites des Big
Data
Si le terrain de jeu du Big Data est loin d'être
restreint, il n'est pas sans limites. Elles tiennent, en premier lieu, à
la nature des données et aux traitements envisagés, et lorsqu'il
est question des données personnelles, la vigilance est
nécessaire. Dans certains pays, le traitement des données
à caractère personnel est régi par des dispositions
particulières, ce qui n'est pas le cas dans la majorité des
pays.
Nous sommes arrivés à un point où la
protection des données personnelles, portée à la
défense des libertés fondamentales de l'individu, est en train de
devenir un argument économique. L'enjeu étant dorénavant,
d'élaborer le cadre normatif le plus attractif pour le
développement de l'économie numérique et des
échanges de données, ceci nécessite d'être vigilent
dans un contexte de forte concurrence entre les puissances économiques.
L'autre préoccupation provient de la
sécurité : une faille minuscule peut menacer des quantités
de données considérables. Si les
utilisateurs perdent confiance dans l'utilisation de leurs informations, c'est
donc tout l'édifice du big data qui risque de s'écrouler. Pour
éviter cela, par exemple en Europe, la commission européenne a
présenté, en début 2012, un règlement qui vise
à protéger davantage les utilisateurs. Ce texte devrait
être voté en 2014 pour une application en 2016, il obligera les
entreprises à demander le consentement explicite de l'utilisateur avant
de collecter ses données. (Haas, 2013)
V.7 Paysage
technologique des Big Data
Après la présentation des Big Data, il est aussi
important de voir le paysage technologique qui constitue cette technologie. Les
données quelque soit leur structure passent par plusieurs étapes
avant que leur valeur ne soit perceptible. Ci-dessus, nous avons un
aperçu global de différentes technologies présentes dans
le paysage Big Data.
Figure 3 : Paysage technologique Big Data,
(Bermond, 2013)
Le Big Data repose sur plusieurs technologies, qui sont
utilisées pour exploiter les gigantesques masses de données.
V.7.1 Intégration
Dans le contexte Big Data, l'intégration des
données s'est étendue à des données non
structurées (données des capteurs, journaux Web, réseaux
sociaux, documents). Hadoop utilise le scripting via MapReduce ; Sqoop et
Flume participent également à l'intégration des
donnés non structurées. Ainsi, certains outils
d'intégration comprenant un adaptateur Big Data existe
déjà sur le marché ; c'est le cas de Talend
Enterprise Data Integration - Big Data Edition. Pour intégrer des gros
volumes de données issus de briques fondatrices du système
d'information des entreprises (ERP, CRM, Supply Chain (gestion de la
chaîne logistique)), les ETL, les EAI, les EII sont toujours
utilisés.
|