Administration d'un big data sous mongodb et extraction de connaissance par réseau de neurones.par Destin CUBAKA BENI Université Pédagogique Nationale (UPN) - Licence 2019 |
I.2. APERÇU HISTORIQUELe Big Data a une histoire récente et en partie cachée, en tant qu'outil des technologies de l'information et en tant qu'espace virtuel d'importance croissante dans le cyberespace. SH. Lazare et F. Barthélemy (www.axiodis.com), dans leur document intitulé « Introduction aux Big Data », présentent l'historique suivant, représenté graphiquement de la manière suivante : Figure 1.1:Graphique historique du Big Data [developpez.com-big data-evolution]
Selon le document « Big-Data et Data-Marketing », le terme « Big Data » est apparu pour la première fois en 2000 lors d'un congrès d'économétrie, puis a repris en 2008 et 2010 sous la couverture de revues Nature et Sciences, et s'est établi dans les entreprises suite à un rapport de MC Kinsey en 2011. Le répertoire de référence pour les utilisateurs intitulé « GUIDE DU BIG DATA 2013-2014 » indique que le Big Data est apparu il y a seulement trois ans dans le domaine de la prise de décision et se positionne comme l'innovation numéro un de la première décennie et à la frontière entre technologie et management. Selon V. Tréguier (2014) et selon la « très courte histoire du Big Data » publiée par Gil Press en 2013 pour la période 1944-2012, sa naissance est liée à l'évolution des systèmes de stockage, de fouille et d'analyse de l'information numérisée, qui ont permis une sorte de big bang d'informations stockées, puis une croissance inflationniste dans le monde des données numérisées. Mais ses prémisses se situent au confluent de la cybernétique et des courants de pensée nés pendant la Seconde Guerre mondiale, selon lesquels l'homme et le monde peuvent être représentés comme des « ensembles d'informations, dont la seule différence avec la machine est leur niveau de complexité. La vie deviendrait alors une séquence de 0 et de 1, « programmable et prévisible » », ajoute V. Tréguier. Les risques d'abus par des gouvernements ou des entreprises ont été décrits pour la première fois par Orwell à la fin de la dernière guerre mondiale, et souvent par la science-fiction. Avec l'apparition de grandes banques de données dans les années 1970 (et tout au long de la guerre froide), de nombreux auteurs s'inquiètent des risques d'atteinte à la vie privée, notamment le professeur A. Miller, qui cite l'exemple de la croissance des données stockées relatives à la santé physique et mentale des individus. I.3. PRESENTATION DE L'ASPECTS BIG DATA2(*)Au-delà des aspects purement quantitatifs, ces données sont présentées de telle manière qu'elles ne sont guère supportées par les SGBD traditionnels : v Elles ne sont pas nécessairement organisées en tables et leurs structures peuvent varier ; v Elles sont produites en temps rée l ; v Elles arrivent mondialement en flots continus ; v Elles sont méta taguée s mais de façon disparate (localisation, heure, jour, etc.) ; v Elles proviennent de sources très disparates (téléphone mobile, capteurs, téléviseurs connectés, tablettes, PC fixes, PC portables, objets, machines), de façon désordonnée et non prédictible. Depuis quelque temps, le mot Big Data est apparu et est largement utilisé par les journalistes, les analystes, les consultants et certains éditeurs ou fabricants occidentaux qu'orientaux intéressés par le monde de la prise de décision. Mais il est clair qu'aucune définition n'a été imposée et que les mots des uns et des autres mélangent avec bonheur beaucoup de choses, le volume global de données à traiter, le volume de la base de données (web log, texte, photo, vidéo, etc.), types de données (structuré, non structuré, multi-structuré), ambitions analytiques (aller au-delà de la BI), etc. Il est difficile de dire si le mot Big Data est adapté et durera (continuera à l'être), mais il est certain que le domaine de la prise de décision connaît un développement important lié à l'émergence simultanée de « nouvelles demandes » et de « nouvelles solutions technologiques » aboutissant au traitement de plus en plus de données, à la fois en termes de volumes et de variétés. La quantité de données générées quotidiennement dans les systèmes d'information augmente de manière exponentielle et, par conséquent, la volumétrie explose aussi dans le monde de la prise de décision. Le traitement du Big Data n'entraîne pas une révolution dans le monde de la prise de décision mais élargit le champ de travail des experts de ce domaine, conduit à modifier les infrastructures en place pour répondre aux nouvelles exigences de volume, de variété et de vitesse données, pour changer la façon dont les données sont préparées pour une analyse avancée, et comme souvent lorsque le marché aborde un nouveau sujet, les solutions occupent une place centrale, même si elles ne sont pas une panacée (remèdes, solutions, moyens) universelles. Le Big Data permet sans aucun doute de mieux connaître les clients3(*), par exemple en traitant automatiquement ce qu'ils disent, pour mieux les servir via des solutions de commerce électronique et de Cloud Computing, qui sont à la fois de plus en plus sophistiquées et de plus en plus facile à mettre en place. Mais au finish, le Big Data n'est qu'une extension de ce qui a été fait pendant des années et présente les mêmes avantages, inconvénients ou risques: information, propagande, désinformation et mystification. * 2 http://en.wikipedia.org/wiki/Big Data/aspect * 3Ceci d'autant plus que les Big data impliquent de nouvelles formes de raisonnements, qui embrassent notamment les formes de raisonnements inductifs. On peut sans grand risque parler des Big data comme d'une nouvelle philosophie et une nouvelle façon de penser le marketing. |
|