Partie 1 : La revue littéraire
Chapitre 1 : Le Big Data et le marketing
1.1 De la donnée à l'information
Aujourd'hui, avec l'informatique et le développement
d'internet, nous disposons d'un nombre incalculable de données. Mais
qu'est-ce qu'une donnée ? Une donnée peut être
constituée de différentes manières, tel que des sons, des
vidéos, des images, des vidéos, des codes-barres etc
...
Elles sont réparties en plusieurs critères :
données structurées, données non structurées,
qualitatives, quantitatives, discrètes ou continues.
Les données non structurées sont des
informations qui n'ont pas de modèle prédéfini, c'est
à dire qu'elles sont compliquées à être
intégrées dans des tableaux ordonnés ou des tableurs. Les
données non structurées représentent dans l'univers des
affaires des dates, des chiffres et des faits. Les fichiers image, audio et
vidéo sont nommés la plupart du temps non structurés. Il
est de ce fait difficile de les analyser du fait d'un manque de structure. Ces
données sont facilement identifiables par les êtres humains.
Les données structurées quant à elles
représentent des informations organisées comme les informations
reprises sur un code barre. Ces informations peuvent paraître
incompréhensibles pour l'oeil humain mais elles sont structurées
et compréhensibles par les ordinateurs. Ces données sont
facilement identifiables pour les ordinateurs et elles peuvent s'organiser sur
la fondation de plusieurs critères : chiffre d'affaires, nombres de
clients ...
Les données peuvent revêtir différentes
caractéristiques :
- Les données qualitatives sont des informations
descriptives.
5
- Les données quantitatives sont quant à elles
des informations numériques et qui se distinguent de deux types :
? Les données discrètes, exemple : «
les données relatives à Bernard Dupont sont qu'il a deux bras et
qu'il est le fils de Gilbert Dupont ». Il s'agit ici de
données que l'on peut compter.
? Les données continues, exemple : « les
données continues sont que Bernard Dupont
pèse 70 kilos et mesure 1m 72 ». Il s'agit
ici de données que l'on peut mesurer.
Les informations engendrées par les systèmes
informatiques sont la plupart du temps produites à la suite d'une
tâche réalisée. Par exemple : « dans votre
supermarché, le caissier scanne les codes-barres de chaque article,
collecte des données sur des codes-barres, qui sont lues par le scanner
laser placé sous la caisse enregistreuse. Ce processus est relié
à un système informatique à distance
récupérant les prix et les descriptions, qui sont renvoyés
vers la caisse enregistreuse pour impression sur le ticket de caisse. Enfin, le
total est calculé et d'autres données, comme celles relatives aux
cartes de fidélité, peuvent à leur tour être
traitées par la caisse enregistreuse pour calculer les réductions
éventuelles »2.
Les données se présentent sous quatre
activités différentes :
- La collecte
- La transmission
- Le stockage
- l'analyse
Dans certains domaines d'activité comme le marketing,
le design et le journalisme le visionnage des données est important. Ce
visionnage des données s'alimente à partir de la croissance et
des possibilités qu'offrent les dispositifs informatiques et graphiques
mais aussi de l'augmentation des sources et de l'ensemble des flux de
données.
2 Will Garside, Brian Cox, « Le stockage Big Data
», Pour les nuls. EMC P7-9
6
D'autre part, il ne faut pas confondre données et
information. « Les données sont des unités
élémentaires d'informations et c'est leur structuration qui
permet la production d'une information faisant sens »3.
Aujourd'hui la moitié des 7 milliards d'habitants du
monde es sur le web. Il y en aura encore plus demain. Cela génère
à l'heure actuelle un volume astronomique de données et va
croitre rapidement à l'avenir. Les informations classiques
conservées sur des médias physiques tels que pellicules de film,
livres, radiographie sont de nos jours transformés en format
numérique et peuvent être utilisées par les ordinateurs via
les réseaux de communications.
Sans arrêt des données sont engendrées,
traitées et stockées, par exemple : « Facebook
intègre plus de 500 téraoctets de nouvelles données chaque
jour »4.
Une énorme quantité de données doit
être stockée pour des recherches antérieures. Par exemple,
des agences de presse qui veulent retrouver des vieux articles et les
rediffuser.
Par ailleurs, certains supports ont besoin d'une analyse plus
développée. Par exemple, des études géologiques,
des images satellites sont présentes en masse sur les réseaux.
Ces données contiennent des informations qui permettent d'aider les
entreprises à rechercher de nouvelles réserves naturelles. On
appelle cela du Big Data car on englobe à la fois le stockage et le
traitement des ensembles de données brutes essentielles pour en tirer
parti.
L'énorme augmentation de la quantité de
données ouvre une nouvelle ère dans la sphère
scientifique, de l'environnement, de l'industrie mais aussi du marketing !
|