2.2.5 Les défis contemporains: le business
intelligence et le Big Data
Aujourd'hui, les capacités de stockage sont quasi sans
limite et le volume de données produit chaque jour dans les
systèmes d'informations ne cesse de croître. En effet, selon IBM,
la quantité de données produite dans le monde tous les deux jours
est équivalente à celle qui a été
générée depuis le début de l'histoire jusqu'en
2003. Un autre fait marquant est qu'en 2012, 90% de toute la quantité de
données existante depuis l'avènement de l'histoire avait
été créée durant les deux années
précédentes. Les enjeux contemporains consistent donc à
tirer parti de cet immense stock d'informations pour fournir les indicateurs
pertinents à la prise une prise de décision fiable. Cependant,
face à cette vague importante d'informations, les modèles de
données classiques restent impuissants. De nouvelles technologies
viennent donc pallier ces insuffisances.
Le Business Intelligence encore appelé Informatique
Décisionnelle est définie comme l'ensemble des moyens permettant
de collecter, consolider modéliser et restituer les données
issues de sources
5. Object Definition Language
6. Object Manipulation Language
7. Object Query Language
Brice Baem BAGOA, Elève Ingénieur des
Travaux Statistiques Page 19
2.3. Les méthodes d'analyse
variées au sein d'une même organisation en vue
d'offrir une aide à la décision. Ces informations sont
stockées sous forme agrégées dans une base de
données appelé entrepôt de donnes ou datawa-rehouse. Bill
IMNON, père de l'informatique décisionnelle définit un
entrepôt de données comme « une collection de données
thématiques, intégrées, non volatiles et
historisées pour la prise de décisions ». Ces bases de
données sont constituées de tables principales (les tables de
faits) reliées à des tables secondaires qui sont les dimensions
d'analyse. Les tables de faits peuvent prendre la forme de cubes (OLAP, ROLAP,
MOLAP) suivant les besoins et la réalité des organisations. Les
entrepôts de données sont généralement basés
sur le modèle relationnel.
Plus évoluée que le BI, le Big Data est un
ensemble de technologies permettant de traiter des informations non
structurées possédant les caractéristiques décrites
sous l'acronyme 3V. Il s'agit du volume très important de ces
données, de leur variété et de leur
vélocité. Cette dernière représente la
fréquence à laquelle les données sont
générées, capturées et partagées. Les bases
de données relationnelles classiques ne permettent pas de gérer
les volumes de données du Big Data. De nouveaux modèles de
représentation permettent de garantir les performances sur les
volumétries en jeu. Ces technologies, dites de Business Analytics and
Optimization (BAO) sont proposés les principaux acteurs de ce
marché que sont IBM, Google, Microsoft etc. Avec ce système les
requêtes sont séparées puis exécutées en
parallèles. Les résultats sont ensuite rassemblés et
récupérés. Ces volumes sont stockés dans le cloud
et sur des supercalculateurs. Bien que son avènement soit assez
récent et que les recherches sur le sujet continuent de nos jours, le
Big Data trouve déjà son application dans plusieurs domaines tels
que la recherche scientifique, la politique et surtout le secteur
privé.
|