La Business Intelligence (BI) ou l’Informatique Décisionnelle permet à tous les acteurs d’une entreprise d’avoir une vision globale sur leurs activités pour les aider dans leurs prises de décisions.
Grâce aux outils de BI, il est possible de créer des analyses sur des données historiques, actuelles ou même prédictives. Avec l’utilisation du Big Data et de la Data science, la BI peut traiter un très grand volume de données, rapidement et complexes. Les décisions qui découlent des analyses de données peuvent être aussi bien opérationnelles que stratégiques.
Nous allons détailler les quatre différentes étapes essentielles à l’informatique décisionnelle, quelles sont-elles ? Comment elles peuvent être mises en place ?
Découvrez les 4 étapes clés de la BI:
Les données d’une entreprise sont réparties dans plusieurs systèmes d’informations, CRM (Customer Relationship Management), ERP (Enterprise Resource Planning), bases de données, fichiers plats etc. Grâce à la BI, il est possible d’extraire et de consolider ces données pour les restituer à travers des tableaux de bord et permettre aux utilisateurs de réaliser des analyses détaillées. Afin d’approfondir encore plus les analyses, il est possible de consolider les données à la fois internes et externes comme les réseaux sociaux ou Gartner par exemple.
Toutes ces données, bien qu’elles soient disponibles et accessibles, il faut pouvoir les récupérer, les transformer pour les nettoyer et les arranger mais aussi pour les stocker. Et c’est à l’aide d’un ETL (nous verrons ci-dessous son fonctionnement ) que nous pouvons réaliser cela. Toutes les données pourraient être récupérées et stockées. Dans l’idéal, l’identification des données essentielles au besoin exprimé permet de réduire les coûts et d’améliorer les performances globales.
ETL (Extract Transform Load)
L’objectif d’un ETL est de récupérer des données de différentes sources en entrée et d’avoir en sortie des données propres, exploitables par différentes fonctions analytiques. Pour cela, nous distinguons trois étapes.
Extraction, les sources de données d’une entreprise sont multiples, il est nécessaire pour l’ETL d’avoir de nombreux connecteurs pour récupérer les données intéressantes. L’ETL va ainsi se connecter aux différentes sources pour extraire les données ou selon les systèmes, attendre que les données soient envoyées.
Transformation, cette étape est primordiale car elle permet de nettoyer, trier, organiser les données entrantes en fonction des besoins. Lors de la transformation, plusieurs règles s’appliquent comme la standardisation, la déduplication ou encore la vérification.
Chargement, dernière étape du processus qui consiste à charger les données extraites puis transformées dans le Data Warehouse.
Tout ce processus se lance de manière générale de façon automatisée. L’ETL prend en compte notamment la gestion des exceptions.
Cette étape dans la BI est primordiale. La bonne mise en place d’un ETL permet d’obtenir des données qualitatives, exploitables et analysables. Avec les outils de reporting sur le marché, nous verrons que cette étape peut être intégrée directement dans ces outils. Cependant il faut garder en mémoire que ce n’est pas optimal de fonctionner ainsi. Pour des processus plus robustes et surtout plus performants, l’utilisation d’un ETL est très recommandée.
Note : Lorsque de très grands volumes de données sont traités à l’aide des solutions de Big Data, à la place d’un ETL, nous utiliserons plutôt des ELT (Extract – Load – Transform). Dans ce cas, toutes les données sont récupérées, stockées sans traitement généralement dans un Data Lake, puis elles seront transformées en fonction des besoins.
Nous avons vu quelles données peuvent être récupérées et comment cela s’opère. L’étape suivante est de stocker ces données, en général, nous utilisons des entrepôts de données. Il s’agit d’un ensemble de bases de données qui contient une partie ou l’intégralité des données fonctionnelles d’une entreprise. Grâce au travail réalisé avec l’ETL, les données sont déjà bien structurées et propres.
Les entrepôts de données permettent un stockage de données important, mais pas uniquement. Ces entrepôts sont aussi utilisés pour historiser les données. Ainsi, aucune donnée n’est supprimée ou remplacée, mais historisée au fil du temps. Cela permet de construire des analyses avec un suivi dans le temps de certains indicateurs. Nous avons vu que l’ETL effectuait une transformation des données avant de les charger. Il est aussi envisageable de stocker les données brutes en plus des données transformées. Elles pourront être utilisées pour de futurs besoins.
Nous allons nous concentrer sur la partie nous permettant d’analyser les données. Pour cela, il y a des bonnes pratiques et des règles à respecter afin d’avoir une structure de données cohérente et performante dans un contexte BI. Le modèle de données le plus commun est le schéma en étoile. Dans ce schéma nous avons 2 types de tables :
– Tables de faits, contiennent les mesures type kpi, prix, quantité ;
– Tables de dimensions, contiennent les concepts d’entreprise tels que client, usine, temps.
Désormais, nous avons récupéré les données depuis différentes sources, elles ont été transformées et stockées dans le Data Warehouse qui a été structuré de telle sorte à nous simplifier la construction de nos analyses. Dernière étape, créer des tableaux de bord à l’aide des outils de reporting.
L’objectif de ces outils est de raconter une histoire avec les données que nous avons récupérées. Une grille avec des données brutes est très souvent difficile à analyser et pas efficace. C’est pourquoi l’utilisation de graphiques, selon le type de données et l’objectif visé, est indispensable.
Ces outils se décomposent en général en 4 parties :
– Récupération des données stockées dans le Data Warehouse ;
– Modélisation logique des données ;
– Construction des tableaux de bord ;
– Partage et diffusion.
Nous avons vu toutes les étapes clés pour construire un processus performant et respectant les principes fondamentaux de la Business Intelligence. Depuis les sources de données aux partages et diffusions des tableaux de bord nous avons parcouru l’intégralité de la chaîne décisionnelle.
La BI est un domaine transverse qui lie la donnée aux métiers. En s’appuyant sur de nombreuses technologies liées à la Data Science, Data Engineering et Data Analysis, il est possible d’apporter beaucoup d’informations à tous les métiers d’une entreprise. Si vous souhaitez en savoir plus sur l’informatique décisionnelle, nous avons développé le cursus Data Analyst abordant ce sujet.
Avec Datascientest