Skip to content

blm03.png
You are here:
Décisionnel
Index de l'article
Décisionnel
Construire un DWH
La conception du DWH
Administration des données
Synthèse de gestion de projet
Toutes les pages


LE DATAWAREHOUSE

DEFINITION

Le Data Warehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées pour le support d’un processus d’aide à la décision.

LES CONCEPTS DE BASE

Un Data Warehouse se structure en quatre classes de données, organisées selon un axe historique et un axe synthétique.

 
  • Les données détaillées

Elles reflètent les événements les plus récents. Les intégrations régulières des données issues des systèmes de production vont habituellement être réalisées à ce niveau.

  • Les données agrégées

Elles correspondent à des éléments d’analyse représentatifs des besoins utilisateurs. Elles constituent déjà un résultat d’analyse et une synthèse de l’information contenue dans le système décisionnel, et doivent être facilement accessibles et compréhensibles.

  • Les méta-données
Elles regroupent l’ensemble des informations concernant le Data Warehouse et les processus associés. Elles constituent une véritable aide en ligne permettant de connaître l’information contenue dans le Data Warehouse.  
  • Les données historisées

Un des objectifs du Data Warehouse est de conserver en ligne les données historisées.




LA CONSTRUCTION DU DATA WAREHOUSE

L’objectif à atteindre est de recomposer les données disponibles pour en obtenir une vision intégrée et transversale aux différentes fonctions de l’entreprise, une vision métier au travers des différents axes d’analyse et une vision agrégée ou détaillée, adaptée à son besoin.

Le cadre général d’un Data Warehouse comporte trois domaines principaux :

  • les applications,
  • les composants fonctionnels du Data Warehouse (acquisition, stockage, accès),
  • les infrastructures (technique et opérationnelle).
 

LES APPLICATIONS

Un Data Warehouse se fait en plusieurs itérations. Chaque sujet traité est décomposé en un ensemble d’initiatives (projet décisionnel entrant en jeu dans la construction d’un Data Warehouse dans une démarche itérative).

Les applications doivent rester maîtrisables et fournir des résultats tangibles dans un délai de moins de six mois, qui correspond au délai moyen de réalisation d’applications. Le périmètre de chaque application doit être clairement défini (acteurs concernés, fréquences et périodicité des analyses, ...).

 

 

LES COMPOSANTS FONCTIONNELS

Trois composants caractérisent un Data Warehouse :

  • L’ACQUISITION (ETL)

Elle se compose de trois phases : l’extraction, la transformation et le chargement (Extraction, Transformation, Loading).

  • LE STOCKAGE

Le composant de base est le SGBD. Il doit être spécifiquement adapté aux caractéristiques de l’accès décisionnel. Du fait de l’importance de l’historique, la structuration physique des données est également très importante.

  • L’ACCES

Définir une architecture globale servant de support aux accès décisionnels impose des choix technologiques non structurants. Il faudra mettre en place une infrastructure commune à toutes les applications décisionnelles, tout en laissant aux utilisateurs l’opportunité d’utiliser les solutions d’accès les mieux adaptées à leur problématique.

 

LES INFRASTRUCTURES

Il y a deux niveaux d’infrastructures :

  • l’infrastructure technique : l’ensemble des composants matériels et logiciels ( à associer aux composants fonctionnels : alimentation, stockage et accès).
  • l’infrastructure opérationnelle : l’ensemble des procédures et des services pour administrer les données, gérer les utilisateurs et exploiter le système.

Pour la construction d’un Data Warehouse, de manière générale, il faut :

  1. Bien connaître les métiers utilisateurs  
  2. Assurer une véritable conduite de projet  
  3. Commencer petit et voir grand 
  4. Gérer l’évolutivion



LA CONCEPTION DU DATA WAREHOUSE

Trois phases importantes pour la conception :

  • Définir le pourquoi du Data Warehouse et les objectifs à atteindre (impliquer les utilisateurs).
  • Définir l’infrastructure technique et organisationnelle du Data Warehouse.
  • Mettre en oeuvre les applications.

DECOUVRIR ET DEFINIR LES INITIATIVES

Cette phase consiste en l’étude stratégique du Data Warehouse et la définition du plan d’action.

 

L’ETUDE STRATEGIQUE

L’étude stratégique permet d’identifier la stratégie de l’entreprise, son organisation, les processus qu’elle met en oeuvre, la culture de l’entreprise. Le but est de déterminer les domaines pour lesquels la mise en place d’un Data Warehouse peut être le plus bénéfique.

 

LE PLAN D’ACTION

Pour mettre en place le plan d’action, il faut :

  • Vérifier la faisabilité de chaque projet (s’assurer de l’existence et de la qualité des données, des possibilités techniques, des possibilités organisationnelles).
  • Estimer les ressources pour chaque projet, les besoins.
  • Séquencer et planifier les projets. Il est possible de commencer petit et voir grand : limiter l’objectif à un domaine précis (Data Mart) ou faire un prototype. Ceci permet d’avoir un retour sur investissement rapide et de prouver le bien fonder du concept. Il faut déterminer la faisabilité de chaque projet envisagé et déterminer les moyens nécessaires (techniques, humains, organisationnels) à leur réalisation.
 

LA FORMATION

Selon l’expérience de l’entreprise en matière de décisionnel et des technologies utilisées, un plan de formation sera nécessaire. Il sera impératif que les membres participants au projet soient favorables au changement.

 

LA MISE EN OEUVRE DES APPLICATIONS

La mise en oeuvre est réalisée pour chaque initiative. La démarche proposée est une démarche en cinq étapes :

  • la spécification,
  • la conception,
  • la mise en oeuvre et l’intégration,
  • le déploiement et la mise en place des accompagnements,
  • les mesures.
 

Il n’existe pas de démarche complète et universelle pour la mise en oeuvre d’un Data Warehouse. Toute approche doit être adaptée à l’entreprise.




L’ADMINISTRATION DES DONNEES

Comme tout autre système informatique, un Data Warehouse s’administre.

Dès la phase de conception de l’architecture, il faut penser à l’administration des données : c’est une des fonctions les plus importantes du Data Warehouse.

Les objectifs de l’administration de données du Data Warehouse sont :

  • Assurer la cohésion du système :
  • Respecter la cohérence et la fiabilité des informations.
  • Unifier la représentation des données.
  • Respecter la cohérence des concepts.
  • Vérifier la non redondance des informations.
  • Simplifier techniquement les systèmes d’information.
  • Diminuer le nombre de fichiers.  
  • Unifier la saisie et le stockage des informations.
  • Organiser les mises à jour et la diffusion des informations.

Un référentiel de données pour le Data Warehouse est un référentiel de données dans lequel sont décrits l’organisation et la localisation des données, ainsi que les règles de consolidation des données agrégées et historisées.

La construction du référentiel est un projet qu’il est nécessaire de prévoir en parallèle à celui du data Warehouse.

 

LA MISE EN OEUVRE

Il n’existe pas une seule manière de le faire. La problématique doit être considérée sous deux aspects : organisationnel et technique.

 

SECURITE

Le Data Warehouse a pour vocation de laisser à l’utilisateur une totale autonomie en ce qui concerne la recherche et l’analyse des données. Cette liberté doit cependant être souvent restreinte, notamment pour des raisons de sécurité.

Plus les autorisations pourront être définies à un niveau fin , plus l’environnement de travail pourra être facilement adapté à chacun des profils d’utilisateur.

 

GESTION DES PERFORMANCES

La possibilité de limiter les accès aux ressources permet à l’administrateur de mieux contrôler les requêtes émises par l’utilisateur. Ce contrôle des ressources peut prendre plusieurs formes :

  • limitation du temps d’exécution
  • limitation du nombre de ligne
  • limitation du nombre de tables interrogées
  • limitation des jointures.

Ce besoin de contrôler les performances est dû à l’autonomie laissée aux utilisateurs par les outils de requêtes.

 

BATCHS

La possibilité d’effectuer des requêtes en batch est une fonctionnalité essentielle dans un contexte de Data Warehouse.




SYNTHESE GESTION DU PROJET

 
  1. Audit métier entreprise
  2. Définition des besoins en terme décisionnel (choix des outils)
  3. Bilan des applications existantes
  4. Définition des axes d’analyses
  5. Administration des données
  6. Conception Datawarehouse
  7. Alimentation Datawarehouse
  8. Conception environnement utilisateur
  9. Mise en oeuvre et déploiement des outils
  10. Réalisation des rapports d’analyses (éditions, tableaux de bord, cubes…)
  11. Formations utilisateurs
  12. Support et maintenance


 

Recherche