
| Décisionnel |
LE DATAWAREHOUSE DEFINITIONLe Data Warehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées pour le support d’un processus d’aide à la décision. LES CONCEPTS DE BASEUn Data Warehouse se structure en quatre classes de données, organisées selon un axe historique et un axe synthétique.
LA CONSTRUCTION DU DATA WAREHOUSE L’objectif à atteindre est de recomposer les données disponibles pour en obtenir une vision intégrée et transversale aux différentes fonctions de l’entreprise, une vision métier au travers des différents axes d’analyse et une vision agrégée ou détaillée, adaptée à son besoin. Le cadre général d’un Data Warehouse comporte trois domaines principaux :
LES APPLICATIONS Un Data Warehouse se fait en plusieurs itérations. Chaque sujet traité est décomposé en un ensemble d’initiatives (projet décisionnel entrant en jeu dans la construction d’un Data Warehouse dans une démarche itérative). Les applications doivent rester maîtrisables et fournir des résultats tangibles dans un délai de moins de six mois, qui correspond au délai moyen de réalisation d’applications. Le périmètre de chaque application doit être clairement défini (acteurs concernés, fréquences et périodicité des analyses, ...).
LES COMPOSANTS FONCTIONNELS Trois composants caractérisent un Data Warehouse :
Elle se compose de trois phases : l’extraction, la transformation et le chargement (Extraction, Transformation, Loading).
Le composant de base est le SGBD. Il doit être spécifiquement adapté aux caractéristiques de l’accès décisionnel. Du fait de l’importance de l’historique, la structuration physique des données est également très importante.
Définir une architecture globale servant de support aux accès décisionnels impose des choix technologiques non structurants. Il faudra mettre en place une infrastructure commune à toutes les applications décisionnelles, tout en laissant aux utilisateurs l’opportunité d’utiliser les solutions d’accès les mieux adaptées à leur problématique. LES INFRASTRUCTURES Il y a deux niveaux d’infrastructures :
Pour la construction d’un Data Warehouse, de manière générale, il faut :
LA CONCEPTION DU DATA WAREHOUSE Trois phases importantes pour la conception :
DECOUVRIR ET DEFINIR LES INITIATIVES Cette phase consiste en l’étude stratégique du Data Warehouse et la définition du plan d’action. L’ETUDE STRATEGIQUE L’étude stratégique permet d’identifier la stratégie de l’entreprise, son organisation, les processus qu’elle met en oeuvre, la culture de l’entreprise. Le but est de déterminer les domaines pour lesquels la mise en place d’un Data Warehouse peut être le plus bénéfique. LE PLAN D’ACTION Pour mettre en place le plan d’action, il faut :
LA FORMATION Selon l’expérience de l’entreprise en matière de décisionnel et des technologies utilisées, un plan de formation sera nécessaire. Il sera impératif que les membres participants au projet soient favorables au changement. LA MISE EN OEUVRE DES APPLICATIONS La mise en oeuvre est réalisée pour chaque initiative. La démarche proposée est une démarche en cinq étapes :
Il n’existe pas de démarche complète et universelle pour la mise en oeuvre d’un Data Warehouse. Toute approche doit être adaptée à l’entreprise.
Comme tout autre système informatique, un Data Warehouse s’administre. Dès la phase de conception de l’architecture, il faut penser à l’administration des données : c’est une des fonctions les plus importantes du Data Warehouse. Les objectifs de l’administration de données du Data Warehouse sont :
Un référentiel de données pour le Data Warehouse est un référentiel de données dans lequel sont décrits l’organisation et la localisation des données, ainsi que les règles de consolidation des données agrégées et historisées. La construction du référentiel est un projet qu’il est nécessaire de prévoir en parallèle à celui du data Warehouse. LA MISE EN OEUVRE Il n’existe pas une seule manière de le faire. La problématique doit être considérée sous deux aspects : organisationnel et technique. SECURITE Le Data Warehouse a pour vocation de laisser à l’utilisateur une totale autonomie en ce qui concerne la recherche et l’analyse des données. Cette liberté doit cependant être souvent restreinte, notamment pour des raisons de sécurité. Plus les autorisations pourront être définies à un niveau fin , plus l’environnement de travail pourra être facilement adapté à chacun des profils d’utilisateur. GESTION DES PERFORMANCES La possibilité de limiter les accès aux ressources permet à l’administrateur de mieux contrôler les requêtes émises par l’utilisateur. Ce contrôle des ressources peut prendre plusieurs formes :
Ce besoin de contrôler les performances est dû à l’autonomie laissée aux utilisateurs par les outils de requêtes. BATCHS La possibilité d’effectuer des requêtes en batch est une fonctionnalité essentielle dans un contexte de Data Warehouse.
|