• Denis PEYRAS, consultant expert BI, ETL, AMOA, AMOE

    Consultant indépendant sénior - Microsoft Business Intelligence - Microsoft Power BI - Microsoft SQL Server - Architecte BI - Conception et mise en oeuvre de services ESB dans un SOA - expert Gouvernance de la Donnée - Conception et mise en oeuvre de référentiels - Formateur. "Maîtiriser des outils, c'est bien, comprendre les besoins et les enjeux d'une entreprise, c'est mieux"
  • 1

Concevoir un Data Warehouse performant et facile à faire évoluer

Formation - Concevoir un Data Warehouse performant et facile à faire évoluer

 

Objectif

Apprendre à bien concevoir un entrepôt de données (Data Warehouse)
 

A qui s'adresse ce cours

Développeurs, chefs de projet

Pré requis

Avoir de bonnes connaissances en bases de données relationnelles, en langage SQL et idéalement en modélisation MERISE. Les cas d'usages UML seront transposés en MERISE.

So'Data peut vous proposer des formations en conception de base de données relationnelle et en langage SQL.

Durée

3 jours, 21 heures.

Formation en inter entreprise, intra entreprise, dans un centre de formation ou dans vos locaux 

Contenu

Module 1 : Introduction et rappels sur l'informatique décisionnel et le vocabulaire

  • Qu'est-ce qu'un système d'information décisionnel ?
  • Evolution des exigences de décision dans le contexte actuel.
  • Infocentres, SIAD, EIS, Data Warehouse, Datamart, bus de données : définition et positionnement.
  • Comprendre la finalité de l'approche Data Warehouse.

Module 2 : Les architectures en réponse aux besoins décisionnels

  • Les composants principaux, Data Warehouse, ODS ou "Staging Area", datamarts.
  • Les architectures proposées par Kimball et Inmon. Avantages et inconvénients.
  • Positionnement du modèle en étoile dans le Data Warehouse selon l'architecture.
  • Les phases du cycle de vie d'un Data Warehouse.
  • Les critères de qualité d'un Data Warehouse
  • La notion de "Meta-donnée", de référentiel.

Réflexion collective

Définition des critères de qualité d'un Data Warehouse.

 

Module 3 : Principes et définitions de base sur la modélisation en étoile, en flocon et en constellation

  • Rappels sur la modélisation des bases de données opérationnelles.
  • Différences entre OLTP et OLAP.
  • Entités, attributs, cardinalités, formes normales.
  • Le principe de la dénormalisation pour concevoir un modèle en étoile.
  • Comprendre les notions de fait, dimension et axe d'analyse.
  • Les alternatives de modélisation : modèle en flocon, en constellation.
  • Les règles et bonnes pratiques de modélisation en étoile, flocon, constellation

.

Etude de cas

A partir d'un cahier des charges d'analyse, identifier les dimensions et faits principaux d'un modèle.

 

Module 4 : Conception du modèle en étoile, en flocon et en constellation

  • Organisation et synthèse des interviews utilisateur pour le recueil du besoin.
  • Compréhension et identification des processus métiers à modéliser.
  • Choix des dimensions d'analyse.
  • Création de hiérarchies dans les dimensions.
  • Identification des mesures et croisements avec les dimensions.
  • Définition de la granularité de l'analyse.
  • Définition des règles d'agrégation.
  • Utilisation d'outils de modélisation.

Exercice

A partir d'objectifs fournis par la MOA, réaliser un macro-modèle, en reliant les dimensions.

 

Module 5 : Optimisation fonctionnelle des modèles en étoile, en flocon et en constellation

  • Gestion de l'évolution des référentiels et du changement des nomenclatures.
  • Gestion des dimensions à évolution lente et rapide.
  • Les clés de substitution.
  • Gestion de la qualité, fiabilité des données.
  • Gestion du contexte non renseigné ou inconnu.
  • Les dimensions dégénérées.

 

Module 6 : Replacer la modélisation dans le cadre du projet décisionnel

  • Présentation de la méthode Kimball et Inmon pour l'organisation du projet.
  • Les acteurs et livrables du projet.
  • Recueil des besoins métier. Formalisation des exigences techniques et d'organisation.
  • Identification des priorités et du périmètre pilote.
  • Modélisation des informations.
  • Choix de l'infrastructure. Implémentation et recette.
  • Déploiement et maintenance du modèle.
  • Gestion des historiques.
  • Les autres approches de modélisation : Datavault

 

Module 7 : Optimisation physique du modèle

  • Gestion de la performance des requêtes.
  • Estimation de l'espace disque requis pour le modèle.
  • Limitation de la taille occupée par une dimension.
  • Agrégation directe de certains éléments dans les tables.
  • Dimensions techniques pour assurer la traçabilité des faits.

Exercice

Estimations de volumétrie moyenne sur quelques cas d'analyse.

 

Module 8 : Alimentation du modèle en étoile, en flocon et en constellation

  • Contraintes des systèmes opérationnels source.
  • Rôle des ODS dans l'alimentation.
  • L'organisation des traitements dans la SA (Staging Area).
  • Les différents types d'alimentation (delta, stock, complète).
  • Les étapes, les règles et les pré-requis de l'alimentation.
  • Gestion des rejets.
  • Gestion des sources différentes pour l'alimentation d'une dimension, ou d'un fait.
  •  ETL, les solutions d'alimentation disponibles sur le marché : Microsoft SSIS, Talend Data Intégration, Datastage, Informatica, Oracle ODI

Exercice

Sur une étude de cas, proposer une architecture de chargement : ODS / Staging Area.

 

Module 10 : Conclusion

  • Ce qu'il faut retenir.
  • Les pièges à éviter.
  • Pour aller plus loin

 

Programmes de cours proposés par So'Data - Reproduction interdite.
Formateur expérimenté intervenant à Bordeaux, Nantes, Rennes, Paris, Montpellier, Toulouse, Niort, Poitiers.

Contact

Please, enter your name
Please, enter your phone number
Please, enter your e-mail address Mail address is not not valid
Please, enter your message