Chaine youtube Piloter.org   Piloter.org sur facebook   Profil  Linkedin   Actualités Twitter
Plus de 800 fiches pratiques pour les managers, sans pub et sans traceurs…
Le Portail du Manager Innovant
Chaine youtube Piloter.org Je suis aussi  sur facebook  Je suis aussi sur  Linkedin  Actualités Twitter
×
★ Tous les articles classés ★

Modélisation du data warehouse, le schéma en étoile

Mise à jour le 13 juillet 2021  Par  Dossier complet Les fiches du dossier: "DataWarehouse"
Le projet Data Warehouse et la modelisation des données en utilisant le schema en étoile. Commençons par un rappel sur la modélisation des bases de données et intéressons nous ensuite aux spécificités de la Business Intelligence...

Tous les modèles sont faux, mais certains sont utiles.
George Box, statisticien britannique

Projet Data warehouse Modélisation des données

Bases OLTP et normalisation

Les bases OLTP sont conçues selon le modèle entité-relation (dont est issue notamment la Méthode MERISE de H. Tardieu, A. Rochfeld et R. Coletti).

Pour éviter les tragiques problèmes de conception comme les redondances et les indexations un peu hasardeuses, il existe des techniques de "normalisation".

Ces techniques de normalisation, appelées les formes "normales", guident le processus de conception.

Spécificités du Data Warehouse

Pour mémoire, il existe 3 formes normales principales dénommées 1FN, 2FN, 3FN. Les 3 formes normales garantissent l'atomisation entité, propriétés, relation et la pertinence du schéma relationnel implanté. Voir notamment l'article Bases de données relationnelles. Le Data Warehouse n'a pas du tout les mêmes exigences ni la même utilisation.
Les modèles de conception sont totalement différents. Ils sont dénormalisés par définition. On en retient deux principaux : le schéma en étoile (Star Schema) et le schéma en flocon (Snowflake Schema).

Le modèle de données en étoile

Modélisation en étoile Le modèle de données en étoile doit son nom à sa forme. Ce modèle de conception privilégie l'approche utilisateur, l'orientation métier.
La table de référence contient les faits.
Les faits ou mesures sont les données chiffrées (du type résultats par secteur).
Les tables satellites correspondent aux dimensions. Ce sont les axes d'analyse des utilisateurs.
Ainsi, dès la conception, la base est orientée en tenant compte des types de recherche des utilisateurs.

Le modèle de données en flocon

Le modèle de données en flocon est une variante du modèle en étoile, plus adapté pour des usages bien spécifiques.

L’auteur

Alain FernandezAlain Fernandez est un spécialiste de la mesure de la performance, de l’aide à la décision et de la conception de tableaux de bord de pilotage. Au fil de ces vingt dernières années, il a conduit de nombreux projets de réalisation de système décisionnel en France et à l'International. Il est l'auteur de plusieurs livres publiés aux Éditions Eyrolles consacrés à ce thème, vendus à plusieurs dizaines de milliers d'exemplaires et régulièrement réédités.
Me suivre sur LinkedIn

Voir aussi... À ce sujet, voir aussi

  • Le modèle de la décision : une illusion
    Avant de lancer un projet décisionnel, Business Intelligence, tableaux de bord, sommes-nous toujours sûr de bien percevoir la réalité de l'organisation, ou plus prosaïquement, nous contentons nous seulement d'un modélisation autant simplificatrice qu'illusoire ? Posez la question, c'est y répondre... La prise de décision en entreprise ne peut se contenter d'une modélisation simpliste
  • Hadoop, définition
    Hadoop est un projet Open Source géré par Apache Software Fundation basé sur le principe Map Reduce et Google File System, deux produits Google Corp. Le produit est écrit en langage Java. Le principe repose sur l'exécution du traitement répartie multi noeuds pour augmenter drastiquement les capacités de calculs et de stockage afin de traiter de très grandes quantités de données.
  • Bases de données NoSQL, le principe
    Que sont les bases de données Not Only SQL ? Quelles sont les applications où elles s'avèrent plus performantes que les bases de données relationnelles SGBD-R ? Cette génération de bases de données remettent partiellement en cause les fondements des classiques bases relationnelles pour obtenir essentiellement des gains en performance avec des systèmes très largement répartis... Mais pas seulement... Voyons tout cela...

À lire

Cet ouvrage expose et commente les différentes manières de structurer un data warehouse selon l'usage attendu. Ce guide complet est une référence du sujet...

Entrepôts de données Guide pratique de modélisation dimensionnelleEntrepôts de données
Ralph Kimball et Margy Ross
Vuibert   2ème édition
464 pages

Dispo : www.amazon.fr


Livres à lire Piloter l'Entreprise Innovante...

Avez-vous déjà essayé d'instaurer la prise de décision en équipe ? Sans précautions préalables, rapidement, le consensus le plus mou qui soit vient casser les plus pures ambitions. Mais connaissez-vous la méthode SOCRIDE centrée sur les questions incontournables de Confiance et de Reconnaissance ? Rien de plus facile ! Elle est expliquée, illustrée et détaillée dans ce livre :

Tableaux de bord du manager innovant, le livreLes tableaux de bord du manager innovant
Une démarche en 7 étapes pour faciliter la prise de décision en équipe

Alain Fernandez
Éditeur : Eyrolles
Pages : 320 pages

Fiche technique Consultez la fiche technique »»»

Pour acheter ce livre :

amazon.fr  Eyrolles.com  ="Fnac.com"

Format ebook : PDF & ePub, Format Kindle

Voir aussi...


Les fiches du dossier: DataWarehouse

Partagez cet article...

Envoyer le lien de cet article par e-mail    Twitter Facebook Linkedin Retour au début
(total partages cumulés > 145)