Data Warehouse, Entrepôt de données

Qu'est-ce qu'un Data Warehouse ?

Définition du Data Warehouse

Le Data Warehouse, ou entrepôt de données, est une base de données dédiée au stockage de l'ensemble des données utilisées dans le cadre de la prise de décision et de l'analyse décisionnelle. Le Data Warehouse est exclusivement réservé à cet usage. Il est alimenté en données depuis les bases de production grâce notamment aux outils d'ETL Extract Transform Load. Le Data Warehouse n'est pas une simple copie des données de production. Le data warehouse est organisé et structuré.

Les 4 caractéristiques essentielles du Data Warehouse

Père du concept, Bill Immon dans son livre "Building the Data Warehouse" (John Wiley and Son 1996) le décrit ainsi :
"Subject oriented, integrated, nonvolatile, time variant collection of data in support of management decisions.
  1. Orienté sujet
    Au coeur du Data warehouse, les données sont organisées par thème. Les données propres à un thème, les ventes par exemple, seront rapatriées des différentes bases OLTP de production et regroupées.
  2. Intégré
    Les données proviennent de sources hétérogènes utilisant chacune un type de format. Elles sont intégrées avant d'être proposées à utilisation
  3. Non volatile
    Les données ne disparaissent pas et ne changent pas au fil des traitements, au fil du temps (Read-Only).
  4. Historisé
    Les données non volatiles sont aussi horodatées. On peut ainsi visualiser l'évolution dans le temps d'une valeur donnée.
    Le degré de détail de l'archivage est bien entendu relatif à la nature des données. Toutes les données ne méritent pas d'être archivées.

Data Warehouse Open Source

Sur des thèmes connexe

Lecture recommandée

Une mise à jour majeure de l'ouvrage de référence du projet Data Warehouse. Ralph Kimball, Margy Ross sont des experts très largement reconnus. L'approche pratique et très terrain dont ils sont coutumiers, se retrouve à chacun des chapitres de cet ouvrage particulièrement complet.

The Data Warehouse Lifecycle Toolkit The Data Warehouse Lifecycle Toolkit
Ralph Kimball, Margy Ross,
Warren Thornthwaite, Joy Mundy et Bob Becker
John Wiley & Sons Ltd
(Langue anglaise)
2nde édition 2008 révisée - 672 pages
Prix librairie : 34,87 Euros



Dispo chez : www.amazon.fr

D 1 2 3 4 5 6 7



Envoyer le lien de cet article par e-mail  Recommandez cet article

Partagez avec Twitter   Partagez sur Facebook  
Partagez sur LinkedIn  Partagez sur Viadeo  Partagez sur Del.icio.us  Partagez sur Yahoo !  Partagez sur BlogMarks  Partagez sur Scoopeo  Bookmark Google  



Copyright : Alain FERNANDEZ ©1998-2010 Tous droits réservés Mentions légales


Nouveaux tableaux de bord des managers Alain Fernandez, cliquez pour consulter la fiche
cccccccc

 Projet BI   Architecture BI   Perspectives BI   BI 2.0   Outils d'analyses   M.D.M   Data Warehouse   Olap   Reporting   BI Open Source