Architecture du Data Warehouse SMP, MMP, Cluster

Architecture technique du Data Warehouse

1. SMP (Symetric Multi-Processing)

  • Principe : le modèle d'architecture de type "SMP" est fondé sur l'exploitation de plusieurs processeurs identiques oeuvrant en parallèle et partageant une mémoire commune.
  • Inconvénients : la mémoire est unique, la synchronisation de l'accès à la mémoire par les différents processeurs constitue le principal inconvénient de ce type d'architecture.

2. MMP (Massively Parallel Processing)

  • Principe : le modèle d'architecture de type "MPP" est fondé sur l'exploitation d'un nombre important de processeurs. Chaque processeur dispose de sa propre mémoire.
  • Inconvénient : il nécessite des développements spécifiques. Les traitements doivent être prévus dès la conception pour une exécution sur ce type d'architecture.

3. Cluster 

  • Principe : avec l´architecture de type "Cluster", les ordinateurs sont organisés en "grappes". Ils sont interconnectés par des liaisons rapides Ethernet. Sur le plan du principe, le fonctionnement est assez proche de l'architecture MMP.
  • Inconvénient : le programme à exécuter doit impérativement être développé pour ce type d'architecture.

4. Data warehouse de nouvelle génération

Voir aussi les solutions autour du moteur Hadoop de Apache Fundation et les principes du Cloud Computing et d'IaaS.

Recommandations

Comme pour tout système informatique, l'architecture technique du Data Warehouse sera choisie et dimensionnée en tenant compte de la volumétrie, du nombre d'utilisateurs et de la charge d'activité potentielle.
Pas facile à définir pour un projet en continuelle évolution. Attention au sous-dimensionnement et n'hésitez pas à jeter un oeil sur les réalisations de la concurrence.

Quelques constructeurs

Cette liste n'est ni exhaustive, ni préférentielle
  • NCR Teradata, un site constructeur mais disposant de pas mal d'infos
  • IBM DB2, le système de Data Warehouse d'IBM
  • Oracle 10g, le système de Data Warehouse d'Oracle

Sur des thèmes connexes

Lecture recommandée

Un guide pratique pour aborder la phase essentielle du projet data warehouse. La phase ETL est aussi la plus difficile et la plus consommatrice de temps, elle requiert toutes les énergies disponibles. Ouvrage de référence.

The Data Warehouse ETL Toolkit: Practical Techniques for Extracting, Cleaning, Conforming, and Delivering Data The Data Warehouse ETL Toolkit
Practical Techniques for Extracting,
Cleaning, Conforming, and Delivering Data

Ralph Kimball, Joe Caserta
Wiley - (Langue anglaise)
528 pages
Prix librairie : 31,38 Euros



Dispo chez : www.amazon.fr

D 1 2 3 4 5 6 7



Envoyer le lien de cet article par e-mail  Recommandez cet article

Partagez avec Twitter   Partagez sur Facebook  
Partagez sur LinkedIn  Partagez sur Viadeo  Partagez sur Del.icio.us  Partagez sur Yahoo !  Partagez sur BlogMarks  Partagez sur Scoopeo  Bookmark Google  



Copyright : Alain FERNANDEZ ©1998-2010 Tous droits réservés Mentions légales


Nouveaux tableaux de bord des managers Alain Fernandez, cliquez pour consulter la fiche
ccccccc

 Projet BI   Architecture BI   Perspectives BI   BI 2.0   Outils d'analyses   M.D.M   Data Warehouse   Olap   Reporting   BI Open Source