Architecture du Data Warehouse SMP, MMP, Cluster

Par   Partagez : Envoyer le lien de cet article par e-mail   

Architecture technique du Data Warehouse

3 architectures technologiques typiques et classiques pour le stockage de grandes quantités de données pour des fins décisionnelles : SMP, MMP et Cluster.

SMP (Symetric Multi-Processing)

Principe : le modèle d'architecture de type "SMP" est fondé sur l'exploitation de plusieurs processeurs identiques oeuvrant en parallèle et partageant une mémoire commune. Inconvénients : la mémoire est unique, la synchronisation de l'accès à la mémoire par les différents processeurs constitue le principal inconvénient de ce type d'architecture.

MMP (Massively Parallel Processing)

  • Principe : le modèle d'architecture de type "MPP" est fondé sur l'exploitation d'un nombre important de processeurs. Chaque processeur dispose de sa propre mémoire.
  • Inconvénient  : il nécessite des développements spécifiques. Les traitements doivent être prévus dès la conception pour une exécution sur ce type d'architecture.

Cluster 

  • Principe : : avec l´architecture de type "Cluster", les ordinateurs sont organisés en "grappes". Ils sont interconnectés par des liaisons rapides Ethernet. Sur le plan du principe, le fonctionnement est assez proche de l'architecture MMP.
  • Inconvénient : : le programme à exécuter doit impérativement être développé pour ce type d'architecture.

Data warehouse de nouvelle génération

Voir aussi les solutions autour du moteur Hadoop de Apache Fundation et les principes du Cloud Computing pour l'emtreprise et d'IaaS. Ce sont des technologies à suivre de près.

Recommandations

Comme pour tout système informatique, l'architecture technique du Data Warehouse sera choisie et dimensionnée en tenant compte de la volumétrie, du nombre d'utilisateurs et de la charge d'activité potentielle.
Pas facile à définir pour un projet en continuelle évolution. Attention au sous-dimensionnement et n'hésitez pas à jeter un oeil sur les réalisations de la concurrence.

Quelques constructeurs

Cette liste n'est ni exhaustive, ni préférentielle
  • NCR Teradata, un site constructeur mais disposant de pas mal d'infos
  • IBM DB2, le système de Data Warehouse d'IBM
  • Oracle 11g, le système de Data Warehouse d'Oracle

Ouvrage de référence

Un guide pratique pour aborder la phase essentielle du projet data warehouse. La phase ETL est aussi la plus difficile et la plus consommatrice de temps, elle requiert toutes les énergies disponibles. (Livre en anglais)

The Data Warehouse ETL Toolkit: Practical Techniques for Extracting, Cleaning, Conforming, and Delivering Data The Data Warehouse ETL Toolkit
Ralph Kimball, Joe Caserta
Wiley
528 pages
Prix : 24 Euros
Dispo :
www.amazon.fr & Format Kindle


Partagez cet article...

Envoyer le lien de cet article par e-mail   
(total partages cumulés > 105)

Si vous souhaitez partager votre point de vue sur cet article, utilisez désormais Twitter ou votre réseau social favori.

La reproduction ou la traduction totale ou partielle de ce texte, images et documents est formellement interdite. Voir ici les conditions pour publier un extrait sur votre site ou blog. Ce texte et les images et documents qu'il contient est déposé auprès de l'IDDN

Suivez aussi les news du portail sur Twitter et rejoignez-nous sur Facebook

Google+    Twitter    Facebook

Excel ® est une marque déposée de Microsoft Corp ®
Gimsi ® est une marque déposée de Alain Fernandez



Copyright : Alain FERNANDEZ ©1998-2017 Tous droits réservés Mentions légales


»» Tous les articles Piloter.org »»