Architecture technique du Data Warehouse
1. SMP (Symetric Multi-Processing)
- Principe : le modèle d'architecture de type "SMP" est fondé sur l'exploitation de plusieurs processeurs identiques oeuvrant en parallèle et partageant une mémoire commune.
- Inconvénients : la mémoire est unique, la synchronisation de l'accès à la mémoire par les différents processeurs constitue le principal inconvénient de ce type d'architecture.
2. MMP (Massively Parallel Processing)
- Principe : le modèle d'architecture de type "MPP" est fondé sur l'exploitation d'un nombre important de processeurs. Chaque processeur dispose de sa propre mémoire.
- Inconvénient : il nécessite des développements spécifiques. Les traitements doivent être prévus dès la conception pour une exécution sur ce type d'architecture.
3. Cluster
- Principe : avec l´architecture de type "Cluster", les ordinateurs sont organisés en "grappes". Ils sont interconnectés par des liaisons rapides Ethernet. Sur le plan du principe, le fonctionnement est assez proche de l'architecture MMP.
- Inconvénient : le programme à exécuter doit impérativement être développé pour ce type d'architecture.
4. Data warehouse de nouvelle génération
Voir aussi les solutions autour du moteur
Hadoop de Apache Fundation et les principes du
Cloud Computing et
d'IaaS. Ce sont des technologies à suivre de près.
Recommandations
Comme pour tout système informatique, l'architecture technique du
Data Warehouse sera choisie et dimensionnée en tenant compte de la volumétrie, du nombre d'utilisateurs et de la charge d'activité potentielle.
Pas facile à définir pour un projet en continuelle évolution. Attention au sous-dimensionnement et n'hésitez pas à jeter un oeil sur les réalisations de la concurrence.
Quelques constructeurs
Cette liste n'est ni exhaustive, ni préférentielle
- NCR Teradata, un site constructeur mais disposant de pas mal d'infos
- IBM DB2, le système de Data Warehouse d'IBM
- Oracle 10g, le système de Data Warehouse d'Oracle
Sur des thèmes connexes
Lecture recommandée
Un guide pratique pour aborder la phase essentielle du projet data warehouse. La phase ETL est aussi la plus difficile et la plus consommatrice de temps, elle requiert toutes les énergies disponibles. Ouvrage de référence.
D
1
2
3
4
5
6
7
Recommandez cet article
Copyright
: Alain FERNANDEZ ©1998-2010 Tous droits réservés Mentions légales