Les outils d'ETL Extract Transform Load
Collecte des données décisionnelles
Lors des premiers projets décisionnels,
cette phase de collecte et de préparation des données était généralement sous-estimée.
C'est peut-être
là une des principales explications des échecs de réalisations
et des très nombreux dépassements de budget.
Retenons que cette phase de collecte et de préparation préalable représente à peu près les 3/4 du projet.
Extract Transform Load, Extraire Transformer Charger
Les outils d'
ETL
- Extract, Transform, Load - ont en charge cette fonction essentielle du système global décisionnel.
Il s'agit en effet de gérer toutes les étapes
de la collecte et de la préparation des données.
Les systèmes de gestion des données de l'entreprise sont hétérogènes autant sur le plan technique que sur le plan logique. Les données à collecter sont en effet stockées dans des systèmes de natures différentes, sous des formats différents, selon des structures différentes. Selon l'"histoire" du SI, les systèmes de stockage proviennent d'éditeurs différents. D'autre part, la micro informatique a fait des ravages notamment dans les services financiers et commerciaux. Il faudra alors chercher l'info essentielle dans des bases types Access ® des classeurs Excel ®...
Enfin les données sont aussi hétérogènes sur le plan logique. Pour rapprocher des données, encore faut-il bien comprendre ce que chacune signifie. Le manque de cohérence des données de référence de l'entreprise est un mal connu. Il est d'autant plus fort lors des opérations de concentration, d'absorbtion et de fusion d'autres acteurs du marché.
Le projet de Gestion des données de référence, MDM Master Data Management tente de remédier à cet handicap chronique.
Extract Extraire
Accéder à la majorité des systèmes de stockage de données (SGBD, ERP, fichiers à plat...) afin de récupérer
les données identifiées et sélectionnées. Prendre en compte les questions de synchronisation et de périodicité des rafraîchissements.
Transform Transformer
Toutes les données ne sont pas utilisables telles quelles. Elle méritent d'être vérifiées, reformatées,
nettoyées afin d'éliminer les valeurs aberrantes et les doublons et consolidées.
Load Charger
Insérer les données dans le
Data Warehouse ou le
Data Mart. Elles sont ensuite disponibles pour les différents
outils d'analyse et de présentation que sont le
Data Mining, l'analyse multimensionnelle
OLAP, les analyses géographiques,
les requêteurs et autres reportings et bien sûr les
tableaux de
bord .
Quelques fournisseurs
- IBM ® Information Server, InfoSphere ® DataStage ®
- SAS Data Integration Studio
- Oracle Warehouse Builder (OWB)
- Sap BusinessObjects Data Integration
Principaux produits Open Source
Sur des thèmes connexes
Lecture recommandée
Un guide pratique pour aborder la phase essentielle du projet data warehouse. La phase ETL est aussi la plus difficile et la plus consommatrice de temps, elle requiert toutes les énergies disponibles. Ouvrage de référence.
D
1
2
3
4
5
6
7
Recommandez cet article
Copyright
: Alain FERNANDEZ ©1998-2010 Tous droits réservés Mentions légales