ETL Extract Transform load Collecte des données

Les outils d'ETL Extract Transform Load

Collecte des données décisionnelles

Lors des premiers projets décisionnels, cette phase de collecte et de préparation des données était généralement sous-estimée. C'est peut-être là une des principales explications des échecs de réalisations et des très nombreux dépassements de budget.
Retenons que cette phase de collecte et de préparation préalable représente à peu près les 3/4 du projet.

Extract Transform Load, Extraire Transformer Charger

Les outils d'ETL - Extract, Transform, Load - ont en charge cette fonction essentielle du système global décisionnel. Il s'agit en effet de gérer toutes les étapes de la collecte et de la préparation des données.
Les systèmes de gestion des données de l'entreprise sont hétérogènes autant sur le plan technique que sur le plan logique. Les données à collecter sont en effet stockées dans des systèmes de natures différentes, sous des formats différents, selon des structures différentes. Selon l'"histoire" du SI, les systèmes de stockage proviennent d'éditeurs différents. D'autre part, la micro informatique a fait des ravages notamment dans les services financiers et commerciaux. Il faudra alors chercher l'info essentielle dans des bases types Access ® des classeurs Excel ®...
Enfin les données sont aussi hétérogènes sur le plan logique. Pour rapprocher des données, encore faut-il bien comprendre ce que chacune signifie. Le manque de cohérence des données de référence de l'entreprise est un mal connu. Il est d'autant plus fort lors des opérations de concentration, d'absorbtion et de fusion d'autres acteurs du marché. Le projet de Gestion des données de référence, MDM Master Data Management tente de remédier à cet handicap chronique.

Extract Extraire

Accéder à la majorité des systèmes de stockage de données (SGBD, ERP, fichiers à plat...) afin de récupérer les données identifiées et sélectionnées. Prendre en compte les questions de synchronisation et de périodicité des rafraîchissements.

Transform Transformer

Toutes les données ne sont pas utilisables telles quelles. Elle méritent d'être vérifiées, reformatées, nettoyées afin d'éliminer les valeurs aberrantes et les doublons et consolidées.

Load Charger

Insérer les données dans le Data Warehouse ou le Data Mart. Elles sont ensuite disponibles pour les différents outils d'analyse et de présentation que sont le Data Mining, l'analyse multimensionnelle OLAP, les analyses géographiques, les requêteurs et autres reportings et bien sûr les tableaux de bord .

Recommandations

Pour transformer les données en valeur, il est nécessaire d'investir dans la technologie mais ce n'est pas suffisant. Collecter des données tout azimuts sans une logique prélable, une stratégie spécifique peut s'avérer plus risqué que profitable.
Les problèmes de "silos" et de cloisonnement, les délicates questions de nettoyage et de consolidation, le manque de compétence pour évaluer l'importance de données rebuteront les plus tenaces.
Définir le "pourquoi", pour quels besoins d'analyse, avant le "Comment" permettra de répondre aux questions essentielles comme : Quelle données collecter ? Quelles données archiver ? Quelles donneées rapprocher ? Quelles données sécuriser ?
Les questions de sécurité et de confidentialité des données, puis de tracabilité, seront posées au plus tôt du lancement du projet.

Quelques fournisseurs

  • IBM ® Information Server, InfoSphere ® DataStage ®
  • SAS Data Integration Studio
  • Oracle Warehouse Builder (OWB)
  • Sap BusinessObjects Data Integration

Principaux produits Open Source

Sur des thèmes connexes

Lecture recommandée

Un guide pratique pour aborder la phase essentielle du projet data warehouse. La phase ETL est aussi la plus difficile et la plus consommatrice de temps, elle requiert toutes les énergies disponibles. Ouvrage de référence.

The Data Warehouse ETL Toolkit: Practical Techniques for Extracting, Cleaning, Conforming, and Delivering Data The Data Warehouse ETL Toolkit
Practical Techniques for Extracting,
Cleaning, Conforming, and Delivering Data

Ralph Kimball, Joe Caserta
Wiley - (Langue anglaise)
528 pages
Prix librairie : 31,38 Euros



Dispo chez :
www.amazon.fr

D 1 2 3 4 5 6 7



Envoyer le lien de cet article par e-mail  Recommandez cet article

Retwittez cet article   Partagez cet article sur Facebook  
Partagez sur LinkedIn  Partagez cet article sur Viadeo  Partagez  cet article sur Del.icio.us  Partagez cet article sur Yahoo !  Partagez sur BlogMarks  Partagez cet article sur Scoopeo  Bookmark Google  



Copyright : Alain FERNANDEZ ©1998-2010 Tous droits réservés Mentions légales


Piloter.org vous a intéressé ?
Envoyez le lien www.piloter.org par e-mail Recommandez ce site
Envoyer le lien de cet article par e-mail  Conseillez cet article
Retwittez cet article   Partagez cet article sur Facebook  Partagez sur LinkedIn  Partagez cet article sur Viadeo  


Performance Management
Nouveaux tableau de bord
Les nouveaux tableaux de bord des managers
Le projet décisionnel en totalité 4ème édition 2008

Consultez la fiche détaillée


Articles les + lus
Les progiciels de la Business Intelligence, système Informatique Décisionnelle
Utiliser Reporting et Requêteur ad hoc
Qu'est-ce que ITIL ? Information Technology Infrastructure Library
La Business Intelligence, le projet Informatique Décisionnelle
Principes, méthodes et outils pour mieux gérer son temps
La méthode Six Sigma en pratique


Gestion de projet
conduite de projet
Le chef de projet efficace
Réussir les projets complexes
Les pratiques de bon sens.
3ème éd 2009

Consultez la fiche détaillée


Gouvernance d'entreprise
Business Intelligence
Business Intelligence
Briques de la BI
Le projet BI, le livre
Les Perspectives
Perspectives BI
BI état de l'art
La BI de demain
BI 2.0
BI 2.0 en pratique
BI Temps réel
Analyse BI
Outils d'analyse
Statistiques
Analyse prédictive
Arbre de decision
Data Mining
Text Mining
Map Reduce
Hadoop
La qualité des données
Collectez les données ETL
Gouvernance des données
MDM Master Data Management
Projet MDM
ROI du MDM
Meta données
BI et ERP (PGI)
Le data warehouse
Data Warehousing
Data Warehouse
Data Mart
Architecture Data Warehouse
Projet Data Warehouse
Modélisation Data Warehouse
ROI du projet
Les briques essentielles
Reporting et Requêteur
Reporting financier
Tableaux de bord et KM 
Portail décisionnel
Décisionnel Open Source 
Analyse Olap
Pourquoi Olap ?, Qu'est-ce que OLAP ?, Modèle de CODD, Nouveau modèle, Conception Olap, ROLAP, MOLAP, HOLAP... , Essayez Olap
Les outils décisionnels
Outils decisionnels
IBM, Oracle, Hyperion Solution, Microsoft, SAP Business Objects, SAS institute, Qliktech, Information Builders, Dundas Data Visualization, Corda Technologies, Prophix, Infor
Projet décisionnel
Conduire le projet , Le projet decisionnel , Le système de pilotage , Le système decisionnel
Les Ressources de la BI
Livres de la BI
Livres du Data Mining
Sites de la BI
Le projet BI en 5 points
10 causes d'echec BI

References du Portail
Glossaire
Sites de reference
Plan du site 1/2
Plan du site 2/2
Contact
A propos...
Copyright©


Toutes les pages de ce site sont sous copyright Alain Fernandez 1998-2010

IDDN Certification



ccccccccccccccccccccc

 Projet BI   Architecture BI   Perspectives BI   BI 2.0   Outils d'analyses   M.D.M   Data Warehouse   Olap   Reporting   BI Open Source 

Nouveaux tableaux de bord des managers Alain Fernandez, cliquez pour consulter la fiche