ETL Extract Transform load Collecte des données

Les outils d'ETL Extract Transform Load

Collecte des données décisionnelles

Lors des premiers projets décisionnels, cette phase de collecte et de préparation des données était généralement sous-estimée. C'est peut-être là une des principales explications des échecs de réalisations et des très nombreux dépassements de budget. Retenons que cette phase de collecte et de préparation préalable représente à peu près les 3/4 du projet. Les outils d'ETL - Extract, Transform, Load - ont en charge cette fonction essentielle du système global décisionnel.

ETL Extract Transform Load, Extraire Transformer Charger

Il s'agit en effet de gérer toutes les étapes de la collecte et de la préparation des données.
Les systèmes de gestion des données de l'entreprise sont hétérogènes autant sur le plan technique que sur le plan logique. Les données à collecter sont en effet stockées dans des systèmes de natures différentes, sous des formats différents, selon des structures différentes. Selon l'"histoire" du SI, les systèmes de stockage proviennent d'éditeurs différents. D'autre part, la micro informatique a fait des ravages notamment dans les services financiers et commerciaux. Il faudra alors chercher l'info essentielle dans des bases types Access ® des classeurs Excel ®...

Enfin les données sont aussi hétérogènes sur le plan logique. Pour rapprocher des données, encore faut-il bien comprendre ce que chacune signifie. Le manque de cohérence des données de référence de l'entreprise est un mal connu. Il est d'autant plus fort lors des opérations de concentration, d'absorption et de fusion d'autres acteurs du marché. Le projet de Gestion des données de référence, MDM Master Data Management tente de remédier à cet handicap chronique.

Extract Extraire

Accéder à la majorité des systèmes de stockage de données (SGBD, ERP, fichiers à plat...) afin de récupérer les données identifiées et sélectionnées. Prendre en compte les questions de synchronisation et de périodicité des rafraîchissements.

Transform Transformer

Toutes les données ne sont pas utilisables telles quelles. Elle méritent d'être vérifiées, reformatées, nettoyées afin d'éliminer les valeurs aberrantes et les doublons et consolidées.

Load Charger

Insérer les données dans le Data Warehouse ou le Data Mart. Elles sont ensuite disponibles pour les différents outils d'analyse et de présentation que sont le Data Mining, l'analyse multimensionnelle OLAP, les analyses géographiques, les requêteurs et autres reportings et bien sûr les tableaux de bord .

Recommandations

Pour transformer les données en valeur, il est nécessaire d'investir dans la technologie mais ce n'est pas suffisant. Collecter des données tout azimuts sans une logique préalable, une stratégie spécifique peut s'avérer plus risqué que profitable.

Les problèmes de "silos" et de cloisonnement, les délicates questions de nettoyage et de consolidation, le manque de compétence pour évaluer l'importance de données rebuteront les plus tenaces.
Définir le "pourquoi", pour quels besoins d'analyse, avant le "Comment" permettra de répondre aux questions essentielles comme : Quelle données collecter ? Quelles données archiver ? Quelles données rapprocher ? Quelles données sécuriser ?
Les questions de sécurité et de confidentialité des données, puis de tracabilité, seront posées au plus tôt du lancement du projet.

Quelques fournisseurs

  • IBM ® Information Server, InfoSphere ® DataStage ®
  • SAS Data Integration Studio
  • Oracle Warehouse Builder (OWB)
  • Sap BusinessObjects Data Integration

Principaux produits Open Source

Livre recommandé

Un guide pratique pour aborder la phase essentielle du projet data warehouse. La phase ETL est aussi la plus difficile et la plus consommatrice de temps, elle requiert toutes les énergies disponibles. Ouvrage de référence.

The Data Warehouse ETL Toolkit: Practical Techniques for Extracting, Cleaning, Conforming, and Delivering Data The Data Warehouse ETL Toolkit
Practical Techniques for Extracting,
Cleaning, Conforming, and Delivering Data

Ralph Kimball, Joe Caserta
Wiley - (Langue anglaise)
528 pages
Prix librairie : 31,38 Euros



Dispo chez :
www.amazon.fr

N'oubliez pas de visiter...

La sélection de livres de management de référence
Les ouvrages de management de la performance,
les méthodes, le développement professionnel, DVD cinéma, humour entreprise...

Pour aller plus avant ...

Partagez cet article...

Partagez avec Twitter  Partagez sur Facebook  Partagez sur LinkedIn  Partagez sur Viadeo  Partagez sur Del.icio.us  

Envoyer le lien de cet article par e-mail  Recommandez cet article

Suivez aussi les news du portail sur Twitter et rejoignez-nous sur Facebook

Pour établir un lien vers cet article depuis votre site recopiez le lien suivant.
La reproduction ou la traduction totale ou partielle de ce texte, images et documents est formellement interdite. Voir ici les conditions pour publier un extrait sur votre site ou blog.
Ce texte et les images et documents qu'il contient est déposé auprès de l'IDDN



Copyright : Alain FERNANDEZ ©1998-2012 Tous droits réservés Mentions légales


  Blog pro      Performance BPM     Tb de bord gestion     Tb de bord Excel      Management de projet     Contrôle de gestion                          ?  

Business Intelligence

Les 78 fiches de la BI

Business Intelligence
1. Business Intelligence
2. Outils de la BI
3. Le projet BI, le livre
Les Perspectives, BI 2.0 +/-
4. Perspectives BI
5. BI état de l'art
6. BI 2.0
7. BI 2.0 en pratique
8. BI Temps réel
9. La BI de demain
10 La BI mobile
Projet BI & Stratégie +/-
11. BI & stratégie
12. Informatique décisionnelle
13. BI, projet stratégique
Le data warehouse +/-
14.Data Warehousing
15. Data Warehouse
16. Data Mart
17. Architecture Data Warehouse
18. Projet Data Warehouse
19. Modélisation Data Warehouse
20. ROI du projet
Big Data
21. Map Reduce
22. Hadoop
23. Hadoop calculs massifs
24.Les bases No SQL
La qualité des données +/-
25. Gestion qualité des données
26. Collectez les données ETL
27. Gouvernance des données
28. MDM Master Data Management
29. Projet MDM
30. ROI du MDM
31. Meta données
32. BI et ERP (PGI)
Outils d'analyse +/-
33. Outils d'analyse
34. Statistiques
35. Analyse prédictive
36. Arbre de decision
37. Data Mining
38. Text Mining
Analyse Olap +/-
39. Pourquoi Olap ?
40. Qu'est-ce que OLAP ?
41. Modèle de CODD
42. Nouveau modèle
43. Conception Olap
44. ROLAP, MOLAP, HOLAP...
45. Essayez Olap
BI Front-end tools +/-
46. Tableau de bord BI
47. Reporting et Requêteur
48. Reporting financier
49. Tableaux de bord et KM 
50. Portail décisionnel
Les outils décisionnels +/-
51. Outils decisionnels
52. IBM
53. Oracle, Hyperion Solution
54. Microsoft
55. SAP Business Objects
56. SAS institute
57. Qliktech
58. Information Builders
59. Dundas Data Visualization
60. Corda Technologies
61. Prophix
62. Infor
BI Open Source +/-
63. Le principe de l'Open Source
64. Projets Open Source
65. Outils ETL Open Source
66. outils Reporting Open Source
67. outils OLAP et Data Warehouse Open Source
68. outils Data Mining Open Source
69. synthèse BI Open Source 
Projet décisionnel +/-
70. Conduire le projet
71. Le projet decisionnel
72. Le système de pilotage
73. Le système decisionnel
Les Ressources de la BI +/-
74. Livres de la Business Intelligence
75. Livres du Data Mining
76. Sites de la Business Intelligence
77. Projet BI en 7 points (ext.)
78. 10 causes d'echec BI (ext.)

References du Portail
Glossaire
Sites de reference
Plan du site 1/2
Plan du site 2/2
Contact
A propos...
Copyright©


Toutes les pages de ce site sont sous copyright Alain Fernandez 1998-2012

IDDN Certification



 Dossier BI   BI 2.0   Stratégie   Data Warehouse   Qualité des données   Outils d'analyse   OLAP   Front-end  Outils BI   BI Open Source   Projet BI 

Portail piloter la performance, Business Intelligence, Performance management