Management de l'entreprise

Collecter les données

Par Partagez : Envoyer le lien de cet article par e-mail   
.

La Collecte des données ou de l'importance des préliminaires....

La phase la plus importante d'un projet se situe bien en amont du lancement proprement dit. On parle alors de l'avant-projet.
Cette caractéristique n'est pas propre aux projets technologiques. Lors de grands travaux de génie civil, le terrassement, la consolidation des sols, la préparation des fondations peuvent représenter une part importance du projet que ce soit en terme de coûts, de délais ou de compétences techniques à mobiliser.
La qualité de l'ouvrage dépendra directement du soin accordé à ces travaux préparatoires.

La phase la plus importante...

Dans le cadre d'un projet décisionnel, ce n'est pas la conception des interfaces utilisateurs mais bien les tâches de collecte, de nettoyage et de mise en forme des données qui constitueront le gros morceau, équivalent par analogie aux travaux de préparation des terrains du chantier de génie civil....

Cette phase préalable peut représenter plus des ¾ des coûts et des délais globaux du projet. Et les compétences techniques à mettre en place ne seront pas en reste. Cette phase essentielle était il y a encore peu bien rarement estimée à sa juste valeur. Sa mésestimation est pourtant une des principales causes des échecs des projets décisionnels.

Pourquoi ?
Les entreprises n'ont que rarement conscience de la lourdeur des travaux à entreprendre pour transformer des données de terrain en informations utilisables au sein du processus décisionnel. Les données collectées au coeur des systèmes de production, même lorsque ceux-ci sont pleinement opérationnels, ne peuvent être utilisés telles quelles à des fins décisionnelles. Les données, dites de production, sont trop souvent imprécises et incohérentes voire erronées.
D'autre part, l'analyse décisionnelle consiste essentiellement à rapprocher des données de sources différentes. Cette opération fondamentale n'est possible que lorsque les informations utilisent un même format et sont dans une logique similaire de gestion.

Il est simplement dommage qu'il faille trop souvent se casser le nez sur cette problématique fondamentale avant d'en saisir la portée.

Afin d'illustrer mon propos, je vous conterai lors d'une prochaine publication une expérience de terrain. Elle m'a été rapportée récemment par un collègue spécialiste du data mining. Je tiens cependant à lui soumettre le texte avant de le publier.


Points de vue


C'est vrai que la collecte est un sujet dont on parle de plus en plus. Pour mon cas particulier nous sommes sur un projet de ce type et on a quand même quelques difficultés à faire établir un devis précis. Des idées ? (Recopié par AlainF suite transfert)
Ecrit par : Remy

Je bute moi même sur un pb de ce type. J'aimerai savoir s'il existe des sites ou forums francais traitant du theme des outils ETL comme : Comment choisir, comment les utiliser, faut-il préférer l'open source, enfin tous ce genre de pb .
Phil
Ecrit par : Philippe Davout

Phil> tu peux essayez le forum suivant : http://www.developpez.net/forums/forumdisplay.php?f=502
Ecrit par : rudy

Je réalise un mémoire sur l'intégration (ou l'integrité) des données au sein d'un datawarehouse. Auriez vous des sources documentaires à me proposer pour que je puisse avancer dans mes recherches?
Ecrit par : grimaud


Partagez cet article...

Envoyer le lien de cet article par e-mail   
(total partages cumulés > 65)

La reproduction ou la traduction totale ou partielle de ce texte, images et documents est formellement interdite. Voir ici les conditions pour publier un extrait sur votre site ou blog. Ce texte et les images et documents qu'il contient est déposé auprès de l'IDDN

Suivez aussi les news du portail sur Twitter et rejoignez-nous sur Facebook

Google+    Twitter    Facebook

Excel ® est une marque déposée de Microsoft Corp ®
Gimsi ® est une marque déposée de Alain Fernandez



Copyright : Alain FERNANDEZ ©1998-2017- Tous droits réservés


  Suivez-nous :   Google+   twitter+  Facebook  Linkedin    e-mail  
»» Toutes les fiches du Blog »»