Utiliser le Data Mining, exploiter les données du Data Warehouse

Qu'est-ce que le Data mining ?


The devil is in the details
Le Data Mining est en fait un terme générique englobant toute une famille d'outils facilitant l'analyse des données contenues au sein d'une base décisionnelle de type Data Warehouse ou DataMart. Certains considèrent cette technique comme "l'art" voire la "science" de l'extraction d'informations significatives de grandes quantités de données.

Définition du Data Mining

En peu de mots, le Data Mining présente l'avantage de trouver des structures originales et des corrélations informelles entre les données.
Il permet de mieux comprendre les liens entre des phénomènes en apparence distincts et d'anticiper des tendances encore peu discernables.

Pour quelles applications utiliser le Data mining ?

A contrario des méthodes classiques d'analyses statistiques, le Data Mining est particulièrement adapté au traitement de grands volumes de données. Avec l'augmentation de la capacité de stockage des supports informatiques, un maximum de renseignements seront captés, ordonnés et rangés au sein du Data Warehouse. Comportement des acheteurs, caractéristiques des produits, historisation de la production, désormais plus rien n'échappe à la collecte.
Avec le Data Mining, ces "tera-nesque" bases de données sont exploitables.

Quel est le principe du data mining ?

Les outils de data mining proposent différentes techniques à choisir en fonction de la nature des données et du type d'étude que l'on souhaite entreprendre
  • Les méthodes utilisant les techniques de classification et de segmentation
  • Les méthodes utilisant des principes d'arbres de décision assez proches des techniques de classification.
  • Les méthodes fondées sur des principes et des règles d'associations ou d'analogies
  • Les méthodes exploitant les capacités d'apprentissage des réseaux de neurones
  • Et pour les études d'évolution de populations, les algorithmes génétiques

Comment utiliser le Data Mining ?

3 conseils
  1. Accordez le soin nécessaire à la phase de collecte des données.
    La collecte des données est une étape fondamentale. Elle est longue et coûteuse. Il est indispensable de disposer de la garantie de la fiabilité des données avant de lancer la moindre analyse.
  2. L'étude des résultats mérite toute votre attention.
    Il ne faut pas hésiter à présenter différemment le problème et à tester d'autres techniques d'analyse avant de s'engager sur un résultat.
  3. Le Data mining n'est pas un oracle absolu. Une absence de réponse du système ne doit pas être systématiquement considérée comme une négation.
    Il faut quelquefois prendre la précaution d'aborder le problème sous un autre angle avant de s'engager.

Quelques produits types représentatifs

  • IBM Cognos Data Mining
  • SAS Enterprise Miner
  • Isoft Alice

Principal produit Open Source

  • Weka de l'Université de Waikato New-Zeland,
  • Rapid Miner
  • Data Mining Open Source
    Un livre est associé au développement du projet de data mining libre Weka. voir ci-après

Sur le même sujet

A lire

Un ouvrage facile d'accès, suffisamment documenté et explicite pour que le lecteur puisse se forger une solide connaissance de la question. Les exemples s'appuient sur le fameux outil gratuit de data mining open source Weka.

Data Mining Data Mining
Practical Machine Learning Tools And Techniques

de I.H. Witten, Eibe Frank
Morgan Kaufmann Publishers
(Langue anglaise)
560 pages
Prix librairie : 43,65 Euros



Dispo chez : www.amazon.fr

D 1 2 3 4 5 6 7



Envoyer le lien de cet article par e-mail  Recommandez cet article

Retwittez cet article   Partagez cet article sur Facebook  
Partagez sur LinkedIn  Partagez cet article sur Viadeo  Partagez  cet article sur Del.icio.us  Partagez cet article sur Yahoo !  Partagez sur BlogMarks  Partagez cet article sur Scoopeo  Bookmark Google  



Copyright : Alain FERNANDEZ ©1998-2010 Tous droits réservés Mentions légales


Piloter.org vous a intéressé ?
Envoyez le lien www.piloter.org par e-mail Recommandez ce site
Envoyer le lien de cet article par e-mail  Conseillez cet article
Retwittez cet article   Partagez cet article sur Facebook  Partagez sur LinkedIn  Partagez cet article sur Viadeo  


Performance Management
Nouveaux tableau de bord
Les nouveaux tableaux de bord des managers
Le projet décisionnel en totalité 4ème édition 2008

Consultez la fiche détaillée


Articles les + lus
Les progiciels de la Business Intelligence, système Informatique Décisionnelle
Utiliser Reporting et Requêteur ad hoc
Qu'est-ce que ITIL ? Information Technology Infrastructure Library
La Business Intelligence, le projet Informatique Décisionnelle
Principes, méthodes et outils pour mieux gérer son temps
La méthode Six Sigma en pratique


Gestion de projet
conduite de projet
Le chef de projet efficace
Réussir les projets complexes
Les pratiques de bon sens.
3ème éd 2009

Consultez la fiche détaillée


Gouvernance d'entreprise
Business Intelligence
Business Intelligence
Briques de la BI
Le projet BI, le livre
Les Perspectives
Perspectives BI
BI état de l'art
La BI de demain
BI 2.0
BI 2.0 en pratique
BI Temps réel
Analyse BI
Outils d'analyse
Statistiques
Analyse prédictive
Arbre de decision
Data Mining
Text Mining
Map Reduce
Hadoop
La qualité des données
Collectez les données ETL
Gouvernance des données
MDM Master Data Management
Projet MDM
ROI du MDM
Meta données
BI et ERP (PGI)
Le data warehouse
Data Warehousing
Data Warehouse
Data Mart
Architecture Data Warehouse
Projet Data Warehouse
Modélisation Data Warehouse
ROI du projet
Les briques essentielles
Reporting et Requêteur
Reporting financier
Tableaux de bord et KM 
Portail décisionnel
Décisionnel Open Source 
Analyse Olap
Pourquoi Olap ?, Qu'est-ce que OLAP ?, Modèle de CODD, Nouveau modèle, Conception Olap, ROLAP, MOLAP, HOLAP... , Essayez Olap
Les outils décisionnels
Outils decisionnels
IBM, Oracle, Hyperion Solution, Microsoft, SAP Business Objects, SAS institute, Qliktech, Information Builders, Dundas Data Visualization, Corda Technologies, Prophix, Infor
Projet décisionnel
Conduire le projet , Le projet decisionnel , Le système de pilotage , Le système decisionnel
Les Ressources de la BI
Livres de la BI
Livres du Data Mining
Sites de la BI
Le projet BI en 5 points
10 causes d'echec BI

References du Portail
Glossaire
Sites de reference
Plan du site 1/2
Plan du site 2/2
Contact
A propos...
Copyright©


Toutes les pages de ce site sont sous copyright Alain Fernandez 1998-2010

IDDN Certification



***********************
Nouveaux tableaux de bord des managers Alain Fernandez, cliquez pour consulter la fiche
ccccccccccccccccccccc

 Projet BI   Architecture BI   Perspectives BI   BI 2.0   Outils d'analyses   M.D.M   Data Warehouse   Olap   Reporting   BI Open Source