Utiliser le Data Mining Exploiter les données du Data Warehouse

Qu'est-ce que le Data mining ?

" The devil is in the details"

Le Data Mining est en fait un terme générique englobant toute une famille d'outils facilitant l'analyse des données contenues au sein d'une base décisionnelle de type Data Warehouse ou DataMart.

Certains considèrent cette technique comme "l'art" voire même la "science" de l'extraction d'informations significatives de grandes quantités de données.

En peu de mots, le Data Mining présente l'avantage de trouver des corrélations informelles entre les données.
Il permet de mieux comprendre les liens entre des phénomènes en apparence distincts et d'anticiper des tendances encore peu discernables.

Pour quelles applications utiliser le Data mining ?
A contrario des méthodes classiques d'analyses statistiques, le Data Mining est particulièrement adapté au traitement de grands volumes de données. Avec l'augmentation de la capacité de stockage des supports informatiques, un maximum de renseignements seront captés, ordonnés et rangés au sein du Data Warehouse. Comportement des acheteurs, caractéristiques des produits, historisation de la production, désormais plus rien n'échappe à la collecte. Avec le Data Mining, ces "tera-nesque" bases de données sont exploitables.

Quel est le principe du data mining ?

Les outils de data mining proposent différentes techniques à choisir en fonction de la nature des données et du type d'étude que l'on souhaite entreprendre.

  • Il existe ainsi des méthodes utilisant les techniques de classification et de segmentation.
  • Les méthodes utilisant des principes d'arbres de décision assez proches des techniques de classification
  • Les méthodes fondées sur des principes et des règles d'associations ou d'analogies
  • Les méthodes exploitant les capacités d'apprentissage des réseaux de neurones
  • Et pour les études d'évolution de populations, les algorithmes génétiques

Comment utiliser le Data Mining ?

Conseil 1 : Accordez le soin nécessaire à la phase de collecte des données.
La collecte des données est une étape fondamentale. Elle est longue et coûteuse. Il est indispensable de disposer de la garantie de la fiabilité des données avant de lancer la moindre analyse.

Conseil 2 : L'étude des résultats mérite toute votre attention.
Il ne faut pas hésiter à présenter différemment le problème et à tester d'autres techniques d'analyse avant de s'engager sur un résultat.

Conseil 3 : Le Data mining n'est pas un oracle absolu. Une absence de réponse du système ne doit pas être systématiquement considérée comme une négation.
Il faut quelquefois prendre la précaution d'aborder le problème sous un autre angle avant de s'engager.

Quelques produits types représentatifs

IBM intelligent miner, SAS Enterprise Miner, Isoft Alice.

Principal produit Open Source

Weka développé en Java est un projet Data Mining Open Source.



Copyright : Alain FERNANDEZ ©1998-2009- Tous droits réservés


Business Intelligence
Business Intelligence
Briques de la BI
Le projet BI, le livre
Conduire le projet
Collecter
Collectez les donnees ETL
Meta donnees
BI et ERP (PGI)
Data Warehouse
Data Warehouse
Projet Data Warehouse
Modelisation Data Warehouse
Architecture Data Warehouse
ROI du projet
Olap
Pourquoi Olap ?
Qu'est-ce que OLAP ?
Modele de CODD
Nouveau modele
Conception Olap
ROLAP, MOLAP, HOLAP...
Essayez Olap
Briques essentielles
Portail Decisionnel
Data Mining
Reporting et Requeteur
Reporting financier
Tableaux de bord et KM 
Decisionnel Open Source 
Outils decisionnels
Outils decisionnels
IBM, Oracle, Hyperion Solution, Microsoft, SAP Business Objects, SAS institute, Qliktech, Information Builders, Dundas Data Visualization, Corda Technologies, Prophix, Infor
Open Source
Le principe de l'Open Source
Projets Open Source
Outils ETL Open Source
outils Reporting Open Source
outils OLAP et Data Warehouse Open Source
outils Data Mining Open Source
Les Ressources
Livres de la BI
Livres du Data Mining
Sites de la BI
Le projet BI en 5 points
10 causes d'echec BI

  References du BPM
Performance Management
Performance Entreprise, Six Sigma, DMAIC, Management des processus, BPM , BAM , SOA , EAI , Processus et activites metiers, Qualite ISO, Systeme Qualité , TQM, Balanced Scorecard, Principe BSC, Strategy Maps, Tableau de bord et KPI
Business intelligence
Progiciel de la BI, Projet BI, ETL, Data Warehouse, Modelisation DW, ROI , Olap, Portail, Data Mining, Reporting, Outils decisionnels, BI Open Source
Developpement durable
Rapport Brundtland, Tableau de bord du developpement durable, Indicateurs de performance, Le projet, ISO 14001, Normes et referentiels, Performance financiere
Gouvernance
Gouvernance d'entreprise, Affaire Enron, Loi Sarbanes Oxley, Normes IAS IFRS
Gouvernance du SI
Les risques, Urbanisation, CobiT, CMMI, ITIL
IT management
Piloter par les enjeux
CRM, ERP, SCM, KM, SI, Enjeux des technologies
Efficacite du manager
Gestion du temps, Lire rapidement, Formations MBA, Formation Continue, Cours gratuits, Ebook
Librairie du manager
Livres de management, Mieux manager, Gestion de projet, Business Intelligence, Entreprendre, Economie, Efficacite professionnelle, Developpement personnel

References du Portail
Glossaire
Sites de reference
Plan du site
Contact
A propos...
Copyright©


Toutes les pages de ce site sont sous copyright Alain Fernandez 1998-2009

IDDN Certification



#090703
***********************
Nouveaux tableaux de bord des managers Alain Fernandez, cliquez pour consulter la fiche

 Projet BI   ETL   Data Warehouse   OLAP   Data Mining   Reporting   Reporting financier   BI Open Source