Data Mining Open Source

Les outils Data Mining Open Source

Le data mining est un terme générique pour désigner une famille d'outils d'analyse particulièrement adaptés à l'exploitation des grandes masses de données. (Pour en savoir plus : Définition du Data Mining )

Weka

(Waikato Environment for Knowledge Analysis) Collection d'outils de Data Mining et techniques connexes développés en Java par l'Université de Waikato New-Zeland (collaboration du CERN)
Weka se connecte aux bases SQL en utilisant le JDBC (Java Database Connectivity), développement Java oblige. Le site : www.cs.waikato.ac.nz/ml/weka/
Weka est désormais intégré dans la Pentaho Open BI Suite
Pour ceux qui souhaite s'initier, rien de plus facile, weka se télécharge depuis sourceforge.net, par exemple La version windows
La doc est sur le site Wiki dédié au projet Doc Weka

Un livre est associé à ce développement :

Data Mining
Practical Machine Learning Tools and TechniquesData Mining
Practical Machine Learning Tools and Techniques

Ian H. Witten , Eibe Frank
Morgan Kaufmann
550 Pages, 50,90€



4ème de couverture :
"As with any burgeoning technology that enjoys commercial attention, the use of data mining is surrounded by a great deal of hype. Exaggerated reports tell of secrets that can be uncovered by setting algorithms loose on oceans of data. But there is no magic in machine learning, no hidden power, no alchemy. Instead there is an identifiable body of practical techniques that can extract useful information from raw data. This book describes these techniques and shows how they work. The book is a major revision of the first edition that appeared in 1999. While the basic core remains the same, it has been updated to reflect the changes that have taken place over five years, and now has nearly double the references. The highlights for the new edition include thirty new technique sections; an enhanced Weka machine learning workbench, which now features an interactive interface; comprehensive information on neural networks; a new section on Bayesian networks; plus much more."


Achat en ligne avec Eyrolles.com ou chez www.amazon.fr

Pour la petite histoire, le Weka est un oiseau de la taille d'une petite poule, assez commun dans le bush en Nouvelle Zelande, il ne vole pas et n'est pas vraiment farouche. En période de nidification, son cri est assez curieux, en tout cas pour les non autochtones. C'est bien ce volatile qui orne le portail web de l'université Waikato.

Rapid Miner

Rapid Miner, anciennement YALE (Yet Another Learning Environment) est un produit open source de data mining écrit en Java.


Copyright : Alain FERNANDEZ ©1998-2009- Tous droits réservés


BI Open Source
Le principe de l'Open Source
Projets Open Source
Outils ETL Open Source
outils Reporting Open Source
outils OLAP et Data Warehouse Open Source
outils Data Mining Open Source

Business Intelligence
Business Intelligence
Briques de la BI
Collecter
Collectez les donnees ETL
Meta donnees
BI et ERP (PGI)
Data Warehouse
Data Warehouse
Projet Data Warehouse
Modelisation Data Warehouse
Architecture Data Warehouse
ROI du projet
Olap
Pourquoi Olap ?
Qu'est-ce que OLAP ?
Modele de CODD
Nouveau modele
Conception Olap
ROLAP, MOLAP, HOLAP...
Essayez Olap
Briques essentielles
Portail Decisionnel
Data Mining
Reporting et Requeteur
Reporting financier
Tableaux de bord et KM 
Decisionnel Open Source 
Outils decisionnels
Outils decisionnels
IBM, Oracle, Hyperion Solution, Microsoft, SAP Business Objects, SAS institute, Qliktech, Information Builders, Dundas Data Visualization, Corda Technologies, Prophix, Infor

  References du BPM
Performance Management
Performance Entreprise, Six Sigma, DMAIC, Management des processus, BPM , BAM , SOA , EAI , Processus et activites metiers, Qualite ISO, Systeme Qualité , TQM, Balanced Scorecard, Principe BSC, Strategy Maps, Tableau de bord et KPI
Business intelligence
Progiciel de la BI, Projet BI, ETL, Data Warehouse, Modelisation DW, ROI , Olap, Portail, Data Mining, Reporting, Outils decisionnels, BI Open Source
Developpement durable
Rapport Brundtland, Tableau de bord du developpement durable, Indicateurs de performance, Le projet, ISO 14001, Normes et referentiels, Performance financiere
Gouvernance
Gouvernance d'entreprise, Affaire Enron, Loi Sarbanes Oxley, Normes IAS IFRS
Gouvernance du SI
Les risques, Urbanisation, CobiT, CMMI, ITIL
IT management
Piloter par les enjeux
CRM, ERP, SCM, KM, SI, Enjeux des technologies
Efficacite du manager
Gestion du temps, Lire rapidement, Formations MBA, Formation Continue, Cours gratuits, Ebook
Librairie du manager
Livres de management, Mieux manager, Gestion de projet, Business Intelligence, Entreprendre, Economie, Efficacite professionnelle, Developpement personnel

References du Portail
Glossaire
Sites de reference
Plan du site
Contact
A propos...
Copyright©



Toutes les pages de ce site sont sous copyright Alain Fernandez 1998-2009

IDDN Certification



#090703
Nouveaux tableaux de bord des managers Alain Fernandez, cliquez pour consulter la fiche

 BI Open Source   ETL O.S.   Reporting O.S.   Olap & DW O.S.   DataMining O.S.   Projets Open Source   La BI expliquée