Chaine youtube Piloter.org   Piloter.org sur facebook   Profil  Linkedin   Actualités Twitter
Le Portail du Manager Innovant
Syndication, fil RSS du site piloter.org  Je suis aussi  sur facebook  Je suis aussi sur  Linkedin  Actualités Twitter
×
★ TOUS LES ARTICLES ★

Data Mining Open Source

Mise à jour le 24 février 2023  Par   Partagez

Les outils Data Mining Open Source

Définition Data Mining Open Source

Le data mining est un terme générique pour désigner une famille d'outils d'analyse particulièrement adaptés à l'exploitation des grandes masses de données. Le data mining permet notamment de rechercher des structures difficilement identifiables et des corrélations peu perceptibles avec les techniques d'analyses statistiques plus classiques.

Les produits Open source

Le chapitre Définition du Data Mining, intégré dans le dossier analyse des données, précise le rôle du data mining, son utilisation et le déroulement du projet.

Weka

Waikato Environment for Knowledge Analysis
Collection d'outils de Data Mining et techniques connexes développées en Java par l'Université de Waikato, New Zeland (collaboration du CERN)
Weka se connecte aux bases SQL en utilisant le JDBC (Java Database Connectivity), développement Java oblige.
Le site : www.cs.waikato.ac.nz/ml/weka/
Weka est désormais intégré dans la Pentaho Open BI Suite.
Pour ceux qui souhaitent s'initier, rien de plus facile. Weka se télécharge depuis sourceforge.net, par exemple : la version windows.

Rapid Miner

Rapid Miner, anciennement YALE (Yet Another Learning Environment), est un produit open source de data mining écrit en Java. C'est un outil assez complet et bien diffusé. Il intègre des fonctions d'ETL et sait exploiter les données de multiples sources (Microsoft Office, Sybase, Oracle, mySql...) de surcroît, il est assez ergonomique et intègre la bibliothèque d'apprentissage de Weka.

Voir aussi

À lire

Un ouvrage est associé au développement du projet de data mining libre Weka. Facile d'accès, suffisamment documenté et explicite pour que le lecteur puisse se forger une solide connaissance de la question. Les exemples s'appuient sur le fameux outil gratuit de data mining open source Weka. (Ouvrage en anglais)

Data MiningData Mining
I.H. Witten, Eibe Frank
Morgan Kaufmann Publishers
4ème édition 2016   654 pages
Prix : 59 Euros
Dispo :
www.amazon.fr & Format Kindle


Pour la petite histoire, le Weka est un oiseau de la taille d'une petite poule, assez commun dans le bush en Nouvelle-Zélande, il ne vole pas et n'est pas vraiment farouche. En période de nidification, son cri assez curieux surprend les non-autochtones au détour d'un chemin de randonnée. C'est bien ce volatile qui orne le portail web de l'université Waikato.


Piloter l'Entreprise Innovante...

De l'importance de réformer les principes archaïques de contrôle de la mesure de la performance pour enfin dynamiser la prise de décision en équipe, incontournable clé de l'entreprise innovante. La méthode SOCRIDE centrée sur les questions de Confiance et de Reconnaissance est ici expliquée, illustrée et détaillée :

Tableaux de bord du manager innovant, le livreLes tableaux de bord du manager innovant
Une démarche en 7 étapes pour faciliter la prise de décision en équipe

Alain Fernandez
Éditeur : Eyrolles
Pages : 320 pages

Consultez la fiche technique »»»

Pour acheter ce livre :

   

Format ebook : PDF & ePub, Format Kindle

À découvrir...

 Ratios de gestion financière Ratios de gestion financière
Un ratio de gestion n'est pas un indicateur de performance clé par définition. Il n'est pas inutile de le rappeler. Un indicateur est nécessairement associé à un objectif précis qui oriente la démarche de progrès. À l'occasion, un ratio de gestion peut être un indicateur de performance s'il répond étroitement à cette définition pour le cas particulier à considérer. En tout cas les ratios de gestion sont bien pratiques pour prendre le pouls d'une activité ou d'une entreprise le cas échéant. Voyons les principaux. 

Voir aussi...


Partagez cet article...

Envoyer le lien de cet article par e-mail   
(total partages cumulés > 165)