Chaine youtube Piloter.org   Piloter.org sur facebook   Profil  Linkedin   Actualités Twitter
Plus de 800 fiches pratiques pour les managers, sans pub et sans traceurs…
Le Portail du Manager Innovant
Chaine youtube Piloter.org Je suis aussi  sur facebook  Je suis aussi sur  Linkedin  Actualités Twitter
×
★ Tous les articles classés ★

Business Intelligence Open Source, principe et produits

Depuis déjà quelques années, les solutions de Business Intelligence Open source sont étudiées selon les mêmes critères que les solutions propriétaires. Tout en sachant que l'open source signifie code ouvert, ils sont une sérieuse limite aux éventuelles "back door". Mais ce n'est pas l'unique avantage de ces solutions.

La BI à l'heure de l'Open Source (OSS)

BI open-source

Qu'est-ce que l'Open Source (OSS) ?

L'informatique décisionnelle ou Business Intelligence est un secteur des technologies de l'information pour l'entreprise toujours en essor. À juste titre.

Le contexte économique est complexe et l'information mérite d'être correctement collectée et traitée pour assure une prise de décision efficace.

L'offre de progiciels Business Intelligence Open Source disponibles est désormais à peu près en phase avec les exigences attendues pour une majorité d'applications d'entreprise.

Logiciels BI Open Source, le principe

Ces toutes dernières années, le monde de l'édition de progiciels d'entreprise Open Source, dont la BI fait partie, est entré dans une phase de restructuration de grande ampleur. Le secteur de la BI Open source est un secteur à suivre de très près.

Avant de poursuivre, simplement une petite remarque à propos de la définition d'Open Source. Un progiciel en Open Source n'est pas nécessairement gratuit. Les deux termes ne sont pas synonymes malgré une croyance encore tenace.

Pour mémoire

Un progiciel Open Source est un progiciel dont l'ensemble des programmes sources est publié en intégralité. Il peut être redistribué, ou modifié. Il n'est pas nécessairement gratuit.
Linux, Apache, MySQL, Mozilla FireFox pour ne citer que les plus connus sont des exemples de progiciel Open Source.

Depuis déjà quelques années, le marché des outils décisionnels open source est en pleine restructuration.

« Concentration » semble d'ailleurs être le mot clé pour décrire cette évolution...

Concentration signifie absorption

Les plus gros absorbent les plus petits. Seuls les éditeurs de solutions de grande envergure peuvent encore escompter faire leur trou sur ce marché en pleine croissance.

Pour résister face aux ténors de la profession et éviter d'être mangé, il faut grossir et manger à son tour les plus petits. Il ne s'agit pas seulement d'une mise en application des lois de la nature à l'économie.

La chaîne décisionnelle est en effet fort complexe. Pour asseoir sa pérennité, l'éditeur doit couvrir les trois étapes majeures du processus :

  • Étape 1. Collecte et stockage des données
  • Étape 2. Transformation des données en informations
  • Étape 3. Présentation
Proposer la chaîne complète n'est pas à la portée de petits éditeurs.

Le client, le best of breed Vs solutions durables

De son côté, le client ne peut plus se contenter du « Best of breed », séduisante recette qui consiste à faire son marché et à sélectionner chez l'un ou l'autre le meilleur produit pour chacune des phases du processus.

Cette recette ne peut tenir la route bien longtemps par manque de standard et de réelle compatibilité entre les produits. La question de la cohérence de la chaîne dans le temps et les problèmes de maintenance à répétition viennent rapidement à bout des avantages initiaux.

Dans tous les cas, le marché n'a pas encore atteint son stade de maturité et il faut s'attendre à de nouvelles annonces de rachats et de rapprochements. Seul les éditeurs proposant la chaîne complète tiendront leurs promesses.

ProspectionVoir ici le tableau récapitulatif des outils de la Business Intelligence Open Source, la synthèse. La suite de l'article présent propose un panorama plus détaillé.

Panorama des suites décisionnelles Open Source

Projet BI Open Source

Le projet Business Intelligence est un projet complexe qui comporte au minimum les briques fonctionnelles suivantes :
1) Collecter
2) Stocker
3) Distribuer
4) Exploiter

Bâtir une suite logiciel implique donc de fournir un ensemble cohérent de progiciels intégrés au sein d'une logique unique couvrant totalement ou partiellement l'ensemble de ces fonctions. C'est non seulement la qualité des produits pris séparément mais aussi la cohérence de la chaîne globale qu'il s'agit de considérer. Le coût d'achat, soit-il modéré, est une préoccupation secondaire. De toutes façons, la principale qualité de l'Open Source réside dans son appellation même : les sources des programmes sont ouverts ce qui signifie : vérifiables et évolutives.

Intégration

Cet effort d'intégration n'est pas des moindres. Pour en apprécier l'ampleur, il suffit de suivre le parcours au forcing des géants de l'édition informatique d'entreprise pour absorber les acteurs de la Business Intelligence, achetés et rachetés les uns après les autres.

Le projet Pentaho

Pentaho est un projet global couvrant l'ensemble de la chaîne décisionnelle.
Pentaho comporte les briques suivantes : reporting, analyse, tableau de bord, data mining et workflow.
Le projet Pentaho a été initié par des vétérans du décisionnel, des ex de Business Objects, Cognos, Hyperion, IBM, Oracle, et SAS.
Ce projet est réellement ambitieux. Il est à suivre de près. Selon les propos des fondateurs, leur objectif n'est pas uniquement de proposer une alternative Open Source, mais bien de dépasser en terme de fonctionnalités les offres du marché. Ils n'attendent pas que vous choisissiez cette solution parce qu'elle est Open Source, mais bien parce que c'est la meilleure.
Ambitieux, vous dites ? À suivre en tout cas.

Le projet Pentaho intègre les produits suivants :

  • Mondrian - Open Source OLAP Server
  • Pentaho Reporting Engine - Open Source Reporting
  • Kettle - Open Source Data Integration (ETL)
  • Pentaho - Comprehensive Open Source BI Suite
  • Weka - Open Source Data Mining

En 2015, Pentaho a été racheté par Hitachi Data System, Depuis 2017 Pentaho est intégré au sein de Hitachi Ventara.

Voir le site web : www.hitachivantara.com.

À lire

Pentaho Solutions: Business Intelligence and Data Warehousing With Pentaho and Mysql

Pentaho Kettle SolutionsPentaho Solutions
Roland Bouman, Jos Van Dongen
John Wiley & Sons
648 pages (anglais)
Dispo :
www.amazon.fr


Le projet Spago

Spago est un projet d'intégration de progiciels décisionnels Open Source. L'objectif étant de proposer un cadre (framework) global. Le site : www.knowage-suite.com .

Le projet Jaspersoft

Jaspersoft est un ensemble d'outils de reporting désormais présentés sous forme de suites. Jaspersoft se compose (actuellement) des produits suivants :
  • JasperReports - Bibliothèque de rapports
  • JasperStudio - Conception de rapports graphiques
  • JasperServer - Serveur de rapports interactifs
  • JasperAnalysis - Analyse interactive des données/OLAP
  • JasperETL - Intégration des données
Le site (en français) : www.jaspersoft.com

Les autres projets

Il existe d'autres projets d'intégration globale du système décisionnel, comme par exemple MarvelIT. Cependant, ils ne sont pas tous aussi aboutis que Pentaho ou Spago pour ne citer que ceux-ci.

Les produits DataMining Open source

Le chapitre Définition du Data Mining, intégré dans le dossier analyse des données, précise le rôle du data mining, son utilisation et le déroulement du projet.

Weka

Waikato Environment for Knowledge Analysis
Collection d'outils de Data Mining et techniques connexes développées en Java par l'Université de Waikato, New Zeland (collaboration du CERN)
Weka se connecte aux bases SQL en utilisant le JDBC (Java Database Connectivity), développement Java oblige.
Le site : www.cs.waikato.ac.nz/ml/weka/
Weka est désormais intégré dans la Pentaho Open BI Suite.
Pour ceux qui souhaitent s'initier, rien de plus facile. Weka se télécharge depuis sourceforge.net, par exemple : la version windows.

Rapid Miner

Rapid Miner, anciennement YALE (Yet Another Learning Environment), est un produit open source de data mining écrit en Java. C'est un outil assez complet et bien diffusé. Il intègre des fonctions d'ETL et sait exploiter les données de multiples sources (Microsoft Office, Sybase, Oracle, mySql...) de surcroît, il est assez ergonomique et intègre la bibliothèque d'apprentissage de Weka.

Voir aussi

À lire

Un ouvrage est associé au développement du projet de data mining libre Weka. Facile d'accès, suffisamment documenté et explicite pour que le lecteur puisse se forger une solide connaissance de la question. Les exemples s'appuient sur le fameux outil gratuit de data mining open source Weka. (Ouvrage en anglais)

Data MiningData Mining
I.H. Witten, Eibe Frank
Morgan Kaufmann Publishers
4ème édition 2016   654 pages
Prix : 59 Euros
Dispo :
www.amazon.fr & Format Kindle


Pour la petite histoire, le Weka est un oiseau de la taille d'une petite poule, assez commun dans le bush en Nouvelle-Zélande, il ne vole pas et n'est pas vraiment farouche. En période de nidification, son cri assez curieux surprend les non-autochtones au détour d'un chemin de randonnée. C'est bien ce volatile qui orne le portail web de l'université Waikato. Panorama des solutions Data Warehouse et OLAP Open source : la Business Intelligence et le progiciel libre...

Panorama Data Warehouse et OLAP Open Source

Data Warehouse

Le Data Warehouse est un système de base de données spécialisée dans le stockage des données utilisées à des fins décisionnelles.
Le Data Warehouse constitue le coeur du système décisionnel. Consultez le dossier Data Warehousing et la définition du Data Warehouse pour en savoir un peu plus.

Infobright

Infobright est le moteur Data Warehouse pour le serveur de bases de données MySQL. Infobright automatise la gestion du célèbre SGBD dans une logique d'entrepôt de données assurant une capacité de plusieurs téraoctets selon l'éditeur.

Il existe deux versions :

  • la version en téléchargement libre, Community Edition (ICE)
  • la version plus "pro", Infobright Enterprise Edition (IEE)
Le site de l'éditeur : hwww.ignitetech.com/infobright-db/

OLAP

Les bases de type OLAP sont destinées à faciliter les interrogations à usage décisionnel en permettant les analyses multi dimensionnelles.
Voir à ce sujet le dossier Qu'est-ce que OLAP ?

Palo Suite

Serveur Olap intégrant un outil d'ETL, accessible depuis le web et compatible Microsoft Excel
Le site de l'éditeur : https://www.jedox.com/fr/

Jedox Palo OLAP Server

La suite Palo de Jedox intègre un moteur Olap : Palo OLAP Server.
Le site de l'éditeur : www.jedox.fr

Mondrian Pentaho

Mondrian est un serveur Olap écrit en langage Java. Mondrian utilise le langage d'interrogation MDX.
Mondrian, précurseur du décisionnel Open source, est désormais intégré au projet Pentaho.
Le site de l'éditeur itachivantara.com/s/article/mondrian

Autres solutions OLAP open source

  • On n'oubliera pas Jpivot, bibliothèque adossée à la base OLAP Mondrian
    jpivot.sourceforge.net/
  • On pourra aussi s'intéresser au projet Pocolap "The little OLAP Project". Il se télécharge sur sourceforge.

Panorama des outils ETL en Open Source

La collecte des données

La collecte des données éparses dans l'entreprise est une fonction fondamentale du système décisionnel. Récupérer les données stockées dans les bases de production pour les utiliser à des fins décisionnels nécessite une série d'opérations particulièrement conséquentes. La phase de collecte est non seulement la plus difficile mais c'est aussi la plus chronophage et la plus coûteuse, ceci entraînant cela.

Les outils ETL Open Source

La phase de collecte est non seulement la plus difficile mais c'est aussi la plus chronophage et la plus coûteuse, ceci entraînant cela.

Les outils d'ETL (Extract Transform Load) ont en charge cette délicate opération du système global décisionnel. Se référer au dossier Collecte des données ETL pour de plus amples informations sur ce sujet particulièrement délicat.

Talend Open Studio

Talend Open Studio est un produit d'ETL particulièrement complet. Un produit à suivre.
Talend Open Studio génère directement les tâches de transformation en Java ou en PERL et dispose de multiples connecteurs pour les principaux produits logiciels d'entreprises.
Le site de l'éditeur : www.talend.com/
La dernière version est téléchargeable sur le site de l'éditeur.

Pentaho Data Integration (PDI)

Pentaho Data Integration (PDI) est en fait à la base la solution d'ETL Kettle intégrée au sein du projet Pentaho.
Le site de l'éditeur : Pentaho Data Integration

À lire

Pentaho Kettle Solutions: Building Open Source ETL Solutions with Pentaho Data Integration

Pentaho Kettle SolutionsPentaho Kettle Solutions
Matt Casters, Roland Bouman, Jos Van Dongen
John Wiley & Sons
720 pages
Prix : 45 Euros
Dispo chez :
www.amazon.fr & Format Kindle

Enhydra Octopus

Enhydra Octopus est un outil d'Extraction, Transformation, Loading. Il se connecte aux bases de données sous JDBC et s'appuie comme il se doit sur un schéma XML.
Le site de l'éditeur : opensource-it.com/

Clover ETL

Clover ETL est une solution d'intégration des données écrite en Java.
Le site de l'éditeur : cloveretl.com

Ketl

Ketl est un produit d'ETL basé sur une architecture Java.
Le site de l'éditeur : linuxlinks.com/ketl

Voir aussi GeoKettle site web https://www.spatialytics.org/projects/geokettle/ et sur sourceforge : https://sourceforge.net/projects/geokettle/?source=directory

Panorama des outils Reporting Open Source (OSS)

Définition Reporting Open Source

image d'un rapport manuelLes outils de reporting permettent de réaliser plus ou moins automatiquement des rapports d'activités. L'outil de reporting interroge les bases de données selon un schéma de requêtes SQL élaboré au préalable.

L'offre reporting Open source, désormais opérationnelle, est suffisamment aboutie pour entrer en compétition avec les produits d'éditeur et intéresser les prescripteurs des projets de Business Intelligence.

Reporting ad hoc

Remarque : les outils disposant d'un module d'interrogation "ad hoc" permettent de construire ses propres requêtes. Cette fonction qui n'est pas du reporting à proprement parlé n'est pas systématiquement intégrée. Pour en savoir plus, voir le dossier Définition du reporting en ligne sur ce site.

Les outils de Reporting open Source

Jasper report

Jasper Report a été racheté par TIBCO, une société américaine d'intégration informatique. JasperReport est toujours aujourd'hui l'outil le plus utilisé par les entreprises friandes de solutions non-propriétaires. Jasper Report, développé en Java, s'exécute aussi bien sur plate-forme : Windows, Linux, ou Mac.
La solution de reporting se compose d'une collection de composants :
  • JasperReport Library : une bibliothèque de classes Java et d'APIs
  • iReport Report Designer,
  • JasperReport Studio : deux outils de conception, le second plus récent est prévu pour remplacer le premier
  • JasperReport Server.
Jasper Report est populaire, l'outil bénéficie donc d'un support conséquent que ce soit au niveau de la documentation disponible que des forums spécialisés.
Le site open source : community.jaspersoft.com (anciennement sous Sourceforge)
Cette solution open source de reporting était déjà supportée par une société commerciale, TIBCO a conservé le site d'origine : www.jaspersoft.com.

Eclipse Birt

La solution Birt intègre plusieurs composant : Report Designer, Runtime, chart Engine, chart Designer et le Viewer. Le Design Engine API vous permet d'intégrer la solution de reporting au sein de vos applications maison.
Birt est un produit de Eclipse. Eclipse est une communauté open source qui génère des rapports pour les applications web.
www.eclipse.org/birt/phoenix

Jfreereport

Jfreereport est une bibliothèque de fonctions reporting écrites en Java et désormais intégrée dans le projet Pentaho.
Pentaho est une solution complète de Business Intelligence.La suite inclut aujourd'hui les principales briques d'un projet professionnel.

Quelques autres solutions dignes d'intérêt

Datavision

Datavision sur Sourceforge datavision.sourceforge.net

Open Report

Open Report est un générateur de rapport dynamique directement au niveau du navigateur.
Le site de l'éditeur : oreports.com

DynamicReports

DynamicReports utilise la solution JasperReports pour créer très rapidement des rapports opérationnels.

Le site de l'éditeur : DynamicReports

Voir aussi Jfreechart, www.jfree.org, une librairie graphique Java.


L’auteur

Alain FernandezAlain Fernandez est un spécialiste de la mesure de la performance et de l’aide à la décision. Au fil de ces vingt dernières années, il a conduit et accompagné de nombreux projets d'entreprise en France et à l'International. Il est l'auteur de plusieurs livres publiés aux Éditions Eyrolles consacrés à ce thème et connexes, vendus à plusieurs dizaines de milliers d'exemplaires et régulièrement réédités.
Me suivre sur LinkedIn

Voir aussi... À ce sujet, voir aussi

  • Comment choisir un progiciel open source d entreprise ?Comment choisir un progiciel open source d'entreprise ?
    Quelques conseils et recommandations pour bien choisir sa solution Open Source pour le SI de l'entreprise ?...
  • ERP Enterprise Resource Planning Progiciel de Gestion IntégréeERP Enterprise Resource Planning Progiciel de Gestion Intégrée
    Centre fédérateur des informations d'entreprise et des processus métiers, les ERP réunissent les fonctions essentielles dites de gestion comme les RH, le commercial, la production, la finance, la comptabilité, les achats...
  • Définition du CRM Customer Relationship Management CRM Customer Relationship Management
    CRM désigne un ensemble de méthodes, de pratiques et d'outils technologiques assurant une gestion plus efficace dans la durée des relations avec les clients et les prospects. En français, on parle de Gestion de la Relation Client (GRC).
  • Knowledge Management  Open SourceKnowledge Management Open Source
    Les des principaux produits logiciels de Knowledge Management publiés sous licence Open Source. La notion de gestion des connaissances englobe de nombreux domaines interconnectés. Nous nous intéresserons essentiellement à la thématique de la Gestion des Contenus (GDC) et au e-learning.

Ressources Web Ressources web


eBook gratuit

Gimsi méthode pour concevoir et réaliser le projet Business IntelligenceMéthode Gimsi
Pour concevoir et réaliser le projet BI en totalité
Alain Fernandez
38 pages

Téléchargement libre


A lire À lire...

Les 10 étapes de la méthode Gimsi sont ici expliquées et illustrées. Best-seller, vendu à plus de 40 000 exemplaires...

Les nouveaux tableaux de bord des managersLes nouveaux tableaux de bord des managers
Le projet Business Intelligence clés en main

Alain Fernandez
6ème édition Eyrolles
468 pages

Voir la fiche du livre »»»

Pour acheter ce livre :

Amazon.fr  Eyrolles.com  Fnac.com

Format ebook : PDF ou ePub, Kindle


Comprendre les enjeux de l'open source avec son principal supporter. Depuis plus de 25 ans, Richard Stallman défend le logiciel libre. À l'origine de la démarche GNU et du copyleft, Richard Stallman milite activement et fermement contre les brevets logiciels...

Richard Stallman et la révolution des logiciels libres Richard Stallman et la révolution des logiciels libres
Richard M. Stallman, Sam Williams, Christophe Masutti
Livio Éditions
340 pages

Dispo : www.amazon.fr

Livres à lire Piloter l'Entreprise Innovante...

La prise de décision en équipe ne s'improvise pas. Pour parvenir à ce mode de management délégataire, crucial pour les organisations actuelles, privées comme publiques, un indispensable travail de fond prélable est nécessaire. La méthode SOCRIDE centrée sur les questions incontournables de Confiance et de Reconnaissance est ici expliquée, illustrée et détaillée :

Tableaux de bord du manager innovant, le livreLes tableaux de bord du manager innovant
Une démarche en 7 étapes pour faciliter la prise de décision en équipe

Alain Fernandez
Éditeur : Eyrolles
Pages : 320 pages

Fiche technique Consultez la fiche technique »»»

Pour acheter ce livre :

amazon.fr  Eyrolles.com  ="Fnac.com"

Format ebook : PDF & ePub, Format Kindle


Voir aussi...


Les fiches du dossier: Outils BI & Open Source

Le mot du jour

De l'autorité
Les systèmes autoritaires sont de loin les plus courants mais ce ne sont pas les plus efficaces. Dans un système autoritaire toute défaillance doit être sanctionnée. S'il y a un écart c'est qu'il y a faute. Qui est reponsable ? Ce sont des têtes que l'on veut et non des solutions. Ce système de management ne favorise pas la recherche de progrès continu..

Partagez cet article...

Envoyer le lien de cet article par e-mail    Twitter Facebook Linkedin Retour au début
(total partages cumulés > 45)