Business Intelligence Open Source, principe et produits
Depuis déjà quelques années, les solutions de Business Intelligence Open source sont étudiées selon les mêmes critères que les solutions propriétaires. Tout en sachant que l'open source signifie code ouvert, ils sont une sérieuse limite  aux  éventuelles "back door". Mais ce n'est pas l'unique avantage de ces solutions.  
La BI à l'heure de l'Open Source (OSS)
Qu'est-ce que l'Open Source (OSS) ?
L'informatique décisionnelle ou Business Intelligence est un secteur des technologies de l'information pour l'entreprise toujours en essor.  À juste titre.
  Le contexte économique est complexe et l'information mérite d'être correctement collectée et traitée pour assure une prise de décision efficace. 
  L'offre de progiciels Business Intelligence Open Source disponibles est  désormais à peu près  en phase avec les exigences attendues pour une majorité d'applications  d'entreprise. 
Logiciels BI Open Source, le principe
 
Ces toutes dernières années, le monde de l'édition de progiciels d'entreprise  Open Source, dont la BI fait partie, est entré dans une phase  de restructuration de grande ampleur. Le secteur de la BI Open source est  un secteur à suivre de très près.
  Avant de poursuivre, simplement une petite remarque à propos de la définition d'Open Source. Un progiciel en Open Source n'est pas nécessairement gratuit. Les deux termes ne sont pas synonymes malgré une croyance encore tenace.
Pour mémoire
 Un progiciel Open Source est un progiciel dont l'ensemble des programmes sources est publié en intégralité. Il peut être redistribué, ou modifié. Il n'est pas nécessairement gratuit.
  Linux, Apache, MySQL, Mozilla FireFox pour ne citer que les plus connus sont des exemples de progiciel Open Source.
  
Depuis déjà quelques années, le marché des outils décisionnels open source est en pleine restructuration.
 « Concentration » semble d'ailleurs être le mot clé pour décrire cette évolution... 
Concentration signifie absorption
Les plus gros absorbent les plus petits. Seuls les éditeurs de solutions de grande envergure peuvent encore escompter faire leur trou sur ce marché en pleine croissance. 
  Pour résister face aux ténors de la profession et éviter d'être mangé, il faut grossir et manger à son tour les plus petits. Il ne s'agit pas seulement d'une mise en application des lois de la nature à l'économie. 
 La chaîne décisionnelle est en effet fort complexe. Pour asseoir sa pérennité, l'éditeur doit couvrir les trois étapes majeures du processus : 
- Étape 1. Collecte et stockage des données
  - Étape 2. Transformation des données en informations
 - Étape 3. Présentation
 
Proposer la chaîne complète n'est pas à la portée de petits éditeurs.
 
Le client, le best of breed Vs solutions durables 
De son côté, le client ne peut plus se contenter du « Best of breed », séduisante recette qui consiste à faire son marché et à sélectionner chez l'un ou l'autre le meilleur produit pour chacune des phases du processus.
   Cette recette ne peut tenir la route bien longtemps par manque de standard et de réelle compatibilité entre les produits. La question de la cohérence de la chaîne dans le temps et les problèmes de maintenance à répétition viennent rapidement à bout des avantages initiaux.
  Dans tous les cas, le marché n'a pas encore atteint son stade de maturité et il faut s'attendre à de nouvelles annonces de rachats et de rapprochements. Seul les éditeurs proposant la chaîne complète tiendront leurs promesses.
Panorama des suites décisionnelles Open Source 
  Projet BI Open Source
  Le projet Business Intelligence est un projet complexe qui comporte au minimum les briques fonctionnelles suivantes :
1) Collecter 
2) Stocker 
3) Distribuer 
4) Exploiter 
  
  Bâtir une suite logiciel implique donc de fournir un ensemble cohérent de progiciels intégrés au sein d'une logique unique couvrant totalement ou partiellement l'ensemble de ces fonctions. C'est non seulement la qualité des produits pris séparément mais aussi la cohérence de la chaîne globale qu'il s'agit de considérer. Le coût d'achat, soit-il modéré, est une préoccupation secondaire. De toutes façons, la principale qualité de l'Open Source réside dans son appellation même : les sources des programmes sont ouverts ce qui signifie :  vérifiables et évolutives.
  
  
  
  
   
Intégration
   Cet effort d'intégration n'est pas des moindres. Pour en apprécier l'ampleur, il suffit  de suivre le  parcours au forcing des géants de l'édition informatique d'entreprise pour absorber les acteurs de la Business Intelligence, achetés et rachetés les uns après les autres.
    
Le projet Pentaho
  
  Pentaho est un projet global couvrant l'ensemble de la 
chaîne décisionnelle. 
Pentaho comporte les briques suivantes : 
reporting, 
analyse, 
tableau de bord, 
data mining et 
workflow.
  
  Le projet Pentaho a été initié par des vétérans du décisionnel, des ex de Business Objects, Cognos, Hyperion, IBM, Oracle, et SAS.
  Ce projet  est réellement ambitieux. Il est  à suivre de près. Selon les propos des fondateurs, leur objectif n'est pas uniquement de proposer une alternative 
Open Source, mais bien de dépasser en terme de fonctionnalités les offres du marché. Ils n'attendent pas que vous choisissiez cette solution parce qu'elle est Open Source, mais bien parce que c'est la meilleure.
   Ambitieux, vous dites ? À suivre en tout cas.
   
  Le projet Pentaho intègre les produits suivants :
  
 
  -  Mondrian - Open Source OLAP Server
  
 - Pentaho Reporting Engine - Open Source Reporting
  
 - Kettle - Open Source Data Integration (ETL)
  
 - Pentaho - Comprehensive Open Source BI Suite
  
 - Weka - Open Source Data Mining
  
 
   
En 2015, Pentaho a été racheté par Hitachi Data System, Depuis 2017 Pentaho est intégré au sein de Hitachi Ventara. 
  
  Voir le site web : www.hitachivantara.com.
   
À lire
   Pentaho Solutions: Business Intelligence and Data Warehousing With Pentaho and Mysql
  
  
Pentaho Solutions
  
 Roland Bouman, Jos Van Dongen
   John Wiley & Sons   
  648 pages (anglais)
 
  
  Dispo : 
   www.amazon.fr
 
     
  
  
  Le projet Spago
  Spago est un projet d'intégration de progiciels décisionnels Open Source. L'objectif étant de  proposer un cadre (framework) global.
  Le site : 
www.knowage-suite.com . 
  
  
  
Le projet Jaspersoft
  Jaspersoft est un ensemble d'outils de reporting désormais présentés sous forme de suites. Jaspersoft se compose (actuellement) des produits suivants : 
  
  -  JasperReports - Bibliothèque de rapports 
  
 -  JasperStudio - Conception de rapports graphiques 
  
 -  JasperServer - Serveur de rapports interactifs 
  
 -  JasperAnalysis - Analyse interactive des données/OLAP
  
 -  JasperETL - Intégration des données 
   
 
  Le site (en français) : 
www.jaspersoft.com 
  Les autres projets 
  Il existe d'autres projets d'intégration globale du système décisionnel, comme par exemple 
MarvelIT. Cependant, ils ne sont pas tous aussi aboutis que Pentaho ou Spago pour ne citer que ceux-ci. 
   
 
Les produits DataMining Open source
     Le chapitre 
Définition du Data Mining, intégré dans le dossier 
analyse des données, précise le rôle du data mining, son utilisation et le déroulement du projet.
     
Weka
 Waikato Environment for Knowledge Analysis
 Collection d'outils de Data Mining et techniques connexes développées en Java par l'Université de Waikato, New Zeland  (collaboration du CERN)
Weka se connecte aux bases  SQL en utilisant le JDBC  (Java Database Connectivity), développement Java oblige.
  Le site : 
www.cs.waikato.ac.nz/ml/weka/
    Weka  est désormais intégré  dans la 
Pentaho Open BI Suite.
    Pour ceux qui souhaitent s'initier, rien de plus facile. Weka se télécharge depuis sourceforge.net, par exemple : 
la version windows.
    
    
Rapid Miner
    Rapid Miner, anciennement YALE (Yet Another Learning Environment), est un produit open source de data mining écrit en Java. C'est un outil assez complet et bien diffusé. Il intègre des fonctions d'ETL et sait exploiter les données de multiples sources (Microsoft Office, Sybase, Oracle, mySql...) de surcroît, il est assez ergonomique et intègre la bibliothèque d'apprentissage de Weka.
    
    
Voir aussi
 
     
    
À lire
     
    
     Un ouvrage est associé au développement du projet de data mining libre Weka. 
    Facile d'accès, suffisamment documenté et explicite pour que le lecteur puisse se forger une solide connaissance de la question. Les exemples s'appuient sur le fameux outil gratuit de data mining open source Weka. (Ouvrage en anglais)
 
    
    
    
    
Data Mining
    
I.H. Witten, Eibe Frank 
Morgan Kaufmann Publishers
4ème édition 2016   
    654 pages
 Prix : 59 Euros
    
    Dispo : 
     www.amazon.fr
 & Format Kindle
 
       
    
    
    Pour la petite histoire, le Weka est un oiseau de la taille d'une petite poule, assez commun dans le bush en Nouvelle-Zélande, il ne vole pas et n'est pas vraiment farouche. En période de nidification, son cri  assez curieux surprend les non-autochtones au détour d'un chemin de randonnée. C'est bien ce volatile qui orne le portail web de l'université Waikato.
   Panorama des solutions Data Warehouse et OLAP Open source : la Business Intelligence et le progiciel libre...
   
Panorama  Data Warehouse et OLAP Open Source 
   
    Data Warehouse
   
   
   Le Data Warehouse est un système de base de données spécialisée dans le stockage des données utilisées à des fins décisionnelles.
 Le Data Warehouse constitue le coeur du système décisionnel.  Consultez le dossier 
Data Warehousing et la 
définition du Data Warehouse pour en savoir un peu  plus. 
   
   
   
   
Infobright
    Infobright est le moteur Data Warehouse pour le serveur de bases de données MySQL. Infobright automatise la gestion du célèbre SGBD dans une logique d'entrepôt de données assurant une capacité de plusieurs téraoctets selon l'éditeur.
     Il existe deux versions : 
     
     - la version en téléchargement libre, Community Edition (ICE)
 
     - la version plus "pro", Infobright Enterprise Edition (IEE)
 
     
   Le site de l'éditeur : 
hwww.ignitetech.com/infobright-db/ 
   
   
OLAP
   Les bases de type OLAP sont destinées à faciliter les interrogations à  usage décisionnel en permettant les analyses multi dimensionnelles.
 Voir à ce sujet le dossier 
Qu'est-ce que OLAP ? 
    Palo Suite
   Serveur Olap intégrant un outil d'ETL, accessible depuis le web et compatible Microsoft Excel  
   Le site de l'éditeur : 
https://www.jedox.com/fr/
   
   
   
   
Jedox Palo OLAP Server
   La suite Palo  de Jedox intègre un moteur Olap : Palo OLAP Server.
   Le site de l'éditeur : 
www.jedox.fr
   
   
Mondrian Pentaho
   Mondrian est un serveur Olap écrit en langage Java. Mondrian utilise le langage d'interrogation 
MDX.
Mondrian, précurseur du décisionnel Open source, est désormais intégré au projet Pentaho.
   Le site de l'éditeur 
itachivantara.com/s/article/mondrian
   
   
 Autres solutions OLAP open source
   
   - On n'oubliera pas Jpivot, bibliothèque adossée à la base OLAP Mondrian 
jpivot.sourceforge.net/
   
    - On pourra aussi s'intéresser au projet   Pocolap  "The little OLAP Project". 
    Il se télécharge sur  sourceforge. 
   
 
 
    
 
Panorama des outils ETL en Open Source
    
   La collecte des données
    La collecte des données éparses dans l'entreprise est une fonction fondamentale du système décisionnel. Récupérer les données stockées dans les bases de production pour les utiliser  à des fins décisionnels nécessite une série d'opérations particulièrement conséquentes.
   
    La phase de collecte est non seulement la plus difficile mais c'est aussi la plus chronophage et la plus coûteuse, ceci entraînant cela. 
   
   
   
     
Les outils ETL Open Source
     La phase de collecte est non seulement la plus difficile mais c'est aussi la plus chronophage et la plus coûteuse, ceci entraînant cela. 
   
     Les outils d'ETL (Extract Transform Load) ont en charge cette délicate opération du système global décisionnel. Se référer au dossier Collecte des données ETL pour de plus amples informations sur ce sujet particulièrement délicat.
   
Talend Open Studio
   
   Talend Open Studio est un produit d'ETL particulièrement complet. Un produit à suivre. 
   Talend Open Studio génère directement les tâches de transformation en Java ou en PERL et dispose de multiples connecteurs pour les principaux produits logiciels d'entreprises. 
 
    Le site de l'éditeur :  
www.talend.com/ 
   La dernière version  est téléchargeable sur le site de l'éditeur.
   
   
Pentaho Data Integration (PDI)
 
   
   
   Pentaho Data Integration (PDI) est en fait à la base la solution d'ETL  Kettle  intégrée au sein du projet Pentaho.
    Le site de l'éditeur :  
Pentaho Data Integration
    
    
À lire
    Pentaho Kettle Solutions: Building Open Source ETL Solutions with Pentaho Data Integration
   
   
Pentaho Kettle Solutions
   
Matt Casters, Roland Bouman, Jos Van Dongen
   John Wiley & Sons   
   720 pages
Prix :  45 Euros 
   
   
 Dispo chez : 
 www.amazon.fr
 & Format Kindle
 
      
    
   
   
   
Enhydra Octopus
   Enhydra Octopus est un outil d'Extraction, Transformation, Loading. Il se connecte aux bases de données sous JDBC et s'appuie comme il se doit sur un 
schéma XML.
    Le site de l'éditeur : 
opensource-it.com/ 
    
Clover ETL
   Clover ETL est une solution d'intégration des données écrite en Java. 
    Le site de l'éditeur : 
   
cloveretl.com  
   
    
Ketl
   Ketl est un produit d'ETL basé sur une architecture Java.
    Le site de l'éditeur : 
linuxlinks.com/ketl 
   
   Voir aussi GeoKettle site web  https://www.spatialytics.org/projects/geokettle/ et sur sourceforge : https://sourceforge.net/projects/geokettle/?source=directory  
   
   
 
  
   
Panorama des outils Reporting Open Source (OSS)
     Définition Reporting Open Source
     
Les outils de reporting permettent de réaliser plus ou moins automatiquement des rapports d'activités. L'outil de reporting interroge les  bases de données selon un schéma de requêtes SQL élaboré au préalable. 
     
L'offre reporting Open source, désormais opérationnelle, est suffisamment aboutie pour entrer en compétition avec les produits d'éditeur et intéresser les prescripteurs des projets de Business Intelligence.
     
     
Reporting ad hoc
       Remarque : les outils disposant d'un module d'interrogation "ad hoc" permettent de construire ses propres requêtes. Cette fonction qui n'est pas du reporting à proprement parlé n'est pas  systématiquement intégrée. Pour en savoir plus, voir le dossier  
Définition du reporting en ligne sur ce site. 
     
     
     
     
       
Les outils de  Reporting open Source 
     Jasper report
 
     Jasper Report a été racheté par  TIBCO, une société américaine d'intégration informatique. JasperReport est toujours aujourd'hui l'outil le plus utilisé par les entreprises friandes de solutions non-propriétaires.  Jasper Report, développé en Java, s'exécute aussi bien sur plate-forme  :   Windows, Linux, ou Mac. 
La solution de reporting se compose d'une collection de composants : 
     
     -  JasperReport Library : une bibliothèque de classes Java et d'APIs
     
 - iReport Report Designer, 
     
 - JasperReport Studio : deux outils de conception, le second plus récent est prévu pour remplacer le premier
     
 - JasperReport Server. 
     
 
     Jasper Report est populaire, l'outil  bénéficie donc d'un support conséquent que ce soit au niveau de  la documentation disponible que des forums spécialisés.
     
Le site  open source : 
community.jaspersoft.com (anciennement sous Sourceforge)
     Cette solution open source de reporting était déjà  supportée par une société commerciale, TIBCO a conservé le site d'origine : 
www.jaspersoft.com. 
     
     
     
Eclipse Birt
     La solution Birt intègre plusieurs composant : Report Designer, Runtime, chart Engine, chart Designer et le Viewer. Le Design Engine API vous permet d'intégrer la solution de reporting au sein de vos applications maison. 
      Birt est un produit de Eclipse. Eclipse est une communauté open source qui génère des rapports pour les applications web. 
www.eclipse.org/birt/phoenix 
     
      
Jfreereport
      
     Jfreereport est une bibliothèque de fonctions reporting écrites en Java et désormais intégrée dans le 
projet Pentaho. 
     
     
Pentaho est une solution complète de Business Intelligence.La suite inclut aujourd'hui les principales briques d'un projet professionnel.  
     
     
Quelques autres solutions dignes d'intérêt
     Datavision
      Datavision sur  Sourceforge 
datavision.sourceforge.net
     Open Report
     Open Report est un générateur de rapport dynamique directement au niveau du navigateur.
     Le site de l'éditeur :  
oreports.com
     DynamicReports
     DynamicReports utilise la solution JasperReports pour créer très rapidement des rapports opérationnels.  
     
Le site de l'éditeur :  DynamicReports
     
Voir aussi  Jfreechart, www.jfree.org, une librairie graphique Java.
     
  
  
L’auteur 
  
Alain Fernandez est un spécialiste de la mesure de la performance et de l’aide à la décision.  Au fil de ces vingt dernières années, il a conduit et accompagné de nombreux projets d'entreprise en France et à l'International. Il est l'auteur de plusieurs livres publiés aux Éditions Eyrolles consacrés à ce thème et connexes, vendus à plusieurs dizaines de milliers d'exemplaires et régulièrement réédités.
 À ce sujet, voir aussi
Comment choisir un progiciel open source d'entreprise ?
   Quelques conseils et recommandations pour bien  choisir sa solution Open Source  pour le SI de l'entreprise ?... 
ERP Enterprise Resource Planning Progiciel de Gestion Intégrée
Centre fédérateur des informations d'entreprise et des processus métiers, les ERP réunissent  les fonctions essentielles dites de gestion comme les RH, le commercial, la production, la finance, la comptabilité, les achats... 
CRM Customer Relationship Management 
 CRM  désigne un ensemble de méthodes, de pratiques et d'outils technologiques assurant une gestion plus efficace dans la durée des relations avec les clients et les prospects. En français, on  parle de  Gestion de la Relation Client (GRC).  
Knowledge Management  Open Source
  Les des principaux produits logiciels de Knowledge Management publiés sous licence Open Source. La notion de gestion des connaissances englobe de nombreux domaines interconnectés. Nous nous intéresserons essentiellement à la thématique de la Gestion des Contenus (GDC) et   au e-learning. 
  Ressources web
 eBook gratuit
Méthode Gimsi
Pour concevoir et réaliser le projet BI en totalité 
Alain Fernandez
 38 pages 
 Téléchargement  libre 
 À lire...
 
Les 10 étapes de la méthode Gimsi sont ici expliquées et illustrées. Best-seller, vendu à plus de 40 000 exemplaires...
Les nouveaux tableaux de bord des managers
 Le projet Business Intelligence clés en main
 Alain Fernandez
6ème édition Eyrolles
468 pages
☛  Voir la fiche du livre »»» 
Pour acheter ce livre : 
 
 
 
Format ebook : PDF ou  ePub,
Kindle
 Comprendre les enjeux de l'open source avec son principal supporter.   
  Depuis plus de 25 ans,  Richard Stallman défend le logiciel libre. À l'origine de la démarche GNU et du copyleft, Richard Stallman milite activement et fermement contre les brevets logiciels... 
Richard Stallman et la révolution des logiciels libres
Richard M. Stallman, Sam Williams, Christophe Masutti 
Livio Éditions 
 340 pages
Dispo :  
www.amazon.fr
 
 Piloter l'Entreprise Innovante...
La prise de décision en équipe ne s'improvise pas. Pour parvenir à ce mode de management délégataire, crucial pour les organisations actuelles, privées comme publiques, un indispensable travail de fond prélable est nécessaire. La méthode SOCRIDE centrée sur les questions incontournables de Confiance et de Reconnaissance est ici expliquée, illustrée et détaillée :
									
									
Les tableaux de bord du manager innovant
 Une démarche en 7 étapes pour faciliter la prise de décision en équipe
									
Alain Fernandez
									
 Éditeur : Eyrolles 
									
Pages : 320 pages
									
  Consultez la fiche technique »»» 
									
									
									Pour acheter ce livre : 
									
  
 
									
									
Format ebook :  PDF &  ePub,
									Format Kindle
									
Voir aussi...
 
Le mot du jour  
QuestionnementThe important thing is not to stop questioning. Curiosity has its own reason for existing.  Albert Einstein
Partagez cet article...
  
(total partages cumulés > 145)