Qualité des données décisionnelles

09 avril 2019  Par   Partagez
L'importance de la qualité des données collectées n'est plus à démontrer. Avec la croissance exponentielle du nombre de données générées, collectées, stockées, analysées et échangées, cette question est toujours plus sensible. S'il est en effet désormais techniquement possible de stocker et de traiter d'incommensurables masses de données, il serait plutôt dommageable de se risquer à prendre des décisions en se fiant à des données erronées. Et pourtant... GIGO Garbage In, Garbage Out dit-on. Autrement dit, si l'on rentre dans le système des données loin d'être nickel il ne faudra pas être surpris du résultat obtenu.
Qualité des données

La gestion qualité des données est au coeur du projet BI

La gestion qualité des données est la clé de voûte du projet Business Intelligence et Big Data.

Il s'agit de décider...

Comment estimer la réussite d'un projet Business Intelligence si ce n'est en évaluant l'apport au processus de décision global de l'organisation ? Avez-vous déjà essayer de décider, de vous engager, de prendre des risques en vous fondant exclusivement sur des informations plus que douteuses ? La gestion de la qualité des données est bien le pilier central ou la clé de voûte, pour rester dans les métaphores architecturales, du projet de Business Intelligence.

Toutes les données ne sont pas logées à la même enseigne

Plusieurs statistiques relèvent que bien des données de l'entreprise, aussi essentielles que les références clients ou les données produits, sont truffées d'erreur. La vérification et la mise en conformité des données est une opération longue et particulièrement coûteuse (même si le coût de ces travaux sera toujours inférieur au coÙt de correction des erreurs induites par des données erronées).

Aussi faut-il la réserver aux données essentielles, et admettre un certain pourcentage d'erreurs pour des données moins importantes qui ne perturberont pas les processus de l'entreprise, qu'ils soient de production, administratifs ou décisionnels.

Par exemple, quelques erreurs de comptage des visites d'un site en ligne ne sont pas un drame. Noyées dans la masse des données collectées, elles ne fausseront pas les statistiques. Rien à voir en tout cas avec une erreur au niveau de la prise de commande (référence, localisation stocks, disponibilité, coordonnées clients, tarifs...)

  • Une erreur de 0,1% sur les 500.000 clics de visiteurs clients de la journée représente : 500 clics erronés. C'est statistiquement insignifiant.
  • Une erreur de 0,1% sur les 50.000 fiches clients de la société : 50 fiches erronées. Ce peut être particulièrement grave.

Comment définir la qualité des données décisionnelles ?

La qualité des données peut être simplement définie selon les caractéristiques suivantes :
  • Accessible

    Une donnée de qualité doit être présente dans le système d'information et accessible par les processus et utilisateurs qui l’utilisent.
  • Valide

    La donnée ne porte pas une valeur aberrante, elle se maintient dans la plage des valeurs acceptables
  • Consistante

    Si la donnée est redondante et présente en plusieurs endroits à la fois, elle porte toujours la même valeur à un instant donné
  • Précision

    Elle est jugée suffisamment précise pour l’usage que l’on en attend.
  • Utile

    Elle répond parfaitement au besoin et à l’usage que l’on en attend.
Ce sont les axes à suivre pour accéder à une meilleure qualité des données.

Gestion qualité des données, les ressources

  • Collecte des données : ETL Extract Transform load

    ETL, Extract Transform load La collecte et la gestion des données sont des phases clés du projet de Business Intelligence. Il s'agit de Collecter et de mettre forme les données de production afin de les rendre disponible pour un usage décisionnel
  • Gouvernance des données

    La gouvernance des données, une compétence tranversale orientée BI en charge de la gestion de la qualité des données-
  • MDM Master Data Management, Gestion des Données de Référence

    Toutes les données de l'entreprise ne sont pas équivalentes en importance loin s'en faut. Il serait un peu absurde de traiter de la même manière un vague clic sur le produit d'une boutique en ligne et une donnée comptable capitale. La gestion des données de référence de l'entreprise est justement la réponse pour un management de la qualité des données bien spécifique. Voyons tout cela.
  • Le référentiel de métadonnées -Meta Data-

    Le référentiel de Meta données, est un point clé du système d'informations décisionnel. Pour Ralph Kimball les métadonnées sont l'ADN du Data warehouse.
  • ERP et Data Warehouse

    ERP et Data Warehouse. Comment exploiter les données des ERP PGI ? Ils contiennent en leurs bases de données une bonne part des informations décisionnelles. Les premiers pas de la mise en cohérence des progiciels de gestion intégrés ERP et la Business Intelligence

Livres recommandés

MDM: Enjeux et méthodes de la gestion des données MDM: Enjeux et méthodes de la gestion des données
Franck Regnier-Pecastaing, Michel Gabassi, Jacques Finet
Dunod
336 pages
Dispo :
www.amazon.fr & Format Kindle

Tous les articles

Partagez cet article...

Envoyer le lien de cet article par e-mail   
(total partages cumulés > 145)

Si vous souhaitez partager votre point de vue sur cet article, utilisez désormais Twitter ou votre réseau social favori.

La reproduction ou la traduction totale ou partielle de ce texte, images et documents est formellement interdite. Voir ici les conditions pour publier un extrait sur votre site ou blog. Ce texte et les images et documents qu'il contient est déposé auprès de l'IDDN

Suivez aussi les news du portail sur Twitter et rejoignez-nous sur Facebook

Twitter    Facebook

Excel ® est une marque déposée de Microsoft Corp ®
Gimsi ® est une marque déposée de Alain Fernandez



Copyright : Alain FERNANDEZ ©1998-2019 Tous droits réservés Mentions légales


Le Portail du Manager Innovant
Le portail du Manager Efficace Piloter.org