Questions autour du Big Data Quoi, Pourquoi, Comment ?

6 décembre 2018  Par                  Partagez
Le big data expliqué au manager en 3 questions/réponses : Quoi, Pourquoi et comment ? Bref tout ce qu'il s'agit de savoir afin de mieux comprendre les enjeux du Big Data

Le Big Data expliqué aux managers en 3 questions/réponses

Une petite présentation rapide pour les managers-décideurs... big-data

1) Qu'est-ce que le Big Data ?

Le Big data c'est la capacité de stocker et de traiter de très grandes quantités de données, de l'ordre du petaoctet. FaceBook® par exemple, gère une base de données qui dépasse largement les 100 petaoctets soit : 100 millions de milliards de données. le chiffre 100 suivi de 15 zéros : 100.0000....0000... etc.

Il ne faut pas considérer ces chiffres impressionnants uniquement en terme de capacité de stockage, le "Stock"). La capacité de réactualisation de très grands volumes le "flux" est tout aussi remarquable. Walmart gère ainsi 1 million de transactions commerciales chaque heure.
Enfin le Big Data c'est aussi la capacité de gérer de multiple formats : numériques, textes, images...

2) Pourquoi le Big Data ?

Nous sommes tous de plus en plus présents dans le monde virtuel proposé par le web. Nous laissons des quantités phénoménales de traces sans toujours nous en rendre bien compte. Les acteurs du marketing et les responsables commerciaux des entreprises ne vont surtout pas laisser passer cette manne. Connaître au mieux les prospects et les clients a toujours été le rêve des entreprises commerciales.

Avec le Big Data, le rêve devient réalité. Autant de données disponibles et une capacité d'analyse en théorie sans limite, c'est la possibilité de bâtir de solides modèles. Le big Data est donc aussi un outil d'aide à la décision en entreprise. Lire ici un développement plus complet.

3) Le Big Data, ça marche comment ?

Le big data c'est en fait la mise en action des outils de stockage et de traitement des données massives mis au point par Google ® pour ses propres besoins, puis standardisés et rendus opérationnels par la fondation Apache avec le désormais fameux framework "Hadoop". L'idée étant de paralléliser à grande échelle les traitements sur de très nombreuses machines peu coûteuses organisées en grappes. La tolérance aux pannes est gérée en totale automatisme.

L'accélération et la parallélisation des traitement imposent un accès facilité aux données. Celles-ci sont donc redondantes. Les bases relationnelles traditionnelles peu adaptées (c'et peu dire !) aux nouvelles conceptions sont donc remplacées par une nouvelle génération.

Les principes fondamentaux de ces nouvelles bases de données ne sont pas exploitables avec le traditionnel langage d'interrogation SQL. Ce sont donc des bases dîtes : "No SQL", d'une structure fort différente des bases de données relationnelles plus classiques.

Pour aller plus avant dans la connaissance du Big Data

  • Qu'est-ce que le Big Data ? Définition et principe
    Une définition du Big Data et de l'Analytique, le principe de fonctionnement et les principales utilisations suivi d'un dossier complet et d'une approche critique afin de mieux se méfier des éditeurs et consultants, vendeurs d'illusions.
  • Une critique du Big Data
    Le Big Data est une révolution en soi, aucun doute à ce sujet. La capacité, toujours en croissance, de stocker d'énormes quantités de données conjuguées à une puissance de traitement phénoménale au sens de ce que l'on connaissait jusqu'ici, implique une profonde évolution de nos modes de fonctionnement.
  • La technologie mise en oeuvre "sous" le Big Data
    Les technologies qui permettent de bâtir une solution de type Big Data ou Données Massives en français, ont leur origine au sein même des moteurs de recherche du web.


À lire

1. Un ouvrage clair et précis pour aborder la question du big data et du Machine Learning. Bien qu'il soit sous-titré aux légitimes fins commerciales "Le guide du Data Scientist", ce livre est à mon avis plutôt destiné aux responsables techniques, les DSI par exemple pour ne citer que ceux-ci. Ils l'utiliseront comme un outil d'auto-formation et seront mieux armés pour piloter le projet, ou plus simplement pour envisager son éventualité dans les meilleurs conditions.

Big Data et Machine Learning - Les concepts et les outils de la data science
Pirmin Lemberger, Marc Batty,...
Dunod  
272 pages
Prix : 30 Euros, 22 Euros en version Kindle
Dispo chez :
www.amazon.fr
& Format Kindle

2. La référence du processus décisionnel en entreprise. Les nouveaux tableaux de bord des managers, le projet Business Intelligence clés en main, l'ouvrage de référence auprès des managers, consultants, chefs de projets décisionnels, formateurs et enseignants.

Nouveaux tableaux de bordLes nouveaux tableaux de bord des managers
Le projet décisionnel en totalité
Alain Fernandez   Eyrolles  6ème édition 2013
495 pages
Prix : 35 euros
Dispo chez :
www.amazon.fr
& PDF ou ePub   Format Kindle

3. Une bonne introduction au Big Data. Les auteurs exposent dans un langage clair toutes les facettes de la problématique et dessinent les perspectives et les mutations qui nous attendent déjà. ce livre est un best-seller de sa catégorie aux Etats-Unis.

Hadoop: The Definitive GuideBig Data : La révolution des données est en marche
Kenneth Cukier, Viktor Mayer-Schoenberger
Robert Laffont   Édition 2014
296 pages
Prix : 21 Euros
Dispo chez :
www.amazon.fr
& Format Kindle

4. Ce livre est un guide de terrain Hadoop, clair et précis. L'auteur, Tom White, est un expert consultant conférencier Hadoop. Il travaille pour Cloudera Entreprise. (Langue anglaise)

Hadoop: The Definitive GuideHadoop The Definitive Guide
Tom White
O'Reilly Media   3ème édition révisée 2012
688 pages
Prix : 43 Euros
Dispo chez :
www.amazon.fr & Format Kindle



Partagez cet article...

Envoyer le lien de cet article par e-mail   
(total partages cumulés > 85)

Si vous souhaitez partager votre point de vue sur cet article, utilisez désormais Twitter ou votre réseau social favori.

La reproduction ou la traduction totale ou partielle de ce texte, images et documents est formellement interdite. Voir ici les conditions pour publier un extrait sur votre site ou blog. Ce texte et les images et documents qu'il contient est déposé auprès de l'IDDN

Suivez aussi les news du portail sur Twitter et rejoignez-nous sur Facebook

Twitter    Facebook

Excel ® est une marque déposée de Microsoft Corp ®
Gimsi ® est une marque déposée de Alain Fernandez



Copyright : Alain FERNANDEZ ©1998-2018 Tous droits réservés Mentions légales
Toutes les marques citées sur cette page sont des marques déposées de leur propriétaire respectif.


Le Portail du Manager Innovant
Le portail du Manager Efficace Piloter.org