Qu'est-ce que le big data ?

Par   Partagez : Envoyer le lien de cet article par e-mail   

Le stockage et l'analyse de grandes masses de données

Capter et stocker un maximum de données

image big data Le Big data data bouscule de fond en comble nos manières de faire du "business". Le concept, tel qu'il est défini actuellement, englobe un ensemble de technologies et de pratiques destinées à stocker de très grandes masses de données et à les analyser très rapidement.
Pour décrire le principe du big data, il est coutumier de résumer ses caractéristiques majeures en utilisant 3 lettres "V" :
Volume, Velocity, Variety.

Nous étudierons aussi au cours de ce dossier le métier clé de "data scientist" ainsi que les principes de fonctionnement des principales briques technologiques.

Les 3 "V"

  • "V" pour Volume

    La quantité de données générée est en pleine expansion et suit une loi quasi exponentielle. Le commerce électronique et les réseaux sociaux sont les grands contributeurs de cette profusion de données.
  • "V" pour Velocity (rapidité)

    La rapidité de renouvellement des données dans un monde connecté n'est plus à démontrer. Toutes les nouveautés et mises à jour sont stockées en respect de la devise du big data : "On garde tout!".
  • "V" pour Variety (variété)

    Les bases de données spécialisées sont en mesure de gérer la multiplicité des formats des données : numérique, texte, image...
Il n'est pas inutile d'y ajouter un quatrième "V" pour "valeur" comme le recommandent les pragmatiques qui sont aussi les mieux avertis (ou déjà échaudés...) de la pratique des technologies de l'information. Autrement dit, il faut bien que tout cela serve à quelque chose "d'utile"...

Analyser les données

Bien évidemment, stocker une telle quantité de données n'a d'autre finalité que de tirer des enseignements pertinents afin d'accroître notre connaissance sur notre environnement professionnel en l'occurrence. Les finalités des analyses big data sont multiples. Que ce soit pour des analyses prospectives afin de mieux comprendre les attentes des clients, la modélisation pour mieux fixer le prix d'une nouvelle gamme de produits selon le segment visé ou encore une simulation du type "que se passerait-il si ?", le champ d'investigation est vaste.

Data scientist et manager

Encore faut-il bien maitriser les techniques d'analyse et savoir choisir la plus opportune afin de tirer les enseignements les plus pertinents. Recherche de corrélation,analyse prospective, modélisation, simulation, data vizualisation, voilà quelques techniques que doit maitriser le spécialiste de l'analyse des données big data, le "data scientist" que l'on pourrait traduire par le scientifique des données. Le métier de data scientist est appelé a se développer.

C'est un métier complexe qui nécessite un bon bagage scientifique, une connaissance évidente des méthodes d'analyses de données, une bonne maîtrise de la technique informatique mise en oeuvre et un goût prononcé des besoins business, qu'il s'agisse de marketing, de management RH ou de production. Le data scientist travaille en effet en étroite collaboration avec les managers "métiers" ou de terrain. Ce sont eux qui font appel à cet expert pour explorer leur champ d'exploration dans leur recherche d'amélioration de la performance.

Aussi, le data scientist ne travaille pas tous azimuts. Il vise une finalité, un résultat qui correspond à un besoin de l'entreprise ou d'un manager métier. Il sélectionne les sources de données puis les données elles-mêmes et lance ses travaux d'analyses à cette fin.

Technologie du big data

  • Les technos
    Présentation des principales technologies du Big Data pour mieux comprendre le principe
  • Hadoop
    Hadoop est la solution Open Source gérée par Apache software Fundation. C'est aujourd'hui la principale solution de stockage et de traitement réparti.
  • Analyse Hadoop
    Le principe de l'analyse massive expliqué
  • Map-reduce
    Hadoop repose sur la solution Map-reduce de Google Corp.
  • Les bases nosql
    Les besoins de redondance indispensables aux calculs massivement parallèles exigeaient une nouvelle structure de bases de données.
  • Bases de données "In Memory"
    Les solutions de bases de données en mémoire peuvent aussi reposer sur une infrastructure big data.
  • Le big data et la prise de décision
    Quels sont les apports du big data au processus décisionnel.
  • Big data et SI
    Comment le Big Data et le culte de l'information réorientent la conception des systèmes d'information.
  • Quoi, Pourquoi, Comment ?
    Le Big Data expliqué au manager décideur en 3 questions.

À lire

1. La référence du processus décisionnel en entreprise. Les nouveaux tableaux de bord des managers, le projet Business Intelligence clés en main, l'ouvrage de référence auprès des managers, consultants, chefs de projets décisionnels, formateurs et enseignants.

Nouveaux tableaux de bordLes nouveaux tableaux de bord des managers
Le projet décisionnel en totalité
Alain Fernandez   Eyrolles  6ème édition 2013
495 pages
Prix : 35 euros
Dispo chez :
www.fnac.com    www.amazon.fr    www.eyrolles.com
& PDF ou ePub   Format Kindle

2. Une bonne introduction au Big Data. Les auteurs exposent dans un langage clair toutes les facettes de la problématique et dessinent les perspectives et les mutations qui nous attendent déjà. ce livre est un best-seller de sa catégorie aux Etats-Unis.

Hadoop: The Definitive GuideBig Data : La révolution des données est en marche
Kenneth Cukier, Viktor Mayer-Schoenberger
Robert Laffont   Édition 2014
296 pages
Prix : 21 Euros
Dispo chez :
www.fnac.com    www.eyrolles.com    www.amazon.fr
& Format Kindle

3. Ce livre est un guide de terrain Hadoop, clair et précis. L'auteur, Tom White, est un expert consultant conférencier Hadoop. Il travaille pour Cloudera Entreprise. (Langue anglaise)

Hadoop: The Definitive GuideHadoop The Definitive Guide
Tom White
O'Reilly Media   3ème édition révisée 2012
688 pages
Prix : 43 Euros
Dispo chez :
www.amazon.fr & Format Kindle



Partagez cet article...

Envoyer le lien de cet article par e-mail   
(total partages cumulés > 165)

Commentaires lecteurs...

La reproduction ou la traduction totale ou partielle de ce texte, images et documents est formellement interdite. Voir ici les conditions pour publier un extrait sur votre site ou blog. Ce texte et les images et documents qu'il contient est déposé auprès de l'IDDN

Suivez aussi les news du portail sur Twitter et rejoignez-nous sur Facebook

Google+    Twitter    Facebook



Copyright : Alain FERNANDEZ ©1998-2015 Tous droits réservés Mentions légales
Toutes les marques citées sur cette page sont des marques déposées de leur propriétaire respectif.


Management de l'entreprise
»» Toutes les fiches Piloter.org »»

Google+   twitter+  Facebook  Linkedin    e-mail