La technologie mise en oeuvre "sous" le Big Data

Par   Partagez : Envoyer le lien de cet article par e-mail   

Soulevons le capot...

... et observons le moteur

technologie big data Toute la puissance du Big Data repose sur une technologie pour le moins révolutionnaire.

En tout cas, elle l'est pour des vieux spécialistes de l'informatique à papa.

Les traitements massivement parallèles, la gestion en temps réel des pannes systèmes ou la redondance systématique des données (out la normalisation des bddd..), c'est un peu tout cela le Big Data.
Bon pas seulement, après il y a les utilisations et là c'est une autre paire de manches. Mais intéressons déjà aux technos proprement dites.

Technologie du big data

  • Map Reduce

    Au départ, il y eut "Map Reduce", une méthode et une technologie de traitement massivement parallèle issues des laboratoires Google Corp ® avec gestion de la tolérance aux pannes et système de gestion de fichiers spécifiques (Google File System). On parle là de traitement sur des milliers de machines réparties en grappes (clusters).
  • Hadoop

    Ensuite, il eut "Hadoop", un framework mis au point par la Apache Software Fundation afin de mieux généraliser l'usage du stockage et traitement massivement parallèle de Map Reduce et de Google File System. Bien entendu, Hadoop possède ses limites. Quoi qu'il en soit, c'est une solution de big data très largement utilisée pour effectuer des analyses sur de très grands nombres de données.
  • Bases No SQL

    Les bases de données relationnelles ont une philosophie d'organisation des données bien spécifiques, avec notamment le langage d'interrogation SQL, le principe d'intégrité des transactions (ACID), et les lois de normalisation. Bien utiles pour gérer les données qualifiées de l'entreprise, elles ne sont pas du tout adaptées au stockage de très grandes dimension et au traitement ultra rapide. Les bases NoSQL autorisent la redondance pour mieux servir les besoins en matière de flexibilité, de tolérance aux pannes et d'évolutivité.
  • Stockage "In-Memory"

    Pour des analyses encore plus rapide, les traitements directement en mémoire sont une solution. Une technologie bien qu'encore trop coûteuse il est vrai pour être généralisée. Le service est-il à la hauteur de l'investissement ?
  • Cloud Computing

    Le Big Data exige une capacité matérielle hors du commun, que ce soit pour le stockage comme pour les ressources processeurs nécessaires au traitement. Nul besoin de s'équiper outre mesure, le "Cloud" est là pour cela. Encore faut-il avoir bien compris le concept pour différencier, le cloud privé du cloud public, l'interne de l'externe et les hybrides combinant plusieurs types de solutions. Ensuite il est aussi prudent de différencier les niveaux de services de chacune des solutions : IAAS, PAAS, SAAS...

À lire

1. Cet ouvrage s'adresse de préférence à des managers déjà bien sensibilisés aux concepts des systèmes d'Informations, telles les bases de données. Les managers techniques, l'utiliseront comme ouvrage d'auto-formation afin d'être armés pour piloter le projet Big data dans l'entreprise.

Big Data et Machine Learning - Les concepts et les outils de la data science
Pirmin Lemberger, Marc Batty,...
Dunod  
272 pages
Prix : 30 Euros, 22 Euros en version Kindle
Dispo chez :
www.amazon.fr
& Format Kindle

2. Une bonne introduction au Big Data. Les auteurs exposent dans un langage clair toutes les facettes de la problématique et dessinent les perspectives et les mutations qui nous attendent déjà. ce livre est un best-seller de sa catégorie aux Etats-Unis.

Hadoop: The Definitive GuideBig Data : La révolution des données est en marche
Kenneth Cukier, Viktor Mayer-Schoenberger
Robert Laffont  
296 pages
Prix : 21 Euros
Dispo chez :
   www.amazon.fr
& Format Kindle

3. Ce livre est un guide de terrain Hadoop, clair et précis. L'auteur, Tom White, est un expert consultant conférencier Hadoop. Il travaille pour Cloudera Entreprise.

Hadoop: The Definitive GuideHadoop The Definitive Guide
Tom White
O'Reilly Media   3ème édition révisée 2012
688 pages
Prix : 43 Euros
Dispo chez :
www.amazon.fr & Format Kindle

Big Data et décisionnel en entreprise

4. L'ouvrage de référence auprès des dirigeants, managers, consultants, chefs de projets décisionnels, formateurs et enseignants.

Nouveaux tableaux de bordLes nouveaux tableaux de bord des managers
Le projet décisionnel en totalité
Alain Fernandez   Eyrolles  6ème édition 2013
495 pages
Prix : 35 euros
Dispo chez :
www.amazon.fr
& PDF ou ePub   Format Kindle



Partagez cet article...

Envoyer le lien de cet article par e-mail   
(total partages cumulés > 145)

Commentaires lecteurs...

Pour commenter en tant qu'Anonyme, cliquez sur "Commencez la discussion" Puis sur "Nom", tout en bas apparaît alors une case à cocher : "Je préfère publier en tant qu'invité"

La reproduction ou la traduction totale ou partielle de ce texte, images et documents est formellement interdite. Voir ici les conditions pour publier un extrait sur votre site ou blog. Ce texte et les images et documents qu'il contient est déposé auprès de l'IDDN

Suivez aussi les news du portail sur Twitter et rejoignez-nous sur Facebook

Google+    Twitter    Facebook

Excel ® est une marque déposée de Microsoft Corp ®
Gimsi ® est une marque déposée de Alain Fernandez



Copyright : Alain FERNANDEZ ©1998-2017 Tous droits réservés Mentions légales
Toutes les marques citées sur cette page sont des marques déposées de leur propriétaire respectif.


Performance, Management & Décision
»» Tous les articles Piloter.org »»