Le Portail du Manager Innovant

Syndication, fil RSS du site piloter.org    Je suis aussi  sur facebook    Je suis aussi sur  Linkedin    Actualités Twitter
Syndication, fil RSS du site piloter.org  Je suis aussi  sur facebook  Je suis aussi sur  Linkedin  Actualités Twitter
×

La technologie mise en oeuvre pour le Big Data

09 juin 2017  Par   Partagez

Soulevons le capot...

... et observons le moteur

technologie big data Toute la puissance du Big Data repose sur une technologie pour le moins révolutionnaire.

En tout cas, elle l'est pour des vieux spécialistes de l'informatique à papa.

Les traitements massivement parallèles, la gestion en temps réel des pannes systèmes ou la redondance systématique des données (out la normalisation des bddd..), c'est un peu tout cela le Big Data.
Bon pas seulement, après il y a les utilisations et là c'est une autre paire de manches. Mais intéressons déjà aux technos proprement dites.

Technologie du big data

  • Map Reduce

    Au départ, il y eut "Map Reduce", une méthode et une technologie de traitement massivement parallèle issues des laboratoires Google Corp ® avec gestion de la tolérance aux pannes et système de gestion de fichiers spécifiques (Google File System). On parle là de traitement sur des milliers de machines réparties en grappes (clusters).
  • Hadoop

    Ensuite, il y eut "Hadoop", un framework mis au point par la Apache Software Fundation afin de mieux généraliser l'usage du stockage et traitement massivement parallèle de Map Reduce et de Google File System. Bien entendu, Hadoop possède ses limites. Quoi qu'il en soit, c'est une solution de big data très largement utilisée pour effectuer des analyses sur de très grands nombres de données.
  • Bases No SQL

    Les bases de données relationnelles ont une philosophie d'organisation des données bien spécifiques, avec notamment le langage d'interrogation SQL, le principe d'intégrité des transactions (ACID), et les lois de normalisation. Bien utiles pour gérer les données qualifiées de l'entreprise, elles ne sont pas du tout adaptées au stockage de très grandes dimension et au traitement ultra rapide. Les bases NoSQL autorisent la redondance pour mieux servir les besoins en matière de flexibilité, de tolérance aux pannes et d'évolutivité.
  • Stockage "In-Memory"

    Pour des analyses encore plus rapide, les traitements directement en mémoire sont une solution. Une technologie bien qu'encore trop coûteuse il est vrai pour être généralisée. Le service est-il à la hauteur de l'investissement ?
  • Cloud Computing

    Le Big Data exige une capacité matérielle hors du commun, que ce soit pour le stockage comme pour les ressources processeurs nécessaires au traitement. Nul besoin de s'équiper outre mesure, le "Cloud" est là pour cela. Encore faut-il avoir bien compris le concept pour différencier, le cloud privé du cloud public, l'interne de l'externe et les hybrides combinant plusieurs types de solutions. Ensuite il est aussi prudent de différencier les niveaux de services de chacune des solutions : IAAS, PAAS, SAAS...

À lire...

Cet ouvrage s'adresse de préférence à des managers déjà bien sensibilisés aux concepts des systèmes d'Informations, telles les bases de données. Les managers techniques, l'utiliseront comme ouvrage d'auto-formation afin d'être armés pour piloter le projet Big data dans l'entreprise...

Big Data et Machine LearningBig Data et Machine Learning
Les concepts et les outils de la data science

Pirmin Lemberger, Marc Batty, Médéric Morel, Jean-Luc Raffaëlli
Dunod 3ème édition 2019
272 pages

Dispo : www.amazon.fr


Une bonne introduction au Big Data. Les auteurs exposent dans un langage clair toutes les facettes de la problématique et dessinent les perspectives et les mutations qui nous attendent déjà. ce livre est un best-seller de sa catégorie aux États-Unis...

Big Data
La révolution des données est en marche

Kenneth Cukier, Viktor Mayer-Schoenberger
Robert Laffont  
296 pages

Dispo : www.amazon.fr & Format Kindle


Ce livre est un guide de terrain Hadoop, clair et précis. L'auteur, Tom White, est un expert consultant conférencier Hadoop. Il travaille pour Cloudera Entreprise...

Hadoop: The Definitive GuideHadoop
The Definitive Guide

Tom White
O'Reilly Media   4ème édition 2015
756 pages (anglais)

Dispo : www.amazon.fr & Format Kindle

Livre de référence du site

Big Data et décisionnel en entreprise

L'ouvrage de référence auprès des dirigeants, managers, consultants, chefs de projets décisionnels, formateurs et enseignants...

Les nouveaux tableaux de bord des managersLes nouveaux tableaux de bord des managers
Le projet Business Intelligence clés en main

Alain Fernandez
6ème édition Eyrolles
468 pages

Pour acheter ce livre :

   

Format ebook : PDF ou ePub, Kindle



Partagez cet article...

Envoyer le lien de cet article par e-mail   
(total partages cumulés > 185)

Sur le même thème...