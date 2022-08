Formation Big Data en ligne

C ette formation Big Data en ligne est à destination des managers qui n'ont guère le temps d'investir dans un programme long et souhaitent savoir concrètement de quoi il en retourne afin de prendre les décisions les plus opportunes en matière d'investissement. Ce guide en ligne d'auto formation gratuit est fait pour eux.

Qu'est-ce que le Big Data ?

Le Big Data est la solution technologique assez révolutionnaire qui remet en question les fondamentaux de l'exploitation des données disponibles, telle qu'elle était envisagée jusqu'à aujourd'hui dans la conception des systèmes d'information et, plus précisément, des Data Warehouse pour ce qui concerne la Business Intelligence.

La technologie mise en oeuvre pour le Big Data est à même de stocker et de permettre des analyses rapides sur d'impressionnants volumes de données de l'ordre de la centaine de pétaoctets, soit 100*1015. Le Big Data offre aussi la capacité d’enregistrer des informations sous des formats disparates tels que numérique, textes ou images.

Le big Data, ce sont des analyses hyper pointues

Disposer d'une telle quantité de données peut s'avérer une précieuse source d'informations et d'aide à la décision pour celui qui dispose des compétences pour bâtir les indispensables algorithmes, et interpréter les modèles de données résultants. En théorie, en tout cas, on dispose de moyens pour connaître ses clients avec une précision inégalée. Cette précieuse connaissance est quelque part le "Graal" de toute entreprise commerciale.

Tout le monde ne s'appelle pas Google, Facebook Amazon, ALibaba ou WallMart...

Les promoteurs du Big Data, éditeurs de solutions, installateurs ou consultants, nous vantent les mérites de cette solution avec emphase. Les stratégies de communications mises en oeuvre risquent de tromper les managers qui n'ont pas suffisamment de recul pour décoder le mythe.

Bien évidemment, les corrélations extraordinaires, qui flirtent avec le stade de la divination, nécessitent des volumes de données que seuls les leaders actuels sont en mesure de disposer (encore faut-il qu'elles soient justes ;-)). Pour des entreprises de taille plus respectable et moins présentes sur le net, les bases de données disponibles Big Data sont bien plus modestes, et ce n'est pas peu dire ;-)...

Formation en ligne en 12 fiches pratiques

Pour se construire une idée assez solide du concept, et être à même de prendre les décisions en matière de choix d'opportunités le cas échéant, vous trouverez ci-après une formation rapide en 12 fiches pratiques traitant des trois thèmes principaux : les fondamentaux, l'infrastructure technologique et les critiques.

Pour pousser plus avant sa connaissance, la quatrième partie présente des ressources complémentaires : ouvrages, MOOC et des formations universitaires pour ceux qui envisagent une réorientation de carrière.

I. Les fondamentaux

1) Le Big data en trois mots Commençons par le début avec un "Digest" introductif qui résume en une simple page le principe et l'usage, et propose une définition du Big Data.

2) Quoi ? Pourquoi ? Comment ? Le Big Data expliqué au manager décideur en 3 questions/réponses : Quoi, Pourquoi et Comment ?

3) Le processus décisionnel Ne perdons pas de vue que le Big Data est aussi une solution technologique récente pour faciliter la prise de décision. Voyons comment il peut améliorer le processus décisionnel.

II. Les technologies mises en oeuvre

4) L'infrastructure technologique Le Big Data repose sur une infrastructure bien particulière. Voyons à présent les technologies mises en oeuvre pour mieux comprendre le principe.

5) La solution "Hadoop" L'Open Source Hadoop est aujourd'hui la principale solution de stockage et de traitement réparti. Voyons le principe de Hadoop qui est surtout conçu pour réaliser des analyses massives.

6) À la base : le modèle Map Reduce Hadoop a été conçu en s'appuyant sur la solution Map-reduce de Google Corp.



7) Les bases NoSql Les bases de données relationnelles ne sont pas adaptées aux calculs massivement parallèles. Ces calculs exigent de réformer le traditionnel principe ACID et de "dénormaliser" les bases pour introduire notamment une dose de redondance et de tolérance aux pannes : Nosql est une nouvelle structure de bases de données.



Les bases de données relationnelles ne sont pas adaptées aux calculs massivement parallèles. Ces calculs exigent de réformer le traditionnel principe ACID et de "dénormaliser" les bases pour introduire notamment une dose de redondance et de tolérance aux pannes : Nosql est une nouvelle structure de bases de données.

9) Les architectures "In-Memory" Pour accélérer les traitements, les modèles sont construits par itérations successives. Ces itérations prennent du temps machine. Certains éditeurs/constructeurs, profitant de la chute continue du coût des mémoires, ont conçu des systèmes de bases de données résidant en mémoire vive dit : In memory.



III. La critique

10) Les vendeurs d'illusions Un article critique des vendeurs et autres promoteurs de solutions qui n'hésitent pas à employer des stratégies de communication trompeuses : Le Big Data et les vendeurs d'illusions .



11) Le Big Data est-il une nouvelle vache à lait ? Il est important de ne jamais oublier que les promoteurs les plus actifs sont avant tout des vendeurs. Ils ont pour finalité bien naturelle l'amélioration durable de leur chiffre d'affaires : Big Data, la nouvelle vache à lait ?



12) Les limites du Big Data Le Big Data n'est pas à la portée de toutes les bourses. Les investissements sont conséquents pour des résultats incertains. Pour bien en comprendre l'intérêt, il est prudent de soulever le capot de la technologie et d'en évaluer les limites : Les limites du Big Data.

IV. Les ressources