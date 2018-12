L e big data expliqué au manager en 3 questions/réponses : Quoi, Pourquoi et comment ? Bref tout ce qu'il s'agit de savoir afin de mieux comprendre les enjeux du Big Data

Le Big Data expliqué aux managers en 3 questions/réponses

1) Qu'est-ce que le Big Data ?

L

Une petite présentation rapide pour les managers-décideurs... Big data c'est la capacité de stocker et de traiter de très grandes quantités de données, de l'ordre du petaoctet. FaceBook® par exemple, gère une base de données qui dépasse largement les 100 petaoctets soit : 100 millions de milliards de données. le chiffre 100 suivi de 15 zéros : 100.0000....0000... etc.

Il ne faut pas considérer ces chiffres impressionnants uniquement en terme de capacité de stockage, le "Stock"). La capacité de réactualisation de très grands volumes le "flux" est tout aussi remarquable. Walmart gère ainsi 1 million de transactions commerciales chaque heure.

Enfin le Big Data c'est aussi la capacité de gérer de multiple formats : numériques, textes, images...

2) Pourquoi le Big Data ?

Nous sommes tous de plus en plus présents dans le monde virtuel proposé par le web. Nous laissons des quantités phénoménales de traces sans toujours nous en rendre bien compte. Les acteurs du marketing et les responsables commerciaux des entreprises ne vont surtout pas laisser passer cette manne. Connaître au mieux les prospects et les clients a toujours été le rêve des entreprises commerciales.

Avec le Big Data, le rêve devient réalité. Autant de données disponibles et une capacité d'analyse en théorie sans limite, c'est la possibilité de bâtir de solides modèles. Le big Data est donc aussi un outil d'aide à la décision en entreprise. Lire ici un développement plus complet.

3) Le Big Data, ça marche comment ?

Le big data c'est en fait la mise en action des outils de stockage et de traitement des données massives mis au point par Google ® pour ses propres besoins, puis standardisés et rendus opérationnels par la fondation Apache avec le désormais fameux framework "Hadoop" . L'idée étant de paralléliser à grande échelle les traitements sur de très nombreuses machines peu coûteuses organisées en grappes. La tolérance aux pannes est gérée en totale automatisme.

L'accélération et la parallélisation des traitement imposent un accès facilité aux données. Celles-ci sont donc redondantes. Les bases relationnelles traditionnelles peu adaptées (c'et peu dire !) aux nouvelles conceptions sont donc remplacées par une nouvelle génération.

Les principes fondamentaux de ces nouvelles bases de données ne sont pas exploitables avec le traditionnel langage d'interrogation SQL. Ce sont donc des bases dîtes : "No SQL", d'une structure fort différente des bases de données relationnelles plus classiques.

Pour aller plus avant dans la connaissance du Big Data

Le Big Data est une révolution en soi, aucun doute à ce sujet. La capacité, toujours en croissance, de stocker d'énormes quantités de données conjuguées à une puissance de traitement phénoménale au sens de ce que l'on connaissait jusqu'ici, implique une profonde évolution de nos modes de fonctionnement.

Les technologies qui permettent de bâtir une solution de type Big Data ou Données Massives en français, ont leur origine au sein même des moteurs de recherche du web.

