Les bases de données relationnelles, étroitement associées au langage SQL, comportent intrinsèquement un certain nombre de règles d'organisation - les formes normales par exemple, pour garantir la robustesse du schéma relationnel - et de sécurité incontournables. Ces règles sont particulièrement efficaces pour un mode de gestion courant des données. Mais elles s'avèrent être un véritable obstacle pour le déploiement de bases de données de grande envergure et redondantes, comme le nécessite le big data, stockage et analyse. Il faut donc adopter un autre mode de gestion des données pour faciliter les analyses massives.
D'autre part, l'orientation "document" facilite le déploiement de la base sur de multiples machines. En automatique bien sûr. Le développeur ne se préoccupe pas de la localisation des documents, fractionnés ou pas.
Lorsque la base devient trop importante, il suffit de définir de nouvelles machines connectées sur le réseau,un nouveau cluster, et la base NoSQL se débrouille.
C'est bien là la réponse aux nouvelles applications exigeantes en rapidité de traitement et en quantité de données gérées. Des quantités de l'ordre de plusieurs centaines de téraoctets, par exemple.
À noter, il existe aussi les bases NOSQL de type "colonnes" et les bases de type "graphe". Les bases de type "colonnes" sont une excellente solution pour réaliser des analyses massives.Elle sont toutefois plus complexes à exploiter. Les bases de type graphes, plus délicates à appréhender sont, comme leurs dénomination l'indique, plus adaptées à la résolution des questions d'organisation en réseau (structure en arcs et noeuds), particulièrement utiles pour gérer les notions d'appartenance à des groupes sociaux par exemple. Il suffit en effet de suivre le graphe en parcourant les noeuds pour percevoir l'ensemble des liens et accéder plus aisément à un élément précis. Voir aussi Map-Reduce
Ainsi, elles ne sont pas toutes totalement rigoureuses sur l'intégrité des transactions (ACID) et ne garantissent pas systématiquement la consistance des données.
Cela dit, la tolérance aux pannes, la flexibilité et l'évolutivité sans contrainte, trois caractéristiques des bases NoSQL, sont des préoccupations pour tous les concepteurs de base de données.
Les impératifs du "time to market" toujours plus court sont un bon aiguillon pour inciter les DSI à réviser sérieusement la gestion des données de l'entreprise. Il s'agit en effet d´adopter des solutions à la mise en oeuvre plus rapide. Bien entendu, toutes les applications ne basculeront pas du jour au lendemain sur les nouveaux modèles de bases de données. Mais une réflexion pour une optimisation efficace des principes de stockage en accord avec les applications utilisatrices s'impose.
Un premier livre plus généraliste sur le Big Data mais qui traite aussi comme il se doit des spécificités des bases NoSQL...
Big Data et Machine Learning
Les concepts et les outils de la data science
Pirmin Lemberger, Marc Batty,...
Dunod
272 pages
Dispo :
www.amazon.fr
& Format Kindle
Un deuxième guide pratique de la base de données Open Source orientée document : MongoDB. The NoSQL Database for Cloud and Desktop Computing (Langue anglaise)...
MongoDB
P. Membrey, E. Plugge, T. Hawkins
Apress
3ème édition 2015
376 pages
Dispo :
www.amazon.fr
& Format Kindle
Un dernier guide pratique de la base de données Open Source orientée document...
Cassandra
Eben Hewitt
O'Reilly Media
3ème édition 2020
400 pages
Dispo :
www.amazon.fr
& Format Kindle