Les Bases de données NoSQL, principe

Par   Partagez : Envoyer le lien de cet article par e-mail   

Bases de données NoSQL Vs SGBDR

base NoSQL

Que sont les bases de données NoSQL ?

Les bases de données relationnelles se prêtent mal aux exigences des applications massivement parallèles exploitant de grandes quantités de données. Les bases de données NoSQL (Not Only SQL) marquent une rupture assez brutale avec la manière de concevoir les schémas de données que l'on pratique depuis (déjà !) quelques décennies.
Spécifiquement dédiées aux applications orientées Internet, les bases de données NoSQL pallient ainsi aux difficultés de la gestion de bases de données relationnelles un peu trop conséquentes et réparties sur plusieurs machines.

Pourquoi NoSQL ?

Le langage SQL règne en maître sur les bases de données relationnelles depuis quelques décennies. SQL est un langage d'interrogation dit de 4ème génération standardisé, à quelques variantes près proposées par les principaux éditeurs de base de données.

Les bases de données relationnelles, étroitement associées au langage SQL, comportent intrinsèquement un certain nombre de règles d'organisation - les formes normales par exemple, pour garantir la robustesse du schéma relationnel - et de sécurité incontournables. Ces règles sont particulièrement efficaces pour un mode de gestion courant des données. Mais elles s'avèrent être un véritable obstacle pour le déploiement de bases de données de grande envergure et redondantes, comme le nécessite le big data, stockage et analyse. Il faut donc adopter un autre mode de gestion des données pour faciliter les analyses massives.

Principe des bases de données NoSQL

Les bases de type NoSQL, a fortiori les bases orientées "document", délaissent les points forts des bases relationnelles, que sont la notion d'enregistrement et les relations entre éléments, pour se focaliser sur la notion de "document". Les bases NoSQL s'avèrent beaucoup plus flexibles et bien plus évolutives. La structure organisationnelle n'est plus liée à un schéma relationnel difficile à modifier, et la base peut donc croître sans contrainte.

D'autre part, l'orientation "document" facilite le déploiement de la base sur de multiples machines. En automatique bien sûr. Le développeur ne se préoccupe pas de la localisation des documents, fractionnés ou pas. Lorsque la base devient trop importante, il suffit de définir de nouvelles machines connectées sur le réseau, et la base NoSQL se débrouille.

C'est bien là la réponse aux nouvelles applications exigeantes en rapidité de traitement et en quantité de données gérées. Des quantités de l'ordre de plusieurs centaines de téraoctets, par exemple.

À noter, il existe aussi les bases NOSQL de type "colonnes" et les bases de type "graphe". Les bases de type "colonnes" sont une excellente solution pour réaliser des analyses massives. Les bases de type graphes, plus délicates à appréhender sont, comme leurs dénomination l'indique, plus adaptées à la résolution des questions d'organisation en réseau (structure en arcs et noeuds). Voir aussi Map-Reduce

Est-ce la fin des SGBD relationnels ?

Les bases de données NoSQL ne remplacent pas nécessairement les bases de données relationnelles. Elles ne s'adressent pas aux mêmes types d'applications. Pour le moment en tout cas.

Ainsi, elles ne sont pas toutes totalement rigoureuses sur l'intégrité des transactions (ACID) et ne garantissent pas systématiquement la consistance des données.

Cela dit, la tolérance aux pannes, la flexibilité et l'évolutivité sans contrainte, trois caractéristiques des bases NoSQL, sont des préoccupations pour tous les concepteurs de base de données.

Les impératifs du "time to market" toujours plus court sont un bon aiguillon pour inciter les DSI à réviser sérieusement la gestion des données de l'entreprise. Il s'agit en effet d´adopter des solutions à la mise en oeuvre plus rapide. Bien entendu, toutes les applications ne basculeront pas du jour au lendemain sur les nouveaux modèles de bases de données. Mais une réflexion pour une optimisation efficace des principes de stockage en accord avec les applications utilisatrices s'impose.

Ressources en ligne

3 des principales bases NoSQL Open Source

  • CouchDB, un produit du projet Apache couchdb.apache.org. C'est une base de type "documentaire".
  • Cassandra développée chez Facebook, et maintenant en Open Source, dans la couveuse de projets de la fondation cassandra.apache.org. C'est une base de type "colonnes".
  • MongoDB, une base NoSQL orientée document, particulièrement bien diffusée et professionnalisée mongodb.org

Autres bases nosql à connaître


Ouvrages de référence

1. Un premier guide pratique de la base de données Open Source orientée document : CouchDB. (Langue anglaise)

Hadoop: The Definitive Guide CouchDB
J. Chris Anderson, Jan Lehnardt, Noah Slater
O'Reilly Media
272 pages
Prix : 46,65 €
Dispo :
www.amazon.fr & Format Kindle

2. Un deuxième guide pratique de la base de données Open Source orientée document : MongoDB. The NoSQL Database for Cloud and Desktop Computing (Langue anglaise).

The Definitive Guide to MongoDB: The NoSQL Database for Cloud and Desktop Computing MongoDB
P. Membrey, E. Plugge, T. Hawkins
Apress   2ème édition Novembre 2013
336 pages
Prix : 34,07 €
Dispo :
www.amazon.fr & Format Kindle

3. Un dernier guide pratique de la base de données Open Source orientée document : Cassandra

Cassandra: The Definitive Guide Cassandra
Eben Hewitt
O'Reilly Media
336 pages
Prix : 38,59 €
Dispo :
www.amazon.fr & Format Kindle



Partagez cet article...

Envoyer le lien de cet article par e-mail   
(total partages cumulés > 45)

Commentaires lecteurs...

Pour commenter en tant qu'Anonyme, cliquez sur "Commencez la discussion" Puis sur "Nom", tout en bas apparaît alors une case à cocher : "Je préfère publier en tant qu'invité"

La reproduction ou la traduction totale ou partielle de ce texte, images et documents est formellement interdite. Voir ici les conditions pour publier un extrait sur votre site ou blog. Ce texte et les images et documents qu'il contient est déposé auprès de l'IDDN

Suivez aussi les news du portail sur Twitter et rejoignez-nous sur Facebook

Google+    Twitter    Facebook

Excel ® est une marque déposée de Microsoft Corp ®
Gimsi ® est une marque déposée de Alain Fernandez


Copyright : Alain FERNANDEZ ©1998-2017 Tous droits réservés Mentions légales
Toutes les marques citées sur cette page sont des marques déposées de leur propriétaire respectif.


Management de l'entreprise
»» Toutes les fiches Piloter.org »»
  Suivez-nous :   Google+   twitter+  Facebook  Linkedin    e-mail