Cassandra, une base de données distribuée NoSQL

Abonnements, magazines... Notre catalogue complet au bas de cette page.

Développée à l'origine par les ingénieurs de Facebook, distribuée, tolérante aux fautes et NoSQL, Cassandra est une base de données très originale. Découvrons là.

Stocker des données est un besoin récurrent en informatique. La pratique établie consiste à utiliser un système de base de données relationnelle (SGDBR) tel que MySQL, SQL Server, PostgreSQL, Oracle ou autre. Avec ces systèmes, les données sont organisées dans des tables, conformément à un modèle relationnel. Il est alors possible de retrouver une information quelconque dans la table au moyen de l'algèbre relationnelle, exprimée par les fameuses requêtes SQL.

Cette approche du stockage de données a largement fait ses preuves. Mais les très gros volumes de données et les architectures distribuées (clusters) font apparaître de nouvelles solutions, même si les bases de données classiques se sont adaptées aux clusters. Les bases de données NoSQL, si elles ne sont pas nouvelles,les premières ayant vu le jour en 1998, commencent à faire leur apparition sur la scène informatique, en situation de production. Ainsi en est-il de la base de données Cassandra qui a été initialement développée par les ingénieurs de Facebook. Offerte à la communauté Open Source, Cassandra est actuellement un des projets phare de la fondation Apache et elle est utilisée par de très gros de l'Internet comme Twitter ou Digg. Cassandra est écrite en Java. C'est une base de données distribuée qui rend très facile la mise en place d'un cluster.

Un noeud défaillant peut être réparé à chaud et une défaillance d'un noeud dans le cluster ne provoque pas une défaillance générale du système puisque les données sont automatiquement répliquées sur tous les noeuds qui sont tous identiques. Cassandra est une base de données intéressante et amusante à découvrir, même pour un amateur qui voudra mettre en place un mécanisme de réplication de données sur son réseau personnel. Le seul point noir est la carence d'une documentation claire, et écrite à l'attention de ceux qui ne savent pas déjà, aussi bien pour la base de données elle-même qu'en ce qui concerne les librairies client. Votre serviteur espère que cet article vous aidera à vous y retrouver.

Frédéric Mazué

S'ABONNER