Pivotal lance Greenplum, un data warehouse open source à traitement massivement parallèle
ven, 30/10/2015 - 12:06
Pivotal vient de dévoiler le premier data warehouse open source à traitement massivement parallèle (MPP, Massively Parallel Processing). Fruit de 10 années de développement et de presque deux millions de lignes de code, Greenplum Database incarne la toute dernière solution core data de Pivotal, commercialisée sous licence Apache Software 2.0.
Greenplum Database se distingue des autres systèmes de traitement de données open source (Apache Hadoop(r), MySQL, PostgreSQL) par son utilisation de la technologie MPP. Résultat, selon Pivotal : Greenplum Database exécute des analyses SQL complexes sur d’énormes volumes de données, à des vitesses plusieurs fois supérieures à toute autre solution testée à ce jour.
« Nous sommes persuadés que l’ouverture du code source d’un data warehouse si largement adopté va produire un effet de levier sur l’ensemble du secteur. En abaissant les barrières à l’entrée d’une analyse temps réel à grande échelle, l’open source permet à davantage d’entreprises de relever les défis du Big Data. Par conséquent, nous pensons voir aboutir un plus grand nombre de projets Big Data d’envergure dans tous les secteurs d’activité.
Avec la sortie d’une base de données aussi fiable et substantielle, nous prévoyons l’émergence rapide d’une forte communauté Greenplum, appelée à stimuler l’innovation Big Data à un moment où le secteur et les clients en ont le plus besoin.
Pour la communauté open source, cette étape marque une évolution majeure. À l’image de Pivotal, beaucoup d’éditeurs de progiciels voient dans l’open source un moyen plus efficace de développer des logiciels. L’open source offre en effet aux clients l’assurance que leurs besoins seront satisfaits sur le long terme, sachant qu’ils peuvent modifier et enrichir directement le code sous-jacent.
Les éditeurs eux-mêmes ont également tout à y gagner, car de nombreux clients ne voient que par l’open source. Pour répondre à leurs demandes, de grands éditeurs de logiciels se résolvent donc à ouvrir le code source de tous leurs produits cloud et de traitement de données dans les 10 prochains mois — soit presque 10 millions de lignes de code. Dans cette nouvelle ère de l’informatique, les éditeurs commerciaux du monde entier doivent se rendre à l’évidence : les beaux jours des modèles de codes propriétaires et verrouillés sont bel et bien révolus. » explique l'éditeur.
Des ressources et le code source sont disponibles à l’adresse greenplum.org.