Talend Open Studio for Big Data sous licence Apache Hadoop
jeu, 01/03/2012 - 14:11
Talend annonce Talend Open Studio for Big Data, sous licence Apache. Pour l'occasion, Talend Open Studio t a été enrichi du support natif d’Apache Hadoop. En outre, Talend Open Studio for Big Data sera livré au sein d’Hortonworks Data Platform - la distribution Hadoop d’Hortonworks.
Talend Open Studio for Big Data est une solution open source d’intégration de données conçue pour améliorer spectaculairement la conception de jobs d’intégration via un environnement de développement graphique particulièrement convivial. Talend Open Studio for Big Data offre un support natif de HDFS (Hadoop Distributed File System), Pig, HBase, Sqoop et Hive. En capitalisant sur l’architecture MapReduce d’Hadoop dédiée aux traitements de données hautement distribués, Talend génère en natif du code Hadoop et exécute des transformations de données directement au sein d’Hadoop, pour assurer une montée en charge maximale. Cette fonctionnalité permet aux entreprises de combiner aisément des traitements basés sur Hadoop avec des processus traditionnels d’intégration de données – qu’ils soient ETL ou ELT – pour bénéficier de performances globales supérieures.
«Talend Open Studio for Big Data devenant un composant clé d’intégration d’Hortonworks Data Platform, nous fournissons aux utilisateurs d’Hadoop la capacité de déplacer des données dans et hors d’Hadoop sans nécessité de recourir à une programmation complexe » déclare Eric Baldeschwieler, CTO et co-fondateur d’Hortonworks. « Talend offre aux entreprises la solution d’intégration open source la plus puissante du marché et nous sommes fiers de collaborer avec ses équipes pour fournir à la communauté Apache Hadoop des fonctionnalités d’intégration aussi avancées. »
Talend Platform for Big Data propose:
- Intégration de ‘Big Data’ : charger des ‘big data’ dans Hadoop via HDFS, HBase, Sqoop ou Hive est souvent considéré comme une problématique d’intégration de données opérationnelles. Talend Platform for Big Data fournit un éventail de composants graphiques et d’espaces de travail permettant d’interagir avec une source ou une cible de ‘big data’ sans nécessité d’apprendre et d’élaborer une programmation complexe.
- Qualité des ‘Big Data’ : Talend Platform for Big Data propose des fonctions de qualité de données tirant parti de l’environnement massivement parallèle d’Hadoop. La plate-forme permet aux développeurs de capitaliser sur l’environnement de traitement haute performance pour identifier des doublons au sein de ces jeux de données très étendus, en quelques minutes plutôt que quelques jours. Elle prend également en charge les opérations de profiling de ‘big data’, ainsi que d’autres problématiques de qualité, car les fonctions de qualité de données de Talend peuvent être employées pour des projets de ‘big data’.
- Optimisation de Projet : Talend Platform for Big Data offre en outre la capacité de planifier, contrôler et déployer tout job de ‘big data’, en tirant parti d’un référentiel partagé pour aider les analystes de données à collaborer et à partager les métadonnées et les objets de leurs projets.
Pour Talend, technologie open source aide les entreprises de toutes tailles à convertir d’énormes jeux de données en intelligence métier. Alors que le déploiement de systèmes propriétaires à travers des environnements étendus et distribués de ‘big data’ est coûteux, les logiciels open source se révèlent beaucoup plus économiques et flexibles que les solutions traditionnelles, et supportent la dimension temps réel, sans augmentation du coût des licences. Ainsi les logiciels open source représentent une technologie de choix pour les applications de ‘big data’.
« Les solutions de big data de Talend offrent une alternative complète et 100% open source, capable de relier Apache Hadoop au reste des applications de l’entreprise. Elles bénéficient en premier lieu aux spécialistes des données en facilitant l’accès et l’analyse de volumes massifs de données » commente Fabrice Bonan, COO et co-fondateur de Talend. « Grâce à la disponibilité de Talend Open Studio for Big Data sous licence Apache et grâce à notre partenariat avec Hortonworks, nous sommes fiers de contribuer à la démocratisation des big data et de simplifier l’intégration d’Hadoop dans des architectures existantes, sans nécessité d’investir des sommes considérables dans des solutions propriétaires non évolutives. »
Talend Open Studio for Big Data sera disponible à partir de mai 2012. Une version de preview est accessible immédiatement à : http://www.talend.com/download-tibd