Neo4j et Google Cloud annoncent de nouvelles fonctionnalités GraphRAG pour les applications d'IA générative

Par:
fredericmazue

mar, 16/04/2024 - 14:14

Neo4j a annoncé la disponibilité de nouvelles intégrations natives à la plateforme de Google Cloud avec comme objectif d’accélérer le développement et le déploiement d’applications d’IA générative. Ces intégrations veulent aider les entreprises qui sont confrontées à la complexité et aux hallucinations lors de la création et du déploiement de ce type d’applications, nécessitant, le plus souvent, des données contextuelles en temps réel et des résultats précis et explicables. 

Les graphes de connaissances identifient les relations entre les données, permettant ainsi aux LLMs (Grands modèles de langage) de mieux ancrer les faits, leur permettant  de raisonner, déduire et récupérer les informations les plus pertinentes avec précision et efficacité.

La génération augmentée par récupération (Retrieval Augmented Generation, ou RAG) est la méthode par laquelle les LLMs s'alimentent en données externes. La combinaison des graphes de connaissances avec RAG, connu sous le nom de GraphRAG, permet aux LLMs d’accéder à des ensembles de données externes et garantit des résultats d’IA générative plus précis, explicables et transparents.

GraphRAG avec Google Cloud : capacités et avantages

Les développeurs peuvent désormais appliquer GraphRAG aux graphes de connaissances afin d'améliorer la précision, le contexte et la capacité d'explication des LLMs. Parmi les avantages de GraphRAG on retrouve :  

1. Développement rapide de graphes de connaissances et des résultats plus précis. Les développeurs peuvent désormais facilement créer des graphes de connaissances avec Gemini, VertexAI, LangChain et Neo4j à partir de données non structurées telles que des PDF, des pages web et d’autres documents, notamment ceux chargés directement ou à partir de Google Cloud Storage (GCS).

2. Ingestion, traitement et analyse des données en quelques secondes. Les développeurs peuvent utiliser des modèles Flex dans Dataflow pour créer des pipelines de données reproductibles et sécurisés qui ingèrent, traitent et analysent des données à travers Google BigQuery, Google Cloud Storage et Neo4j. Une approche pour alimenter les graphes de connaissances avec des informations en temps réel et pour permettre aux applications d’IA générative de fournir des informations pertinentes et opportunes.

3. Conception d’applications d’IA générative alimentées par les graphes de connaissances stockés sur Google Cloud. Les clients peuvent utiliser Gemini sur Google Workspace et Reasoning Engine de Vertex AI pour déployer, surveiller et mettre à l'échelle les applications et les APIs d’IA générative sur Google Cloud Run. Gemini Workspace se base sur les données d’entraînement de Neo4j pour traduire automatiquement tout extrait de code en langage de requête Cypher de Neo4j. Les développeurs peuvent également utiliser Cypher avec n'importe quel environnement de développement intégré (Integrated Development Environment) pris en charge par Gemini Workspace pour une interrogation et une visualisation des données de graphes plus efficaces. Les fonctionnalités de recherche vectorielle, GraphRAG et de mémoire conversationnelle de Neo4j s'intègrent de manière transparente via LangChain et Neo4j AuraDB sur Google Cloud.