AWS et NVIDIA collaborent à construire une infrastructure d'intelligence artificielle à la demande

Par:
fredericmazue

mer, 22/03/2023 - 09:23

A l’occasion de la conférence NVIDIA GTC qui a lieu en ce moment, Amazon Web Services (AWS) et NVIDIA ont annoncé une collaboration en plusieurs parties visant à construire ce que les partenaires décrivent comme l'infrastructure d'intelligence artificielle (IA) à la demande la plus évolutive au monde, optimisée pour entraîner des « Large Langage Models » (LLM) de plus en plus complexes et développer des applications d'IA générative.

Cette collaboration intégrera des instances P5 d'Amazon Elastic Compute Cloud (Amazon EC2) de nouvelle génération, équipées de GPU NVIDIA H100 Tensor Core du réseau et de l'évolutivité de pointe d'AWS, qui fourniront jusqu'à 20 exaFLOPS de performances de calcul pour construire et entraîner les plus grands modèles de deep learning. Les instances P5 seront les premières instances basées sur le GPU à tirer parti du réseau Elastic Fabric Adapter (EFA) de deuxième génération d'AWS, qui fournit 3 200 Gbps de débit réseau à faible latence et à large bande passante, permettant aux clients de faire évoluer jusqu'à 20 000 GPU H100 dans des UltraClusters EC2 pour un accès à la demande à des performances de classe supercalculateur pour l'IA.