AWS : nouvelle instance EC2 P5e basée sur les NVIDIA H200

Par:
francoistonic

mer, 11/09/2024 - 11:57

AWS annonce la disponibilité des instances EC2 P5e utilisant les NVIDIA H200. Ces instances sont dédiées à l'inférence LLM. Ce sont les premières instances intégrant ces GPU. Actuellement la P5e.48xlarge est la seule disponible : 192 vCPU, 2 To de RAM, 8 H200, 1 To de RAM côté GPU, une bande passante de 900 Gb/s et un stockage NVMe de 24 To. La P5e se dédie à des usages très précis dans l'IA. 

D'autres instances P5 sont attendues dans les prochaines semaines. 

Tous les détails : https://aws.amazon.com/fr/blogs/machine-learning/amazon-ec2-p5e-instances-are-generally-available/