Amazon ha dado un paso significativo en el ámbito de la inteligencia artificial con el lanzamiento de su innovador sistema SageMaker HyperPod, diseñado para maximizar el uso de las NVIDIA Blackwell GPUs en un único sistema. Este avance se espera que impulse una nueva ola de innovaciones en el sector, gracias a su impresionante capacidad de 360 petaflops en cálculo de punto flotante denso (FP8) y 1.4 exaflops en cálculo de punto flotante disperso (FP4).
En el núcleo de esta solución se encuentran los nuevos P6e-GB200 UltraServers, potenciados por la arquitectura NVIDIA GB200 NVL72, que prometen un rendimiento sin precedentes en el desarrollo e implementación de modelos de inteligencia artificial a escala de mil billones de parámetros. Estos servidores Ultra, integrados en el entorno de entrenamiento distribuido de SageMaker HyperPod, ofrecen a las organizaciones la capacidad de escalar rápidamente, minimizando el tiempo de inactividad y facilitando la transición del entrenamiento al despliegue masivo.
Los UltraServers destacan por su integración de 36 CPUs NVIDIA Grace con 72 GPUs Blackwell en un único dominio NVLink, lo que proporciona un acceso sin igual a recursos computacionales esenciales. Este diseño permite una mejora significativa en el rendimiento y eficiencia en la formación de modelos de IA.
Además, la solución ofrece una red de alto rendimiento, con un ancho de banda de 130 TBps de baja latencia entre las GPUs, optimizando la comunicación en trabajos de IA a gran escala. Con un soporte de hasta 405 TB de almacenamiento NVMe SSD local, se maximiza el proceso de entrenamiento de modelos permitiendo un almacenamiento y acceso rápido a datos críticos.
Al combinar SageMaker HyperPod con los P6e-GB200 UltraServers, las organizaciones pueden lograr un entrenamiento y despliegue más ágiles y eficaces de modelos de IA generativos avanzados. Esto es particularmente ventajoso para aquellas que manejan múltiples equipos y proyectos, optimizando el uso de infraestructura y minimizando los costos operativos.
Las capacidades de UltraServer están disponibles a través de planes de entrenamiento flexibles en la zona local de AWS en Dallas, facilitando el acceso a potentes herramientas que Amazon ofrece para la evolución de la inteligencia artificial en diversos sectores. Las organizaciones interesadas pueden registrarse en la consola de SageMaker para iniciar el uso de esta innovadora tecnología y maximizar sus inversiones en IA.