TensorWave Launches the Largest AMD GPU Cluster in North America: 8,192 MI325X with Direct Liquid Cooling for AI

En un movimiento audaz para redefinir el panorama de la inteligencia artificial en Norteamérica, la startup TensorWave ha revelado el despliegue del clúster de entrenamiento de IA más grande basado en GPU AMD hasta la fecha. Con un impresionante conjunto de 8.192 aceleradores Instinct MI325X, esta innovación marca un hito técnico y estratégico en un sector tradicionalmente dominado por NVIDIA.

Un factor distintivo de esta instalación es su sistema de refrigeración líquida directa a chip, un enfoque pionero a esta escala. La compañía ha compartido imágenes del clúster en la red X, mostrando complejos bastidores atravesados por bucles de refrigeración de color naranja brillante. Este sistema ya se encuentra en pleno funcionamiento, ofreciendo capacidades de entrenamiento en la nube bajo demanda.

El AMD Instinct MI325X, lanzado a finales de 2024, destaca por su arquitectura innovadora. Equipado con 256 GB de memoria HBM3e y un ancho de banda de 6 TB/s, cada acelerador alcanza hasta 2,6 PFLOPS de cálculo en FP8, gracias a sus 19.456 núcleos stream. Aunque no puede competir en escala por nodo con NVIDIA, TensorWave apuesta por la eficiencia y densidad térmica por rack.

La infraestructura completa genera más de 2 PB/s de ancho de banda agregado y un rendimiento pico teórico de 21 exaFLOPS en precisión FP8. Sin embargo, el desempeño sostenido dependerá de la eficiencia del paralelismo del modelo y su arquitectura de interconexión.

La implementación de refrigeración líquida es clave para manejar los 1.000 vatios que consume cada GPU, algo imposible de gestionar solo con aire. Esta decisión no solo optimiza la operación actual, sino que también prepara el terreno para futuras actualizaciones con GPUs MI350X, que podrían alcanzar hasta 1.400 vatios de consumo por unidad.

Este avance llega poco después de que TensorWave asegurara una ronda de financiación Serie A de 100 millones de dólares, liderada por AMD Ventures. La elección de AMD sobre NVIDIA no solo responde a razones económicas, sino también a la confianza en la madurez del ecosistema ROCm para entrenamientos a gran escala. Aunque NVIDIA sigue siendo el líder indiscutible del mercado, el éxito de TensorWave establece un precedente para diversificar las opciones disponibles.

De cara al futuro, TensorWave planea integrar las GPUs MI350X en la segunda mitad de 2025 y explorar nuevas precisiones como FP4 y FP6. Con más de 8.000 GPUs AMD ya en funcionamiento bajo cargas reales, la startup se posiciona como un referente para clientes que buscan soluciones alternativas y competitivas. Este proyecto podría influir en otras empresas interesadas en IA sostenible y escalable, sirviendo como ejemplo de innovación y eficiencia en el sector.

More information and references in Cloud News.

Silvia Pastor
Silvia Pastor
Silvia Pastor is a prominent journalist for Noticias.Madrid, specializing in investigative journalism. Her daily work includes covering important events in the capital, writing current affairs articles, and producing audiovisual segments. Silvia conducts interviews with key figures, provides expert analysis, and maintains an active presence on social media, sharing her articles and providing real-time updates. Her professional approach, focused on truthfulness, objectivity, and journalistic ethics, makes her a reliable source of information for her audience.

More popular

More articles like this one.
Relacionados

Trump: Un Tirano en la Sombra, Aún No He Terminado de Hablar

La exvicepresidenta de Estados Unidos y aspirante demócrata a...

Israel Reporta Ataque Dirigido contra Miembro de la Yihad Islámica en el Centro de Gaza

En las últimas dos semanas, las tensiones en Israel...

Valencianos se Manifiestan Exigiendo la Dimisión de Mazón a un Año de la Dana

Miles de valencianos han salido nuevamente a las calles,...

Rusia advierte a la UE: “Confiscar activos tendrá un costo adicional”

Rusia ha lanzado una dura advertencia a la Unión...
Privacy Overview

This website uses cookies so that we can provide you with the best user experience possible. Cookie information is stored in your browser and performs functions such as recognising you when you return to our website and helping our team to understand which sections of the website you find most interesting and useful.