La inteligencia artificial sigue impulsando avances significativos en el desarrollo de hardware. NVIDIA ha revelado su nuevo Rubin CPX, una GPU que inaugura la categoría de procesadores para inferencia de contexto masivo dentro del ecosistema CUDA. Este lanzamiento marca un hito al permitir que los sistemas de IA trabajen con ventanas de contexto de hasta un millón de tokens, lo que transformará áreas como la asistencia a la programación y la generación de vídeo multimodal.
Rubin CPX es descrita como la primera GPU CUDA diseñada para manejar contextos de escala masiva, permitiendo que los modelos procesen millones de unidades de información. Esto permitirá a los copilotos de programación comprender proyectos enteros, mientras que aplicaciones de vídeo podrán procesar una hora de contenido en un solo contexto. Este avance es posible gracias a los aceleradores de atención de largo alcance, códecs de vídeo y un diseño centrado en eficiencia energética y alto rendimiento. La GPU ofrece hasta 30 petaflops en precisión NVFP4 y cuenta con 128 GB de memoria GDDR7 optimizada, triplicando la capacidad de atención respecto a generaciones anteriores.
Rubin CPX se integra en la plataforma NVIDIA Vera Rubin NVL144 CPX, ofreciendo 8 exaflops de IA en un rack junto a 100 TB de memoria rápida, lo que representa un salto significativo en rendimiento. NVIDIA planea ofrecer una bandeja de cómputo CPX para ampliar sin necesidad de reemplazar la infraestructura existente.
En su presentación, Jensen Huang, consejero delegado de NVIDIA, comparó este lanzamiento con anteriores revoluciones de la compañía, destacando que los modelos ahora trabajan con millones de tokens, requiriendo una arquitectura completamente nueva. La empresa espera que Rubin CPX genere 5.000 millones de dólares en ingresos por tokens por cada 100 millones invertidos en infraestructura, destacando el papel del hardware como multiplicador de negocios de IA.
Varias empresas ya planean aprovechar las capacidades de Rubin CPX. Cursor pretende ofrecer generación de código ultrarrápida, Runway proyecta mejor control en producciones de vídeo, y Magic busca lograr agentes autónomos de programación sin reentrenamientos.
NVIDIA acompaña el lanzamiento con una pila de software que incluye NVIDIA Dynamo, Modelos Nemotron, NVIDIA AI Enterprise y CUDA-X, diseñada para que los clientes pasen de prototipos a producción sin fricciones.
Rubin CPX estará disponible a finales de 2026, permitiendo a las corporaciones planificar su despliegue y ajustar arquitecturas de datos. Este lanzamiento no solo introduce un nuevo producto, sino que redefine el paradigma de rendimiento en tokens procesados dentro de contextos gigantescos, alineándose con la creciente demanda de IA sofisticada y exponencialmente más compleja.
Más información y referencias en Noticias Cloud.