En el competitivo panorama del hardware de inteligencia artificial, NVIDIA parece liderar con su serie Blackwell y la nueva plataforma Rubin. Sin embargo, Positron AI, bajo la dirección de Mitesh Agarwal, sugiere que hay espacio para otras propuestas, especialmente aquellas que se centran en inferencias más económicas y eficientes. La empresa apuesta por sistemas refrigerados por aire, a diferencia de las GPUs de NVIDIA que requieren sofisticadas instalaciones de refrigeración líquida.
Los productos de Positron, Atlas y su próxima generación Asimov, prometen consumir de 2 a 5 veces menos energía en cargas de inferencia. Esto se suma a un diseño que permite su uso en racks convencionales, un aspecto crucial para empresas que quieren maximizar infraestructuras ya existentes, especialmente porque el 95% de la capacidad instalada utiliza refrigeración por aire.
En el ámbito de los centros de datos, donde los costos, los tiempos y la complejidad son factores determinantes, Positron argumenta que su enfoque no sacrifica rendimiento, sino que está optimizado para inferencias, manteniéndose eficiente en términos térmicos y energéticos. Las GPUs de NVIDIA, diseñadas para manejar altas densidades de energía, requieren sistemas de refrigeración líquida costosos y complejos, una barrera significativa para muchos.
El enfoque de Positron se centra en inferir más tokens por euro y vatio. Con un presupuesto energético por chip significativamente menor que el de sus competidores, y un rendimiento por coste notablemente mejorado, prometen amplios retornos de inversión. La compañía se marca como especialista en inferencia, el área con mayor crecimiento proyectado entre 2025 y 2028.
Un factor clave que podría dar ventaja a Positron es la escasez de HBM y los cuellos de botella en la fabricación avanzada, donde han optado por desarrollar una arquitectura de memoria propia, evadiendo las limitaciones del suministro que afectan a grandes jugadores como NVIDIA, AMD y TPU.
En cuanto al hardware adicional, Positron incorpora sistemas con CPUs x86, específicamente AMD EPYC, y una configuración que maximiza el uso de memoria. Esto se traduce en una utilización eficiente del ancho de banda, superando a muchas soluciones GPU en el mercado.
NVIDIA, por su parte, está respondiendo con Rubin CPX, centrado en optimizar las etapas de entrada de tokens. No obstante, Agarwal parece indiferente, argumentando que el valor real está en la salida, en aplicaciones como la generación de código, vídeo y largas secuencias, áreas donde Positron optimiza su rendimiento.
La estrategia de Positron se centra en capturar un segmento del mercado que sigue utilizando tecnología basada en aire, con una fuerte propuesta de retorno de inversión y un enfoque específico en las necesidades actuales de inferencia. En un mercado en rápido cambio, la capacidad de adaptarse a infraestructuras existentes puede ser un factor decisivo para su éxito.
Más información y referencias en Noticias Cloud.