Broadcom ha dado un paso significativo en la interconexión de redes para inteligencia artificial (IA) con el lanzamiento de Thor Ultra, la primera tarjeta de red Ethernet (NIC) de 800G orientada a IA. Este desarrollo busca conectar cientos de miles de XPUs, como GPUs, CPUs y otros aceleradores, para el entrenamiento e inferencia de modelos de gran escala que manejen billones de parámetros, empleando redes Ethernet abiertas y estandarizadas.
La implementación de Thor Ultra resuelve varios de los desafíos que enfrentan las redes de IA a gran escala debido a las limitaciones del RDMA clásico. Entre las innovaciones de esta tarjeta se destacan el multipathing a nivel de paquete para equilibrar la carga, la entrega fuera de orden directamente en la memoria de la XPU para maximizar la utilización de la red, la retransmisión selectiva que acelera el tiempo de finalización de tareas (JCT), y un control de congestión programable que administra eficazmente picos y microcongestiones.
Thor Ultra, compatible con la especificación del Ultra Ethernet Consortium (UEC), no solo mejora el rendimiento sostenido de los clústeres de IA, sino que también reduce la dependencia de soluciones propietarias. Esta compatibilidad se extiende a cualquier XPU, óptica o switch desde la capa inicial hasta los elementos de red de alta densidad.
En términos de hardware, Thor Ultra se presenta en formatos estándar como PCIe CEM y OCP 3.0, utilizando una interfaz de host PCI Express Gen6 y SerDes PAM4, garantizando baja tasa de error de bits y soportando cobre pasivo de largo alcance. En cuanto a seguridad, la NIC incorpora cifrado/descifrado optimizado, arranque seguro con firmware verificado y atestación del dispositivo, además de herramientas avanzadas de telemetría y control de congestión.
Thor Ultra también se integra perfectamente dentro del ecosistema de Broadcom que incluye productos como Tomahawk y Jericho, permitiendo la creación de tejidos Ethernet a 800G con telemetría avanzada, visibilidad total y compatibilidad garantizada. Esta flexibilidad brinda a los clientes la capacidad de elegir su equipamiento y facilitar una adopción menos dependiente de proveedores verticales.
La aparición de redes RoCE/UEC sobre Ethernet responde a la necesidad de estandarizar operaciones ante el crecimiento exponencial de los clústeres de IA. Broadcom apuesta por un uso más amplio de Ethernet mediante la mejora del RDMA, lo que permitirá soportar la nueva generación de IA con características como multipathing fino, reordenación inteligente y control de congestión distribuido. El soporte para DACs de largo alcance y formatos estándar facilita la integración en infraestructuras ya existentes.
Thor Ultra representa un avance estratégico, destinado a escalar las capacidades de la IA sin necesidad de cambiar las infraestructuras de red actuales. Permite enfrentar distintos cuellos de botella en el ciclo de IA, desde el entrenamiento hasta la inferencia, asegurando la estabilidad en entornos multi-tenant gracias a su capacidad de segmentación y auditoría sin sacrificar rendimiento.
Actualmente en fase de sampling para clientes y socios, este lanzamiento se posiciona como un elemento central dentro de la visión de Broadcom para fábricas de IA basadas en Ethernet, priorizando la interoperabilidad y eficiencia en gran escala. Con Thor Ultra, Broadcom eleva la barra en la tecnología de redes para IA, estableciendo un estándar en 800G y acelerando la transición hacia redes abiertas UEC.
Más información y referencias en Noticias Cloud.