Meta ha dado un paso significativo en el campo de la inteligencia artificial con el anuncio de Catalina, su nueva arquitectura de hardware presentada en el Open Compute Project (OCP). Esta iniciativa combina la potencia del NVIDIA Blackwell GB200 NVL72, el estándar Open Rack v3 (ORv3), y un sistema de refrigeración líquida de alta densidad. Con esto, Meta busca no solo escalar su infraestructura de IA, sino también promover la colaboración abierta en un sector dominado por soluciones propietarias.
El crecimiento de Meta en el ámbito de la inteligencia artificial ha sido notable. En 2022, la empresa operaba con clusters de aproximadamente 6.000 GPUs. Un año después, con el auge de la IA generativa y los grandes modelos de lenguaje, estos clusters aumentaron a 16.000-24.000 GPUs. Para 2024, Meta ya gestionaba más de 100.000 GPUs en producción, un crecimiento impulsado por el entrenamiento de modelos como Llama 3.1, que utiliza más de 16.000 GPUs H100 y 15 billones de tokens.
Catalina surge como respuesta a esta creciente demanda de computación. Los pods de Catalina, cada uno formado por dos racks IT, ofrecen un dominio de escalado de 72 GPUs y distintas innovaciones como interconexiones NVLink, NVSwitches para conexión interna y un sistema avanzado de refrigeración líquida asistida por aire. Estos pods pueden expandirse a través de Disaggregated Scheduled Fabric (DSF), una red que conecta múltiples pods y racks en un único superclúster.
La implementación de Open Rack v3 es parte esencial de Catalina. ORv3 soporta hasta 94 kW por rack, integrando unidades de energía de 480 V y sistemas de refrigeración compatibles con infraestructuras modernas, lo cual reduce tiempo de despliegue y mantenimiento. Estos avances reflejan la apuesta de Meta por la eficiencia energética y la sostenibilidad.
Meta también está diversificando sus opciones tecnológicas. Aunque Catalina se basa en el NVIDIA GB200 NVL72, la plataforma Grand Teton ahora incorpora aceleradores de AMD Instinct MI300X, y se ha desarrollado un ASIC de red propio (FBNIC) junto con switches de Broadcom y Cisco, afirmando la apertura tecnológica.
La colaboración de Meta con Microsoft dentro del OCP destaca su estrategia de cooperación en el desarrollo de estándares como SAI y OAM. Juntos, trabajan en innovaciones como Mount Diablo, que optimiza el uso del espacio dentro de los racks.
La presentación de Catalina simboliza un compromiso con la apertura tecnológica. Meta insiste en que la inteligencia artificial necesita un entorno abierto para alcanzar su verdadero potencial, impulsando el uso de hardware modular, redes desagregadas y colaboración industrial. Esto busca democratizar la IA y asegurar que sus beneficios sean ampliamente accesibles.
Catalina representa un avance en la infraestructura digital, centrada en escalar masivamente, mantener la eficiencia energética y promover la apertura tecnológica. Con los centros de datos como centros neurálgicos de la inteligencia artificial, Meta aspira a liderar con tecnología de punta y un enfoque colaborativo que podría transformar la industria.
Más información y referencias en Noticias Cloud.