El avance de China en el sector de la inteligencia artificial continúa consolidándose pese a las restricciones impuestas por Estados Unidos en el acceso a chips avanzados y tecnología de fabricación. En este contexto, DeepSeek AI, compañía líder en innovación tecnológica, ha presentado el Fire-Flyer File System (3FS), un sistema de archivos distribuido que promete optimizar las cargas de trabajo de entrenamiento e inferencia en inteligencia artificial.
Este sistema de código abierto ha sido diseñado para maximizar las capacidades de los SSDs modernos y las redes RDMA, alcanzando un rendimiento de lectura que supera los estándares actuales. Al hacerlo, permite un acceso más eficiente a grandes volúmenes de datos en entornos de alto rendimiento, marcando un hito en el desarrollo de la infraestructura tecnológica necesaria para el futuro del sector.
A medida que los modelos de inteligencia artificial se vuelven más complejos, la necesidad de sistemas de almacenamiento que faciliten un acceso rápido y eficiente a los datos se ha vuelto crítica. 3FS ha sido elaborado para satisfacer esta demanda, ofreciendo una solución de almacenamiento distribuido que mejora significativamente el rendimiento y la escalabilidad en entornos de computación avanzada. Entre sus innovadoras características se encuentran una arquitectura desagregada que combina el rendimiento de miles de SSDs y nodos de almacenamiento, una consistencia fuerte mediante la implementación de Chain Replication con Apportioned Queries (CRAQ), y una interfaz de archivos estándar que no requiere aprender nuevas APIs.
En pruebas recientes, DeepSeek ha demostrado las capacidades de 3FS bajo condiciones de carga intensiva. En un clúster de 180 nodos, cada uno equipado con 16 SSDs NVMe de 14 TiB y redes InfiniBand de 200 Gbps, el sistema alcanzó una velocidad de lectura agregada de 6.6 TiB/s. Adicionalmente, en la prueba GraySort, logró procesar 110.5 TiB en poco más de 30 minutos, demostrando su eficiencia en el manejo de grandes volúmenes de datos. En términos de inferencia en modelos de lenguaje, KVCache en 3FS alcanzó un rendimiento impresionante de más de 40 GiB/s por nodo.
El impacto de 3FS en la industria se traduce en ventajas significativas sobre las soluciones de almacenamiento tradicionales. DeepSeek, quien ha utilizado internamente este sistema desde 2019, ha reportado una optimización considerable en sus procesos, alcanzando el 80% del rendimiento de un servidor NVIDIA DGX-A100, pero con un 50% del costo y un 60% del consumo energético. Esta competitiva ventaja podría beneficiar a empresas que buscan reducir costos sin sacrificar el rendimiento.
Además, el lanzamiento de 3FS como software de código abierto refuerza su accesibilidad, permitiendo que investigadores y empresas utilicen esta tecnología para sus proyectos en inteligencia artificial. El sistema de archivos puede encontrarse en GitHub, extendiendo su impacto más allá del ámbito corporativo hacia la comunidad académica y tecnológica global.
En conclusión, el Fire-Flyer File System (3FS) de DeepSeek establece un nuevo estándar en almacenamiento para inteligencia artificial. Al ofrecer una solución escalable, eficiente y de alto rendimiento, China no solo reafirma su posición como competidor clave en la IA, sino que también lidera avances en la infraestructura esencial para el sector. Estos desarrollos representan una oportunidad invaluable para centros de datos, instituciones de investigación y empresas alrededor del mundo que buscan fortalecer sus capacidades en inteligencia artificial sin depender de tecnologías propietarias.