Desarrollo de Modelos Fundamentales en AWS: Aprendizajes del Programa GENIAC en Japón

En 2024, Japón inauguró el Generative AI Accelerator Challenge (GENIAC), un ambicioso proyecto liderado por el Ministerio de Economía, Comercio e Industria, enfocado en potenciar la inteligencia artificial generativa. Este programa brinda a las empresas acceso a financiación, asesoramiento y potentes recursos computacionales para desarrollar modelos fundamentales (FM). Amazon Web Services (AWS) fue la nube elegida para la segunda fase de GENIAC, ofreciendo infraestructura y asesoría a 12 organizaciones participantes.

Inicialmente, el reto parecía sencillo: ofrecer acceso a GPUs y chips Trainium con la meta de fomentar la innovación. Sin embargo, AWS encontró que el verdadero desafío iba más allá de contar con más de 1,000 aceleradores, pues el éxito en el entrenamiento de modelos fundamentales dependía de crear un sistema confiable y resolver problemas complejos del entrenamiento distribuido.

Durante la segunda fase, 12 clientes desplegaron con éxito 127 instancias de Amazon EC2 P5 (con GPU NVIDIA H100 TensorCore) y 24 instancias de Amazon EC2 Trn1 (con AWS Trainium) en apenas un día. En los siguientes seis meses, se entrenaron varios modelos a gran escala, destacando proyectos como Stockmark-2-100B-Instruct-beta y Llama 3.1 Shisa V2 405B.

Un aprendizaje crucial fue la necesidad de equipos multidisciplinarios para llevar a cabo iniciativas de aprendizaje automático ambiciosas. AWS formó un equipo virtual integrando cuentas, arquitectos de soluciones y equipos técnicos, lo que promovió un soporte efectivo y el intercambio de conocimientos con los clientes.

La comunicación estructurada resultó vital. Un canal interno en Slack facilitó la resolución rápida de problemas y fomentó un entorno colaborativo donde se intercambiaba información. Documentos de seguimiento detallados ayudaron a clarificar requisitos técnicos, y las reuniones semanales permitieron compartir aprendizajes y mejorar el modelo de participación.

Desarrollar arquitecturas de referencia fue clave. En lugar de permitir configuraciones desde cero, AWS creó plantillas y automatizaciones para dos enfoques: AWS ParallelCluster y SageMaker HyperPod. Estas arquitecturas facilitaron el despliegue de entornos con mínima fricción.

El programa GENIAC ha demostrado que entrenar modelos fundamentales a escala es principalmente un desafío organizativo. Con un soporte estructurado y un enfoque colaborativo, los participantes ejecutaron exitosamente grandes cargas de trabajo en la nube. Al concluir la segunda fase, se realizó un evento técnico en Tokio para preparar a los desarrolladores para la próxima etapa de GENIAC, subrayando un avance significativo en el camino hacia la inteligencia artificial generativa global. AWS continúa comprometido con el desarrollo de estas tecnologías a nivel mundial.

Silvia Pastor
Silvia Pastor
Silvia Pastor es una destacada periodista de Noticias.Madrid, especializada en periodismo de investigación. Su labor diaria incluye la cobertura de eventos importantes en la capital, la redacción de artículos de actualidad y la producción de segmentos audiovisuales. Silvia realiza entrevistas a figuras clave, proporciona análisis expertos y mantiene una presencia activa en redes sociales, compartiendo sus artículos y ofreciendo actualizaciones en tiempo real. Su enfoque profesional, centrado en la veracidad, objetividad y ética periodística, la convierte en una fuente confiable de información para su audiencia.

Más artículos como este
Relacionados

La Unión Europea Expresa Alta Preocupación por la Controvertida Ley Anticorrupción en Ucrania

El parlamento ucraniano, dominado por el partido del presidente...

Madrid se Rinde al Furor del K-pop con Stray Kids: «Mi Pasaporte a la Felicidad»

Una multitud entusiasta se congregó en el Estadio Metropolitano...

Windows 365 Impulsa la Productividad y Seguridad con un ROI Potencial de 195%, Revela Estudio Forrester

Un reciente estudio de Forrester ha puesto de manifiesto...

Mejora del Rendimiento de Deep Learning: Integrando Amazon Q Developer con MCP

Los equipos de ciencia de datos especializados en inteligencia...
Resumen de privacidad

Esta web utiliza cookies para que podamos ofrecerte la mejor experiencia de usuario posible. La información de las cookies se almacena en tu navegador y realiza funciones tales como reconocerte cuando vuelves a nuestra web o ayudar a nuestro equipo a comprender qué secciones de la web encuentras más interesantes y útiles.