Amazon Web Services (AWS) ha consolidado su compromiso con el desarrollo de tecnologías avanzadas de inteligencia artificial generativa (IA) a través del lanzamiento del Programa de Apoyo al Desarrollo de Modelos de Lenguaje Grandes (LLM Program) en Japón. Este programa ha permitido a diversas empresas y organizaciones japonesas aprovechar el poder de los modelos de lenguaje grandes (LLM), utilizando la infraestructura de IA generativa de AWS para impulsar la productividad y crear experiencias diferenciadas.
Desde startups hasta conglomerados globales, 15 organizaciones fueron seleccionadas para participar en este programa, y 12 de ellas han utilizado las capacidades de cómputo de AWS Trainium para entrenar sus modelos, ahora explorando AWS Inferentia para la inferencia. A inicios de este año, los resultados del programa fueron presentados en una rueda de prensa, donde las empresas pioneras compartieron sus experiencias y logros.
El LLM Program brinda un apoyo integral, incluyendo orientación para asegurar una infraestructura de cómputo de alto rendimiento, asistencia técnica y resolución de problemas, así como créditos en la nube. Además, facilitó sesiones colaborativas de intercambio de conocimiento, permitiendo a los participantes discutir las complejidades técnicas y comerciales de su trabajo. Este enfoque colaborativo permitió a las organizaciones avanzar rápidamente en sus capacidades de IA generativa.
Ricoh, una de las participantes, destacó el retraso en el desarrollo de LLMs en japonés comparado con los modelos en inglés o multilingües. La empresa desarrolló un LLM bilingüe japonés-inglés mediante una estrategia de aprendizaje curricular. Takeshi Suzuki, Director Adjunto del Centro de Desarrollo de Tecnología Digital de Ricoh, explicó que su enfoque se centró en refinar las metodologías de entrenamiento para crear una ventaja competitiva.
Otra empresa, Stockmark, se enfocó en construir LLMs fiables para aplicaciones industriales y decidió preentrenar un LLM japonés para abordar el problema de la alucinación, utilizando una gran cantidad de datos textuales japoneses de fuentes públicas y comerciales.
El grupo NTT, en colaboración con Intel y Sony, desarrolló el modelo tsuzumi, un LLM de alto rendimiento y bajo peso que mejora la calidad y cantidad de datos de entrenamiento en japonés sin aumentar el tamaño del parámetro. Este modelo ha mostrado una alta competencia en el idioma japonés y capacidades multimodales en progreso.
El programa también fomentó la creación de modelos específicos por dominio, modelos multimodales y lingüísticamente diversos. Por ejemplo, KARAKURI desarrolló un LLM para chatbots de atención al cliente y Watashiha creó un modelo enfocado en el humor llamado OGIRI. Prefered Networks desarrolló un modelo de visión general que puede integrar y procesar información textual y visual.
El éxito del LLM Program de AWS en Japón subraya el compromiso de la compañía con la innovación en inteligencia artificial, tanto a nivel local como global. Las organizaciones participantes han realizado avances significativos y han encontrado nuevas aplicaciones para estas tecnologías en el mundo real, demostrando el potencial transformador de la IA generativa.