Acelerando el Futuro: Desbloqueo de Modelos de Lenguaje Japoneses con AWS Trainium y el Programa de Soporte de AWS

Amazon Web Services (AWS) ha consolidado su compromiso con el desarrollo de tecnologías avanzadas de inteligencia artificial generativa (IA) a través del lanzamiento del Programa de Apoyo al Desarrollo de Modelos de Lenguaje Grandes (LLM Program) en Japón. Este programa ha permitido a diversas empresas y organizaciones japonesas aprovechar el poder de los modelos de lenguaje grandes (LLM), utilizando la infraestructura de IA generativa de AWS para impulsar la productividad y crear experiencias diferenciadas.

Desde startups hasta conglomerados globales, 15 organizaciones fueron seleccionadas para participar en este programa, y 12 de ellas han utilizado las capacidades de cómputo de AWS Trainium para entrenar sus modelos, ahora explorando AWS Inferentia para la inferencia. A inicios de este año, los resultados del programa fueron presentados en una rueda de prensa, donde las empresas pioneras compartieron sus experiencias y logros.

El LLM Program brinda un apoyo integral, incluyendo orientación para asegurar una infraestructura de cómputo de alto rendimiento, asistencia técnica y resolución de problemas, así como créditos en la nube. Además, facilitó sesiones colaborativas de intercambio de conocimiento, permitiendo a los participantes discutir las complejidades técnicas y comerciales de su trabajo. Este enfoque colaborativo permitió a las organizaciones avanzar rápidamente en sus capacidades de IA generativa.

Ricoh, una de las participantes, destacó el retraso en el desarrollo de LLMs en japonés comparado con los modelos en inglés o multilingües. La empresa desarrolló un LLM bilingüe japonés-inglés mediante una estrategia de aprendizaje curricular. Takeshi Suzuki, Director Adjunto del Centro de Desarrollo de Tecnología Digital de Ricoh, explicó que su enfoque se centró en refinar las metodologías de entrenamiento para crear una ventaja competitiva.

Otra empresa, Stockmark, se enfocó en construir LLMs fiables para aplicaciones industriales y decidió preentrenar un LLM japonés para abordar el problema de la alucinación, utilizando una gran cantidad de datos textuales japoneses de fuentes públicas y comerciales.

El grupo NTT, en colaboración con Intel y Sony, desarrolló el modelo tsuzumi, un LLM de alto rendimiento y bajo peso que mejora la calidad y cantidad de datos de entrenamiento en japonés sin aumentar el tamaño del parámetro. Este modelo ha mostrado una alta competencia en el idioma japonés y capacidades multimodales en progreso.

El programa también fomentó la creación de modelos específicos por dominio, modelos multimodales y lingüísticamente diversos. Por ejemplo, KARAKURI desarrolló un LLM para chatbots de atención al cliente y Watashiha creó un modelo enfocado en el humor llamado OGIRI. Prefered Networks desarrolló un modelo de visión general que puede integrar y procesar información textual y visual.

El éxito del LLM Program de AWS en Japón subraya el compromiso de la compañía con la innovación en inteligencia artificial, tanto a nivel local como global. Las organizaciones participantes han realizado avances significativos y han encontrado nuevas aplicaciones para estas tecnologías en el mundo real, demostrando el potencial transformador de la IA generativa.

Mariana G.
Mariana G.
Mariana G. es una periodista europea y editora de noticias de actualidad en Madrid, España, y el mundo. Con más de 15 años de experiencia en el campo, se especializa en cubrir eventos de relevancia local e internacional, ofreciendo análisis profundos y reportajes detallados. Su trabajo diario incluye la supervisión de la redacción, la selección de temas de interés, y la edición de artículos para asegurar la máxima calidad informativa. Mariana es conocida por su enfoque riguroso y su capacidad para comunicar noticias complejas de manera clara y accesible para una audiencia diversa.

Más popular

Más artículos como este
Relacionados

Reinventa tu Espacio: Más de 10 Ideas Innovadoras para Decorar Techos

En la búsqueda constante de renovar y personalizar el...

Hospital Gregorio Marañón Destacado por Excelencia en Gestión Pública e Innovación

En una ceremonia que celebró la constante búsqueda de...

Alemania: El Momento Decisivo para Enfrentar los Retos del Futuro

En un avance significativo que ha sacudido el panorama...