Hoy, Amazon ha anunciado la disponibilidad de los modelos de inteligencia artificial Llama 3.2 en Amazon SageMaker JumpStart y Amazon Bedrock. Esta nueva colección de modelos generativos está pre-entrenada y ajustada mediante instrucciones, y abarca desde ligeros modelos de solo texto con 1.000 millones (1B) y 3.000 millones (3B) de parámetros, hasta modelos más robustos de 11.000 millones (11B) y 90.000 millones (90B) de parámetros, capaces de realizar tareas sofisticadas de razonamiento y soporte multimodal para imágenes de alta resolución.
SageMaker JumpStart, la plataforma de aprendizaje automático de Amazon, está diseñada para proporcionar acceso rápido a algoritmos, modelos y soluciones de machine learning (ML). Por su parte, Amazon Bedrock es un servicio gestionado que ofrece una selección de modelos fundacionales de alto rendimiento, desarrollados por compañías líderes en IA como Meta, a través de una sola API. Este servicio también incluye un conjunto amplio de capacidades para construir aplicaciones de IA generativa con garantías de seguridad, privacidad y responsabilidad.
En su comunicado, Amazon ha ilustrado diversas aplicaciones de los modelos Llama 3.2 11B y 90B basadas en visión. Esta es la primera vez que los modelos Llama de Meta se lanzan con capacidades de visión, expandiendo su uso más allá de las aplicaciones tradicionales de texto. Algunos casos de uso destacados incluyen la respuesta a preguntas visuales de documentos, la extracción de información estructurada de imágenes y la generación de subtítulos para imágenes.
Los modelos Llama 3.2, disponibles ahora en SageMaker JumpStart y Amazon Bedrock, son multimodales y soportan entrada y salida de texto, así como entrada de texto+imagen y salida de texto. Estos avances incluyen una nueva arquitectura que integra representaciones del codificador de imágenes en el modelo de lenguaje, mejorando la eficiencia en cargas de trabajo de IA con menor latencia y mejor rendimiento. Además, soportan una longitud de contexto de 128.000 tokens y han ampliado su capacidad multilingüe a ocho idiomas: inglés, alemán, francés, italiano, portugués, hindi, español y tailandés.
Los modelos Llama 3.2 están disponibles para inferencias en diversas regiones. En SageMaker JumpStart, se pueden encontrar inicialmente en AWS en la región US East (Ohio), mientras que en Amazon Bedrock están disponibles en US West (Oregon) y US East (Ohio, N. Virginia), con opciones de inferencia entre regiones. Los modelos de menor capacidad, Llama 3.2 1B y 3B, están disponibles también en regiones europeas como Frankfurt, Irlanda y París, con planes de expandir su disponibilidad regional en el futuro.
Además de su integración en SageMaker y Bedrock, Amazon ha presentado ejemplos prácticos de utilización de los modelos Llama 3.2, tales como la respuesta a preguntas sobre documentos, la extracción de entidades y la generación de subtítulos. Estas demostraciones subrayan el amplio potencial y utilidad de estos modelos en diversas industrias, incluyendo el comercio electrónico y el marketing, marcando un nuevo hito en el desarrollo y aplicación de inteligencia artificial avanzada.