OpenAI ha dado un paso significativo hacia la accesibilidad y la innovación en la inteligencia artificial al lanzar sus nuevos modelos de peso abierto, gpt-oss-120b y gpt-oss-20b, ahora disponibles en Amazon SageMaker JumpStart. Esta iniciativa permite a desarrolladores y empresas implementar y escalar sus ideas de inteligencia artificial generativa de manera segura y eficiente en la plataforma de Amazon Web Services (AWS).
Estos modelos GPT OSS se destacan por su eficacia en tareas complejas como la programación, el análisis científico y el razonamiento matemático. Con una ventana de contexto de 128K y niveles de razonamiento ajustables, se pueden personalizar para satisfacer diversas necesidades. Además, los modelos son capaces de integrarse con herramientas externas y trabajar en flujos de trabajo de inteligencia artificial a través de frameworks como Strands Agents, ofreciendo una visión detallada de sus procesos de razonamiento mediante la capacidad de salida en cadena de pensamientos.
SageMaker JumpStart, un servicio completamente gestionado, proporciona un catálogo amplio de modelos de última generación que facilitan la redacción de contenido, la generación de código y la clasificación, lo cual acelera significativamente el desarrollo de aplicaciones de aprendizaje automático. Los usuarios pueden acceder y desplegar estos modelos de OpenAI desde Amazon SageMaker Studio o mediante el SDK de Python de SageMaker. Herramientas adicionales como Pipelines y Debugger optimizan el rendimiento y control de las operaciones en un entorno seguro de AWS.
La disponibilidad de estos modelos se extiende a varias regiones de AWS, incluyendo US East (Ohio, N. Virginia) y Asia Pacífico (Mumbai, Tokio). Para aprovechar esta nueva oferta, es necesario tener una cuenta de AWS, un rol de IAM para manejar SageMaker, y acceso a SageMaker Studio o a un entorno de desarrollo interactivo.
El despliegue del modelo gpt-oss-120b requiere definir el nombre del endpoint, especificar el número de instancias, y elegir el tipo de instancia con GPU recomendada para un rendimiento óptimo. Esto se puede realizar tanto en SageMaker Studio como a través del SDK de Python.
Por otra parte, OpenAI ha integrado un sistema de búsqueda web a través de EXA, una API basada en significados que permite enriquecer las respuestas de los modelos con información actualizada. Para usar este servicio, los usuarios deben obtener una clave API de EXA y configurarla correctamente.
Finalmente, se sugiere a los usuarios eliminar los recursos creados al utilizar el modelo para evitar costos extra. Con estas nuevas capacidades, OpenAI reafirma su compromiso con la democratización y el poder transformador de la inteligencia artificial, impulsando la innovación en diversos sectores empresariales.