El 5 de agosto de 2025, OpenAI marcó un hito en el ámbito de la inteligencia artificial lanzando sus modelos GPT-OSS a través de Amazon SageMaker AI y Amazon Bedrock. Estos modelos, denominados gpt-oss-20b y gpt-oss-120b, son avanzadas arquitecturas de Transformer enfocadas exclusivamente en texto. Destacan por su innovador uso de la técnica Mixture-of-Experts (MoE), que optimiza el uso de recursos computacionales activando solo una parte de los parámetros por token, lo que mejora significativamente la eficiencia.
Destinados a tareas complejas como programación, análisis científico y razonamiento matemático, estos modelos ofrecen una longitud de contexto notablemente extendida de 128,000 tokens. Su diseño también contempla niveles de razonamiento ajustables y estructurados, lo que los hace altamente versátiles.
OpenAI ha puesto un fuerte énfasis en la seguridad de estos modelos, sometiéndolos a rigurosos entrenamientos centrados en robustecerse contra usos indebidos. Las evaluaciones de afinamiento adversarial son parte integral del proceso para garantizar su robustez.
La flexibilidad de implementación es otra de sus ventajas. Los usuarios pueden acceder a los modelos directamente a través de Amazon SageMaker JumpStart o mediante las API de Amazon Bedrock. Además, la capacidad de afinar estos modelos permite adaptarlos a dominios particulares sin necesidad de empezar el entrenamiento desde cero, resultando en un rendimiento más preciso.
El entorno gestionado para el afinamiento de estos modelos utiliza herramientas de código abierto, facilitando la distribución del entrenamiento en múltiples GPUs. La optimización con DeepSpeed ZeRO-3 es crucial para reducir el uso de memoria, lo que permite entrenar modelos con miles de millones de parámetros de forma eficiente.
En el ámbito empresarial, los modelos GPT-OSS son una solución ideal para tareas multilingües, proporcionando herramientas de IA capaces de operar en varios idiomas y contextos. Esto es especialmente valioso para las empresas que buscan innovación y automatización, permitiendo una implementación y adaptación rápida y sencilla a necesidades específicas.
La introducción de los modelos GPT-OSS representa un avance significativo por parte de OpenAI, ofreciendo soluciones avanzadas de inteligencia artificial que pueden integrarse sin problemas en los flujos de trabajo empresariales, enriqueciendo el razonamiento y análisis en entornos multilingües.