La inteligencia artificial generativa está ganando prominencia en el ámbito empresarial por su versatilidad y la capacidad de abordar numerosos casos de uso. El verdadero valor de los modelos fundacionales (FMs) se concreta cuando se adaptan a datos específicos de dominio, aunque gestionarlos a lo largo de su ciclo de vida introduce cierta complejidad. La operacionalización de estos flujos de trabajo se vuelve crítica a medida que los FMs se adaptan a diferentes dominios y datos.
Amazon SageMaker, un servicio completamente gestionado para construir, entrenar y desplegar modelos de aprendizaje automático (ML), ha visto un aumento notable en la adopción para personalizar y desplegar FMs destinados a aplicaciones de AI generativa. SageMaker ofrece una amplia gama de características para construir flujos de trabajo automatizados y mejorar la excelencia operativa en la gestión de modelos, destacando particularmente su Registro de Modelos. Este registro ayuda a catalogar y gestionar versiones de modelos, facilitando la colaboración y la gobernanza. Una vez que un modelo es entrenado y evaluado, puede ser almacenado en el Registro de Modelos para su gestión futura.
Recientemente, Amazon SageMaker introdujo nuevas funciones en su Registro de Modelos para simplificar el proceso de versionado y catalogación de FMs. Los usuarios de SageMaker pueden entrenar o ajustar FMs, incluyendo los modelos de SageMaker JumpStart y Amazon Bedrock, y gestionar estos modelos dentro del Registro de Modelos. A medida que las empresas escalan sus aplicaciones de AI generativa para tareas específicas de dominio, el número de modelos puede aumentar rápidamente. El Registro de Modelos de SageMaker puede utilizarse como un inventario para llevar un seguimiento de los modelos, versiones y metadatos asociados.
Si bien el Model Registry ha funcionado adecuadamente para modelos tradicionales de menor tamaño, gestionar FMs más grandes y los requisitos de aceptación de acuerdos de licencia de usuario final (EULA) presentaban desafíos. Las nuevas características de Model Registry han facilitado el registro de FMs ajustados, que luego pueden ser desplegados para su uso actual.
El desarrollo de modelos es un proceso iterativo que implica numerosos ciclos de experimentación para lograr el rendimiento esperado del modelo. Una vez entrenados, estos modelos pueden registrarse en el Registro de Modelos, siendo catalogados como versiones. Los modelos pueden organizarse en grupos, las versiones compararse por sus métricas de calidad, y los modelos pueden tener un estado de aprobación asociado indicando si son desplegables.
Aprobado manualmente un modelo, puede activarse un pipeline de integración continua y despliegue continuo (CI/CD) para su puesta en producción. Opcionalmente, el Registro de Modelos puede usarse como un repositorio de modelos aprobados para uso empresarial, permitiendo que distintos equipos desplieguen estos modelos y construyan aplicaciones alrededor de ellos.
Model Registry ha lanzado dos nuevas funciones para soportar mejor las aplicaciones de AI generativa: ModelDataSource y URI del modelo fuente. ModelDataSource permite registrar artefactos de modelo sin comprimir y aceptar la EULA sin intervención manual, reduciendo la latencia al iniciar los endpoints de SageMaker. La función URI del modelo fuente admite la configuración automática de archivos de especificación de inferencia para algunos IDs de modelo reconocidos, permitiendo registrar modelos propietarios de JumpStart sin necesidad de especificaciones de inferencia.
Con la adopción creciente de la AI generativa en diversas partes del negocio, la gestión y versionado robusto de modelos se vuelve esencial. Model Registry proporciona control de versiones, seguimiento, colaboración y gobernanza de los FMs, empoderando a las organizaciones para adoptar AI generativa y alcanzar resultados transformadores. Para más información sobre Model Registry, visite la consola de SageMaker.