Desde la introducción de los modelos fundacionales (FMs) alimentados por servicios como Amazon Bedrock y Amazon SageMaker JumpStart, las empresas han buscado ejercer un control más detallado sobre quiénes pueden acceder y utilizar estos modelos. Esta medida es esencial para cumplir con normativas, asegurar la seguridad y garantizar una gobernanza efectiva.
Lanzado en 2021, Amazon SageMaker Canvas es un servicio visual de apuntar y hacer clic que permite a analistas de negocios y científicos de datos ciudadanos usar modelos de aprendizaje automático (ML) sin necesidad de escribir código. SageMaker Canvas ofrece una interfaz sin código que permite consumir una amplia gama de FMs de ambos servicios de manera estándar, así como personalizar las respuestas del modelo utilizando un flujo de trabajo de Recuperación Aumentada Generativa (RAG) con Amazon Kendra como base de conocimiento o afinando con un conjunto de datos etiquetado. Esta facilidad de uso acelera la productividad al permitir a los usuarios sin conocimientos técnicos acceder a capacidades avanzadas de IA generativa.
En este artículo, se analizan estrategias para gobernar el acceso a modelos de Amazon Bedrock y SageMaker JumpStart desde SageMaker Canvas utilizando políticas de AWS Identity and Access Management (IAM). Se exploran métodos para crear permisos detallados que controlen la invocación de modelos de Amazon Bedrock y prevengan la provisión de puntos finales de SageMaker con modelos específicos de SageMaker JumpStart. Se proporcionan ejemplos de código adaptados a escenarios comunes de gobernanza empresarial. Al final, se comprenderá cómo asegurar el acceso a capacidades de IA generativa, manteniendo un uso seguro y conforme a normativas de estas avanzadas tecnologías dentro del entorno sin código de SageMaker Canvas.
El artículo es un recurso valioso para operadores de ML, equipos de seguridad y cualquier persona encargada de la gobernanza de la IA en una empresa. La arquitectura de SageMaker Canvas permite a analistas de negocios y científicos de datos interactuar con modelos de ML sin escribir código. Sin embargo, gestionar el acceso a estos modelos es crucial para mantener la seguridad y el cumplimiento. Cuando un usuario interactúa con SageMaker Canvas, las operaciones que realiza, como invocar un modelo o crear un punto final, son ejecutadas por el rol de servicio de SageMaker. Los perfiles de usuario de SageMaker pueden heredar el rol predeterminado del dominio de SageMaker o tener un rol específico de usuario.
Personalizar las políticas adjuntas a este rol permite controlar qué acciones están permitidas o denegadas, gobernando así el acceso a las capacidades de IA generativa. Aquí se discute qué políticas de IAM usar para este rol y cómo controlar las operaciones dentro de SageMaker Canvas, basándose en los requisitos organizacionales. Se analizan dos patrones para ambos tipos de modelos, Amazon Bedrock y SageMaker JumpStart: limitar el acceso a todos los modelos de un servicio o limitar el acceso a modelos específicos.
Para usar modelos de Amazon Bedrock, SageMaker Canvas llama a las APIs bedrock:InvokeModel para invocar el modelo de manera síncrona y bedrock:InvokeModelWithResponseStream para invocar el modelo con respuesta a través de un socket. SageMaker Canvas también permite afinar grandes modelos de lenguaje (LLM) con Amazon Bedrock, aunque de momento solo permite la afinación de modelos Titan de Amazon.
Limitar el acceso a todos los modelos de Amazon Bedrock puede realizarse modificando el rol de SageMaker para denegar específicamente estas APIs, asegurando que ningún usuario pueda invocar cualquier modelo de Amazon Bedrock a través de SageMaker Canvas. De manera similar, se puede limitar el acceso a modelos específicos de SageMaker JumpStart especificando sus IDs de modelo en la política IAM, como denegar el acceso a los modelos Hugging Face FLAN T5 y MPT.
Para evitar cargos futuros de instancias de espacio de trabajo, se recomienda cerrar sesión en SageMaker Canvas al terminar de usar la aplicación. También es posible configurar SageMaker Canvas para que se apague automáticamente cuando esté inactivo.
En conclusión, este artículo demuestra cómo SageMaker Canvas invoca LLMs impulsados por Amazon Bedrock y SageMaker JumpStart, y cómo las empresas pueden gobernar el acceso a estos modelos. Siguiendo estas directrices, las empresas pueden asegurar que su uso de modelos de IA generativa sea seguro y cumpla con las políticas organizacionales, protegiendo datos sensibles y empoderando a los analistas de negocio y científicos de datos para aprovechar al máximo la IA en un entorno controlado.