Amazon Web Services (AWS) ha desvelado dos innovadoras herramientas para la gestión y análisis de datos: Amazon DataZone y Amazon SageMaker Canvas. Estas soluciones están diseñadas para simplificar la administración, descubrimiento, compartición y gobernanza de datos, al mismo tiempo que capacitan a los analistas de negocios y expertos en dominio a construir y desplegar modelos de aprendizaje automático (ML) sin necesidad de codificación.
Amazon DataZone se presenta como una plataforma que facilita la creación y gestión de «zonas de datos», lagos de datos virtuales destinados a almacenar y procesar información sin la necesidad de una infraestructura compleja o extensa codificación. Esta herramienta optimiza el acceso y la colaboración en toda la organización, permitiendo a ingenieros, científicos de datos, gerentes de producto y usuarios de negocio colaborar en la obtención de insights valiosos basados en datos.
Por su parte, Amazon SageMaker Canvas es una herramienta de ML sin código que simplifica la ingestión de datos de fuentes populares como Amazon S3, Amazon Redshift, Amazon Athena, Snowflake, Salesforce y Databricks. SageMaker Canvas ofrece robustas capacidades de preparación de datos a través de Amazon SageMaker Data Wrangler, construcción automatizada de modelos mediante Amazon SageMaker Autopilot y uso de modelos de ML pre-construidos, incluidos los modelos de fundamentos de Amazon Bedrock y Amazon SageMaker Jumpstart.
Las empresas pueden aprovechar estas soluciones para optimizar operaciones y tomar decisiones informadas sin una carga administrativa significativa. Por ejemplo, instituciones financieras pueden utilizar SageMaker Canvas para la detección de fraudes, permitiendo rápidas iteraciones de modelos que mejoren la eficiencia y precisión. La gobernanza de ML es esencial para asegurar que los datos empleados en estos modelos sean precisos, seguros y confiables.
La integración de Amazon DataZone y Amazon SageMaker facilita la configuración de infraestructura con controles de seguridad, la colaboración en proyectos de ML y la gobernanza del acceso a datos y activos de ML. Los usuarios pueden publicar activos de datos en Amazon DataZone y permitir que otros miembros de la organización los descubran y usen, mejorando la colaboración y eficiencia en proyectos de ML. Esta capacidad de gobernanza de datos y reutilización de modelos ayuda a las organizaciones a reducir la duplicación de esfuerzos y fomentar el intercambio de conocimientos a lo largo del ciclo de vida del ML.
En resumen, la combinación de SageMaker Canvas y Amazon DataZone ofrece una solución poderosa para la gobernanza de datos, colaboración y reutilización en proyectos de ML. Las organizaciones pueden emplear estas herramientas para casos de uso de inteligencia artificial generativa, habilitando la capacitación y adaptación de grandes modelos de lenguaje u otros modelos fundamentales con políticas de gobernanza robustas. Esto permite desbloquear todo el potencial del ML y la inteligencia artificial generativa mientras se mantiene el control y supervisión sobre los activos de datos. Se invita a las empresas a explorar esta nueva integración para optimizar sus procesos de preparación de datos, ingeniería de características y construcción de modelos ML, promoviendo la reutilización y el intercambio de modelos dentro de su organización.