Amazon SageMaker Canvas ha revolucionado el proceso de preparación de datos para proyectos de aprendizaje automático (ML) con una integración crucial con SageMaker Data Wrangler. Este nuevo avance permite a los usuarios simplificar y acelerar significativamente una de las fases más arduas del desarrollo de ML: la preparación de datos.
La integración de SageMaker Canvas con Data Wrangler no se limita a permitir la construcción y despliegue de modelos sin necesidad de código. Ahora, también incorpora capacidades avanzadas de preparación de datos específicas para ML que anteriormente estaban reservadas solo para Data Wrangler. La combinación de estas funcionalidades crea un entorno de trabajo integral y sin código para la preparación y manipulación de datos, así como para la creación y despliegue de modelos ML.
Entre las mejoras destacadas, la nueva plataforma ofrece una carga de páginas hasta diez veces más rápida, una interfaz de lenguaje natural para la preparación de datos y la capacidad de visualizar el tamaño y la forma de los datos en cada etapa del proceso. Además, los usuarios pueden disfrutar de funciones mejoradas para reemplazo y reordenación de transformaciones, lo que facilita iterar en los flujos de datos de manera más eficiente. Los modelos de ML pueden ser creados con un solo clic dentro de la misma interfaz, y es posible generar conjuntos de datos para afinar modelos basados en SageMaker Canvas.
La transición entre Data Wrangler y SageMaker Canvas se realiza mediante Amazon Simple Storage Service (Amazon S3). Para migrar los flujos de Data Wrangler, los usuarios deben abrir un terminal en SageMaker Studio, copiar los archivos de flujo a Amazon S3 e importarlos a SageMaker Canvas.
Una vez completada la migración, los flujos pueden ser modificados y analizados mediante la interfaz visual de SageMaker Canvas. Los usuarios pueden explorar y preparar datos de manera manual o utilizando el lenguaje natural, y una vez satisfechos con el resultado, pueden optar por crear un modelo de ML o exportar el conjunto de datos para su posterior uso.
Esta integración no solo une la preparación de datos, la construcción de modelos y su despliegue en una sola herramienta, sino que también permite a analistas de negocios y usuarios no técnicos ser más eficientes en sus proyectos de ML. Gracias a esta plataforma unificada, se ahorra tiempo y se reduce la complejidad de los procesos, mejorando al mismo tiempo la calidad y precisión de los modelos de aprendizaje automático.
Para aprovechar estas nuevas capacidades, los usuarios deben iniciar sesión en SageMaker Canvas, preparar sus flujos de datos y disfrutar de la potencia de una plataforma unificada que facilita la preparación de datos y el desarrollo de modelos de ML.