Amazon ha lanzado una serie de innovaciones para su plataforma SageMaker AI, introduciendo dos modernas plantillas de interfaz de usuario: Text Ranking y Question and Answer. Estas herramientas están especialmente diseñadas para optimizar la calidad de los modelos de lenguaje, permitiendo obtener feedback estructurado y específico de los usuarios, crucial para mejorar la eficacia de estos sistemas.
La plantilla Text Ranking ofrece a los anotadores humanos la capacidad de clasificar respuestas generadas por modelos de lenguaje grande (LLM) según criterios específicos como la relevancia y precisión factual. Este método de retroalimentación es esencial para el desarrollo de modelos más precisos, empleando técnicas como el Reinforcement Learning from Human Feedback (RLHF), que ajusta las respuestas del modelo basándose en las preferencias humanas.
Por otro lado, la plantilla Question and Answer facilita la creación de pares de preguntas y respuestas de alta calidad. Estos pares actúan como datos de demostración para el Supervised Fine-Tuning (SFT), enseñando a los modelos a responder con mayor exactitud a entradas similares, mejorando así su eficacia y utilidad.
La configuración de estas plantillas ha sido simplificada. Los usuarios deben acceder a la consola de SageMaker AI, donde encontrarán la nueva categoría de Generative AI. Aquí, pueden crear trabajos de etiquetado especificando detalles como la ubicación del manifiesto de entrada y la ruta de salida, mejorando la eficiencia del proceso.
Específicamente, la plantilla Text Ranking utiliza un archivo JSON para detallar el contenido a ser clasificado, permitiendo una evaluación más estructurada. Las respuestas anotadas se almacenan eficientemente en un bucket de S3, permitiendo una revisión y ajuste continuos del modelo.
En paralelo, la plantilla Question and Answer permite a los anotadores generar preguntas y respuestas relevantes a partir de textos. Esta herramienta destaca por su flexibilidad y su función de coincidencia por colores, que ayuda a identificar rápidamente secciones clave del texto.
Además, Amazon ha puesto a disposición una API de Creación de Trabajos de Etiquetado. Esta facilita la configuración programática de trabajos de clasificación, proporcionando una flexibilidad adicional e integración con flujos de trabajo existentes.
Con estas innovaciones, Amazon SageMaker AI busca potenciar a sus usuarios, permitiéndoles generar conjuntos de datos de alta calidad de manera más eficiente y efectiva, alineando mejor los modelos de lenguaje con las necesidades y preferencias humanas.