Optimización del Filtrado de Metadata para Datos Tabulares Mediante el Uso de Bases de Conocimiento en Amazon Bedrock

Amazon Bedrock ha revelado una nueva funcionalidad bautizada como «filtro de metadatos», que introduce un notable avance en el campo de la Generación Aumentada por Recuperación (RAG). Esta característica, que sustituye el motor predeterminado del sistema, fue anunciada el 27 de marzo de 2024 y promete brindar a las empresas una herramienta más eficaz para dotar sus modelos de inteligencia artificial con información precisa y actualizada.

Bedrock, un servicio completamente gestionado por Amazon, ofrece modelos de alto rendimiento de reconocidas compañías de inteligencia artificial como AI21 Labs, Anthropic, Cohere, Meta, Mistral AI, y Stability AI, a través de una única API. Para simplificar el flujo de trabajo completo de RAG, que abarca desde la ingestión hasta la recuperación y la ampliación del prompt, Bedrock incluyó la funcionalidad de Knowledge Bases, la cual ahora admite el uso de metadatos.

La implementación de esta solución se estructura en tres fases fundamentales: la preparación de datos para el filtrado de metadatos, la creación y recopilación de datos y metadatos en la base de conocimientos, y finalmente, la recuperación de información utilizando este filtro. Como demostración práctica, se utilizó un conjunto de datos públicos de Food.com, procesando las 2,000 filas más relevantes de recetas y reseñas.

El filtrado de metadatos resulta especialmente valioso en el manejo de datos tabulares, facilitando la disponibilidad de detalles de un campo a otro y permitiendo la cita exacta de documentos o campos de texto, disminuyendo así los errores. En un caso práctico, se realizaron consultas para identificar recetas con tiempos de preparación y niveles de colesterol específicos, evidenciando que los resultados obtenidos con el filtrado de metadatos eran considerablemente más precisos.

En definitiva, Amazon Bedrock ahora proporciona herramientas más sofisticadas y mejoradas para el manejo de datos en contextos de RAG, permitiendo a las organizaciones obtener resultados más relevantes y precisos en sus modelos de inteligencia artificial. Tanay Chowdhury, Científico de Datos en el Centro de Innovación en IA Generativa de Amazon Web Services, subrayó la importancia de esta actualización y su potencial para beneficiar a las empresas mediante el uso de IA generativa y aprendizaje automático.

Mariana G.
Mariana G.
Mariana G. es una periodista europea y editora de noticias de actualidad en Madrid, España, y el mundo. Con más de 15 años de experiencia en el campo, se especializa en cubrir eventos de relevancia local e internacional, ofreciendo análisis profundos y reportajes detallados. Su trabajo diario incluye la supervisión de la redacción, la selección de temas de interés, y la edición de artículos para asegurar la máxima calidad informativa. Mariana es conocida por su enfoque riguroso y su capacidad para comunicar noticias complejas de manera clara y accesible para una audiencia diversa.

Más popular

Más artículos como este
Relacionados

Multitudinaria manifestación en Madrid en apoyo a la educación pública – CGT

En una contundente manifestación, más de 100.000 personas se...

Sabores del Deshielo: Explorando la Cocina Nórdica en Primavera

La cocina nórdica, reconocida por su estética minimalista y...

TSMC Impulsa la Innovación: Aumenta Producción de Chips de 2nm hasta 80,000 Obleas al Mes

TSMC, el notable gigante taiwanés de la industria de...

Máximo Pradera Regresa a la Televisión: Supera el Cáncer de Próstata y Pierde 20 Kilos

Máximo Pradera reapareció este fin de semana en el...