Volkswagen, el gigante automovilístico europeo, ha dado un paso significativo en la gestión del conocimiento en el ámbito de la producción mediante la implementación de una innovadora solución basada en inteligencia artificial generativa. En colaboración con el equipo de Prototipado e Ingeniería de Clientes de AWS (AWSI-PACE), la compañía ha desarrollado un prototipo que emplea los avanzados modelos Claude 3 de Anthropic en Amazon Bedrock. Este prototipo revolucionario permite extraer y analizar información de documentos privados complejos en formato PDF, integrando tanto texto como imágenes.
El reto principal para Volkswagen fue diseñar un sistema eficiente capaz de manejar y procesar datos en un entorno multimodal, asegurando al mismo tiempo la precisión y accesibilidad de la información guardada. La solución, basada en la arquitectura de Recuperación de Generación Aumentada (RAG), permite a la empresa gestionar y acceder a su información interna de forma efectiva, mejorando la precisión y eficiencia de sus operaciones productivas.
Esta innovadora arquitectura se apoya en un sistema backend nativo sin servidor de AWS, enfocado en la eficiencia, escalabilidad y fiabilidad. Integra múltiples servicios de AWS, como Amazon S3 para el almacenamiento de datos, Amazon Kendra para la búsqueda semántica y Amazon Bedrock para el análisis e inferencia de datos. Los modelos de visión de Claude 3 son esenciales para comprender y analizar imágenes junto al texto, lo cual resulta fundamental para extraer información de documentos complejos.
El proceso del sistema inicia cuando un usuario carga un documento PDF mediante la interfaz web, facilitada por Amazon CloudFront. Una vez cargado, el PDF se almacena en Amazon S3, donde Amazon Kendra se encarga de indexar el texto. Simultáneamente, una función Lambda extrae imágenes de los documentos, las cuales son procesadas por Amazon Bedrock para extraer texto contextual relevante. Este texto se almacena nuevamente en S3 y es indexado por Amazon Kendra para mejorar la capacidad de búsqueda y consulta.
El sistema no solo es capaz de manejar documentos en alemán, sino que también posee una destacada capacidad multilingüe, lo que le permite gestionar consultas y proporcionar respuestas tanto en alemán como en inglés. Este avance es crucial para los usuarios que interactúan con documentos en varios idiomas, permitiéndoles realizar consultas en su idioma preferido y, así, mejorar la experiencia del usuario.
Los resultados del prototipo han sido impresionantes. No solo han conseguido un proceso de búsqueda semántica más preciso y contextualmente relevante, sino que también han mejorado la experiencia del usuario al integrar capacidades multilingües. Estas características han ampliado significativamente el alcance y la accesibilidad del sistema para los usuarios de Volkswagen.
Stefan Krawinkel, portavoz de Volkswagen, manifestó su satisfacción con los logros alcanzados, destacando el espíritu innovador del equipo de AWS y el potencial de la inteligencia artificial generativa para enfrentar desafíos complejos y redefinir las fronteras tecnológicas. La colaboración no solo ha permitido superar barreras actuales, sino que también ha abierto nuevas oportunidades para innovaciones futuras en el sector automotriz.