Intel y Aible han unido fuerzas para lanzar una solución empresarial integral de inteligencia artificial generativa (GenAI) y análisis aumentados sin servidor. Esta innovadora colaboración facilita la ejecución de casos de uso avanzados de GenAI y generación aumentada por recuperación (RAG) en múltiples generaciones de CPUs Intel® Xeon®, con optimizaciones de ingeniería y un programa de benchmarking para mejorar la eficiencia y reducir costos para los clientes empresariales.
Innovaciones en el Rendimiento de GenAI con Intel Xeon
Aible ha demostrado cómo las CPUs pueden potenciar notoriamente el rendimiento en diversas cargas de trabajo de IA moderna, desde la ejecución de modelos de lenguaje hasta RAG. Con una tecnología optimizada para procesadores Intel, Aible adopta un enfoque eficiente y sin servidor para la inteligencia artificial, utilizando recursos solo cuando las solicitudes de los usuarios están activas. Este método bajo demanda, donde bases de datos vectoriales y modelos de lenguaje se activan solo por unos segundos, logra reducir el costo total de propiedad (TCO), ofreciendo así una ventaja significativa en términos de eficiencia y costos.
Colaboración Estratégica para la Eficiencia en la IA
Mishali Naik, ingeniera principal senior de Intel en el Grupo de Centros de Datos e IA, resaltó: «Los clientes buscan soluciones eficientes y de nivel empresarial para aprovechar el poder de la IA. Nuestra colaboración con Aible muestra cómo estamos trabajando estrechamente con la industria para ofrecer innovación en IA y reducir la barrera de entrada para que muchos clientes ejecuten las últimas cargas de trabajo de GenAI utilizando procesadores Intel Xeon».
Reducción de Costes y Mejora de la Eficiencia
A través del uso exclusivo de CPUs en modo sin servidor, Aible ofrece una solución más segura y económica para proyectos de GenAI, permitiendo compartir recursos informáticos subyacentes entre múltiples clientes. Los benchmarks realizados por Aible indican que sus clientes pueden obtener hasta un ahorro de costos 55 veces mayor al ejecutar modelos RAG en esta infraestructura. Esta notable reducción de costos subraya la efectividad del enfoque exclusivo de Aible, que evita la necesidad de costosas infraestructuras basadas en GPU.
Resultados de la Colaboración Intel-Aible
Intel, incluyendo Intel Labs, ha colaborado estrechamente con Aible para optimizar las cargas de trabajo de IA en procesadores Xeon. Las optimizaciones del código de Aible para AVX-512 han permitido mejoras significativas en rendimiento y eficiencia en los procesadores Xeon, subrayando el impacto de las optimizaciones estratégicas de software.
La combinación de modelos RAG con procesadores Intel Xeon, apuntalada por plataformas como Aible, habilita una multitud de aplicaciones clave, incluyendo procesamiento de lenguaje natural (NLP), sistemas de recomendación, sistemas de soporte de decisiones y generación de contenido. Esta sinergia no solo impulsa la eficiencia operativa, sino que también promete transformar la manera en que las empresas abordan sus necesidades de inteligencia artificial.