La startup francesa Mistral AI ha marcado un hito en el ámbito de la inteligencia artificial con el lanzamiento de Pixtral Large, un modelo multimodal que cuenta con 124.000 millones de parámetros. Este nuevo sistema se sitúa a la vanguardia del mercado, superando a competidores como GPT-4o y Gemini 1.5 Pro en pruebas fundamentales para la comprensión de textos, imágenes, gráficos y documentos complejos.
Pixtral Large se distingue por su notable capacidad para procesar simultáneamente hasta 30 imágenes de alta resolución o un libro de 300 páginas, habilitado por una ventana de contexto ampliada de 128.000 tokens. Basado en el exitoso Mistral Large 2, el modelo integra un codificador de visión de 1.000 millones de parámetros y un decodificador multimodal con 123.000 millones de parámetros. Esto le permite mantener un liderazgo en tareas textuales al mismo tiempo que expande su dominio en el manejo de datos visuales complejos.
En cuanto al rendimiento, Pixtral Large ha logrado destacarse en varias áreas clave. Por ejemplo, ha alcanzado un 69,4 % de precisión en el razonamiento matemático visual con MathVista, superando a todos los modelos existentes. Además, ha obtenido mejores resultados en la comprensión de documentos y gráficos, así como en evaluaciones de casos prácticos de uso multimodal en las pruebas DocVQA, ChartQA y MM-MT-Bench.
Otro aspecto innovador es la actualización de la plataforma Le Chat, impulsada por Pixtral Large, que se convierte en un entorno integral para la creación y gestión de contenido. Las nuevas características incluyen búsqueda web integrada, análisis avanzado de documentos, generación de imágenes mediante la tecnología Flux Pro de Black Forest Labs y Canvas, una herramienta de creación y edición de contenido en tiempo real.
Durante su fase beta, estas funcionalidades estarán disponibles de forma gratuita, permitiendo a los usuarios experimentar sin costos. Pixtral Large se ofrece bajo dos tipos de licencias: una de investigación para usos académicos y educativos, y otra comercial para desarrollo y aplicaciones comerciales. El modelo puede probarse en Le Chat, descargarse desde el sitio oficial de Mistral, o integrarse mediante su API.
Con este lanzamiento, Mistral se posiciona como un contendiente fuerte en un mercado dominado tradicionalmente por empresas estadounidenses. Ofreciendo opciones de código abierto y accesibles, la firma francesa reafirma su compromiso con una inteligencia artificial inclusiva y colaborativa, alterando la dinámica de competencia dentro del sector.
Adicionalmente, Mistral ha lanzado una actualización de su modelo textual insignia, Mistral Large 24.11, ahora disponible en plataformas como Google Cloud y Microsoft Azure. Este modelo introduce mejoras en la comprensión de contextos largos y un sistema de prompts optimizado, ideal para flujos de trabajo empresariales.
Con Pixtral Large y Mistral Large 24.11, Mistral AI muestra su compromiso continuo con la innovación en el campo de la inteligencia artificial, facilitando herramientas robustas y accesibles que prometen transformar la interacción con datos complejos en diversos formatos y sectores.