En el escenario de innovación tecnológica, la reciente presentación de NVIDIA en el CES 2025 ha capturado la atención de la industria con el lanzamiento de Cosmos, una plataforma que promete revolucionar el desarrollo de sistemas de Inteligencia Artificial (IA) física, incluyendo robots y vehículos autónomos (AV). Cosmos se caracteriza por su capacidad para utilizar modelos fundacionales generativos y tokenizadores avanzados, además de un pipeline de procesamiento de datos optimizado para GPUs de NVIDIA.
La creación de IA física ha sido tradicionalmente un desafío costoso y complejo debido a la necesidad de grandes cantidades de datos y pruebas reales. Sin embargo, Cosmos ofrece la posibilidad de generar datos sintéticos fotorealistas basados en físicas, lo que facilita el entrenamiento y la evaluación de modelos de manera más eficiente y económica. Los desarrolladores ahora pueden personalizar estos modelos con información específica, como datos provenientes de vehículos autónomos en diversas condiciones ambientales o robots operando en distintas configuraciones industriales.
Jensen Huang, fundador y CEO de NVIDIA, destacó la trascendencia de esta innovación al afirmar: “El momento de transformación para la robótica está cerca. Al igual que los modelos de lenguaje, los modelos fundacionales de mundos son clave para avanzar en el desarrollo de robots y AVs. Cosmos pone estas herramientas al alcance de todos los desarrolladores.”
En un intento por democratizar aún más la tecnología, los modelos fundacionales de Cosmos están disponibles bajo una licencia abierta. Esto fomenta la colaboración en la comunidad de robótica y AV, permitiendo el acceso a los modelos a través del catálogo de APIs de NVIDIA, así como su descarga desde plataformas como NVIDIA NGC y Hugging Face. Estos modelos son adaptables para distintas funciones, desde la búsqueda y comprensión de videos hasta la generación de datos sintéticos y la simulación de futuros posibles.
Cosmos también incorpora herramientas avanzadas que facilitan el procesamiento de modelos de IA física. Un pipeline acelerado, alimentado por tecnología NVIDIA AI y CUDA, permite procesar vastas cantidades de datos de video en un tiempo significativamente reducido. Además, el Cosmos Tokenizer, una herramienta de última generación, y el NVIDIA NeMo Framework, ofrecen capacidades sin precedentes para el tratamiento de imágenes y videos.
Empresas líderes en los campos de robótica y transporte ya están adoptando las tecnologías de Cosmos. Compañías como XPENG y Agility utilizan la plataforma para desarrollar robots humanoides y entrenar modelos sin depender de costosos datos reales. En el sector de los vehículos autónomos, firmas como Waabi y Foretellix emplean Cosmos para crear escenarios de prueba y datos de alta fidelidad.
Dara Khosrowshahi, CEO de Uber, comentó sobre la importancia de esta tecnología: “La IA generativa será clave para el futuro de la movilidad. Cosmos y NVIDIA DGX Cloud acelerarán significativamente las soluciones de conducción autónoma segura y escalable.”
El compromiso de NVIDIA con una IA segura y responsable se mantiene firme en el diseño de Cosmos, habiendo incorporado herramientas para mitigar contenidos dañinos y aplicar marcas de agua invisibles a los videos generados por IA. Esto ayuda a reducir el riesgo de desinformación y fomenta prácticas de IA responsable entre los desarrolladores.
Cosmos ya está disponible en plataformas como NVIDIA NGC y Hugging Face, con la expectativa de que los modelos sean optimizados próximamente como microservicios NIM de NVIDIA. Además, la plataforma se integra con NVIDIA DGX Cloud para facilitar despliegues rápidos y ofrece soporte empresarial a través de NVIDIA AI Enterprise.
Con esta nueva oferta, NVIDIA redefine el paradigma en el desarrollo de IA física, impulsando la innovación y facilitando un acceso más amplio a tecnologías avanzadas en robótica y vehículos autónomos.