En el mundo de la inteligencia artificial aplicada a la robótica y vehículos autónomos, la obtención de datos de calidad sigue siendo un desafío crucial. La necesidad de datos variados, precisos y seguros es imperativa, aunque la recolección exclusiva en entornos reales resulta ser un proceso costoso, lento y, a veces, peligroso. Para abordar esta problemática, NVIDIA ha actualizado sus Open World Foundation Models (WFMs) mediante Cosmos Predict 2.5 y Cosmos Transfer 2.5, logrando integrar estas herramientas con Omniverse y el ecosistema Isaac para generar datos sintéticos físicamente plausibles a gran escala, lo que acelera significativamente el tránsito de la simulación a la realidad.
La reciente actualización se basa en dos conceptos fundamentales: unificar la generación de mundos y permitir variaciones a voluntad, lo que incluye el control detallado de factores como el clima, la luz y el terreno, así como la consistencia multicámara. El objetivo es claro: probar y validar modelos de IA física con una cobertura de escenarios que sería impracticable recolectar únicamente en ambientes reales como calles, fábricas o campos agrícolas.
Cosmos Predict 2.5 se posiciona como una arquitectura innovadora que combina modelos como Text2World, Image2World y Video2World. Este sistema es capaz de generar mundos en video coherentes y controlables a partir de prompts, imágenes o videos, ofreciendo salidas multicámara consistentes. Por su parte, Cosmos Transfer 2.5 añade la capacidad de realizar transferencias de estilo espacial de mundo a mundo con alta fidelidad, multiplicando así la variabilidad del dataset.
Estas herramientas se integran en pipelines de datos sintéticos sobre NVIDIA Omniverse e Isaac Sim, lo cual permite un acortamiento del gap sim-to-real con videos fotorrealistas y anotaciones consistentes. El enfoque está diseñado para complementar, no reemplazar, los datos recogidos en escenarios reales.
En términos prácticos, empresas como Skild AI, Serve Robotics y Zipline ya están utilizando estos modelos para ampliar su capacidad de datos y validar políticas robóticas. Estas compañías han logrado avances significativos en áreas que van desde entregas autónomas hasta la detección de posibles obstrucciones en entornos industriales.
El uso de datos sintéticos resulta crucial para la «IA física», que debe funcionar en tiempo real y en entornos dinámicos. Al contrario que las IA generativas de texto o imagen, la IA física requiere datos basados en la realidad física y los eventos que ocurren en ella. Los datos sintéticos permiten cubrir escenarios raros y controlan la distribución de los mismos, además de proporcionar etiquetas precisas que facilitan el rápido entrenamiento y validación de los modelos.
OpenUSD junto a Omniverse se presenta como el lenguaje común para el 3D industrial, facilitando la interoperabilidad entre gemelos digitales, activos SimReady y datos sintéticos en diversas plataformas. Desarrolladores y equipos cuentan con amplios recursos y guías para comenzar a explorar y aplicar estas herramientas, abriendo así la puerta a un futuro donde la simulación y la realidad convergen para empujar los límites de la tecnología.
Más información y referencias en Noticias Cloud.


