En un paso audaz hacia el futuro de la inteligencia artificial, Google DeepMind ha presentado su innovador modelo de generación de video, Veo 2, prometiendo cambiar radicalmente la creación de contenido audiovisual. Este lanzamiento se produce apenas una semana después de que OpenAI revelara su propio modelo de video, Sora, lo que intensifica la competencia en el ámbito de las tecnologías creativas avanzadas.
Veo 2 se destaca por su capacidad para generar videos de alta calidad y resolución, alcanzando hasta 1080p en más de un minuto de duración. El modelo ofrece una amplia variedad de estilos visuales y cinematográficos, que van desde tomas de dron hasta planos panorámicos y primeros planos, todo con una sorprendente exactitud en la física del mundo real y las expresiones humanas. Un ejemplo de su capacidad puede apreciarse en una impresionante secuencia que captura un plano en ángulo bajo de flamencos en un lago, logrando transmitir la belleza y la serenidad del entorno natural.
La comparación entre Veo 2 y Sora de OpenAI revela que ambos modelos ofrecen innovaciones únicas. Mientras que Sora se especializa en la narrativa creativa con escenarios imaginativos, Veo 2 se orienta hacia el realismo y la precisión, ofreciendo un control más preciso sobre el proceso de generación de video.
Pruebas internas llevadas a cabo por Google han destacado la superioridad de Veo 2 en comparación con otros competidores, como Sora Turbo, especialmente en la creación de clips de video. Sin embargo, Google reconoce que aún existen desafíos en la generación de videos realistas, especialmente en escenas complejas o con movimiento dinámico.
Para asegurar un uso responsable y transparente de esta tecnología, Veo 2 inicialmente estará integrado en productos seleccionados de Google como VideoFX, YouTube y Vertex AI. Se espera una futura ampliación a plataformas como YouTube Shorts en 2025. Como medida de seguridad, los videos generados por inteligencia artificial estarán equipados con una marca de agua invisible conocida como SynthID, garantizando así su identificación y autenticidad.
En paralelo al lanzamiento de Veo 2, DeepMind también ha actualizado su modelo de generación de imágenes, Imagen 3, que promete mejorar la viveza de los colores, la composición y el detalle de las imágenes. Este modelo ya se está implementando a nivel global. Google Labs, por su parte, ha lanzado un nuevo experimento llamado «Whisk», que utiliza las capacidades de Imagen 3 y Gemini para permitir interacciones con imágenes, demostrando así los avances en la generación de contenido visual mediante inteligencia artificial.
Estos avances demuestran el compromiso de Google DeepMind con la innovación tecnológica, marcando una nueva era en la creación y consumo de contenido digital, donde el realismo y la creatividad se unen en perfecta sincronía.