Una Nueva Era en la Generación de Videos

0
111
a new era of video generation?

Una semana después del lanzamiento de Sora por OpenAI, Google DeepMind ha presentado Veo 2, un modelo de generación de video que promete revolucionar la creación de contenido audiovisual mediante inteligencia artificial. Veo 2 se diferencia por su capacidad de generar videos de alta calidad con resolución de hasta 1080p y superando un minuto de duración, mostrando una amplia variedad de estilos visuales y cinematográficos.

Entre las características más destacadas de Veo 2 se incluyen la generación de videos realistas en resoluciones fenomenales, la comprensión de diferentes tipos de tomas de cámara como dron, panorámicas y primeros planos, así como una mejor replicación de la física del mundo real y la expresión humana. Un ejemplo de su capacidad muestra un impresionante plano en ángulo bajo de flamencos en un lago, donde se captura la belleza natural y la serenidad del entorno, ilustrando así el potencial de la tecnología.

Al comparar Veo 2 con Sora de OpenAI, se observa que aunque ambos modelos son innovadores, cada uno tiene sus fortalezas. Sora se destaca en la narrativa creativa y escenarios imaginativos, mientras que Veo 2 se enfoca en la realismo y la precisión física, ofreciendo además un mayor control sobre el proceso de generación de video.

Pruebas realizadas por Google, utilizando un conjunto de datos de evaluación de videos, han señalado a Veo 2 como superior a competidores como Sora Turbo en la generación de clips de video. Sin embargo, Google también reconoce limitaciones persistentes en la generación de videos realistas, especialmente en escenas complejas y secuencias de movimiento.

Para garantizar un uso adecuado y la transparencia, la implementación inicial de Veo 2 estará restringida a productos seleccionados como VideoFX, YouTube y Vertex AI, con planes de expansión a plataformas como YouTube Shorts en 2025. Todos los videos generados por la inteligencia artificial llevarán una marca de agua invisible llamada SynthID.

Además del lanzamiento de Veo 2, DeepMind ha mejorado su modelo de generación de imágenes, Imagen 3, que produce imágenes con colores más vivos, mejor composición y mayor detalle. Este modelo también se está implementando globalmente. Asimismo, Google Labs ha introducido un nuevo experimento llamado «Whisk», que aprovecha las capacidades de generación visual de Imagen 3 y Gemini, permitiendo a los usuarios interactuar mediante imágenes para demostrar los avances en la generación de contenido visual impulsada por inteligencia artificial.
vía: AI Accelerator Institute