RSS Feed

2022-10-22 20:19:56 By : Ms. Cassie Duan

Inmediatamente después del generador de texto a video de Meta, Google ha anunciado su propio generador de películas con inteligencia artificial (IA).Imagen Video de Goggle todavía está en su fase de desarrollo, pero la compañía dice que será capaz de producir videos de 1280 × 768 a 24 cuadros por segundo a partir de un mensaje escrito.Según el trabajo de investigación de Google, Imagen Video tendrá habilidades estilísticas, como generar videos basados ​​en el trabajo de artistas famosos como Vincent van Gough.También generará objetos giratorios en 3D conservando su estructura y representando texto en varios estilos de animación.Google espera que su modelo de video con IA pueda "disminuir significativamente la dificultad de generar contenido de alta calidad".Imagen Video se basa en Imagen de Google, un programa de texto a imagen similar a DALL-E de OpenAI.https://petapixel.com/assets/uploads/2022/10/27.mp4Según lo descrito por la enseñanza de investigación de Google, Imagen Video tomará una descripción de texto y generará un video de 16 cuadros, tres cuadros por segundo con una resolución de 24 × 48 píxeles.Luego, el sistema aumenta la escala y "predice" fotogramas adicionales, produciendo un video final de 128 fotogramas y 24 fotogramas por segundo a 720p.Google dice que Imagen Video ha sido entrenado en 14 millones de pares de video-texto y 60 millones de pares de imagen-texto, así como en el conjunto de datos de imagen-texto LAION que se usó para entrenar Stable Diffusion.Entre los ejemplos proporcionados por Google, se encuentra un panda masticando bambú, un zoom en un mar agitado lleno de barcos piratas y un astronauta montando a caballo.Vale la pena señalar que todos los resultados de Imagen Video son seleccionados por Google y hasta el momento ningún evaluador independiente ha probado el programa.Dicho esto, el trabajo de investigación afirma que Imagen Video puede reproducir texto correctamente, algo con lo que tanto DALL-E como Stable Diffusion tienen problemas.El texto que generan esos programas es apenas legible.También afirma que Imagen Video ha demostrado una comprensión de la profundidad y la tridimensionalidad, lo que permite crear videos de vuelo de drones que giran y capturan objetos desde diferentes ángulos sin distorsión.Google ha expresado su preocupación por los "datos problemáticos" utilizados para entrenar sus programas generadores de imágenes de IA.La empresa ha intentado filtrar contenido sexualmente explícito o violento, así como estereotipos sociales y prejuicios culturales.Le preocupa que la herramienta pueda usarse "para generar contenido falso, odioso, explícito o dañino".“Hemos decidido no lanzar el modelo de Imagen Video o su código fuente hasta que se mitiguen estas preocupaciones”, agrega Google.