Mundo Digital

Meta hizo DALL-E para video, y es espeluznante y asombroso

Meta presentó un modelo loco de inteligencia artificial que permite a los usuarios convertir sus descripciones escritas en video. El sistema se llama Hacer un vídeo y es lo último en una tendencia de contenido generado por IA en la web.

El sistema acepta descripciones breves como «un robot surfeando una ola en el océano» o «un pez payaso nadando en el arrecife de coral» y genera dinámicamente un breve GIF de la descripción. Incluso hay tres estilos diferentes de videos para elegir: surrealista, realista y estilizado.

El pincel de un artista pintando sobre un lienzo de cerca

De acuerdo a un publicación de Facebook por el CEO de Meta, Mark Zuckerberg, traducir texto escrito en video es mucho más difícil debido a que el video requiere movimiento:

“Es mucho más difícil generar videos que fotos porque más allá de generar correctamente cada píxel, el sistema también tiene que predecir cómo cambiarán con el tiempo. Make-A-Video resuelve esto al agregar una capa de aprendizaje no supervisado que permite que el sistema comprenda el movimiento en el mundo físico y lo aplique a la generación tradicional de texto a imagen”.

1664502227 827 Meta Hizo Dall E Para Video Y Es Espeluznante Y Asombroso.webp
Una pareja joven caminando bajo una fuerte lluvia

El equipo de investigación de IA de Meta escribió un papel describiendo cómo funciona el sistema y cómo se diferencia de los métodos actuales de texto a imagen (T2I). A diferencia de otros modelos de lenguaje de máquina, el método de texto a video (T2V) de Meta no utiliza pares de texto y video predefinidos. Por ejemplo, no empareja «hombre caminando» con un video de un hombre real caminando.

Si esto se parece mucho a DALL-E, la popular aplicación T2I, no estaría muy lejos. Se han implementado otras aplicaciones T2I desde que DALL-E ganó popularidad. TikTok lanzó un filtro en agosto llamado AI Greenscreen que genera imágenes de estilo de pintura en función de las palabras que escribe.

1664502228 161 Meta Hizo Dall E Para Video Y Es Espeluznante Y Asombroso.webp
Un bebé perezoso esponjoso con un sombrero de punto naranja tratando de descifrar una computadora portátil cerca de una pantalla de iluminación de estudio muy detallada que se refleja en su ojo

El contenido generado por IA se ha vuelto bastante popular en los últimos años. La tecnología deepfake, técnicas de aprendizaje automático para reemplazar la cara de una persona con otra, incluso es utilizada por estudios de efectos visuales para espectáculos de gran presupuesto como el mandaloriano.

En julio, The Times informó por error sobre una mujer ucraniana en medio de la guerra entre Rusia y Ucrania. El problema es que ella no era real.

La amenaza de la IA probablemente no sea una amenaza real, pero proyectos como DALL-E y Make-A-Video son exploraciones divertidas de algunas de las posibilidades interesantes.

Recomendaciones de los editores






Publicaciones relacionadas

Botón volver arriba