Es posible que haya notado algunos memes de video impresionantes hechos con IA en las últimas semanas. Harry Potter reimaginado como un comercial de Balenciaga y imágenes de pesadilla de Will Smith comiendo espaguetis se volvieron virales recientemente. Destacan lo rápido que avanza la capacidad de la IA para crear videos, así como lo problemáticos que pueden ser algunos usos de la tecnología.
Estos videos me recuerdan el momento en que las herramientas de creación de imágenes de IA se generalizaron el año pasado, cuando programas como Craiyon (anteriormente conocido como DALL-E Mini) permitieron que cualquiera evocara imágenes reconocibles, aunque crudas y a menudo surrealistas, como imágenes de vigilancia de bebés. robando una gasolinera, bocetos de la sala de audiencias de Darth Vadar y Elon Musk comiendo crayones.
Craiyon era una imitación de código abierto del generador de imágenes DALL-E 2, entonces cuidadosamente restringido, de OpenAI, la compañía detrás de ChatGPT. La herramienta fue la primera en mostrar la capacidad de AI para tomar un mensaje de texto y convertirlo en lo que parecían fotos reales e ilustraciones dibujadas por humanos. Desde entonces, DALL-E se ha abierto a todos, y programas como Midjourney y Dream Studio han desarrollado y perfeccionado herramientas similares, lo que hace que sea relativamente trivial crear imágenes complejas y realistas con unos pocos toques en el teclado.
A medida que los ingenieros ajustaron las perillas y palancas algorítmicas detrás de estos generadores de imágenes, agregaron más datos de entrenamiento y pagaron más chips de GPU para ejecutar todo, estas herramientas de creación de imágenes se volvieron increíblemente buenas para falsificar la realidad. Para tomar algunos ejemplos de un subreddit dedicado a extrañas imágenes de IA, echa un vistazo a Alex Jones en un desfile del orgullo gay o el Arca de la Alianza en una venta de garaje.
El acceso generalizado a esta tecnología, y su sofisticación, nos obliga a repensar cómo vemos las imágenes en línea, como se destacó después de que las imágenes creadas por IA que pretendían mostrar el arresto de Donald Trump se hicieran virales el mes pasado. El incidente llevó a Midjourney a anunciar que ya no ofrecería una prueba gratuita de su servicio, una solución que podría disuadir a algunos malos actores tacaños pero que deja intacto el problema más amplio.
Como escribe Amanda Hoover de WIRED esta semana, los algoritmos todavía tienen dificultades para generar videos convincentes a partir de un aviso. La creación de muchos fotogramas individuales es costosa desde el punto de vista computacional y, como muestran los videos que tiemblan y chisporrotean hoy en día, es difícil para los algoritmos mantener suficiente coherencia entre ellos para producir un video que tenga sentido.
Sin embargo, las herramientas de IA se están volviendo mucho más hábiles para editar videos. El meme de Balenciaga, junto con las versiones que hacen referencia a Friends y Breaking Bad , se crearon combinando algunas herramientas de IA diferentes, primero para generar imágenes fijas y luego para agregar efectos de animación simples. Pero el resultado final sigue siendo impresionante.
Runway ML, una startup que está desarrollando herramientas de inteligencia artificial para la creación y edición profesional de imágenes y videos, lanzó esta semana una nueva técnica más eficiente para aplicar cambios de estilo a los videos. Lo usé para crear este metraje de ensueño de mi gata, Leona, caminando a través de un "paisaje de nubes" de un video existente en solo unos minutos.
Diferentes técnicas de aprendizaje automático abren nuevas posibilidades. Una empresa llamada Luma AI, por ejemplo, está utilizando una técnica conocida como campos de radiación neuronal para convertir fotografías 2D en escenas 3D detalladas. Introduce algunas instantáneas en la aplicación de la empresa y tendrás una escena 3D totalmente interactiva con la que jugar.
Estos clips sugieren que estamos en un punto de inflexión para la creación de videos con IA. Al igual que con la generación de imágenes de IA, una creciente avalancha de memes podría ser seguida por mejoras significativas en la calidad y la capacidad de control de los videos de IA que alojan la tecnología en todo tipo de lugares. AI bien puede convertirse en una musa para algunos autores. Las herramientas de Runway fueron utilizadas por los artistas de efectos visuales que trabajaron en Everything Everywhere All At Once, ganadora del Oscar. Darren Aronofsky, director de The Whale , Black Swan y Pi también es fanático de Runway.
Pero solo necesita observar qué tan avanzadas son ahora las imágenes de Midjourney y Dream Studio para detectar hacia dónde se dirige el video de IA y qué tan difícil puede volverse distinguir los clips reales de los falsos. Por supuesto, las personas ya pueden manipular videos con la tecnología existente, pero aún es relativamente costoso y difícil de lograr.
Los rápidos avances en la IA generativa pueden resultar peligrosos en una era en la que las redes sociales se han convertido en armas y las falsificaciones profundas son juguetes de los propagandistas. Como Jason Parham escribió para WIRED esta semana, también debemos considerar seriamente cómo la IA generativa puede recuperar y reutilizar estereotipos desagradables.
Por ahora, el instinto de confiar en los videoclips es mayormente confiable, pero es posible que no pase mucho tiempo antes de que las imágenes que vemos sean menos sólidas y veraces de lo que alguna vez fueron.