La imagen de la portada no existe, tampoco el hombre que aparece en ella. Se trata de un fotograma de un vídeo de un minuto creador por inteligencia artificial y ya casi es imposible de distinguir de la realidad. Es obra OpenAI, el renombrado laboratorio de inteligencia artificial detrás de innovaciones como ChatGPT y DALL-E, ha revelado su última hazaña tecnológica: Sora, una herramienta capaz de generar videos realistas a partir de descripciones textuales. Este nuevo modelo, cuyo nombre se inspira en la palabra japonesa para "cielo", promete revolucionar la manera en que se crean contenidos visuales, permitiendo producir secuencias de hasta un minuto de duración que siguen las instrucciones de los usuarios tanto en tema como en estilo.
🚨 BREAKING: OpenAI just announced their new Text-To-Video model called Sora.
— Alvaro Cintas (@dr_cintas) February 15, 2024
Look at these 10 insane examples:
1. Space movie trailer featuring a man wearing a red wool knitted motorcycle helmet pic.twitter.com/Z8ezF69Tar
La capacidad de Sora para generar videos a partir de imágenes fijas o ampliar material de archivo existente con nuevo contenido abre un abanico de posibilidades para creadores y investigadores. La introducción de Sora se suma a los éxitos anteriores de OpenAI, como el generador de imágenes Dall-E en 2021 y el chatbot generativo ChatGPT en noviembre de 2022, este último alcanzando rápidamente los 100 millones de usuarios.
Capaz de crear vídeos complejos y realistas con multitud de detalles
A diferencia de otras herramientas de generación de video que producen fragmentos cortos y a menudo poco relacionados con las indicaciones dadas, Sora se distingue por su capacidad para crear videos complejos y realistas. Esta innovación coloca a OpenAI a la vanguardia de la inteligencia artificial generativa, superando a otras compañías que aún están desarrollando sus propias herramientas de video generativo. Por suerte, la seguridad y la ética son prioridades claras para OpenAI en el desarrollo y lanzamiento de Sora.
https://t.co/uCuhUPv51N pic.twitter.com/nej4TIwgaP
— Sam Altman (@sama) February 15, 2024
La empresa ha implementado un proceso de "red teaming", donde expertos evalúan el modelo en busca de vulnerabilidades o maneras en que podría usarse inapropiadamente, siguiendo estrictas directrices que prohíben contenido de violencia extrema, sexual, de odio, la semejanza de celebridades, o la propiedad intelectual de terceros. Además, OpenAI está trabajando en herramientas para etiquetar los videos creados por Sora, siguiendo las directrices de C2PA, y aplicando métodos de seguridad usados previamente en DALL-E para rechazar indicaciones de texto inapropiadas o dañinas.
Acceso limitado
A diferencia de sus predecesores, que se centraban en la generación de texto e imágenes, esta herramienta eleva la apuesta al permitir la producción de secuencias de vídeo que capturan escenas complejas, movimientos específicos y una precisión en los detalles hasta ahora no vista en el ámbito de la inteligencia artificial. Actualmente, el acceso a Sora está limitado a investigadores y creadores de vídeo seleccionados, lo que subraya el carácter experimental y vanguardista de esta tecnología.
Introducing Sora, our text-to-video model.
— OpenAI (@OpenAI) February 15, 2024
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
La capacidad de esta herramienta para entender y ejecutar comandos en un lenguaje natural se fundamenta en el entrenamiento con una extensa biblioteca de vídeos. Esto le permite reconocer y recrear una amplia gama de movimientos, escenarios y elementos visuales especificados por los usuarios. Por ejemplo, puede generar un vídeo de una mujer caminando por una calle de Tokio iluminada por neones, con descripciones detalladas de su vestimenta y el ambiente circundante, demostrando su habilidad para interpretar y materializar visualmente las instrucciones de forma precisa.
https://t.co/rmk9zI0oqO pic.twitter.com/WanFKOzdIw
— Sam Altman (@sama) February 15, 2024
Formará parte del catálogo de productos de OpenAI
A pesar de su prometedor inicio, Sora aún enfrenta desafíos, especialmente en la simulación exacta de las físicas y la comprensión de la causalidad en las escenas generadas. OpenAI ha reconocido estas limitaciones y trabaja en la mejora continua del modelo, buscando equilibrar su innovador potencial con la responsabilidad de garantizar su uso seguro y ético. La fase actual de pruebas y desarrollo de Sora apunta a una futura incorporación al catálogo de productos de OpenAI, aunque aún no se ha definido una fecha específica para su lanzamiento al público general.
Announcing Sora — our model which creates minute-long videos from a text prompt: https://t.co/SZ3OxPnxwz pic.twitter.com/0kzXTqK9bG
— Greg Brockman (@gdb) February 15, 2024
Vandal Random es el vertical especializado en cine, series, anime, manga, cómics y entretenimiento en general de Vandal. En estas páginas también encontrarás artículos sobre cultura, ciencia e historia orientados a la divulgación. ¡No olvides decirnos lo que te parece este artículo o darnos tu opinión sobre el tema participando en los comentarios!