“OpenAI presenta SORA, la IA que redefine el sector audiovisual, permitiendo la creación de vídeos realistas desde simples instrucciones de texto. Este avance no solo mejora la forma en que generamos y disfrutamos del contenido multimedia, sino que también nos acerca a la AGI (Inteligencia General Artificial), prometiendo una era de posibilidades creativas sin precedentes”
Fotograma hiperrealista de uno de los vídeos presentación de SORA.
Hace apenas una semana, OpenAI, la empresa que está detrás de innovaciones como Chat GPT, presentaba SORA, su más reciente modelo de IA (inteligencia artificial), con el que pretende revolucionar el sector audiovisual como nunca nadie antes hubiera podido imaginar. He de confesar que, desde la popularización de los primeros modelos de IA generativa hacia finales de 2022, ningún modelo me había impresionado tanto. Sin duda, es el primer paso para transformar por completo la manera en que producimos y consumimos contenido audiovisual.
Con una interfaz de usuario sorprendentemente intuitiva y muy sencilla de usar, SORA tiene la capacidad de generar escenas de vídeo totalmente realistas a partir de instrucciones de texto simples. Por el momento, puede generar vídeos de hasta un minuto de duración, no está disponible para el público en general, aunque desde OpenAI han anunciado que en los próximos meses entrará a formar parte de su catálogo de productos.
Este innovador modelo no solo es capaz de procesar y ejecutar las solicitudes de los usuarios, sino que también es capaz de comprender cómo debe combinar los diferentes elementos para crear entornos completamente realistas. SORA sobresale en la creación de escenarios detallados, permitiendo la incorporación de múltiples personajes, asignándoles movimientos específicos y logrando una representación precisa tanto de los sujetos como del entorno que los rodea.
Además de poseer la capacidad de crear vídeos a partir de simples instrucciones de texto, SORA también puede animar imágenes estáticas o incluso rellenar fotogramas en vídeos ya existentes.
Más allá de la espectacularidad y la calidad de los vídeos, lo que realmente impacta es su capacidad para interpretar y replicar la complejidad de una escena real, un paso muy significativo en el camino hacia la AGI (Inteligencia General Artificial).
Cuando hablamos de AGI, nos referimos a una forma avanzada de IA capaz de entender, aprender y aplicar su inteligencia a una amplia gama de tareas y problemas, de manera similar o incluso superior a como lo hacemos los humanos. A diferencia de la IA específica, que está diseñada y entrenada para realizar tareas concretas, como redacción de texto, reconocimiento de imágenes o traducción de idiomas, la AGI tiene la capacidad de transferir su aprendizaje y adaptarse a situaciones nuevas y desconocidas, resolviendo problemas en diversos temas sin la necesidad de ser programada específicamente para ello.
Este modelo no solo promete una revolución en la producción de contenido audiovisual, es una insinuación en toda regla del potencial ilimitado que la IA puede ofrecer en un futuro cercano. Un antes y un después en nuestra interacción con una tecnología que nos permita expandir las fronteras creativas hasta límites insospechados.