SORA, un hito en la evolución de la inteligencia artificial con impacto en los medios y otras industrias
Dependiendo de lo acertado que sea la construcción del prompt (mensaje de instrucciones), que proporcionemos a la IA, obtendremos una respuesta que satisfaga las necesidades del usuario. De ahí que el uso de prompts sea visto como un entorno que requiere cada vez más de profesionalidad y rigor.
Un ejemplo de ello se puede observar con la instrucción dado a SORA, una de las recientes herramientas que Open AI (la empresa creadora de ChatGPT) ha lanzado a la ya emergente industria de la inteligencia artificial.
El prompt escogido por Open AI es: “Escena de pasos de una persona corriendo, película cinematográfica filmada en 35 mm». Y la respuesta de SORA, de acuerdo a los resultados en el video generado a partir de dicha instrucción, es que a veces crea movimientos físicamente inverosímiles (según el propio diagnóstico de Open AI ).
Podemos decir, por tanto, que el sistema SORA se encuentra en una fase embrionaria. Esto porque resulta difícil asimilar (según el video creado por SORA), una persona corriendo en una cinta, de forma inversa al rodamiento de la cinta. Y más aún, que la propia máquina de cinta de running se esté deslizando en la misma trayectoria de la persona corriendo.
Si bien las escenas son ciertamente impresionantes, las capacidades más sorprendentes de Sora son aquellas para las que no ha sido entrenado. De acuerdo con la descripción de Open AI, SORA es un modelo de IA que puede crear escenas realistas e imaginativas a partir de instrucciones de texto. Está impulsado por una versión del modelo de difusión utilizado por el generador de imágenes Dalle-3 de OpenAI, así como por el motor basado en el transformador de GPT-4. SORA, no solo produce videos que cumplen con las demandas de las indicaciones, sino que lo hace de una manera que muestra una comprensión emergente de la gramática cinematográfica. El sistema puede generar videos de hasta un minuto de duración manteniendo la calidad visual y el cumplimiento de las indicaciones del usuario.
Según el The New York Times, OpenAI decidió que el nuevo sistema se llamara SORA, por la palabra japonesa que significa “cielo”. El equipo detrás de la tecnología, que incluye a los investigadores Tim Brooks y Bill Peebles, eligió el nombre porque “evoca la idea de un potencial creativo ilimitado”.
Una característica de Sora que el equipo de OpenAI no mostró, y que puede que no lance durante bastante tiempo, es la capacidad de generar vídeos a partir de una sola imagen o una secuencia de fotogramas. «Esta será otra forma realmente interesante de mejorar las capacidades de narración», dice Brooks. «Puedes dibujar exactamente lo que tienes en mente y luego darle vida». El trasfondo de estos nuevos desarrollos serán los fines que se le dé a la nueva plataforma. OpenAI es consciente de que esta característica también tiene el potencial de producir deepfakes y desinformación. «Vamos a tener mucho cuidado con todas las implicaciones de seguridad que esto conlleva», sostiene Peebles.
Indudablemente, nos encontramos en fase de experimentación de los nuevos sistemas de IA, proclives a ser utilizados por las organizaciones de noticias. Lo que si podemos afirmar es que el sistema SORA es un ejemplo de IA generativa, que puede crear textos, imágenes y sonidos en instantes. Al igual que otras tecnologías de IA generativa, el sistema de OpenAI aprende analizando datos digitales, en este caso videos y subtítulos que describen su contenido. De hecho, esta evolución de la IA visto a través de SORA, pone de manifiesto lo que se ya preveía que iba a suceder tarde o temprano: la convergencia de lo multimedia con la inteligencia artificial. Incluso, transmedial.
Estos nuevos desarrollos de IA bajo modelos al estilo de SORA conllevan el abordaje de la responsabilidad y la ética de la IA que los usuarios propongan en la construcción del prompt. De esto hablaremos en otros post.
El contenido de este sitio está bajo una licencia Creative Commons Attribution 4.0 International. Difunde, cita y enlaza.
COMO CITAR:
Flores-Vivar, J.M. (20 de febrero de 2024) SORA, un hito en la evolución de la inteligencia artificial con impacto en los medios y otras industrias. Cultura de Red (Blogs Fundación para el Conocimiento Madrid+d), [https://www.madrimasd.org/blogs/culturadered/sora-un-hito-en-la-evolucion-de-la-inteligencia-artificial-con-impacto-en-los-medios-y-otras-industrias/]