Sora: la inteligencia artificial capaz de generar vídeos a partir de texto

OpenAI sorprende con esta última herramienta. Hasta el momento solo está disponible para algunos creativos y todavía se encuentra en evaluación.

17/02/2024 08:42 De los mismos creadores de ChatGPT, la empresa OpenAI lanzó Sora un modelo de inteligencia artificial que puede crear vídeos de hasta 60 segundos con escenas muy detalladas, movimientos de cámara complejos y múltiples personajes a partir de instrucciones de texto.

A través de sus redes sociales, Sam Altman, el CEO de OpenAI, escribió: "Aquí está sora, nuestro modelo de generación de videos". La empresa estadounidense también compartió por la red social X algunos videos generados a partir de texto.

Por ejemplo, este mensaje que creó un clip de 17 segundos.

"La hermosa y nevada ciudad de Tokio está muy animada. La cámara se mueve por las bulliciosas calles de la ciudad, siguiendo a varias personas disfrutando del hermoso clima nevado y comprando en los puestos cercanos. Preciosos pétalos de sakura vuelan con el viento junto con los copos de nieve”.

Presentamos Sora, nuestro modelo de texto a video.

[Lea también: Desnudos filtrados y uso de IA en estafas serán los ataques más frecuentes por hackers en 2024 ]

Sora puede crear vídeos de hasta 60 segundos con escenas muy detalladas, movimientos de cámara complejos y múltiples personajes con emociones vibrantes. https://t.co/7j2JN27M3W

Mensaje: “Hermoso, nevado… pic.twitter.com/ruTEWn87vf
– OpenAI (@OpenAI) 15 de febrero de 2024

En el blog oficial de OpenAI explican que Sora puede generar vídeos de hasta un minuto de duración manteniendo la calidad visual y el cumplimiento de las indicaciones del usuario.

¿Está disponible para todos?

OpenAI explica que hoy en día, Sora está disponible para los miembros del "equipo rojo" para evaluar áreas críticas en busca de daños o riesgos.

"También estamos otorgando acceso a una serie de artistas visuales, diseñadores y cineastas para obtener comentarios sobre cómo hacer avanzar el modelo para que sea más útil para los profesionales creativos. Estamos compartiendo el progreso de nuestra investigación desde el principio para comenzar a trabajar y recibir comentarios de personas viejas a OpenAI y para brindarle al público una idea de las capacidades de IA que hay en el horizonte”, precisa.

Lea también: Desnudos filtrados y uso de IA en estafas serán los ataques más frecuentes por hackers en 2024

Sus creadores enfatizan que Sora es capaz de generar escenas complejas con múltiples personajes, tipos específicos de movimiento y detalles precisos. del sujeto y el fondo.

El modelo comprende no sólo lo que el usuario ha pedido en el mensaje, sino también cómo existen esas cosas en el mundo físico.

El modelo tiene un profundo conocimiento del lenguaje, lo que le permite interpretar indicaciones con precisión y generar personajes convincentes que expresan emociones vibrantes.

Sora también puede crear múltiples tomas dentro de un solo video generado que persisten con precisión los personajes y el estilo visual.

Debilidades y seguridad

OpenAI también señala que el modelo actual tiene debilidades.

"Puede tener dificultades para simular con precisión la física de una escena compleja y es posible que no comprenda casos específicos de causa y efecto. Por ejemplo, una persona puede darle un mordisco a una galleta, pero después, es posible que la galleta no tenga la marca del mordisco", cita como ejemplo.

El modelo también puede confundir los detalles espaciales de un mensaje, por ejemplo, mezclando izquierda y derecha, y puede tener dificultades con descripciones precisas de eventos que tienen lugar a lo largo del tiempo, como seguir una trayectoria de cámara específica.

Sobre la seguridad afirman que tomarán varias medidas de seguridad importantes antes de que Sora esté disponible en los productos de OpenAI.

"Estamos trabajando con los miembros del equipo rojo (expertos en áreas como desinformación, contenido que incita al odio y prejuicios) que probarán el modelo de manera adversa. También estamos creando herramientas para ayudar a detectar contenido engañoso, como un clasificador de detección que puede indicar cuándo Sora generó un vídeo", señala comunicado de OpenAI.

Finalmente, enfatiza la empresa de Sam Altman que a pesar de investigaciones y pruebas exhaustivas, no podrán predecir todas las formas beneficiosas en que las personas utilizarán tecnología nuestra, ni todas las formas en que abusarán de ella.

“Es por eso que creemos que aprender del uso en el mundo real es un componente crítico para crear y lanzar sistemas de IA cada vez más seguros con el tiempo”, concluye.

Lee también en El Peruano

#CentralElPeruano ??? En el Perú existen más de 10,000 clubes de ciencia y tecnología, promovidos por el @ConcytecPeru, en las instituciones educativas públicas y privadas.

??https://t.co/YnzO5Bmt7W
? Por José Vadillo Vila (@vadillovila) pic.twitter.com/PGvIqu2rHw
— Diario El Peruano (@DiarioElPeruano) January 24, 2024