Innovación

OpenAI anuncia Sora, la nueva intelifencia artificial que crea videos a partir de textos: así funciona

La IA es una creación de los mismos desarrolladores de otros productos similares como ChatGPT o Dall-E

Viernes, Febrero 16, 2024

Bienvenidos al futuro. La empresa que causó revuelo en los últimos tres años por poner a disposición del mundo entero inteligencias artificiales generativas para texto como ChatGPT o para imágenes como Dall-E, ahora da un paso más allá e ingresa al mundo de los videos con Sora.

Leer también: Seis ventajas de tener electrodomésticos con IA: Samsung

El programa tiene un uso similar al de sus marcas hermanas, dependiendo de un prompt (orden detallada escrita a manera de comandos) para generar contenido, en este caso, clips. La gama de posibilidades permite a los internautas crear desde caricaturas, hasta animaciones más complejas o videos 100% realistas.

Sora todavía se encuentra en una etapa muy temprana de su lanzamiento, por lo que únicamente ha sido utilizada hasta el momento por un selecto grupo de "artistas visuales, diseñadores y cineastas para obtener comentarios sobre cómo hacer avanzar el modelo para que sea más útil para los profesionales creativos", según señala la compañía creadora.

A su vez, el llamado "equipo rojo de Open AI", que es aquel que se enfoca en áreas como desinformación y contenido que incita al odio o a otros prejuicios en contra de los avances tecnológicos, ya se encuentra evaluando "áreas críticas en busca de daños o riesgos".

A tener en cuenta antes de usar Sora

Aunque se están incluyendo más herramientas o o perfeccionando algunos detalles, la IA ya es capaz de generar escenas con varios personas y con texturas bien definidas en cada elemento del paisaje, sea natural o no. Sus desarrolladores afirman que "el modelo comprende no solo lo que el usuario ha pedido en el mensaje, sino también cómo existen esas cosas en el mundo físico".

Asimismo, Open AI añadió "el modelo tiene un profundo conocimiento del lenguaje, lo que le permite interpretar indicaciones con precisión y generar personajes que expresan emociones vibrantes", pero que tiene que ser muy detallado el comando a ofrecer.

También se hizo la salvedad que la escena debe ser explicada en detalle desde su inicio hasta su final. La interacción de cada elemento o personaje también tiene que narrarse por completo.

Podría revisar otros temas: Así funciona el procesador del Redmi Note 13 Pro+ 5G

Por ejemplo, "para simular con precisión la física de una escena compleja y es posible que no comprenda casos específicos de causa y efecto. Por ejemplo, una persona puede darle un mordisco a una galleta, pero después, es posible que la galleta no tenga la marca del mordisco".