Sora de OpenAI, el último avance en inteligencia artificial, está cambiando rápidamente la forma en que se crean y consumen los videos. La herramienta permite a los usuarios generar videoclips cortos a partir de mensajes de texto, imágenes o videos existentes, y ya ha captado una gran atención en línea. Este artículo analiza qué es Sora, cómo funciona, su disponibilidad actual y las controversias que rodean su desarrollo y uso.

¿Qué es Sora?

Sora es un modelo de vídeo generativo que transforma descripciones de texto en secuencias de vídeo realistas. Por ejemplo, escribir “una bolsa de plástico flotando en el viento” producirá un clip coincidente. La herramienta se basa en la tecnología de generación de imágenes anterior de OpenAI, como DALL-E, pero está diseñada específicamente para lograr movimiento natural y consistencia visual. OpenAI reveló a Sora por primera vez a principios de 2024, haciéndolo accesible para los suscriptores de ChatGPT Plus y Pro en diciembre.

Conclusión clave: Sora representa un salto significativo en la creación de contenido impulsado por IA, yendo más allá de las imágenes estáticas al vídeo dinámico.

¿Cómo funciona?

Sora opera como un modelo de difusión, comenzando con ruido aleatorio y refinándolo gradualmente hasta convertirlo en una escena coherente que coincide con el mensaje de entrada. La versión más nueva de Sora 2 agrega diálogos sincronizados y efectos de sonido, mejorando el realismo. La tecnología divide las imágenes en pequeños “parches”, similar a cómo los modelos de lenguaje procesan el texto, lo que permite a la IA comprender el movimiento, la textura y los detalles en diferentes formatos.

Los usuarios pueden cargar texto, imágenes o clips cortos, configurando duraciones de video de 5 a 20 segundos con resoluciones de hasta 1080p. A diferencia de los modelos más antiguos, Sora ahora simula con precisión interacciones del mundo real, como la marca de un mordisco en un vídeo de alguien comiendo una galleta. OpenAI reconoce que el sistema no es perfecto, pero es más confiable a la hora de seguir las leyes de la física que las iteraciones anteriores.

¿Qué puedes hacer con él?

Las últimas actualizaciones de Sora incluyen funciones de guiones gráficos para creadores profesionales, lo que les permite planificar escenas antes de generar videos. Si bien inicialmente se limitó a clips cortos e informales, la plataforma está evolucionando hacia tiempos de ejecución más largos y resoluciones más altas, lo que la hace adecuada para trabajos más pulidos. Algunos artistas, como Arvida Byström, utilizan los fallos de la IA de Sora de forma creativa y encuentran belleza en distorsiones inesperadas.

Sin embargo, gran parte del contenido actual generado con Sora es entretenimiento de bajo esfuerzo impulsado por tendencias denominado “AI Slop”. Los expertos advierten que esta facilidad de creación podría erosionar la confianza en los medios visuales. Según Nathaniel Fast de USC Marshall, el mejor de los casos es que la gente simplemente lo ignore, mientras que el peor de los casos es una pérdida generalizada de fe en lo que es real.

Disponibilidad, acceso y costo

OpenAI ofrece dos versiones de Sora: una herramienta de escritorio para uso profesional y una aplicación móvil para compartir vídeos en redes sociales. La aplicación móvil está disponible en EE. UU., Canadá, Japón y Corea del Sur, y hay planes de expansión.

El costo varía según el nivel de suscripción:

  • Usuarios de ChatGPT gratuitos: Generaciones diarias limitadas.
  • ChatGPT Plus ($20/mes): Asignación diaria generosa.
  • ChatGPT Pro ($200/mes): Funciones superiores, mayor resolución y descargas sin marcas de agua.
  • Pago por uso: Paquetes adicionales de 10 generaciones de videos por alrededor de $4.

Controversias y cuestiones legales

La aparición de Sora ha revolucionado la industria de la creación de vídeos, haciendo que los vídeos de calidad profesional sean accesibles a cualquier persona con un mensaje de texto. Esto genera preocupaciones sobre la desinformación, la suplantación de identidad y la infracción de derechos de autor. OpenAI ha implementado un filtro de uso indebido de semejanza para evitar el uso no autorizado de imágenes de personas reales, pero existen soluciones.

Cameo, una plataforma de vídeos de celebridades, ha presentado una demanda contra OpenAI por su función “Cameo”, alegando confusión de marca y potencial para engañar al público. OpenAI inicialmente utilizó una política de exclusión voluntaria para contenido protegido por derechos de autor, exigiendo que los titulares de derechos solicitaran la exclusión, pero está cambiando hacia un modelo de inclusión voluntaria en el que los creadores deben otorgar permiso.

Los expertos advierten que las salvaguardias son imperfectas y la transparencia es crucial. William Schultz, de Merchant and Gould, enfatiza que el uso responsable es clave, especialmente porque el contenido generado por IA puede no ser elegible para la protección de derechos de autor sin la participación humana.

El panorama más amplio

Sora marca un cambio fundamental en la IA generativa de imágenes a películas en movimiento. Esta transición podría remodelar la economía de la producción, distribución y autenticidad de los medios. Si bien las nuevas herramientas desbloquean el potencial creativo, también exigen precaución. OpenAI debe priorizar la IA con fines específicos sobre la innovación con fines de lucro para generar confianza y garantizar que estas tecnologías sirvan al progreso humano.

Conclusión: Sora de OpenAI no es solo otra herramienta de IA; es un presagio de un futuro en el que la creación de vídeos se democratiza, pero también se desestabiliza potencialmente. Las implicaciones son de gran alcance y la industria debe abordar los desafíos éticos, legales y sociales de manera proactiva.