Додому Dernières nouvelles et articles Sora d’OpenAI : l’avenir de la vidéo générée par l’IA est là

Sora d’OpenAI : l’avenir de la vidéo générée par l’IA est là

Sora d’OpenAI : l’avenir de la vidéo générée par l’IA est là

Sora d’OpenAI, la dernière avancée en matière d’intelligence artificielle, change rapidement la façon dont les vidéos sont créées et consommées. L’outil permet aux utilisateurs de générer de courts clips vidéo à partir d’invites textuelles, d’images ou de vidéos existantes, et a déjà attiré une large attention en ligne. Cet article décrit ce qu’est Sora, comment il fonctionne, sa disponibilité actuelle et les controverses entourant son développement et son utilisation.

Qu’est-ce que Sora ?

Sora est un modèle vidéo génératif qui transforme les descriptions textuelles en séquences vidéo réalistes. Par exemple, en tapant « un sac en plastique flottant dans le vent », vous obtiendrez un clip correspondant. L’outil s’appuie sur la technologie de génération d’images antérieure d’OpenAI, comme DALL-E, mais est spécifiquement conçu pour un mouvement naturel et une cohérence visuelle. OpenAI a dévoilé Sora pour la première fois début 2024, le rendant accessible aux abonnés ChatGPT Plus et Pro en décembre.

À retenir : Sora représente une avancée significative dans la création de contenu basée sur l’IA, passant des images statiques à la vidéo dynamique.

Comment ça marche ?

Sora fonctionne comme un modèle de diffusion, commençant par un bruit aléatoire et l’affinant progressivement en une scène cohérente qui correspond à l’invite de saisie. La nouvelle version de Sora 2 ajoute des dialogues et des effets sonores synchronisés, améliorant ainsi le réalisme. La technologie décompose les images en petits « patches » – de la même manière que les modèles de langage traitent le texte – permettant à l’IA de comprendre le mouvement, la texture et les détails dans différents formats.

Les utilisateurs peuvent télécharger du texte, des images ou de courts clips, en définissant des durées vidéo de 5 à 20 secondes à des résolutions allant jusqu’à 1080p. Contrairement aux anciens modèles, Sora simule désormais avec précision les interactions du monde réel, comme une marque de morsure dans une vidéo de quelqu’un mangeant un cookie. OpenAI reconnaît que le système n’est pas parfait, mais il est plus fiable pour suivre les lois de la physique que les itérations précédentes.

Que pouvez-vous en faire ?

Les dernières mises à jour de Sora incluent des fonctionnalités de storyboard pour les créateurs professionnels, leur permettant de planifier des scènes avant de générer des vidéos. Bien qu’initialement limitée à des clips courts et occasionnels, la plate-forme évolue vers des durées d’exécution plus longues et des résolutions plus élevées, ce qui la rend adaptée à un travail plus soigné. Certains artistes, comme Arvida Byström, utilisent les problèmes d’IA de Sora de manière créative, trouvant la beauté dans des distorsions inattendues.

Cependant, une grande partie du contenu actuel généré avec Sora est un divertissement à faible effort et axé sur les tendances, surnommé « AI slop ». Les experts préviennent que cette facilité de création pourrait éroder la confiance dans les médias visuels. Selon Nathaniel Fast de l’USC Marshall, le meilleur des cas est que les gens l’ignorent tout simplement, tandis que le pire des cas est une perte généralisée de confiance dans la réalité.

Disponibilité, accès et coût

OpenAI propose deux versions de Sora : un outil de bureau à usage professionnel et une application mobile pour le partage de vidéos sur les réseaux sociaux. L’application mobile est disponible aux États-Unis, au Canada, au Japon et en Corée du Sud, avec des plans d’expansion.

Le coût varie selon le niveau d’abonnement :

  • Utilisateurs ChatGPT gratuits : Générations quotidiennes limitées.
  • ChatGPT Plus (20 $/mois) : Allocation journalière généreuse.
  • ChatGPT Pro (200 $/mois) : Fonctionnalités supérieures, résolution plus élevée, téléchargements sans filigrane.
  • Paiement à l’utilisation : Offres groupées supplémentaires de 10 générations vidéo pour environ 4 $.

Controverses et problèmes juridiques

L’émergence de Sora a bouleversé le secteur de la création vidéo, rendant la vidéo de qualité professionnelle accessible à toute personne disposant d’une invite textuelle. Cela soulève des inquiétudes concernant la désinformation, l’usurpation d’identité et la violation du droit d’auteur. OpenAI a implémenté un filtre Likeness Misuse pour empêcher l’utilisation non autorisée d’images de personnes réelles, mais des solutions de contournement existent.

Cameo, une plateforme vidéo de célébrités, a intenté une action en justice contre OpenAI pour sa fonctionnalité « Cameo », alléguant une confusion entre la marque et un potentiel d’induction du public en erreur. OpenAI a initialement utilisé une politique de désinscription pour le contenu protégé par le droit d’auteur, obligeant les titulaires de droits à demander l’exclusion, mais s’oriente désormais vers un modèle de désinscription dans lequel les créateurs doivent accorder leur autorisation.

Les experts avertissent que les garanties sont imparfaites et que la transparence est cruciale. William Schultz de Merchant and Gould souligne qu’une utilisation responsable est essentielle, d’autant plus que le contenu généré par l’IA peut ne pas être éligible à la protection des droits d’auteur sans intervention humaine.

Vue d’ensemble

Sora marque un changement crucial dans l’IA générative des images vers les films. Cette transition pourrait remodeler l’économie de la production, de la distribution et de l’authenticité des médias. Si les nouveaux outils libèrent le potentiel créatif, ils exigent également de la prudence. OpenAI doit donner la priorité à l’IA axée sur un objectif précis plutôt qu’à l’innovation axée sur le profit pour instaurer la confiance et garantir que ces technologies servent le progrès humain.

Conclusion : Sora d’OpenAI n’est pas simplement un autre outil d’IA ; c’est le signe avant-coureur d’un avenir où la création vidéo sera démocratisée, mais aussi potentiellement déstabilisée. Les implications sont considérables et l’industrie doit relever les défis éthiques, juridiques et sociétaux de manière proactive.

Exit mobile version