Sora di OpenAI, l’ultima svolta nel campo dell’intelligenza artificiale, sta rapidamente cambiando il modo in cui i video vengono creati e consumati. Lo strumento consente agli utenti di generare brevi clip video da messaggi di testo, immagini o video esistenti e ha già catturato l’attenzione diffusa online. Questo articolo analizza cos’è Sora, come funziona, la sua attuale disponibilità e le controversie che circondano il suo sviluppo e utilizzo.
Cos’è Sora?
Sora è un modello video generativo che trasforma le descrizioni testuali in riprese video realistiche. Ad esempio, digitando “un sacchetto di plastica che fluttua nel vento” verrà prodotta una clip corrispondente. Lo strumento si basa sulla precedente tecnologia di generazione di immagini di OpenAI, come DALL-E, ma è specificamente progettato per il movimento naturale e la coerenza visiva. OpenAI ha rivelato per la prima volta Sora all’inizio del 2024, rendendolo accessibile agli abbonati ChatGPT Plus e Pro a dicembre.
Riassunto chiave: Sora rappresenta un passo avanti significativo nella creazione di contenuti basati sull’intelligenza artificiale, passando dalle immagini statiche ai video dinamici.
Come funziona?
Sora funziona come un modello di diffusione, iniziando con il rumore casuale e perfezionandolo gradualmente in una scena coerente che corrisponde al prompt di input. La nuova versione di Sora 2 aggiunge dialoghi sincronizzati ed effetti sonori, migliorando il realismo. La tecnologia scompone le immagini in piccole “patch” – simili a come i modelli linguistici elaborano il testo – consentendo all’intelligenza artificiale di comprendere movimento, trama e dettagli in diversi formati.
Gli utenti possono caricare testo, immagini o brevi clip, impostando la durata del video da 5 a 20 secondi con risoluzioni fino a 1080p. A differenza dei modelli precedenti, Sora ora simula accuratamente le interazioni del mondo reale, come il segno di un morso in un video di qualcuno che mangia un biscotto. OpenAI riconosce che il sistema non è perfetto, ma è più affidabile nel seguire le leggi della fisica rispetto alle iterazioni precedenti.
Cosa puoi farci?
Gli ultimi aggiornamenti di Sora includono funzionalità di storyboard per creatori professionisti, consentendo loro di pianificare le scene prima di generare video. Sebbene inizialmente limitata a clip brevi e casuali, la piattaforma si sta evolvendo verso tempi di esecuzione più lunghi e risoluzioni più elevate, rendendola adatta a lavori più raffinati. Alcuni artisti, come Arvida Byström, utilizzano i difetti dell’intelligenza artificiale di Sora in modo creativo, trovando la bellezza nelle distorsioni inaspettate.
Tuttavia, gran parte dei contenuti attuali generati con Sora sono intrattenimento a basso sforzo e orientato alle tendenze soprannominato “AI slop”. Gli esperti avvertono che questa facilità di creazione potrebbe minare la fiducia nei media visivi. Secondo Nathaniel Fast della USC Marshall, lo scenario migliore è che le persone semplicemente lo ignorino, mentre il caso peggiore è una diffusa perdita di fiducia in ciò che è reale.
Disponibilità, accesso e costi
OpenAI offre due versioni di Sora: uno strumento desktop per uso professionale e un’app mobile per la condivisione di video sui social. L’app mobile è disponibile negli Stati Uniti, Canada, Giappone e Corea del Sud, con piani di espansione.
Il costo varia in base al livello di abbonamento:
- Utenti ChatGPT gratuiti: Generazioni giornaliere limitate.
- ChatGPT Plus ($20/mese): Generosa indennità giornaliera.
- ChatGPT Pro ($ 200/mese): Funzionalità superiori, risoluzione più elevata, download senza filigrana.
- Pagamento a consumo: Pacchetti aggiuntivi di 10 generazioni di video per circa $ 4.
Controversie e questioni legali
L’emergere di Sora ha sconvolto il settore della creazione di video, rendendo i video di qualità professionale accessibili a chiunque abbia un messaggio di testo. Ciò solleva preoccupazioni riguardo alla disinformazione, all’impersonificazione e alla violazione del copyright. OpenAI ha implementato un filtro Likeness Misuse per impedire l’uso non autorizzato delle immagini di persone reali, ma esistono soluzioni alternative.
Cameo, una piattaforma video di celebrità, ha intentato una causa contro OpenAI per la sua funzione “Cameo”, sostenendo confusione sul marchio e potenziale di fuorviare il pubblico. OpenAI inizialmente ha utilizzato una politica di opt-out per i contenuti protetti da copyright, richiedendo ai titolari dei diritti di richiedere l’esclusione, ma si sta spostando verso un modello di opt-in in cui i creatori devono concedere l’autorizzazione.
Gli esperti avvertono che le garanzie sono imperfette e che la trasparenza è fondamentale. William Schultz di Merchant and Gould sottolinea che l’uso responsabile è fondamentale, soprattutto perché i contenuti generati dall’intelligenza artificiale potrebbero non essere idonei alla protezione del copyright senza il contributo umano.
Il quadro più ampio
Sora segna un passaggio fondamentale nell’intelligenza artificiale generativa dalle immagini ai film. Questa transizione potrebbe rimodellare l’economia della produzione, distribuzione e autenticità dei media. Se da un lato i nuovi strumenti sbloccano il potenziale creativo, dall’altro richiedono anche cautela. OpenAI deve dare priorità all’intelligenza artificiale orientata agli obiettivi rispetto all’innovazione orientata al profitto per creare fiducia e garantire che queste tecnologie siano al servizio del progresso umano.
Conclusione: Sora di OpenAI non è solo un altro strumento di intelligenza artificiale; è un presagio di un futuro in cui la creazione di video sarà democratizzata, ma anche potenzialmente destabilizzata. Le implicazioni sono di vasta portata e il settore deve affrontare le sfide etiche, legali e sociali in modo proattivo.




























