Sora von OpenAI, der neueste Durchbruch in der künstlichen Intelligenz, verändert rasant die Art und Weise, wie Videos erstellt und konsumiert werden. Das Tool ermöglicht es Benutzern, kurze Videoclips aus Textaufforderungen, Bildern oder vorhandenen Videos zu erstellen, und hat im Internet bereits große Aufmerksamkeit erregt. In diesem Artikel wird erläutert, was Sora ist, wie es funktioniert, wie es derzeit verfügbar ist und welche Kontroversen rund um seine Entwicklung und Verwendung bestehen.
Was ist Sora?
Sora ist ein generatives Videomodell, das Textbeschreibungen in realistisches Videomaterial umwandelt. Wenn Sie beispielsweise „eine im Wind schwebende Plastiktüte“ eingeben, wird ein passender Clip erstellt. Das Tool baut auf der früheren Bilderzeugungstechnologie von OpenAI wie DALL-E auf, ist jedoch speziell auf natürliche Bewegung und visuelle Konsistenz ausgelegt. OpenAI enthüllte Sora erstmals Anfang 2024 und machte es im Dezember für ChatGPT Plus- und Pro-Abonnenten zugänglich.
Wichtige Erkenntnisse: Sora stellt einen bedeutenden Sprung in der KI-gesteuerten Inhaltserstellung dar und geht über statische Bilder hinaus zu dynamischen Videos.
Wie funktioniert es?
Sora arbeitet als Diffusionsmodell, das mit zufälligem Rauschen beginnt und es schrittweise zu einer kohärenten Szene verfeinert, die der Eingabeaufforderung entspricht. Die neuere Version von Sora 2 fügt synchronisierte Dialoge und Soundeffekte hinzu und erhöht so den Realismus. Die Technologie zerlegt Bilder in kleine „Patches“ – ähnlich wie Sprachmodelle Text verarbeiten – und ermöglicht es der KI, Bewegungen, Texturen und Details in verschiedenen Formaten zu verstehen.
Benutzer können Text, Bilder oder kurze Clips hochladen und dabei Videolängen von 5 bis 20 Sekunden bei Auflösungen von bis zu 1080p einstellen. Im Gegensatz zu älteren Modellen simuliert Sora nun reale Interaktionen genau, beispielsweise eine Bissspur in einem Video, in dem jemand einen Keks isst. OpenAI räumt ein, dass das System nicht perfekt ist, aber es befolgt die Gesetze der Physik zuverlässiger als frühere Iterationen.
Was kann man damit machen?
Zu den neuesten Updates von Sora gehören Storyboarding-Funktionen für professionelle YouTuber, die es ihnen ermöglichen, Szenen zu planen, bevor sie Videos erstellen. Während die Plattform zunächst auf kurze, gelegentliche Clips beschränkt war, entwickelt sie sich in Richtung längerer Laufzeiten und höherer Auflösungen weiter, sodass sie sich für anspruchsvollere Arbeiten eignet. Einige Künstler, wie Arvida Byström, nutzen Soras KI-Störungen kreativ und finden Schönheit in unerwarteten Verzerrungen.
Allerdings handelt es sich bei einem Großteil der aktuellen mit Sora generierten Inhalte um unkomplizierte, trendgesteuerte Unterhaltung, die als „KI-Slop“ bezeichnet wird. Experten warnen, dass diese Einfachheit der Erstellung das Vertrauen in visuelle Medien untergraben könnte. Laut Nathaniel Fast vom USC Marshall besteht das beste Szenario darin, dass die Menschen es einfach ignorieren, während im schlimmsten Fall ein weit verbreiteter Vertrauensverlust in die Realität besteht.
Verfügbarkeit, Zugang und Kosten
OpenAI bietet zwei Versionen von Sora: ein Desktop-Tool für den professionellen Einsatz und eine mobile App für die gemeinsame Nutzung von Videos in sozialen Netzwerken. Die mobile App ist in den USA, Kanada, Japan und Südkorea verfügbar, eine Erweiterung ist geplant.
Die Kosten variieren je nach Abonnementstufe:
- Kostenloser ChatGPT-Benutzer: Begrenzte tägliche Generationen.
- ChatGPT Plus (20 $/Monat): Großzügiges Tagesgeld.
- ChatGPT Pro (200 $/Monat): Überragende Funktionen, höhere Auflösung, wasserzeichenfreie Downloads.
- Pay-as-you-go: Zusätzliche Pakete mit 10 Videogenerationen für etwa 4 $.
Kontroversen und rechtliche Fragen
Das Aufkommen von Sora hat die Videoerstellungsbranche revolutioniert und Videos in professioneller Qualität für jeden mit einer Textaufforderung zugänglich gemacht. Dies gibt Anlass zu Bedenken hinsichtlich Fehlinformationen, Identitätsdiebstahl und Urheberrechtsverletzungen. OpenAI hat einen Likeness Misuse-Filter implementiert, um die unbefugte Verwendung von Bildern realer Personen zu verhindern, es gibt jedoch Problemumgehungen.
Cameo, eine Promi-Videoplattform, hat eine Klage gegen OpenAI wegen seiner „Cameo“-Funktion eingereicht und behauptet, dass es Markenverwechslungen und die Möglichkeit einer Irreführung der Öffentlichkeit gebe. OpenAI nutzte ursprünglich eine Opt-out-Richtlinie für urheberrechtlich geschützte Inhalte, die von den Rechteinhabern verlangte, einen Ausschluss zu beantragen, geht aber zu einem Opt-in-Modell über, bei dem Urheber ihre Erlaubnis erteilen müssen.
Experten warnen, dass die Schutzmaßnahmen unvollständig seien und Transparenz von entscheidender Bedeutung sei. William Schultz von Merchant and Gould betont, dass eine verantwortungsvolle Nutzung von entscheidender Bedeutung ist, insbesondere da KI-generierte Inhalte ohne menschliches Zutun möglicherweise nicht urheberrechtlich geschützt sind.
Das Gesamtbild
Sora markiert einen entscheidenden Wandel in der generativen KI von Bildern zu Filmen. Dieser Übergang könnte die Ökonomie der Medienproduktion, -verteilung und -authentizität verändern. Während neue Tools kreatives Potenzial freisetzen, erfordern sie auch Vorsicht. OpenAI muss zweckorientierter KI Vorrang vor gewinnorientierter Innovation einräumen, um Vertrauen aufzubauen und sicherzustellen, dass diese Technologien dem menschlichen Fortschritt dienen.
Fazit: Sora von OpenAI ist nicht nur ein weiteres KI-Tool; Es ist ein Vorbote einer Zukunft, in der die Videoproduktion demokratisiert, aber auch möglicherweise destabilisiert wird. Die Auswirkungen sind weitreichend und die Branche muss die ethischen, rechtlichen und gesellschaftlichen Herausforderungen proaktiv angehen.
