Sora ist ein multimodales Text-zu-Video-Modell von OpenAI,
das aus beschreibenden Texten (Prompts), Bildern oder bestehenden Videoclips
realistische Kurzvideos generiert. Die KI ermöglicht die Erstellung von bis zu
20 Sekunden langen Videos in hoher Auflösung (bis zu 1080p), wobei je nach
Tarif unterschiedliche Videolängen und -qualitäten zur Verfügung stehen. Sora
wurde erstmals am 15. Februar 2024 in einer Forschungspräsentation vorgestellt
und ist seit Dezember 2024 für zahlende Nutzer:innen von ChatGPT Plus und Pro
verfügbar.
Technologie und Funktionsweise:
Sora nutzt moderne KI-Technologien, um aus Texten, Bildern oder kurzen Videos
neue Videoclips zu erstellen. Dabei „lernt“ das System aus Millionen
Beispielen, wie echte Videos aussehen und wie sich Szenen realistisch bewegen.
So kann Sora auf Basis weniger Vorgaben glaubwürdige, zusammenhängende Videos
erzeugen. Die Architektur von Sora baut auf den Erfahrungen mit DALL·E 3 auf,
wurde aber speziell für die Herausforderungen der Videoproduktion
weiterentwickelt.
Funktionen:
Nutzer können Videos nicht nur aus Text generieren, sondern auch bestehende
Bilder oder Videos animieren, fortsetzen oder remixen. Zu den
Bearbeitungsfunktionen zählen „Remix“, „Recut“, „Storyboard“, „Loop“ und
„Blend“. Sora bietet zudem Community-Feeds, in denen Prompts und Ergebnisse
geteilt werden. Für Pro-Nutzer sind Downloads ohne Wasserzeichen möglich,
während Plus-Nutzer Videos mit sichtbarem Watermark erhalten. Die Videos werden
stets mit C2PA-Metadaten zur Kennzeichnung als KI-generiert versehen.
Leistungsprofil und Grenzen:
Sora überzeugt mit fotorealistischen Szenen und ruhigen Bewegungen, stößt aber
bei komplexer Physik, Kausalität oder detailreichen Menschen an Grenzen. Die
generierten Videos enthalten keinen Ton. Die Nutzung ist aus ethischen Gründen
und zur Vermeidung von Missbrauch reguliert; sensible Inhalte (z. B. Gewalt,
Prominente, urheberrechtlich geschützte Werke) sind ausgeschlossen.
Abgrenzung zu anderen Modellen:
Im Vergleich zu Text-zu-Bild-Modellen wie DALL·E 3 oder Konkurrenzprodukten wie
Meta Make-A-Video und Google Lumiere bietet Sora ein breiteres
Funktionsspektrum und eine höhere Videoqualität. Es positioniert sich als
zentrales Werkzeug für Kreative, Werbetreibende und Filmemacher.
Kontext:
Sora erweitert den generativen KI-Bereich um die Videoproduktion und wirft neue
ethische und urheberrechtliche Fragen auf. Durch transparente Kennzeichnung und
Zugangskontrollen nimmt OpenAI diese Herausforderungen ernst.