Sora (OpenAI)

Was ist Sora:

Sora ist ein multimodales Text-zu-Video-Modell von OpenAI, das aus beschreibenden Texten (Prompts), Bildern oder bestehenden Videoclips realistische Kurzvideos generiert. Die KI ermöglicht die Erstellung von bis zu 20 Sekunden langen Videos in hoher Auflösung (bis zu 1080p), wobei je nach Tarif unterschiedliche Videolängen und -qualitäten zur Verfügung stehen. Sora wurde erstmals am 15. Februar 2024 in einer Forschungspräsentation vorgestellt und ist seit Dezember 2024 für zahlende Nutzer:innen von ChatGPT Plus und Pro verfügbar.

Technologie und Funktionsweise:

Sora nutzt moderne KI-Technologien, um aus Texten, Bildern oder kurzen Videos neue Videoclips zu erstellen. Dabei „lernt“ das System aus Millionen Beispielen, wie echte Videos aussehen und wie sich Szenen realistisch bewegen. So kann Sora auf Basis weniger Vorgaben glaubwürdige, zusammenhängende Videos erzeugen. Die Architektur von Sora baut auf den Erfahrungen mit DALL·E 3 auf, wurde aber speziell für die Herausforderungen der Videoproduktion weiterentwickelt.

Funktionen:

Nutzer können Videos nicht nur aus Text generieren, sondern auch bestehende Bilder oder Videos animieren, fortsetzen oder remixen. Zu den Bearbeitungsfunktionen zählen „Remix“, „Recut“, „Storyboard“, „Loop“ und „Blend“. Sora bietet zudem Community-Feeds, in denen Prompts und Ergebnisse geteilt werden. Für Pro-Nutzer sind Downloads ohne Wasserzeichen möglich, während Plus-Nutzer Videos mit sichtbarem Watermark erhalten. Die Videos werden stets mit C2PA-Metadaten zur Kennzeichnung als KI-generiert versehen.

Leistungsprofil und Grenzen:

Sora überzeugt mit fotorealistischen Szenen und ruhigen Bewegungen, stößt aber bei komplexer Physik, Kausalität oder detailreichen Menschen an Grenzen. Die generierten Videos enthalten keinen Ton. Die Nutzung ist aus ethischen Gründen und zur Vermeidung von Missbrauch reguliert; sensible Inhalte (z. B. Gewalt, Prominente, urheberrechtlich geschützte Werke) sind ausgeschlossen.

Abgrenzung zu anderen Modellen:

Im Vergleich zu Text-zu-Bild-Modellen wie DALL·E 3 oder Konkurrenzprodukten wie Meta Make-A-Video und Google Lumiere bietet Sora ein breiteres Funktionsspektrum und eine höhere Videoqualität. Es positioniert sich als zentrales Werkzeug für Kreative, Werbetreibende und Filmemacher.

Kontext:

Sora erweitert den generativen KI-Bereich um die Videoproduktion und wirft neue ethische und urheberrechtliche Fragen auf. Durch transparente Kennzeichnung und Zugangskontrollen nimmt OpenAI diese Herausforderungen ernst.

Quellen:

OpenAI: Sora – Offizielle Produktseite
(https://openai.com/de-DE/sora/)
OpenAI: „Sora: Creating video from text“ – Technischer Hintergrund
(https://openai.com/de-DE/index/sora/)
Wikipedia: „Sora (Künstliche Intelligenz)“
(https://de.wikipedia.org/wiki/Sora_(K%C3%BCnstliche_Intelligenz))

Erstellt mit Perplexitiy und ChatGPT

» E-tivity 5.2: Wissensglossar