Sie können das Glossar über das Suchfeld oder das Stichwortalphabet durchsuchen.

@ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z | Alle

T

TTV (Text To Video)

Text-to-Video

Definition:
Text-to-Video (TTV) bezeichnet die Fähigkeit künstlicher Intelligenz, aus einem eingegebenen Text automatisiert ein Video zu erzeugen. Das System interpretiert beschreibende Sprache und generiert daraus entweder realitätsnahe Bilder in Bewegung (sogenannte „generative“ Ansätze) oder kombiniert vorhandenes visuelles Material (z. B. Avatare, Stockclips, Illustrationen) zu einem semantisch passenden Video. Es handelt sich um eine Weiterentwicklung des bekannten Text-to-Image-Prinzips, das durch Modelle wie DALL·E oder Midjourney populär wurde.

Funktionsweise:
TTV-Tools kombinieren maschinelles Sprachverständnis (Natural Language Processing) mit generativer Bild- und Videotechnologie (z. B. Diffusion Models, GANs). Je nach System und Anbieter werden dabei entweder vollständig synthetische Videos erzeugt (z. B. KI-generierte Animationen oder Szenen) oder strukturierte Video-Slideshows erstellt. Einige Tools wie Synthesia oder Pictory setzen auf Avatare, die gesprochene Texte mimisch darstellen, während andere wie RunwayML direkt Bewegungsbilder aus Textanweisungen generieren („ein Hund läuft durch eine verschneite Landschaft“).

Anwendungsbereiche:

  • E-Learning & Erklärvideos: Automatisierte Erstellung von Videos für Schulungsinhalte

  • Marketing & Social Media: Kurze Videoclips zur visuellen Unterstützung von Kampagnen

  • Unternehmenskommunikation: CEO-Botschaften oder Produktankündigungen mit KI-Avataren

  • Barrierefreier Zugang: Mehrsprachige Videos mit automatischer Untertitelung und Avataren

Chancen und Grenzen:
Text-to-Video bietet enormes Potenzial zur Beschleunigung der Content-Erstellung und zur Kostensenkung. Besonders im Bereich der internen Kommunikation oder bei sich wiederholenden Inhalten kann TTV helfen, Prozesse zu automatisieren. Allerdings bestehen noch klare technische Grenzen in Bezug auf Auflösung, Mimikrealismus und kreative Kontrolle. Auch rechtliche Fragen – etwa beim Einsatz generierter Personenbilder oder Stimmen – sind noch nicht abschließend geklärt.

Fazit:
TTV ist ein wachsendes Feld der KI-Anwendung mit hohem disruptivem Potenzial für Medien, Bildung und Kommunikation. Es steht exemplarisch für den Übergang von statischer zu dynamisch-generativer KI-Nutzung.