Nutzung der Bild- und Videogenerierung

Nutzung der Bild- und Videogenerierung

von Matthias Enderle -
Anzahl Antworten: 4
Nutzerbild von Gruppenchat KITE Start: 04.07.25

Für mich waren die Tools weitgehend neu , Daher habe ich da auch ein wenig Zeit zum Ausprobieren investiert.
Bei den Tools zur Bildbearbeitung hat mich überrascht, wie unterschiedlich diese auf bestimmte Eingaben reagieren und wie es doch immer wieder zu bemerkenswerten Abweichungen kommt.
Die Tools zur Videobearbeitung fand ich sehr interessant mit Blick auf die Bilder als Vorlagen.
Vielleicht kann man da auch mit Videoschnitt noch viel machen, um mehrere Videos zusammenzuschneiden.

73 Wörter

Als Antwort auf Matthias Enderle

Re: Nutzung der Bild- und Videogenerierung

von Erik Laubenstein -
Nutzerbild von Gruppenchat KITE Start: 04.07.25
Hallo Matthias,
ich finde die Bandbreite von "kaum nutzba"r bis hin zu "wahnsinnig realitätsnah" ist sehr groß.
Das führt dazu, dass ich die Nutzung recht schnell über habe - aber meistens sitzt das Problem auch eher vor dem Rechner ;)

40 Wörter

Als Antwort auf Erik Laubenstein

Re: Nutzung der Bild- und Videogenerierung

von Matthias Enderle -
Nutzerbild von Gruppenchat KITE Start: 04.07.25
Allerdings ... nichts für Leute mit schwachen Nerven würd ich sagen. Aber da muss man sich wohl behutsam der Thematik nähern. Bemerkenswerte Artefakte bei meiner Sommerfest-Aufgabe ... permanent zwei Fernsehtürme im Bild und einmal - statt eines Clubs an der Spree wurden Bilder eines Festungsturms aus dem Mittelalter auf einem Berg generiert. Kuriositäten lächelnd

54 Wörter

Als Antwort auf Matthias Enderle

Re: Nutzung der Bild- und Videogenerierung

von Milena Droste -
Nutzerbild von Gruppenchat KITE Start: 04.07.25
Lieber Matthias,

deine Beobachtung zu den teils kuriosen Abweichungen bei der Bild- und Videogenerierung ist typisch für die aktuelle Entwicklungsstufe vieler KI-Modelle. Solche „Artefakte“ entstehen oft, wenn das Modell Elemente aus dem Prompt mit ähnlichen Mustern aus den Trainingsdaten verwechselt oder wenn es versucht, mehrere Bedeutungen gleichzeitig darzustellen. Um diese Effekte zu reduzieren, kann es helfen, Prompts noch genauer zu formulieren und mögliche Fehlinterpretationen direkt auszuschließen – zum Beispiel, indem man explizit schreibt „nur ein Fernsehturm“ oder „Club an der Spree, keine mittelalterliche Festung“.

Deine Idee, mit Videoschnitt nachträglich aus mehreren KI-generierten Sequenzen ein stimmiges Endprodukt zu gestalten, ist sehr sinnvoll. In der Praxis kombinieren viele Creator heute die schnelle Rohproduktion durch KI mit klassischem Schnitt in Programmen wie DaVinci Resolve, Adobe Premiere oder sogar einfacheren Tools wie Clipchamp. So lassen sich nicht nur Fehler kaschieren, sondern auch mehrere gute Sequenzen zu einem professionellen Gesamtvideo verbinden.

Viele Grüße!

147 Wörter

Als Antwort auf Milena Droste

Re: Nutzung der Bild- und Videogenerierung

von Matthias Enderle -
Nutzerbild von Gruppenchat KITE Start: 04.07.25
Hallo Milena,

besten Dank für Deine Rückmeldung. Ja, ich denke auch, die Artefakte hängen mit der Formulierung der Prompts zusammen. Andere Formulierungen und genauere Hinweise hätten solche Effekte eliminiert. Eventuell auch gleich zu Anfang die Rückfrage an das Toll formulieren, ob noch Punkte fehlen. Oder den Weg über Meta-Prompts gehen, um, so präzise Formulierungen zu erhalten. Interessant auch Dein Hinweis zu den Trainingsdaten. Das könnte definitiv ein Grund sein.

69 Wörter