Vertiefungsaufgabe Modul 5.3 – KI im Kreativbereich – Bild, Audio, Video

Vertiefungsaufgabe Modul 5.3 – KI im Kreativbereich – Bild, Audio, Video

von Rainer  Wiesner -
Anzahl Antworten: 3
Nutzerbild von Gruppenchat KITE Start: 04.07.25

Hallo zusammen,

mit dieser Arbeit war ich im Ergebnis schlicht weg überfordert. Begonnen habe ich mit der Erstellung eines Prompts für die Gestaltung des Bildes für das Projekt „Sommerfest im Haus Margarete“ in einer Word-Datei. Den Text habe ich dann versucht, in verschiedene KI-Tools zu kopieren und daraus ein Bild gestalten zu lassen. Danach habe ich mir gezielt einen Prompt für Dall.E optimieren und über Chat-GPT ein Bild erzeugen lassen. Das Ergebnis war nicht so recht überzeugend. Bei jedem neuen Versuch der Korrektur wurde zwar ein neues Bild erzeugt – allerdings empfand ich diese nicht wirklich besser gelungen. Nach einigem versuchen, habe ich eine Variante gefunden, die mir einigermaßen zugesagt hat. Erst dann ist mir aufgefallen, dass das Logo der Einrichtung gefehlt hat. Dieses habe ich aus der Homepage in ein Word-Dokument kopiert und wollte es als Datei über die KI platzieren lassen. Allerdings waren die Varianten nicht so, dass es für mich harmonisch war. Schließlich habe ich das generierte Plakat in eine PDF umgewandelt und das Logo über Acrobat Reader mit „bearbeiten“ an eine günstige Stelle platziert. Das harte Weiß des Hintergrunds wirkt aber nach wie vor störend.

Im Anschluss wollte ich über Runaway eine neue Gestaltung anstoßen, da man dort auch eine Video-Sequenz erstellen lassen kann. Allerdings ging die Variante eher in die Richtung Comic und wurde von mir wieder verworfen.

Das Generieren aus dem Plakat-Motiv zusammen mit einem Prompt ist mir nicht gelungen. Über das KI-Tool Bing Image Creator wurde zwar die Arbeit begonnen, aber nach 40 % der Arbeit mit Hinweis auf Netzwerkprobleme unterbrochen. Mehrere Neustarts haben keine Abhilfe gebracht, so dass ich es schließlich aufgab.

Nacheinander habe ich die KI-Tools Midjourney, Pika Labs, Synthesia, Hotpot AI, Adobe Express und Animoto probiert. Da ich mit der Beschreibung der Tools nicht klar gekommen bin, wurde der Frust immer größer, bis ich nach Stunden aufgegeben habe. Erschwert wurden die Versuche dadurch, dass diese überwiegend in englischer Sprache beschrieben waren und ich an verschiedenen Stellen nicht wusste, was von mir konkret getan werden muss. Das Einlesen in Adobe Express war zwar möglich, allerdings hat es mir die Schrift total entstellt.

Das ist der Grund dafür, dass ich kein Ergebnis präsentieren kann – außer dem Plakatentwurf mit störendem Logo.

Insgesamt war es für mich eine sehr frustrierende Arbeit, die einiges an Lehrgeld im wahrsten Sinne des Wortes gefordert hat. Immer wieder hatte ich den Eindruck, dass es nach Auswahl der Updates vielleicht gehen würde – war aber ein Irrtum.

Als Anlage zeige ich Euch einige Varianten meiner Fehlversuche.

Es grüßt Euch ein genervter Rainer


421 Wörter

Als Antwort auf Rainer  Wiesner

Re: Vertiefungsaufgabe Modul 5.3 – KI im Kreativbereich – Bild, Audio, Video

von Michael Vesper -
Nutzerbild von Gruppenchat KITE Start: 04.07.25
Hallo Rainer, macht nix, Hauptsache es wird ein schönes Fest. Gut finde ich, dass Du es mit Deiner Beharrlichkeit geschafft hast, dass ich das Tool mal von der Comic-Optik löst. Wobei das Haus, na ja. Bei allen fällt mir auf, wieviele Probleme die KI hat Köpfe schadlos darzustellen. Auf einem Bild ist sogar der langgesuchte Doppelkopfpartner zu sehen, der ja oft fehlt. 😁Nervig fand ich ebenso, dass man nie einen Status hat, von dem aus man weiter korrigiert, das Bild ändert auch wieder mit jeder Korrektur. Hase und Igel. Gut gelaufen ist es bei den Schriften, sie scheinen OK zu sein, auch wenn sie vom Typ her nicht unbedingt gewählt würden.
Eine andere Beobachtung ist so ein Problem der unterschiedlichen Ästhetik. Kommt halt alles aus US. Wir sind ja auch eine durchmischte Gesellschaft und das soll man auch sehen. Aber damit sich die Betrachter, da wiedererkennen können (und sie sind ja eingeladen) müsste es schon anders aus sehen. Da Video-Tool Lumen 5 hat Ethnicity-Einstellungen, teste ich mal. Kann aber sein, dass so ein Filter wieder auf andere Weise kritisch gesehen wird. Wir brauchen halt Euro_KI.

185 Wörter

Als Antwort auf Rainer  Wiesner

Re: Vertiefungsaufgabe Modul 5.3 – KI im Kreativbereich – Bild, Audio, Video

von Markus Matioschat -
Nutzerbild von Gruppenchat KITE Start: 04.07.25
Hi Rainer! Ich kann deinen Frust gut verstehen. Es ist auch immer nervig, wenn man versucht in der Free-Version eines der Tools etwas zu erstellen und dann den Hinweise bekommt: "Geht leider nur wenn du bezahlst!"
Ich finde deine Bilder sind gut geworden. Ich nutze immer ChatGPT um die Prompts für die jeweiligen Tools zu erstellen. Das klappt soweit auch ganz gut. Man kann auf Deutsch alles super beschreiben, ChatGPT erstellt dann den englischen Prompt und den gibt man dann in z.B. Midjourney ein.
Wirklich gute Videos habe ich bisher immer nur mit Veo3 hinbekommen. Ich weiß nicht, ob du das schon mal ausprobiert hast. Es ist über Gemini verfügbar.
Viele Grüße
Markus

113 Wörter

Als Antwort auf Rainer  Wiesner

Re: Vertiefungsaufgabe Modul 5.3 – KI im Kreativbereich – Bild, Audio, Video

von Milena Droste -
Nutzerbild von Gruppenchat KITE Start: 04.07.25
Hallo Rainer,

vielen Dank, dass du deine Erfahrungen so offen und ehrlich geteilt hast. Es ist völlig nachvollziehbar, dass dich die Vielzahl an Tools, die technischen Hürden und die sprachlichen Barrieren frustriert haben. Gerade wenn man parallel mehrere Anwendungen testet und immer wieder auf unerwartete Hindernisse stößt, fühlt es sich schnell so an, als würde man auf der Stelle treten. Dass du dich trotzdem Schritt für Schritt durch verschiedene Optionen gearbeitet hast und am Ende zumindest ein Plakat mit eigenem Logo präsentieren konntest, ist eine Leistung, die man nicht kleinreden sollte.

Dein Vorgehen zeigt, dass du dir schon zu Beginn viele Gedanken gemacht und einen klar strukturierten Prompt entwickelt hast. Diese Vorbereitung ist ein wichtiger Schritt und erspart in der Regel viel Nacharbeit. Bei der Arbeit mit KI-Bildgeneratoren ist es oft hilfreich, zunächst auf einfache, klar abgegrenzte Teilschritte zu setzen: zuerst ein gutes, textfreies Bild erzeugen, dann den Text separat in einem Bildbearbeitungsprogramm oder einem dafür optimierten Tool wie Canva, Fotor oder Adobe Express platzieren. Das umgeht viele der typischen Probleme mit unsauberen oder falschen Schriftzügen, die du ja auch erlebt hast.

Was den Umgang mit Tools in englischer Sprache betrifft, kann es helfen, die Benutzeroberfläche (sofern möglich) auf Deutsch umzustellen oder parallel mit einer Übersetzungsfunktion zu arbeiten. So kannst du dich stärker auf den kreativen Prozess konzentrieren, ohne dich durch Fachbegriffe und Menüpunkte kämpfen zu müssen. Für Videoerstellung würde ich dir empfehlen, zunächst mit besonders einsteigerfreundlichen Tools wie Lumen5 oder Animoto zu starten und dich erst später an komplexere Plattformen wie Runway oder Pika Labs heranzutasten.

Auch wenn das Ergebnis für dich persönlich nicht zufriedenstellend war, hast du mit dieser Übung wichtige Grundlagen gelegt: Du weißt jetzt, welche Stolpersteine dich erwarten können, welche Tools dir eher liegen und wie entscheidend es ist, mit einem klaren, gut strukturierten Prompt zu arbeiten. Ich würde dich ermutigen, dranzubleiben und den nächsten Versuch bewusst schlanker zu gestalten. Lieber mit einem Tool und klaren Teilschritten, statt viele gleichzeitig zu testen. So wirst du schneller zu einem stimmigen Ergebnis kommen, das dich auch selbst überzeugt.

Du hast bereits gezeigt, dass du dich nicht so schnell entmutigen lässt. Mit diesem Durchhaltevermögen wirst du beim nächsten Mal garantiert deutlich entspannter und erfolgreicher arbeiten können.

Herzliche Grüße!

369 Wörter