Reflexion Modul 5 - Ganz schön was los hier

Reflexion Modul 5 - Ganz schön was los hier

von Michael Vesper -
Anzahl Antworten: 2
Nutzerbild von Gruppenchat KITE Start: 04.07.25

Mit Grafikbearbeitung habe ich sonst nichts zu tun, daher war das alles für mich spannend und Neuland. Ich mache Texte und Konzept und freue mich über das, was die Grafik liefert. Die Anzahl der Anwendungen ist so groß, dass ich mich erst sortieren muss. Schwierig finde ich zu überblicken, wie weit die jeweilige Free-Version reicht und wann man wie zuzahlt. Außerdem wird sich das wohl dauernd ändern. Da braucht  man im Betrieb ein sorgfältiges Ressourcen-Management, sonst gibt es schnell Wildwuchs. Ich habe mit DALL-E ein Plakat produziert, da habe ich gesehen, dass Sprache ein Problem ist – und zwar sehr schnell. Ich denke mal, speziell alles, was nicht Englisch ist. Ich habe aber zwischenzeitlich ein Bild für unsere Rubrik Mountainbike auf der Internetseite kreieren lassen. Dem sieht  man zwar an, dass es KI ist – ich schreibe es auch drunter. Aber nach dem Prompt gibt es eine absolut realistische Fahrsituation in einer für uns landschaftstypischen Situation wieder. Für das Prompting konnte ich schon die 5er Version nutzen. Also, der Chat ist ja mit seinen Vorschlägen und Rückfragen schon sehr aktiv. Ich habe mir aber vorgenommen, jetzt auch noch mal Midjourney zu testen.  Bei der Bildausgabe produziere ich immer diese web-Formate! Muss das sein? Ich würde mir gerne die Umwandlung sparen. Außerdem ist die Auflösung derzeit wohl nur für Web geeignet – oder?

Die Videogestaltung  mit Lumen 5 fand ich super. Man muss sich mehr  Mühe bei der Bildzuordnung geben, und auch bei den Bildvorschlägen muss man kritisch sein, aber da hat Paul Becker mit dem Einsteigertipp ganz recht gehabt. Ich will das noch mal themenfokussiert nutzen. Wenn ich z.B. ein bestimmtes Veranstaltungsformat (Sport, Tanz usw.) oder ein enges Thema (Mountainbikepark) setze, denke ich, das wird sehr kompakt.
Ich wollte auch noch, was zu den Fakes ergänzen. Das mit den Fünf-Finger-Bildern hat sich rumgesprochen, auch auf einem Motiv, das ich für eine Vertiefungsaufgabe einer Präsi erzeugt hatte, hat dieses Problem. Aber, ich habe ja schon punktuell mal hier und da bei so Kurz-Workshops oder eher Demo-Veranstaltungen teilgenommen. Bei einer haben wir in verschiedenen Gruppen 20 Motive vorgelegt bekommen. Es sollte entschieden werden, was ist nur mit KI, was ganz ohne hergestellt. Das Ergebnis wäre gewesen: 1 menschengemacht, 19 durch KI. Ergebnis von fünf Gruppen mit je 5 Teilnehmern:
Keiner hat 19:1 genannt. Die meisten waren im Bereich  40:60 oder 60:40 irgendwo. Und: keiner hat das Nicht-KI-Bild identifiziert. Wirklich genau keiner. Das war mit Midjourney produziert. Ich denke, wenn da der oder die Richtige am Keyboard sitzt, kannst Du als Laie nicht mehr davon ausgehen, dass Du einen Unterschied merkst, wenn das nicht so Kunstfarbenbilder sind wie sie DALL-E auswirft.


435 Wörter

Als Antwort auf Michael Vesper

Re: Reflexion Modul 5 - Ganz schön was los hier

von Evica Draeger -
Nutzerbild von Gruppenchat KITE Start: 04.07.25
Hallo Michael,
danke für deine spannende Reflektion.
Bei deiner Aussage "Schwierig finde ich zu überblicken, wie weit die jeweilige Free-Version reicht und wann man wie zuzahlt" bin ich ganz bei dir. Es geht mir auch so. Bei manchen Tools war ich überrascht, dass die gratis Version ziemlich schnell zu ende war. Andersrum kann ich verstehen, dass die Anbieter ihre Pro Versionen verkaufen möchten.
Du schreibst, die Videogestaltung mit Lumen war super. Das inspiriert mich sehr es nochmal zu versuchen. Ich kam mit Lumen gar nicht gut klar. Vielleicht hatte ich nur ein schlechten Tag oder solächelnd.

Viele Grüße
Evica

99 Wörter

Als Antwort auf Michael Vesper

Re: Reflexion Modul 5 - Ganz schön was los hier

von Milena Droste -
Nutzerbild von Gruppenchat KITE Start: 04.07.25
Lieber Michael,

vielen Dank für deine ausführliche Schilderung, die sehr gut zeigt, an welchen Punkten in der praktischen Arbeit mit KI-Tools noch Fragen offen sind. Zum Thema Free-Versionen ist es tatsächlich so, dass die Anbieter ihre Funktionsumfänge regelmäßig anpassen. Häufig sind Einschränkungen bei der maximalen Bildauflösung, beim Zugriff auf die neuesten Modellversionen oder bei der Anzahl der monatlichen Generierungen zu finden. Um hier den Überblick zu behalten, lohnt es sich, für die wichtigsten Tools eine kleine interne Übersicht zu führen und regelmäßig zu prüfen, ob sich die Lizenzmodelle geändert haben. So kann im Unternehmen gezielt entschieden werden, wann ein Upgrade sinnvoll ist.

Was die Sprache in DALL·E betrifft, liegt die Ursache in der Art und Weise, wie Bildgeneratoren trainiert werden. Sie haben in der Regel sehr viele englischsprachige Beispiele gesehen, deutlich weniger jedoch in anderen Sprachen. Zudem „denkt“ das Modell in Bildelementen und kann Text oft nicht sauber reproduzieren. Für nicht englische Texte kann es helfen, zunächst mit englischen Begriffen zu arbeiten und diese anschließend in einem Grafikprogramm manuell zu ersetzen oder durch ein Vektortool sauber einzubetten.

Bei den Bildformaten erzeugen viele KI-Tools standardmäßig weboptimierte Formate wie WebP oder komprimierte JPEGs, da diese platzsparend sind und sich schnell laden. Manche Plattformen erlauben aber in den Einstellungen die direkte Ausgabe als PNG oder TIFF. Falls das Tool das nicht unterstützt, kann eine Umwandlung in ein verlustfreies Format mit einer externen Software erfolgen, ohne dass die Qualität leidet.

Zur Frage der Auflösung: Die Standardauflösungen vieler frei verfügbarer KI-Generatoren sind tatsächlich vor allem für die Bildschirmdarstellung optimiert. Für hochwertige Drucke werden jedoch höhere ppi-Werte benötigt. Hier helfen sogenannte Upscaling-Tools, die per KI die Bildgröße vergrößern und Details rekonstruieren. Viele Generatoren wie Midjourney oder DALL·E bieten inzwischen integrierte Upscale-Funktionen an, alternativ gibt es spezialisierte Dienste wie Topaz Gigapixel AI.

Zu deiner Erfahrung mit der Erkennung von KI-Bildern: Das ist ein spannendes Beispiel dafür, wie weit die Bildqualität inzwischen fortgeschritten ist. Momentan gibt es zwar erste Erkennungstools, doch sie arbeiten nicht zuverlässig, vor allem wenn das Bild nachbearbeitet oder komprimiert wurde. Wasserzeichen oder unsichtbare Metadaten können helfen, KI-Bilder kenntlich zu machen, sind jedoch leicht zu entfernen. Daher ist es für Transparenz und Vertrauen oft am besten, wie du es bereits machst, die KI-Generierung offen zu kennzeichnen.

Viele Grüße!

373 Wörter