Synthographie und Marketing: Wie künstliche Intelligenz das visuelle Storytelling verändert

Der Einsatz von künstlicher Intelligenz (KI) verändert auf dramatische Art und Weise das visuelle Storytelling. Dank der Synthographie ist es möglich visuelle Inhalte auf schnelle und effiziente Weise zu erstellen, wodurch die Erarbeitung von visuellem Content vereinfacht und dabei mehr Personalisierung ermöglicht wird. 

Durch die Nutzung von KI-basierten Tools, wie z.B. Stable Diffusion, können wir als Kreative und Designer auf ein schnelles Hilfswerk zurückgreifen um für Kunden und Projekte Illustrationen, Grafiken und Bildmaterial zu erstellen und das weitaus breit gefächerter als es z.B. durch Stockfotos oder ähnlichem Ausgangsmaterial möglich wäre. Tendenziell ist zu Beginn des KI-Unterstützten Prozesses nur die eigene Fantasie der limitierende Faktor, aber dazu später mehr. 

Durch diese Form der zeiteffizienten „Automatisierung” können letztendlich nicht nur Kosten gespart werden, es erlaubt auch die Erarbeitung eines größeren Fundus an Material, auf welchem man Aufbauen kann.  

Durch KI-basierte Tools ergeben sich gänzlich neue Optionen und Möglichkeiten für das „visual Storytelling“ und danke der rapiden Weiterentwicklung dieser Technologie ist davon auszugehen, dass sie in den kommenden Jahren zu einer etablierten Rolle für die visuelle Kommunikation von Unternehmen, Marken, oder Freelancern wird. 

Was ist „Synthographie“? 

Kurz gesagt: Ein Kunstbegriff bestehend aus den Wörtern „Synthese“ und „Graphie“. Dieser Begriff beschreibt die Grundlegende Funktion der derzeitigen KI-Technologie zur Erstellung von Bildern – synthetisiert durch Beschreibung. Diese Synthese ist möglich durch Verwendung von Deep-Learning Modellen wie GAN’s (Generative Adversarial Networks), oder VAE’s (Variational Auto Encoder) um aus einem so genannten „Prompt“ (englisch, aus dem Theater, „Stichwort“). Anhand dieses Prompts wird ein neues, künstlerisches Bild generiert. 

Im Gegensatz zu traditioneller digitaler Kunst, wo der Künstler das Bild von Grund auf nach seiner Vorstellung erstellt, wird bei der Synthographie dieser Prozess durch die KI vollends automatisiert – ohne menschliches Zutun. Durch diese Form der Automatisierung können sich zum Teil komplexe und vielfältige visuelle Ergebnisse ergeben welche z.B. von Designern und Künstlern als Inspirationsquelle genutzt werden können. 

Auch wenn die Technologie rund um Synthographie noch relativ neu ist, gibt es bereits immense Weiterentwicklungen und Anwendungsgebiete und es ist davon auszugehen, dass diese Technologie gekommen ist, um zu bleiben. 

Syntographie: Erstellt mit Stable Diffusion
Syntographie: Erstellt mit Stable Diffusion
Syntographie: Erstellt mit Stable Diffusion
Syntographie: Erstellt mit Stable Diffusion
Syntographie: Erstellt mit Stable Diffusion
Syntographie: Erstellt mit Stable Diffusion
Syntographie: Erstellt mit Stable Diffusion
Syntographie: Erstellt mit Stable Diffusion

Erstellt mit Stable Diffusion

Welche Vorteile bringen KI generierte Bilder? 

KI-Bilder für visuelles Storytelling haben das Potenzial in den Bereichen des Designs und des Marketings die Arbeit positiv zu beeinflussen: 

  • Zeit- und Kosteneinsparungen: 
    KI generierte Bilder können in kurzer Zeit erstellt werden, dadurch kann entsprechend schneller und effizienter gearbeitet werden. 
  • Personalisierung: 
    Dank KI können Bilder zu einem gewissen Anteil an die Bedürfnisse und Vorlieben bzw. Vorgaben von Kunden angepasst werden. Dadurch kann z.B. der Marken-, bzw. Unternehmensauftritt relevanter und effektiver visuell dargestellt werden. 
     
  • Automatisierung: 
    Durch die Automatisierung des Generierungsprozesses können sich Design- oder Marketingteam parallel auf andere Aspekte der Arbeit konzentrieren, wie z.B. die Ausarbeitung, oder Entwicklung von Strategien, oder die Interaktion mit Kunden. 
     
  • Kreativität: 
    KI generierte Bilder sind ein guter Ausgangspunkt für kreatives Denken. Das erstellte Bildmaterial kann durchaus als Grundlage für eigene Kreationen dienen, um die eigene Kreativität und Originalität mit einfließen zu lassen. 
     

Man sollte jedoch im Hinterkopf behalten das KI generierte Bilder mit Fehlern und Makeln behaftet sein können. Das bedeutet aber nicht zwingend das die Bilder unbrauchbar sind, denn versierte Designer und Künstler sind durchaus in der Lage diverse Makel auszubessern und das Bild gegebenenfalls optisch zu optimieren, oder zu verändern. 

Welche Nachteile bringen KI-Bilder mit sich? 

Auch wenn durch Synthographie generierte Bilder relevante Vorteile mit sich bringen, so gibt es derzeitig auch einige Nachteile, die man berücksichtigen sollte: 

  • Mangel an Originalität: 
    Da die Basis der KI-Algorithmen eine Grundlage aus bestehenden Daten ist können die Bilder eine mangelnde Originalität aufweisen, oder „generisch“ Wirken. Prinzipiell ist es daher immer möglich das unterschiedliche KI-Modelle sehr ähnliche, oder identische Bilder generieren können. 
     
  • Feinabstimmung: 
    KI-Systeme haben, nach derzeitig technologischem Stand, Probleme komplexe visuelle Konzepte und Stimmungen zu verarbeiten bzw. zu generieren. Dadurch ist eine Feinabstimmung für bestimmte Details, oder Elemente gegebenenfalls nur eingeschränkt möglich. 
  • Fehlende Kontrolle: 
    Da die KI-Bilder automatisiert erstellt bzw. generiert werden haben Designer und Künstler nur beschränkte Kontrolle, um in den kreativen Prozess einzugreifen und haben auf das Endresultat der KI nur einen bedingten Einfluss.  
  • Künstliche Ästhetik: 
    KI-generierte Bilder laufen Gefahr aufgrund ihrer algorithmischen Entstehung als „unecht“, oder „künstlich“ empfunden zu werden. Dies kann unter Umständen nicht den erwarteten ästhetischen Geschmack treffen. 
     

Diese Nachteile sollten durchaus berücksichtig werden, wenn es darum geht auf KI generierte Bilder in der Kreativen- und Designphase zurückzugreifen bzw. solche zu integrieren und ob sie am Ende den gewünschten Nutzen im visuellen Storytelling gerecht werden. 

Syntographie: Erstellt mit Stable Diffusion
Syntographie: Erstellt mit Stable Diffusion
Syntographie: Erstellt mit Stable Diffusion
Syntographie: Erstellt mit Stable Diffusion

Erstellt mit Stable Diffusion

Wie generiert die KI ein Bild? 

Die Generierung durch Synthographie ist ein Prozess der KI, bei dem die KI-Algorithmen verwendet werden, damit aus einem „Prompt“, also einer Beschreibung, ein neues Bild erzeugt wird. Damit dies möglich ist müssen einige Schritte vorab durchlaufen werden: 

  • Datenbeschaffung und Vorbereitung:  
    Es werden Bilddaten für das Training eines KI-Models benötigt. Diese können z.B. aus frei Verfügbaren Datensätzen gesammelt, oder aber durch speziell kuratierte gewonnen werden. 
     
  • Modelltraining:  
    Ein KI-Modell wird auf Basis der beschafften Daten trainiert. Durch das Training lernt das Modell wie es aus einer Beschreibung ein neues Bild generiert welches optisch den Trainingsdaten entspricht. 
     
  • Bildgenerierung:  
    Ist das Training abgeschlossen kann das Modell verwendet werden um daraus neue Bilder basierend auf der Beschreibung zu generieren. 

KI-Bilder durch txt2img 

Die KI-Technologie txt2img ist die ausschlaggebende Funktion welche mithilfe von Deep-Learning Modellen aus einer Textbeschreibung („Prompt”) Bilder generieren kann. Die Qualität der Trainingsdaten spielt hier eine eklatant wichtige Rolle für die Bildgenerierung, denn nur hochwertige und abwechslungsreiche Datensätze führen zu qualitativ brauchbaren KI-Bildern. 

Ein „txt2img prompt“ ist ein kurzer Text, der als Beschreibung für die KI verwendet wird damit das Bild generiert werden kann. Der Prompt kann wahlweise ein Bild beschreiben, oder eine allgemeine Beschreibung des gewünschten visuellen Inhalts sein. 

Ein Prompt kann also z.B. (simplifiziert) „Eine Großstadt bei Sonnenuntergang während der Rush Hour“ sein, oder „Ein Gemälde von einem grünen Auto, im Stil von Rembrandt“. 

Ein Prompt kann aber auch wesentlich komplexer und spezifischer sein in dem explizit Details wie Farben, Formen, Objekte, oder gar Beleuchtung, Stil und ggfs. Künstler in die Generierung mit einbezogen werden. 

Txt2img ist also ein sehr wichtiger Faktor für die KI-Bildgenerierung. Dieser Faktor hilft dem Algorithmus den visuellen Inhalt zu verstehen und sich bei der Generierung bestmöglich an dem „Prompt“ zu orientieren. 

Welche Technologien gibt es derzeitig? 

Derzeitig sind die „3 Großen“ DALL·E 2, MidJourney und Stable Diffusion. Alle genannten basieren auf künstlicher Intelligenz und maschinellem Lernen. 

  • DALL·E 2 ist ein von OpenAI entwickeltes AI-Programm, das Bilder aus textuellen Beschreibungen erzeugt. Mit mehr als 10 Milliarden trainierten Versionen des GPT-3-Transformer-Modells interpretiert es natürlichsprachliche Eingaben und generiert das entsprechende Bild. Derzeitig nur als Software as a Service verfügbar.
  • MidJourney ist ein weiteres von KI angetriebenes Tool, das Bilder auf Basis von Benutzereingaben generiert. MidJourney brilliert dabei echte Kunststile anzupassen, um ein Bild mit jeder gewünschten Kombination von Beschreibungen zu erstellen. Es zeichnet sich besonders durch die Erstellung von Umgebungen aus, insbesondere von Fantasy- und Science-Fiction-Szenen, mit dramatischer Beleuchtung, die wie gerenderte Konzeptkunst aus einem Videospiel aussieht. MidJourney steht derzeitig nur als Software as Service in Form eines Discord-Bots zur Verfügung.

  • Stable Diffusion ist ein txt2img-Modell, das einen CLIP ViT-L/14 Text-Encoder verwendet, um das Modell bei Texteingaben zu optimieren. Es teilt den Bildprozess in einen “Diffusions”-Prozess auf – er startet mit reinem Rauschen und verbessert das Bild schrittweise, bis es vollständig frei von Rauschen ist und sich der bereitgestellten Textbeschreibung annähert. Im Gegensatz zu DALL·E 2 und MidJourney ist Stable Diffusion Open Source und kann, mit den vorhandenen hardware-technischen Voraussetzungen, von jedem lokal eingerichtet und genutzt werden.

Fazit 

Der Einsatz von künstlicher Intelligenz (KI) verändert das visuelle Storytelling dramatisch. Durch die Synthographie können visuelle Inhalte schnell und günstig erstellt werden und. Sie eröffnet eine Vielzahl von Möglichkeiten für die Personalisierung und Individualisierung von Content. KI generiertes Material kann so als Ausgangspunkt für weitere kreative Denkprozesse dienen! Mensch und Maschine in kreativer Symbiose. 

Neugierig geworden?
Jetzt Beratungstermin vereinbaren!

Wird geladen ...