DE / EN
Mag. Sandra Seck

KI-Tools im Test: Erfahrungsbericht Künstliche Intelligenz

BLOG

Künstliche Intelligenz im Dienste der Kreativität? Wenn kreative Neugier auf künstliche Intelligenz trifft, wird es spannend. Gerade im Marketing bieten sich nämlich aufregende neue Möglichkeiten, KI-basierte Tools innovativ und gezielt einzusetzen. Die neuen Programme sind verheißungsvoll und versprechen, die Arbeit von Kreativen und Designern in den unterschiedlichsten Bereichen vielfältig zu erleichtern und Optimierungen zu bringen.

Wir haben uns in der Agentur einige der neuen Technologien für verschiedene Disziplinen genauer angeschaut: Text, Bild, Video – und natürlich auch Audio, weil wir in Kürze mit unserem SPS Podcast starten werden. Was können die KI-Tools wirklich und inwieweit sind sie für den Einsatz in einem professionellen Umfeld geeignet? Cool Tools unter der Lupe – der SPS Erfahrungsbericht.

Descript: Das Video & Audio Tool im Test

Von Tamara, Kreation & Design

Ich bin überrascht, was Descript alles kann! Der Funktionsumfang ist sehr groß und die eigentliche Hauptfunktion, nämlich Videos zu transkribieren und dann auf Basis des Textes ein Video zu schneiden, ist erstaunlich – das hatte ich so nicht erwartet. Damit wird der Schnitt super easy: Man wählt einfach die Wörter aus, die man nicht braucht, löscht sie wie in der Textverarbeitung Word heraus, und das Tool schneidet gleich auch noch das Video dazu.

Die Funktion Overdub ist genial. Wenn man in der Aufnahme einen Versprecher drinnen hat, kann man dafür seine eigene Stimme aufnehmen und diese mit Text-to-Speech wieder einsetzen. Funktioniert aber leider momentan nur in Englisch (was ich allerdings erst erkannt habe, nachdem ich bereits eine halbe Stunde lang einen Text in Deutsch aufgenommen hatte!). Das Prinzip ist ganz einfach: Man liest mindestens 30 Minuten laut einen englischen Text vor und spricht ihn ein, und nach einigen Stunden erhält man von seiner Stimme ein Voice Model für Text-to-Speech.

Ein weiteres geniales Feature: Wenn man einen Podcast aufnimmt, streicht die KI automatisch Füllwörter wie „ähm“ und „ah“ heraus. Die lästige Audio-Schnittarbeit fällt damit komplett weg. Es gibt eine kostenlose Version mit einigen Limits, die nur eine eingeschränkte Nutzung zulassen. Die Pro-Version um 12 USD monatlich kann ich aber sehr empfehlen, weil sie im Vergleich zu anderen Schnitttools sehr kostengünstig ist.

„Mein Fazit: Ein erschwingliches Must-Have für alle Podcast Creator!“

Insgesamt haben mich die gut gemachten Videos und die tollen Einführungs-Tutorials in der Software überzeugt, die sehr einfache Aufzeichnung, der große Funktionsumfang und neben dem günstigen Preis auch die Tatsache, dass das Tool sehr gut für Anfänger geeignet ist. Abstriche gibt es für die unübersichtliche Struktur der erstellten Daten und dafür, dass das Transkribieren nicht so genau funktioniert, wenn die Aussprache nicht so perfekt ist wie bei einem ausgebildeten Sprecher. In Deutsch (meine Muttersprache) hat es immerhin noch besser geklappt als in Englisch, was leider kaum brauchbar war. Mein Fazit: Ein erschwingliches Must-Have für alle Podcast Creator!

Rytr: Das Text Tool im Test

Von Sandra, Text

Rytr ist ein Text Tool, das automatisch Inhalte generiert, die Sie anpassen oder weiterverarbeiten können. Das Tool beruht auf der GPT3-Technologie von OpenAI, einem amerikanischen Unternehmen, das sich mit der Erforschung Künstlicher Intelligenz beschäftigt. Finanziert von großen Geldgebern wie Elon Musk und Microsoft hat OpenAI Tools wie die Bildsoftware DALL-E oder den Chatbot ChatGPT entwickelt. GPT-3, der Generative Pre-trained Transformer der dritten Generation, ist ein maschinelles Lernmodell und basiert auf Deep-Learning, um jede Art von Text zu erstellen.

"Zielgruppe ist somit jeder, der Texte braucht, ob Texter, die AIDA- und PAS-Textwerkzeuge für ihre Copys anwenden, Unternehmen, die Anzeigen für Facebook, Google & LinkedIn oder Posts für Social Media brauchen, oder HR-Abteilungen, die Stellenbeschreibungen und Interviewfragen erarbeiten."

Grundsätzlich ist das Tool recht einfach in der Bedienung und es braucht keine großen Fachkenntnisse – also hervorragend geeignet auch für Anfänger! Das Dashboard ist in Englisch, die Texte können aber in Deutsch oder in anderen bekannten Sprachen erstellt werden. In der Anwendung bietet Rytr eine große Bandbreite mit vielen Optionen zur Inhaltgenerierung: Von E-Mails und Blogartikeln über Social Media Beiträge bis hin zu Texten für Landingpages oder einem CTA ist alles möglich. Insgesamt stehen über 30 verschiedene Anwendungen bzw. Vorlagen zur Auswahl, sogenannte „Use Cases“. Zielgruppe ist somit jeder, der Texte braucht, ob Texter, die AIDA- und PAS-Textwerkzeuge für ihre Copys anwenden, Unternehmen, die Anzeigen für Facebook, Google & LinkedIn oder Posts für Social Media brauchen, oder HR-Abteilungen, die Stellenbeschreibungen und Interviewfragen erarbeiten. Aber auch außerhalb des Businessumfelds ist Rytr nutzbar: Sogar Songtexte und Storys kreiert die KI, ebenso wie Videobeschreibungen oder Ideen zu neuen Videos, und unter „Magic Command“ sind weitere Anwendungen wie Gedichte oder Briefe möglich.

Hat man sich für einen Use Case entschieden, braucht man nur mehr eine kurze Beschreibung oder Keywords einzugeben, die das konkrete Thema näher beschreiben, schon spuckt das System in Sekundenschnelle einen Text basierend auf diesen Informationen (und natürlich auf den durch GPT-3 gelernten Inhalten!) aus. Hier kann man noch aus bis zu drei Varianten des Textes wählen. Die Ergebnisse können Sie dann frei miteinander kombinieren und bearbeiten. Sehr praktisch ist, dass Rytr eine übersichtliche Oberfläche mit einem Rich-Text-Editor hat, so dass die Bearbeitung und Formatierung des Textes schnell und einfach zu handhaben ist. Zusätzlich können Sie die Tonalität des Textes auswählen, um bestimmte Emotionen auszudrücken, wie z.B. wertschätzend, überzeugend oder kritisch. Das verleiht den Computertexten einen menschlicheren Touch und formuliert die Texte zielführender. Der Grad an Kreativität ist ebenfalls wählbar, je nachdem ob ein eher faktischer Schreibstil oder etwas Außergewöhnliches gewünscht wird.

"Die breite Textklaviatur, auf der die KI spielt, ist ziemlich beeindruckend. Damit am Ende überzeugende Ergebnisse herauskommen, muss man sich aber trotz simpler Bedienung ein bisschen einarbeiten.."

Und wie überzeugend ist das Tool als Ganzes? Die breite Textklaviatur, auf der die KI spielt, ist ziemlich beeindruckend. Damit am Ende überzeugende Ergebnisse herauskommen, muss man sich aber trotz simpler Bedienung ein bisschen einarbeiten, um der KI optimale Anweisungen geben zu können. Sprache und Grammatik sind gut umgesetzt, betrachtet man die fertigen Texte aber im Detail, ist bei den Sinnzusammenhängen noch Luft nach oben, insbesondere bei längeren Texten. Kurze Texte wie Social Media Posts waren im Test recht gelungen. Die integrierte SEO Analyse und der Plagiatsprüfungstest sind echte Vorteile, wodurch sich Rytr gut für Inhalte zu SEO-Zwecken verwenden lässt. Hervorragend ist das Tool für ein erstes Brainstorming zum Themeneinstieg und um Ideen und Formulierungen zu generieren, mit denen man dann weiter durchstarten kann. Das im kostenlosen Paket sehr geringe monatliche Volumen (5 000 Zeichen) ist schnell aufgebraucht und reicht maximal für ein schnelles Ausprobieren. Wer also wirklich damit arbeiten will, wird sich für ein kostenpflichtiges Abo entscheiden müssen – für den unlimitierten Zugang werden knapp 28 Euro im Monat fällig, mit monatlichem Limit von 50 000 Zeichen knapp 9 Euro.

Reface: Die Face Swap App im Test

Von Thomas, Digitalstratege und passionierter Reface Nutzer

„Das Tool setzt ein schnell gemachtes Selfie oder ein Portrait-Bild einer anderen Person auf Bilder und fotografierte Menschen, egal ob Stars, Celebrities oder den Nachbarn. Und das in einer erschreckenden Perfektion!“

Ich habe Reface vor knapp zwei Jahren das erste Mal benutzt. Die App kam über eine Werbung auf Social Media in meine Timeline und wie alle KI-Produkte musste ich sie ausprobieren, weil das Versprechen war, dass ich "in jeden Körper schlüpfen kann, den ich möchte": Und sie wurde zu meinem Markenzeichen.

Die App lässt sich frei nutzen und bietet in einer Pro-Version unlimitierten Einsatz. Das Tool setzt ein schnell gemachtes Selfie oder ein Portrait-Bild einer anderen Person auf Bilder und fotografierte Menschen, egal ob Stars, Celebrities oder den Nachbarn. Und das in einer erschreckenden Perfektion! So habe ich das Tool zunächst kennengelernt. Schnell wurde dann aber der Funktionsumfang erweitert und ich konnte meinen Kopf auch in Videos diverser Art einsetzen – was ebenfalls sehr gut umgesetzt wurde.

Mittlerweile kann ich Fotos animieren, Texte einsprechen und die KI schafft es, auch schlecht gemachtes Ausgangsmaterial so zu verändern, dass mein Kopf auf dem Bild sitzt. Dazu das neueste Feature, die Erschaffung eines Avatars über eine Vielzahl von Bildern, die man von sich selbst hochlädt. Komplett frei generiert. Ich selbst habe so meinen Profilbildern auf diversen Social Media Plattformen immer wieder einen neuen Look verpasst, just for fun. Aus Harvey Specter oder der Pate wurde dann ein "Ich-Pate", den ich zu meinem Profilbild machte. Im Hintergrund verarbeitet die KI wohl alle Bilder, um immer besser und klarer die Köpfe zu ersetzen.

Ich kann mir sehr gut vorstellen, dass dieses Tool für den professionellen Einsatz genutzt werden kann und wird. Der Nachteil ist natürlich, dass diese Technologie Tür und Tor für Missbrauch öffnet. Reface versucht zwar, dem Einhalt zu gebieten, indem es Wasserzeichen auf dem generierten Material ausweist. Aber findige Kräfte werden diese wohl zu entfernen wissen, fürchte ich. Alles in allem ist Reface ein witziges Tool, mit enormer KI-Kraft. Es gibt kaum ein Tool, dass ich persönlich so häufig nutze wie dieses.

Gigapixel AI: Das Bild Tool im Test

Von Noel, Grafik

Gigapixel AI ist eine Bildbearbeitungssoftware von Topaz Labs, die Auflösung und Details von Bildern verbessert. Mit Hilfe von „Deep Learning“ kann das Tool niedrig aufgelöste Bilder in höherer Qualität und mit höherem Detailreichtum anzeigen. Eine Aufgabe, die grundsätzlich schwer zu bewältigen ist und von den meisten KIs dadurch gelöst wird, dass sie einfach mehr Pixel einsetzen. Das Ergebnis ist dann oft ein ebenso fehlerhaftes Bild, allerdings in größeren Dimensionen. Nicht so bei Gigapixel AI: Durch die mit Portraits, Landschaften, Architektur und Umwelteinflüssen gefüllte Datenbank hat das neuronale Netz eine ausgezeichnete Vorstellung von fotorealistischen Aufnahmen und erschafft damit eine natürliche Hochrechnung der Bilder.

"Wenn wir vor der Herausforderung stehen, nur schlecht aufgelöste Bilder als Ausgangsmaterial zu haben und auch kein Stockmaterial in ausreichender Auflösung vorliegt, ist das Tool gerade bei großen Printproduktionen ein echter Retter in der Not!"

Die vielleicht beeindruckendste Technologie hinter diesem Programm ist die „Face Recovery“, eingeführt in der Version 6.1. Hier werden niedrig aufgelöste Portraits mit unglaublichem Detailreichtum generiert, die sich um bis zu 600 Prozent vergrößern lassen. Eigentlich wurde Gigapixel AI für fotorealistische Stillleben entwickelt. Dennoch werden bereits großartige Ergebnisse im Motion-Bereich erzielt. In der Zukunft können wir von einem breiten Anwendungsspektrum profitieren, sei es im Print durch eine unglaubliche Qualitäts- und Detailerzeugung oder beispielsweise im Game-Design durch höher aufgelöste Strukturen und eine feinere Texturerzeugung. Angewendet wurde das Tool bereits, um eine „Remastered“ Version von Final Fantasy VII zu erstellen, um die Texturen in Counter-Strike 1.6 hochzurechnen und um Deep Space 9 in ein 4K Erlebnis zu verwandeln. In der Agenturpraxis ist Gigapixel ein sehr nützliches und vergleichsweise preisgünstiges Tool, das geniale Ergebnisse bringt: Wenn wir vor der Herausforderung stehen, nur schlecht aufgelöste Bilder als Ausgangsmaterial zu haben und auch kein Stockmaterial in ausreichender Auflösung vorliegt, ist das Tool gerade bei großen Printproduktionen ein echter Retter in der Not!

Dall-E: Das Bildgenerator Tool im Test

Von Peter, Grafik & Design

Die Anfänge der künstlichen Intelligenz als Bildgeneratoren liegen schon weit in der Vergangenheit zurück, der massive Anstieg ihrer Popularität und die breite Verfügbarkeit ist allerdings ein jüngeres Phänomen. Einer der ersten bekannten Generatoren war DeepDream von Google, ein neuronales Netzwerk, das Muster in Bildern erkennen konnte und diese so lange „bearbeitete“, bis traum- oder eben albtraumhafte Kreationen entstanden, die in Augen, Gesichtern und Gliedmaßen kaum mehr das ursprüngliche Inputbild erkennen ließen.


DALL·E 2023 Text-to-Image: Macro photo with a 35mm macro lens of a fuzzy bee holding a knitted sock"

Ein nächster Schritt waren Text-to-Image Generatoren, allen voran DALL-E von OpenAI, die mit einfachen Texteingaben Bilder generieren konnten, oft mit absolut erstaunlichen Ergebnissen. Heute sind die neuronalen Netze und Algorithmen so weit fortgeschritten, dass KI-generierter Bildcontent immer wieder Schlagzeilen macht. In der Praxis ist es allerdings trotzdem so, dass man verstehen kann und muss, wie die Systeme auf die Texteingaben reagieren. Illustrative, abstrakte oder künstlerische Interpretationen von textlichen Eingaben lassen weit mehr Spielraum zu als fotorealistische Text Prompts.

"Spannend vielleicht, aber nichts, was das menschliche Gehirn nicht sofort als Fehler erkennen würde."

Wer sich also erwartet, die perfekte Alternative zu Stock Image Seiten gefunden zu haben, wird enttäuscht sein, wenn das generierte Model ein paar Finger zu viel hat und die Frisur sich in unmöglichen Verwindungen im Hintergrund mit einem Baum verbindet. Spannend vielleicht, aber nichts, was das menschliche Gehirn nicht sofort als Fehler erkennen würde. So bleiben abstrakte, traumähnliche, bunte Szenen, die das Gefühl vermitteln, die KI selbst kann träumen. Und das alles nur mit einer Reihe von hochkomplexen mathematischen Systemen, die aus Nichts etwas machen.


DALL·E 2023 Text-to-Image: "A painting of two flying bees above a bee hive in the style of Jean-Michel Basquiat"

Fun-Fact: Die Titelbilder unserer Blogbeiträge zum Thema KI wurden alle mit DALL-E erstellt. Für unser KI-Glossar habe ich zum Beispiel folgenden Text eingegeben "an expressionistic oil painting of an artificial intelligence glossary". Hier geht's zum Ergebnis & unserem Glossar.

Unser Fazit

KI hat sich in den vergangenen Jahren unglaublich weiterentwickelt und bekommt aktuell einen enormen Schub. Kommen KI-basierte Tools als Werkzeuge im Kreationsprozess zum Einsatz, können sie zeitaufwändige (Teil-) Arbeiten übernehmen und liefern mit sehr gutem Output effizient sofortige Ergebnisse. In beeindruckender Geschwindigkeit sind sie für schnelle Anregungen und Ideenfindung gut geeignet und beschleunigen die Prozesse, gerade beim Projektstart. Die Arbeit in allen Bereichen können sie aber nicht komplett übernehmen. In jedem Fall sind sie mächtige Technologien, die Kreative bei ihrer Arbeit unterstützen können, sie aber nicht ersetzen. Zumindest noch nicht.


Wir bei SPS MARKETING verstehen uns als B2B Experience Hub und beherrschen seit über 25 Jahren die gesamte Bandbreite im Industriemarketing – klassisch, digital und global. Als ReFORMer, TransFORMER und PerFORMer setzen wir gemeinsam mit unseren Kunden außergewöhnliche Konzepte mit einem hohen Speed um. Profitieren auch Sie von unserem Erfahrungsschatz und kontaktieren Sie uns für ein unverbindliches Beratungsgespräch!

zurück