Wie KI unse­re Wer­be­welt ver­än­dern wird – Teil 1

Am 26.4. fand das dies­jäh­ri­ge Radio Adver­ti­sing Sum­mit in Köln statt. Ein Live-Event mit unter­schied­li­chen Akteu­ren aus der Radio‑, Audio und Wer­be­bran­che. Ein Panel beschäf­tig­te sich damit, wie KI unse­re Wer­be­welt ver­än­dern wird, denn in die­ser hat die Ver­wen­dung von künst­li­cher Intel­li­genz (KI) in den letz­ten Jah­ren stark zuge­nom­men. Teil­neh­mer die­ses Panels war unter ande­rem Dr. Timo P. Kunz, Mit­grün­der des Soft­ware­un­ter­neh­mens Aflo­rith­mic, der sich, gemein­sam mit einem wei­te­ren Grün­der, für ein Inter­view mit uns bereiterklärte.

Beitragsbild_KI-Aflorithmic

Inter­view mit den Grün­dern von Aflo­rith­mic  

Aus die­sem aktu­el­len Anlass spre­chen wir im fol­gen­den Inter­view mit zwei von drei Grün­dern von Aflo­rith­mic Björn Ühss und Dr. Timo P. Kunz über ihre Erfah­run­gen mit der Ver­wen­dung von KI in der Audio­wer­bung. Aflo­rith­mic ist der Erfin­der von Audio­Stack, einer gene­ra­ti­ven KI-Infra­struk­tur, die eine neue Gene­ra­ti­on der Audio­er­stel­lung für Wer­bung, Video-Voice­over, Pod­cas­ting und Dyna­mic Audio (DCO) ermög­licht. So wird pro­fes­sio­nell klin­gen­des Audio aus Text erstellt, ein­schließ­lich Musik und kom­ple­xer Audio­tech­nik. Audio­Stack ver­kürzt dabei die Audio-Pro­duk­ti­ons­zy­klen von Tagen oder Wochen auf Sekun­den.  

Die Audio-Bran­che hat das Tool von Aflo­rith­mic zuletzt live auf dem Radio Adver­ti­sing Sum­mit erlebt. Was kann das Tool? 

Dr. Timo P. Kunz: Wir haben unse­re eige­ne Soft­ware dort mit der KI-Stim­me S.A.R.A., die wir für die Omni­com ent­wi­ckelt haben, vor­ge­stellt. S.A.R.A. steht für Speech & Audio Real­time Auto­ma­ti­on und über­setzt in Sekun­den ein­ge­ge­be­ne Texte in Audio, wie hier in der Demo zu sehen und hören ist:

Björn Ühss: Uns geht es bei Aflo­rith­mic darum, die kom­plet­te Wert­schöp­fungs­ket­te im Audio-Pro­duk­ti­ons­pro­zess abzu­de­cken. Das beginnt mit dem Skript, das man dann in eine Form fusio­niert, damit es sich gut mit syn­the­ti­schen Stim­men ver­trägt. Wir decken dann den gesam­ten Pro­zess vom Arran­ge­ment über das Sound­de­sign bis hin zum Mas­te­ring mit unse­rer Soft­ware ab. Unse­re Infra­struk­tur macht das mitt­ler­wei­le in unter acht Sekun­den.  

Im letz­ten Jahr wurde eine Koope­ra­ti­on mit der Omni­com Media Group vor­ge­stellt. Kun­den die­ser Agen­tur­grup­pe haben nun die Mög­lich­keit, Audio­in­hal­te in Minu­ten­schnel­le über das Tool von Aflo­rith­mic zu erstel­len? Wel­che ers­ten Cases konn­ten hier gene­riert wer­den? 

Dr. Timo P. Kunz: Unse­re Ent­wick­lung wird zunächst inner­halb der Agen­tur für Use Cases ver­wen­det, um Show­ca­ses zu pro­du­zie­ren. Zusätz­lich arbei­ten wir an einer ers­ten Instal­la­ti­on mit einem Ein­zel­händ­ler. Das ist beson­ders span­nend, weil das Tool in Echt­zeit Abbin­der oder Pro­dukt­spe­zi­fi­ka­tio­nen inner­halb eines Spots in weni­gen Sekun­den pro Filia­le erstel­len kann. Mit­hil­fe von Schnitt­stel­len las­sen sich sogar auto­ma­ti­siert Daten im Sys­tem hin­ter­le­gen, die dann das ent­spre­chen­de Pro­dukt in das Skript ein­bin­den und pro­du­zie­ren.  

Wird die Stim­me dafür extra für den Kun­den pro­du­ziert oder wird eine bestehen­de Stim­me genom­men? 

Dr. Timo P. Kunz: Für das beschrie­be­ne Ein­zel­han­dels-Pro­jekt bauen wir wie­der eine Stim­me auf. Je grö­ßer die Marke, desto mehr Wert legt der Kunde dar­auf. Die Kam­pa­gnen, die wir bereits in den USA umge­setzt haben, grei­fen auch auf Stan­dard-Stim­men aus dem Sys­tem zurück. Diese sind zum jet­zi­gen Zeit­punkt noch nicht über­nutzt und wer­den gerne ver­wen­det. 

Björn Ühss: Es gibt aus mei­ner Sicht zwei große USPs für Kun­den. Zum einen ist es für Kun­den, die viele Pro­duk­te haben und diese in Spots tes­ten möch­ten, mit einem natür­li­chen und nicht KI-basier­ten Pro­duk­ti­ons­pro­zess nur schwer abzu­bil­den. Es gibt zu lange Vor­lauf- und Pro­duk­ti­ons­zei­ten und die Spot-Erstel­lung ist letzt­end­lich für den Kun­den zu teuer. Hier hilft unse­re Soft­ware­lö­sung enorm. Des Wei­te­ren bie­tet unse­re Lösung Vor­tei­le im Ein­zel­han­del mit Fili­al­be­trie­ben wie Fit­ness­stu­di­os, Fast­food­ket­ten, Auto­mo­bil­un­ter­neh­men. Kam­pa­gnen kön­nen so zum Bei­spiel in Sekun­den­schnel­le auf die Geo­lo­ca­ti­on indi­vi­dua­li­siert wer­den. Die Umset­zung ist immer kos­ten­ef­fi­zi­ent, weil man zu jeder Zeit im Spot noch etwas ändern kann.  

Wie bekom­men Kun­den Zugang zu die­ser Ent­wick­lung?  

Dr. Timo P. Kunz: Wir bie­ten ent­we­der ein Lizenz­mo­dell oder die Kun­den kön­nen direkt pro­jekt­be­zo­gen auf uns zukom­men und wir hel­fen bei der Erstel­lung der Spots. Unse­re Lösung kann in bestehen­de Sys­te­me inte­griert wer­den oder stand-alone funk­tio­nie­ren.  

Es gibt bereits Tools zur Erstel­lung von loka­len Radio­kam­pa­gnen. Worin unter­schei­det sich das Sys­tem von Aflo­rith­mic zu die­sen?  

Dr. Timo P. Kunz: Um eine gute Spot­qua­li­tät zu erhal­ten, muss die ganze Pro­duk­ti­ons­ket­te, die in einem nor­ma­len Stu­dio vor­han­den ist, abge­bil­det sein. Musik­ele­men­te wer­den also abge­mischt und nicht über­ein­an­der­ge­legt. Ein Call-to-Action in einem Spot muss anders mit Sound hin­ter­legt wer­den als ein Spot­be­stand­teil in dem das Pro­dukt vor­ge­stellt wird.  

Björn Ühss: Mir gefällt der Ver­gleich mit Musik immer gut. Es gibt sehr gute Musi­ker, aber die sind noch längst keine Welt­stars. Es gibt einen guten Grund, warum Musi­ker sich mit Pro­du­zen­ten zusam­men­schlie­ßen. Gute Pro­du­zen­ten machen die Musik erfolg­reich. Und so haben auch wir unse­re Audio Pro­duk­ti­ons Engi­ne ent­wi­ckelt, wel­che alle Ele­men­te End-to-End ver­bin­det und am Schluss auch mas­tert und ver­edelt, für maxi­ma­len Hör­ge­nuss. Hier nut­zen wir unse­re Audio-Mas­te­ring-Erfah­rung, aber auch kom­ple­xe Algo­rith­men, die ein Ton­stu­dio und Pro­du­zen­ten emu­lie­ren. Das ermög­licht, dass es im fina­len Gesamt­klang gut, stark und sehr hoch­wer­tig klingt. 

Der Fokus liegt also auf der Sound­pro­duk­ti­on. Wie sieht es mit der Tex­terstel­lung aus?  

Dr. Timo P. Kunz: Bis­lang haben wir auf Basis von fer­ti­gen Tem­pla­tes gear­bei­tet. Bis­lang war das die beste Metho­de, um aus bestehen­den Bau­stei­nen ein Skript zu erstel­len. Seit die­sem Jahr hat sich das mit der Ent­wick­lung von ChatGPT radi­kal geän­dert. Die Kun­den erwar­ten nun, dass so ein Sys­tem prompt schrei­ben kann.  

Björn Ühss: Das geht natür­lich nicht an uns vor­bei. Die Unrei­fe von ChatGPT besteht zum Bei­spiel darin, dass bestehen­de Sys­te­me Skrip­te immer mit einer Frage begin­nen. Das ist nicht immer opti­mal und sehr repe­ti­tiv. Auch ist die Spot­län­ge abhän­gig von der gewähl­ten Stim­me und der Länge des Skrip­tes. Diese Lear­nings wol­len wir in unse­rem Sys­tem eben­falls abde­cken. Gene­ra­ti­ve Tex­terstel­lungs­funk­tio­nen, wie auch auf Audio­wer­bung zuge­schnit­te­ne KI Model­le, ste­hen bei uns auf unse­rer Road­map für die­ses Jahr. 

Fort­set­zung folgt…

Wei­te­re span­nen­de Fra­gen und Ant­wor­ten erwar­ten Sie nächs­ten Diens­tag im zwei­ten Teil unse­res Inter­views. Denn wir wol­len unter ande­rem her­aus­fin­den, ob KI den Ein­satz von ech­ten Stim­men lang­fris­tig gese­hen erset­zen wird, wel­che Anwen­dungs­bei­spie­le es von KI im Bereich Audio gibt und sich KI-basier­te Wer­be­kam­pa­gnen in Zukunft von her­kömm­li­chen Kam­pa­gnen unter­schei­den werden?

Seien Sie gespannt!

Kreise_Blog_Redakteure_2023_KZeschke

Über Aflo­rith­mic

Logo_AflorithmicAflo­rith­mic Labs, Ltd ist ein Tech­no­lo­gie­un­ter­neh­men mit Sitz in Lon­don und Bar­ce­lo­na. Die api.audio Platt­form ermög­licht eine voll­au­to­ma­ti­sche, ska­lier­ba­re Audio­pro­duk­ti­on mit Hilfe von Text-to-Speech, Voice Clo­ning und KI-gesteu­er­ter Nach­be­ar­bei­tung. Die erstell­ten Audio­da­tei­en kön­nen dann u.A. auf Web­sei­ten, Mobil-Apps oder Smartspea­k­ern aus­ge­spielt werden.

Mit die­sem Audio-As-A-Ser­vice kön­nen Unter­neh­men hoch­wer­tig-klin­gen­de Audio­da­tei­en ohne irgend­wel­che Vor­kennt­nis­se erstel­len: ange­fan­gen von ein­fa­chem Text bis hin zu Sound-Design und kom­ple­xer Tontechnik.

Das Team besteht aus hoch qua­li­fi­zier­ten Spe­zia­lis­ten für maschi­nel­les Ler­nen, Soft­ware­ent­wick­lung, Sprach­syn­the­se, KI-For­schung, Audio­tech­nik und Produktentwicklung.

Team_Aflorithmic

Quel­len: Bei­trags­bild via Ado­be­Stock von vegefox.com, Logo und Bild von Aflorithmic