Zum Hauptinhalt springen

Sie haben noch Fragen? Kontaktieren Sie uns:    +49 (911) 58 15-0    info@studio-gong.de

#Tech­Simp­le – Multimodalität 


In der Welt der KI hat­ten wir uns zuletzt mit dem Begriff des Large Lan­guage Models (LLMs) beschäf­tigt. Im heu­ti­gen #Tech­Simp­le dreht sich alles um den Begriff der Mul­ti­mo­da­li­tät, wel­ches auch eine Rolle bei den LLM spielt. In die­sem #Tech­Simp­le wer­fen wir einen Blick dar­auf, was sich hin­ter dem Begriff verbirgt.

Multimodalität Unter dem Begriff der Multimodalität wird die Fähigkeit eines KI-Modells beschrieben, welches verschiedene Datentypen gleichzeitig verarbeiten kann. Bei diesen Datentypen (Modalitäten) kann es sich um Texte, Bilder, Audio oder Video handeln. Durch diese Fähigkeit ahmt die KI die menschliche Wahrnehmung nach und erhält dadurch ein tieferes Verständnis. Oft sind Large Language Modelle (LLM) mit der Eigenschaft der Multimodalität erweitert. Bekannte Modelle mit Multimodalität sind u.a. Gemini und GPT-4V.

 

Nut­zen sie unser Glossar

Sie inter­es­sie­ren sich auch für ande­re Begrif­fe und Abkür­zun­gen? Dann infor­mie­ren Sie sich in unse­rer ste­tig wach­sen­den #Tech­Simp­le-Samm­lung. Oder nut­zen Sie das STUDIO GONG-Glos­sar auf unse­rer Web­site. Hier fin­den Sie alle #Tech­Simp­le-Begrif­fe rund um Radio & Audio über­sicht­lich auf einen Blick!

Wei­te­re span­nen­de Arti­kel auf unse­rem Blog


Alle Autoren 
Andreas Lang
Andre­as Lang 
Geschäfts­füh­rer
Michael Reuter
Micha­el Reuter 
Mar­ke­ting­lei­ter
Marina Regulin
Mari­na Regulin 
Mar­ke­ting-Mana­ge­rin Kommunikation
Julia Marks
Julia Marks 
Mar­ke­ting-Mana­ge­rin New Business
Jessica Köhler
Jes­si­ca Köhler 
Team-Assis­ten­tin Kommunikation
Sabine Rost
Sabi­ne Rost 
Assis­tenz der Mar­ke­ting- und Verkaufsleitung
Carina Bauer
Cari­na Bauer 
Mar­ke­ting-Mana­ge­rin Kom­mu­ni­ka­ti­on
(Seni­or)
Katharina Zeschke
Katha­ri­na Zeschke 
Audio-Exper­tin