Voice Key Insights - egta insight

Ein Leben ohne Voice Assistants ist für viele inzwischen gar nicht mehr vorstellbar. Wir berichten über die Voice Key Insights der egta-Studie.

Quelle: www.pixabay.com von chaitawat

Voice im Alltag

Es beginnt bereits kurz nach dem Aufstehen. Am Frühstückstisch wird Alexa nach den neuesten Nachrichten oder dem Lieblingsradiosender gefragt. Während der Fahrt zur Arbeit informiert das Auto über den bevorstehenden Stau. Mittags wird über Siri eine Pizza bestellt und abends dem Fernseher befohlen, die Lieblingssendung zu zeigen. Somit lässt sich inzwischen sagen, dass Spracherlebnisse sich zunehmend in den Alltag integrieren. Aber Voice bietet nicht nur Werbetreibenden verschiedene Möglichkeiten, sondern eröffnet auch Fernseh- und Radiounternehmen sowie deren Verkaufshäusern eine Vielzahl von Möglichkeiten. Zum Beispiel, um die Benutzererfahrung zu bereichern, neue Produkte vorzustellen, sprachaktivierte Markeninhalte bereitzustellen und vieles mehr.

Was ist Voice?

Was noch vor wenigen Jahren undenkbar war, ist inzwischen Alltag. Nach der Schaffung des World Wide Web in den 90er Jahren, der Einführung von Social Media ab 2007 und der Einführung von Smartphones in den letzten Jahren, ist das Aufkommen von Sprache nun die vierte große Veränderung im Verbraucherverhalten in den letzten 30 Jahren. Während das Gespräch mit einem Computer noch vor wenigen Jahren nicht möglich schien, ist es jetzt dank der vielen Fortschritte bei Spracherkennung, maschinellem Lernen und intelligenter Lautsprecher-Technologie, gepaart mit intelligenten persönlichen Assistenten, zur Realität geworden.

Voice Assistenten benutzen zwei verschiedene Zweige der künstlichen Intelligenz: Zum einen gibt es die Spracherkennung und zum anderen die Verarbeitung natürlicher Sprache (NLP). Wenn ein Benutzer einen Befehl an einen intelligenten Lautsprecher sendet, erkennt der Spracherkennungsteil die Schallwellen und wandelt sie in geschriebene Wörter um. Der NLP-Teil nimmt dann diese Wörter und verarbeitet die darin enthaltenen Befehle.

Sprachassistenten befinden sich jedoch noch immer in den Anfängen, insbesondere für Werbe‑, Medien- und Unterhaltungszwecke. Die am häufigsten verwendeten Sprachbefehle dienen in der Regel praktischen Zwecken, wie dem Einschalten von Musik, dem Hören des Wetterberichts oder dem Einstellen von Timern.

Warum Voice?

Sprache hat mehrere wesentliche Vorteile:

Geschwindigkeit:
Eine kürzlich von Stanford durchgeführte Studie hat gezeigt, dass Voice-to-Text dreimal schneller ist, als das Tippen auf dem Telefon, selbst wenn man die Zeit berücksichtigt, die für Korrekturen benötigt wird.
Freisprechen:
In einigen Fällen, z. B. beim Autofahren oder Kochen, ist Sprechen viel praktischer und sicherer als Wischen oder Tippen.
Intuitivität:
Sprechen ist für jeden selbstverständlich, noch bevor wir lesen oder schreiben können. Anstelle einer neuen Schnittstelle ist die Sprachtechnologie die älteste Schnittstelle, die es gibt. Selbst Benutzer, die mit dieser neuen Technologie weniger vertraut sind, können auf natürliche Weise antworten.
Empathie:
Der Ton einer Nachricht (Sarkasmus, Wut, Freude, etc.) kann in einer E‑Mail oder Textnachricht manchmal schwer zu beurteilen sein. Im Gegensatz zum geschriebenen Wort umfasst die Stimme Ton, Lautstärke, Intonation und Sprachtempo – und vermittelt so viele Informationen.

Mehrwert für Unternehmen

Aber auch Unternehmen oder Marken können von den Fortschritten in diesem neuen Bereich profitieren. Es gibt bereits mehrere Möglichkeiten, wie Marken mit ihren Verbrauchern kommunizieren:

Nutzen mit Persönlichkeit:
Durch Stimme können Marken Nutzen und Persönlichkeit verbinden. Ein gutes Beispiel ist Sony Music, das mit der Stimme von Paloma Faith, einem ihrer bekannten Aufnahmekünstler, eine Gute-Nacht-Story-Anwendung entwickelt hat.
Bekanntheit schaffen:
Stimme kann die Markenbekanntheit steigern und Benutzer über neue Produkte informieren, wie dies mit Nike der Fall war, das eine Sprach-App entwickelt hat, mit der Fernsehzuschauer ein Paar Turnschuhe bestellen können, die während eines Basketballspiels vorgestellt werden.

Ähnlich wie das Internet in den 90er Jahren bietet die Sprachtechnologie einen riesigen Pool an Möglichkeiten. Wenn Sprachassistenten dank der Fortschritte in der künstlichen Intelligenz kontextbezogener werden, werden sie proaktiver und nicht nur reaktiver. Sie entwickeln sich von einer FAQ, über Gespräche, bis hin zu einem wirklich interaktiven Assistenten, der das Leben der Verbraucher verbessert. Mit zunehmender Akzeptanz der Stimme durch die Verbraucher und einer immer noch begrenzten Menge an Inhalten im Sprachökosystem, stellt es eine enorme Chance für Unternehmen dar.

Skills

Es ist wichtig zu verstehen, dass jede Plattform einen anderen Namen für ihre Sprachanwendungen hat. Amazon hat sich für “Skills” entschieden, Google für “Actions” und Samsung für “Capsules”. Die Entwicklerplattformen von Amazon und Google – Alexa Skills Kit (ASK) und Actions on Google – bieten eine umfassende Sammlung von Tools, Dokumentationen, APIs und Code-Beispielen, um den Aufbau von Fähigkeiten und die Entwicklung von Funktionen für diejenigen zu vereinfachen, die eine Sprachanwendung erstellen und starten möchten. Somit gehört auch die Anwendung von Musikfähigkeiten dazu. Das ist eine Fähigkeit, mit welcher der Benutzer Audioinhalte auswählen, anhören und auch steuern kann.

Podcasting stieg um fast 5 % in Bezug auf “jemals erprobte” und “monatlich aktive Benutzer”. Auch die Audio-Unterhaltung verzeichnet einen Aufwärtstrend. Zudem ist das Hören von Radio über intelligente Lautsprecher bei „jemals erprobten“ und bei „monatlich aktiven Benutzern“ um etwa 4 % gestiegen. Bei den “täglich aktiven Benutzern” jedoch um 2 %.

Fazit

Aus den jüngsten Anwendungsfällen geht hervor, dass Voice für Werbung und Medien eine glänzende Zukunft hat. Im Rahmen der derzeitigen Möglichkeiten wird die Verwendung von Sprache als weiteres Mittel zur Kommunikation und Erreichung von Kunden zunehmen. Dabei spielen Early Adopters eine wesentliche Rolle bei der Aufklärung des Marktes. Sie zeigen, wie Sprache effektiv eingesetzt werden kann und ebnen anderen Marken den Weg für die Umsetzung von Sprachinitiativen. Mit zunehmender Verwendung von Sprachbefehlen wird es für Medienunternehmen und andere Unternehmen zu einer Notwendigkeit, benutzerdefinierte Fähigkeiten und Aktionen zu entwickeln, um sich selbst verfügbar zu machen, das Branding zu ermöglichen, die Benutzererfahrung zu verbessern und Möglichkeiten der Monetarisierung zu nutzen.

Die gesamte Studie der egta können Sie in der Publikation “egta insight – Voice: Key Insights for Media Companies into an Emerging Technology” einsehen.