aus dem Netzwerk Insider November 2024
Kaum ein Technologiethema bewegt die Welt derzeit so sehr wie die Künstliche Intelligenz. Das geht mittlerweile seit Jahren so, und wir haben uns inzwischen an das dazugehörige Buzzword-Bingo gewöhnt: Häufig wird der Begriff der Künstlichen Intelligenz auf alles Neue und Beeindruckende angewendet, um mehr Aufmerksamkeit zu erregen.
Welche Technologie tatsächlich dahinter steckt, interessiert ohnehin kaum jemanden, und verraten muss man es ja auch nicht, ist schließlich alles geheim und neu. Oder auch nicht. Der Begriff der Künstlichen Intelligenz ist im allgemeinen Sprachgebrauch nicht wirklich definiert, warum also nicht auf den Hype-Zug aufspringen und von den Assoziationen profitieren?
Wenn es um konkrete Anwendungen geht, dreht sich die Diskussion allerdings häufig noch immer um Wunschdenken, Phantasie und Versprechen von künftigem Nutzen. Natürlich gibt es zahlreiche Meetings, Workshops, Projekte und mittlerweile in vielen Unternehmen auch Tests, Proofs of Concept, Testabos etc. pp. Man will schließlich nicht den Anschluss verpassen.
Doch was bedeutet das? Wie viele dieser Anwendungen sieht der durchschnittliche Angestellte davon in seinem Arbeitsalltag?
Meistens nicht so viele – jedenfalls nicht genug, um den anhaltenden Hype zu rechtfertigen. Zwar gibt es entsprechende Angebote, wie Microsofts Copilot, der Potenzial für spürbare Veränderungen hat, doch bislang wirkt es stellenweise eher unausgereift und ist zudem noch teuer. Daneben gibt es natürlich viele neue Webseiten, Apps und Services, sowohl von hippen Startups als auch von alten Bekannten, die jedoch in der Breite noch nicht angekommen sind.
Wer also nicht gerne zwischendurch mit den großen Sprachmodellen bzw. Large Language Models wie ChatGPT, Gemini, Llama und Konsorten spielt oder bereits einen Weg gefunden hat, sie produktiv zu nutzen, bleibt schnell als Beobachter am Rande des Geschehens zurück, mit mehr oder weniger Interesse am Thema.
Contact Center
Ein Bereich, in dem bereits einiges passiert und mit dem die meisten von uns – zumindest auf Kundenseite – regelmäßig Kontakt haben, ist der Kundenservice bzw. das Contact Center.
Im Contact Center liegen die Vorteile von KI-Anwendungen auf der Hand: In keinem anderen Bereich der Kommunikation lässt sich das kommerzielle Potenzial von Einsparungen derart gut nachvollziehen wie im Contact Center. Wenn zudem der Kundenservice verbessert wird, lohnt sich die Investition. Auf Kundenseite sind die Erwartungen häufig schon derart tief gesunken, dass man auch gerne bereit ist, sich mit einem Automaten abzugeben, da einem dann wenigstens zügig geholfen wird – sofern alles funktioniert. Man spricht hier von einem echten Win-Win und einem positiven Return of Invest.
Doch was kann Künstliche Intelligenz in dem Bereich überhaupt leisten? Ich möchte in der Folge einige Beispiele skizzieren. Was dabei unter den KI-Begriff fällt und was nicht, unterliegt dabei – ganz im Sinne des Zeitgeistes – keiner festen Definition oder zugrunde liegenden Technologie.
Künstliche Gesprächspartner
Das offensichtlichste Beispiel für Künstliche Intelligenz im Contact Center ist die direkte Kundenkommunikation. Dabei unterhält sich der Kunde mit einem künstlichen Gesprächspartner, den man in der Regel Bot nennt, und es gibt ihn in zwei wesentlichen Ausprägungen: den Voice-Bot und den Chat-Bot.
Beide können sowohl zur Vorqualifikation eingesetzt werden, also zur Ermittlung von Informationen wie Themen, Namen, Kunden- und Bestellnummern etc., als auch zur abschließenden Bearbeitung von Anfragen. Dabei kann der Bot beispielsweise Informationen zu Öffnungszeiten, Lieferstatus oder komplexeren Aufgaben bereitstellen, ohne dass ein menschlicher Agent benötigt wird.
Ein „Voice-Bot“ wird in seiner einfachsten Ausprägung (mit sehr wohlwollender Definition) schon seit vielen Jahren im Call Center eingesetzt. Denn auf der untersten Entwicklungsstufe beginnen wir mit der klassischen IVR (Interactive Voice Response).
Dabei handelt es sich um ein einfaches Sprachmenü. Das System arbeitet mit vordefinierten Ansagen, und der Kunde antwortet, indem er Zahlen – möglichst deutlich – nennt oder sie per Mehrfrequenzwahlverfahren (DTMF) über die Wähltastatur eingibt.
Damit beeindruckt man heutzutage zwar niemanden mehr, doch wird die Funktion bei vielen Herstellern nativ angeboten und lässt sich leicht konfigurieren sowie in die Systeminterna integrieren. Dadurch können bei Bedarf interne Daten abgefragt und beispielsweise Routingentscheidungen, sprich die Suche nach dem richtigen Agenten, beeinflusst oder einfache Informationen gegeben werden.
Etwas weniger holprig wird es für den Kunden, wenn er sein Anliegen nennen kann, als Schlagwort oder – deutlich besser – in natürlicher Sprache, wie er es auch bei einem menschlichen Agenten tun würde. Das fällt in den Bereich der Intent-Erkennung, sprich der Bot soll selbst erkennen, was der Mensch eigentlich möchte, ohne ihn dafür mit endlosen Aufzählungen von Antwortmöglichkeiten quälen zu müssen.
Damit verlassen wir die starren Konversationsbäume und betreten die moderne Bot-Landschaft, die sich dadurch auszeichnet, dass sie deutlich flexibler in der Gesprächsgestaltung ist. Wenn ein Kunde bei seiner Vorstellung bereits sein Anliegen und beispielsweise ein Datum nennt, muss der Bot nicht erneut danach fragen. Stattdessen erkennt er selbständig, welche Information noch fehlt, und fragt nur danach, wenn es nötig ist. Denn falls sich ein Kunde über eine bekannte Rufnummer meldet oder über die genannten Informationen bereits in der Datenbank gefunden werden kann, sind deutlich effizientere Konversationen möglich.
Allerdings müssen hierzu sämtliche beteiligten Systeme miteinander sprechen. Und natürlich muss in einem solchen Modell definiert werden, wie Gespräche gestaltet und Informationsflüsse ablaufen sollen. In diesem Bereich sind mit Cognigy und Parloa aktuell auch zwei deutsche Unternehmen mit ihren Ansätzen erfolgreich am Markt, denn diese Art von Bots gehört nicht mehr zum Standard-Lösungsumfang der Contact Center.
Somit sind mit dem Contact Center, der Bot-KI und den Kundendatenbanken, welche üblicherweise über Customer-Relationship-Management-Software realisiert werden, schon mindestens drei Systeme involviert, die miteinander kommunizieren müssen, damit Daten abgefragt, interaktive Konversationen geführt, Routingentscheidungen beeinflusst und Erkenntnisse abgespeichert werden können.
Und es werden schnell mehr: Für einen Chat gibt es in der Regel eine Integration über die Webseite, eine App oder einen externen Nachrichtendienst. Dann muss entschieden werden, wann und mit welchen Informationen an einen menschlichen Agenten übergeben werden soll.
Viele Unternehmen unterschätzen den Aufwand, der in solche Projekte investiert werden muss, um ein gutes Ergebnis zu erzielen. Bei einem erfolgreichen Projekt kann sich das Resultat dann auch sehen lassen und zum eingangs erwähnten Win-Win führen.
Die großen Sprachmodelle – das Aushängeschild des aktuellen KI-Hypes – kommen dabei oft gar nicht zum Einsatz. Zwar können solche Systeme mit geringem Aufwand extrem flexible Bots erstellen, die ein außerordentliches Talent für natürliche Sprache haben: Im einfachsten Fall werden diese lediglich über einen Prompt „eingewiesen“. Jedoch liegt die Herausforderung darin, ihre Geschwätzigkeit unter Kontrolle zu halten.
Denn wie unzählige Beispiele aus der jüngsten Vergangenheit bereits demonstriert haben, ist es schwierig, solch einen Bot davon abzuhalten, in bestimmten Situationen Blödsinn zu erzählen. Wenn ein Sprachmodell anfängt zu „halluzinieren“, wird es im besten Fall absurd bis witzig. Allerdings kann es dann auch passieren, dass der Bot Falschinformationen verbreitet oder seinen Gesprächspartner beschimpft, was im Kundenservice nicht so gut ankommt.
Und natürlich müssen auch hier die entsprechenden Informationsflüsse mit anderen Systemen ermöglicht werden, wenn etwas Sinnvolles dabei herauskommen soll.
Gesprächszusammenfassung
Auch wenn bei den Bots häufig auf Sprachmodelle für die Gesprächsführung verzichtet wird, gibt es eine weitere Aufgabe im Contact Center, bei der die beeindruckende Mächtigkeit dieser Systeme genutzt werden kann, ohne sie direkt mit den Kunden interagieren zu lassen.
Nach einer Konversation – ob Chat, E-Mail oder Telefonat – erstellt ein Agent in der Regel während der Nachbereitungszeit eine Gesprächszusammenfassung. Die manuelle Erstellung dieser Zusammenfassung kann bei komplexen und/oder länglichen Sachverhalten einige Zeit und Konzentration in Anspruch nehmen.
Solch eine Aufgabe kann sehr gut von einem Sprachmodell übernommen werden, sofern die entsprechenden Protokolle zur Verfügung stehen. Der Agent braucht nur noch Korrekturen vorzunehmen, das Ergebnis bestätigen oder auf Knopfdruck einen neuen Versuch anfordern. So lässt sich über viele Vorgänge in Summe viel Zeit sparen, die zudem über das Reporting mit den zuvor benötigten Zeiten direkt verglichen werden können.
Damit kann dann jemand eine schöne Management-Folie mit der dokumentierten Optimierung erstellen, die einem relativ geringen Kostenpunkt gegenübersteht. Denn in diesem Fall muss das System nicht allzu aufwändig integriert und trainiert werden, um sinnvolle Ergebnisse zu liefern.
Und falls es keine sinnvollen Ergebnisse liefert, führt dies auch nicht gleich zu einem Image-Schaden, da lediglich interne Daten erzeugt und verarbeitet werden, mit denen der Kunde selbst niemals direkt in Berührung kommt.
Datenverarbeitung
Apropos Datenverarbeitung: Künstliche Intelligenz wird natürlich schnell mit der zwangsläufigen Datenverarbeitung in der Cloud in Verbindung gebracht. Nicht zuletzt sorgt das Thema aktuell wieder für Streit mit großen Firmen, wie beispielsweise Facebook, die gewisse KI-Features in der EU nicht zur Verfügung stellen, da sie nur schwer mit dem hiesigen Datenschutz zu vereinbaren sind.
Somit kann den Menschen in der EU, zumindest laut Facebook, nur eine „zweitklassige Erfahrung“ geboten werden, und es muss befürchtet werden, dass Europa im „Wettbewerb bei der KI-Entwicklung“ zurückfällt.
Demnach ist zu erwarten, dass solche Funktionen wie Bots oder eine Gesprächszusammenfassung, die teilweise sensible Daten verarbeiten, kaum umsetzbar sind.
Doch es gibt Lösungen. Zwar muss sehr genau im Blick behalten werden, welche Daten unter welchen Umständen wohin fließen und dort gespeichert sowie verarbeitet werden. Jedoch können viele Komponenten auch unter kontrollierten Bedingungen (bei Bedarf sogar On-Premises) zur Verfügung gestellt werden. Dies gilt ebenso für Sprachmodelle.
Weitere Funktionen
Grundlegende Funktionen wie die Spracherkennung, also die Übersetzung von Text aus Sprache (speech to text), und Sprachsynthese (text to speech) werden in der einen oder anderen Form schon seit sehr langer Zeit im Contact Center eingesetzt und sind auch heute noch eine Grundvoraussetzung für viele erweiterte KI-Funktionen, wie beispielsweise Voice-Bots.
Fortlaufende Verbesserungen, insbesondere im Bereich der Spracherkennung, sind dabei essentiell, um die Leistungsfähigkeit und Robustheit der darauf aufbauenden Systeme bei Fehlern, Ungenauigkeiten oder beispielsweise Dialekten auf der menschlichen Seite zu erhöhen.
Ein Beispiel für ein solches System ist eine Sentimentanalyse. Diese hat zum Ziel, die Stimmung des Kunden einzuordnen – dementsprechend wird sie mitunter auch Stimmungserkennung genannt. Was zunächst eher banal klingt, ist technisch anspruchsvoll und kann wertvolle Daten erzeugen, die im Kundenservice sinnvoll genutzt werden können.
Verärgerte Kunden können an geeignete Stellen (speziell geschulte Mitarbeiter) vermittelt werden, während bei zufriedenen Kunden die Möglichkeit besteht, weitere Dienstleistungen oder Produkte anzubieten (neudeutsch: Upselling). Oder Agenten können daran gemessen werden, wie sich die Stimmung ihrer Gesprächspartner im Laufe des Gesprächs entwickelt. Und wenn es ganz schlimm wird, können Agenten schon während des Gesprächs Unterstützung erhalten.
Daneben gibt es noch viele kleine Funktionen, die in der Lage sind, den Agenten zu helfen. Vorschläge für Antwortmöglichkeiten bei Textnachrichten haben die meisten Anwender schon in ihren Messenger-Apps gesehen. Ganz ähnlich kann das auch bei einem Agenten funktionieren, der solche Chats mit einem Kunden führt, zum Beispiel über die Webseite.
Im Schriftgut-Bereich, sprich Kommunikation per E-Mail bzw. Brief oder Fax, dürfen solche Vorschläge durchaus länger und komplexer werden. Natürlich gibt es Vorlagen für die meisten typischen Konversationen, aber in anderen Fällen lässt sich viel Zeit und Mühe sparen, wenn der Agent nur den automatisch generierten Vorschlag des Systems kontrollieren und ggf. anpassen muss, ähnlich wie bei der Gesprächszusammenfassung. Und wenn das Sprachmodell im Vorfeld mit den Agenten-Richtlinien, FAQs etc. gefüttert wird, steigt zumindest die Wahrscheinlichkeit, dass diese tatsächlich auch beachtet werden.
Fazit
Ein Problem bei Funktionen aus dem Dunstkreis der Künstlichen Intelligenz ist, dass oft nicht leicht zu vermitteln ist, wie genau diese Systeme funktionieren, welche Schritte für eine erfolgreiche Integration erforderlich sind und wie sich die einzelnen Bausteine zu einem sinnvollen Gesamtkonstrukt kombinieren lassen.
Das liegt nicht zuletzt daran, dass das Gesamtsystem Contact Center, selbst in Zeiten von Cloud-Software, immer an individuelle Anforderungen der Unternehmen angepasst werden muss. All das zu erläutern braucht Zeit und Rückfragen.
Somit erklärt sich dann auch die Buzzword-Schlacht im Fachjargon. Gerade im Marketing muss man möglichst schnell positiv auffallen, und da bleibt nicht viel Zeit für „wenn dies, dann das“. Hier ist Künstliche Intelligenz ein willkommener Nährboden für neue Wortkreationen und absurde Versprechen.
Dabei können sich hilfreiche Funktionen unter der Haube verbergen. Neben den angesprochenen gibt es noch viele weitere Beispiele für existierende Unterstützung durch Künstliche Intelligenz im Contact Center.
Darüber hinaus besteht vor allem noch ungeahntes Potenzial in künftigen Funktionen, die heute noch nicht ausgereift oder vielleicht noch gar nicht erfunden sind. Dementsprechend gibt es viel Bewegung in der Branche, und die wird es auf absehbare Zeit auch weiterhin geben.