nach oben

Informatik Spektrum

Erschienen in:

Open Access 31.05.2023 | HAUPTBEITRAG

Fuzzy Conversational Character Computing

Für Chat- und Voicebots

verfasst von: Sophie Hundertmark, Edy Portmann, Nils Hafner

Erschienen in: Informatik Spektrum | Ausgabe 3/2023

Aktivieren Sie unsere intelligente Suche, um passende Fachinhalte oder Patente zu finden.

search-config

KI-gestützte Suche

Patentsuche

Aus

Zusammenfassung

Der folgende Beitrag zeigt auf, wie bestehende Disziplinen und Methoden aus den Bereichen der Psychologie und der Wirtschaftsinformatik miteinander kombiniert und erweitert werden, damit Conversational Bots, auch als Chat- oder Voicebots bekannt, nicht nur natürliche Sprache verstehen und verarbeiten können, sondern auch personalisiert auf die Useranfragen eingehen können. Dies alles mit dem Ziel, möglichst natürliche Dialoge zwischen Menschen und Maschinen zu ermöglichen und dabei den Fokus der Datensparsamkeit nicht zu verlieren.

Dank dem neuen Ansatz des Character Computing (CC) in Kombination mit Computing with Words and Perceptions (CWP), welches ein Teilbereich der Fuzzylogic ist, und der Conversational Theory wird die Sprach- und Emotionserkennung von Conversational Bots auf ein komplett neues Level gebracht. Bisherige Chat- oder Voicebots sind lediglich darauf ausgelegt, einfache Befehle von ihren Usern zu verstehen und auszuführen. Dabei wird der Sprachinput einem vordefinierten Befehl zugeordnet und danach ausgeführt. So wird die Komplexität der Sprache auf einem Niveau vereinfacht, sodass viele wichtige Informationen verloren gehen. Es werden so beispielsweise keinerlei Informationen über die Persönlichkeit und Emotionen der User weiterverarbeitet. Beim klassischen Character Computing werden die Persönlichkeit und Emotionen zwar berücksichtigt, aber in der Regel wird eine Vielzahl von Daten benötigt, um zunächst den Character und anschließend das erwartete Verhalten des Users ableiten zu können. Dies ist in der Realität von Chat- und Voicebots kaum umsetzbar. Daher zeigen wir mit unserer Arbeit auf, wie Character Computing unter der Anwendung der Fuzzylogic mit dem Fokus auf Datensparsamkeit und Ethik angewendet werden kann.

Hinweis des Verlags

Der Verlag bleibt in Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und Institutsadressen neutral.

Chat- und Voicebots

Als Ausgangslage geht es zunächst nochmal darum, den Begriff der Chat- und Voicebots, auch Conversational Bots oder Agents genannt, zu definieren. Diese Conversational Bots sollen dann unter der Verwendung der später vorgestellten Disziplinen optimiert und erweitert werden.

Chatbots (kurz: Bots) oder auch Conversational Agents (CA) genannt, sind softwarebasierte Systeme, die natürliche Sprache verwenden, um eine menschliche Unterhaltung zu simulieren [1]. Mit Chatbots können Nutzer Informationen austauschen [2] oder auf Daten und Dienste zugreifen, indem sie natürliche Sprache verwenden [3]. Obwohl die Bezeichnung dieser softwarebasierten Systeme ständig diskutiert wird (z. B. CA, Chatbot, Chatterbot oder digitaler Assistent), bleibt der Hauptzweck derselbe, nämlich ein nichtmenschliches System, das mit einem Menschen kommuniziert, um einen bestimmten Zweck zu erreichen (z. B. Informationen abrufen, einen Dienst nutzen oder andere Smart Services auslösen) [4]. Es entsteht also jedes Mal ein automatisierter Dialog zwischen Kund*innen und einem System, bei dem Informationen abwechselnd ausgetauscht werden. Dies unterscheidet den Chatbot von anderen Self-Service-Tools, bei denen Kunden (abgesehen von statischen Hilfstexten) eher auf sich allein gestellt sind. Während es sich bei Chatbots immer um Dialoge in Textform handelt, durch die Nutzer*innen Informationen austauschen können [2] oder auf Daten und Dienste zugreifen, findet bei Voicebots jeder Dialog in gesprochener und natürlicher Sprache statt [3].

Der erste Chatbot mit dem Namen ELIZA wurde 1966 von Joseph Weizenbaum als textbasiertes Computerprogramm entwickelt, das eine Konversation in natürlicher Sprache mit einem Computer ermöglichte [5]. In den 1980er-Jahren wurden die textbasierten Chatbots durch sprachbasierte Dialogsysteme und verkörperte CAs erweitert [6].

Textbasierte Chatbots werden häufig auf Webseiten und Messenger-Plattformen (z. B. Facebook Messenger, WeChat, WhatsApp) implementiert, um den Kunden einen digitalen Touchpoint in natürlicher Sprache zu bieten. Während sich diese Arbeit vor allem auf den Einsatz von Bots im Customer Service fokussiert, können Chatbots jedoch auch in verschiedenen anderen Anwendungsfällen eingesetzt werden, z. B. bei der Wissensvermittlung [7], bei Buchungen und zur Unterstützung der Zusammenarbeit am Arbeitsplatz [8].

Character Computing

Die Beschreibung der heutigen Chat- und Voicebots hat aufgezeigt, dass bisherige Conversational Systems nur ein sehr eingeschränktes Sprachverständnis haben. Vor allem im Hinblick auf ein individuelles Verhalten, je nach User, sind die Fähigkeiten der heutigen Bot-Systeme noch sehr eingeschränkt. Mithilfe des Character Computing sollen die Kompetenzen der heutigen Bots deutlich ergänzt werden.

Character Computing (CC) ist noch eine eher neue Disziplin, welche die Forschungsgebiete der Computer Science und der Psychologie miteinander verbindet und mehrheitlich durch die Forschungen von El Bolock et al. [9, 13] geprägt wurden ist.

Character Computing in Abgrenzung zu anderen Disziplinen

Während Forscher, wie Picard [10] sich schon seit einigen Jahrzehnten mit Disziplinen des Affective und Personality Computing beschäftigen, berücksichtigen El Bolock et al. den gesamten Menschen, inklusive der Situation und der emotionalen Lage, in der sich eine Person gerade befindet [13].

Beim Affective Computing werden lediglich menschliche Emotionen berücksichtigt und dem Computer übermittelt. So soll laut Picard (1997) [10] ein möglichst natürliches Erlebnis zwischen Menschen und Maschinen entstehen. Affective Computing zielt darauf ab, emotionale Zustände anhand verschiedener Verhaltenshinweise zu erkennen und sich ihnen anzupassen.

Während Affective Computing hauptsächlich entwickelt wurde und weiter erforscht wird, damit Emotionen innerhalb von Technologien berücksichtigt werden, geht es beim Personality Computing darum, die Persönlichkeit des Users zu berücksichtigen und passend darauf reagieren zu können. Computer sollen dank dem Personality Computing die menschliche Persönlichkeit automatisch erkennen, wahrnehmen und darauf eingehen können. Für die Zwecke des Personality Computing wird die Persönlichkeit mehrheitlich anhand des Fünf-Facetten-Modells (FFM) [11, 12] dargestellt.

El Bolock et al. [13] argumentieren, dass weder Affective Computing noch Personality Computing genügen, um wirklich das Verhalten eines Menschen vorhersehen zu können und somit auch passend darauf reagieren zu können. Das liegt vor allem daran, dass zwei Menschen mit gegensätzlichen Persönlichkeitsmerkmalen in der gleichen Situation unterschiedliche Emotionen empfinden können. Wenn sie zum Beispiel gezwungen sind, einen öffentlichen Vortrag zu halten, könnte die eine Person strahlen vor Aufregung, der andere schwitzt vor Angst. Auch ein und dieselbe Person mit der gleichen Persönlichkeit kann in der gleichen Situation unterschiedliche Emotionen empfinden. Ein gelassener Lehrer könnte den Klassenclown normalerweise tolerieren, ihn aber an einem Tag, an dem er durch etwas Ungewöhnliches stark provoziert wurde, anschnauzen. El Bolock et al. (2020) gehen noch einen Schritt weiter. Laut ihnen würde es noch nicht mal genügen die beiden oben beschriebenen Disziplinen miteinander zu verknüpfen. Um sich ein ganzheitliches Bild von einer Person machen zu können, benötigen Computer viel mehr als nur die Emotionen und die Persönlichkeit. El Bolock et al. (2020) erwähnen hier nochmal das Beispiel des gelassenen Lehrers, der plötzlich doch ungehalten wird, und fragen sich, was wohl dazu geführt haben könnte. Es könnte doch sein, dass dieser Lehrer gerade dabei ist, seinen Schülern die Krankheit Krebs zu erklären, an der er gerade einen geliebten Menschen verloren hat. Das würde einen Lehrer nervös machen und zu dieser unerwarteten Reaktion führen. In diesem Fall können die Emotionen nur erklärt werden, wenn man die Geschichte der Person berücksichtigt. Dieses ist nur eines von vielen Beispielen, was die Notwenigkeit den Menschen als Ganzes zu betrachten, also den gesamten Character [9], aufzeigt. Der Charakter ist die individuelle Person mit all ihren definierenden oder beschreibenden Merkmalen. Dazu gehören stabile Persönlichkeitsmerkmale, variable affektive, kognitive und motivationale Zustände sowie Geschichte, Moral, Überzeugungen, Fähigkeiten, Aussehen und soziokulturelle Einbettung [13].

Character Computing basiert aus dem oben genannten Gründen auf einem ganzheitlichen, psychologisch getriebenen Modell des menschlichen Verhaltens. Anders als beim Affective Computing und beim Personality Computing, wird beim Character Computing das menschliche Verhalten nicht nur modelliert, sondern es wird auch vorhergesagt. Dies geschieht auf der Grundlage der Zusammenhänge einer Situation und dem Charakter eines Menschen [9]. Dabei steht der Character des Menschen im Mittelpunkt zu seinen anderen Merkmalen. Forscher des Character Computing nutzen die Triade Charakter-Verhalten-Situation [14], um den Charakter auf eine formalere oder ganzheitlichere Weise zu definieren.

Die Triade als Basis des Character Computing

Der Character zeigt nicht nur, wer ein Mensch ist, sondern auch wie er sich verhält und in Zukunft verhalten wird und das im Hinblick auf eine bestimmte Situation. Jede Komponente der Triade aus Persönlichkeit, Verhalten und Situation ist eine Funktion der beiden anderen Teile. Mit anderen Worten: Wenn die Situation und die Persönlichkeit gegeben sind, kann das Verhalten vorhergesagt werden, wenn das Verhalten und die Situation gegeben sind, kann die Persönlichkeit vorhergesagt werden, und wenn das Verhalten und die Persönlichkeit gegeben sind, kann die Situation vorhergesagt werden. Dies sind zunächst aber nur sehr allgemeine und stark vereinfachte Annahmen. Grundsätzlich kann nämlich jede der Komponenten der Triade weiter in kleinere Einheiten und Merkmale zerlegt werden kann, die das Verhalten oder den Charakter eines Menschen in einer bestimmten Situation am besten darstellen [13]. Dies macht das Modell komplex. Um weiter zu verdeutlichen, warum alle Charakterkomponenten in der Triade berücksichtigt werden müssen und nicht nur die Persönlichkeit, erläutern El Bolock et al. nochmal das Beispiel des Lehrers, der anscheinend seine Kontrolle verloren haben soll [13]. Es wurde eine mögliche Ursache erörtert, für die man seine Vorgeschichte kennen muss, nämlich den Tod eines geliebten Menschen durch Krebs. Ein anderes Szenario wäre, dass dieser Lehrer ein afroamerikanischer Geschichtslehrer ist, der gerade den institutionalisierten Rassismus erklärt. Die Tatsache, dass er Afroamerikaner ist, das heißt seine Kultur und sein Aussehen, sind der Hauptauslöser für sein ungewöhnliches Verhalten [15]. Der Charakter ist also der Grund für das Verhalten einer Person in einer bestimmten Situation. Zwar handelt es sich hierbei um eine Kausalitätsbeziehung, doch lässt sich die Korrelation zwischen den drei Komponenten oft leichter nutzen, um die am schwierigsten zu messenden Komponenten von den leichter zu messenden abzugrenzen.

Damit der Dreiklang und die inneren Abhängigkeiten für ein Computermodell nachvollziehbar sind, wird die Triade als Tripel (C, B, S) dargestellt. C spiegelt den Charakter wider, B das Verhalten und S repräsentiert die Situation. C ist dabei selbst ein Paar von Eigenschaften und Zuständen. El Bolock et al. definieren die drei Hauptfunktionen, die die drei Komponenten miteinander verbinden, wie folgt:

C = beobachten (B,S), B = vorhersagen (C,S), und S = verstehen (C, B) [13].

Ziele des Character Computing

Ein Hauptanliegen des Character Computing ist es also, die Modelle zu berechnen, die die drei Funktionen Beobachten, Vorhersagen und Verstehen repräsentieren. Da es aber unendlich viele Komponenten gibt, die in die Darstellung von C, B und S einbezogen werden können, ist eine Herausforderung des Character Computing, die kleinste Teilmenge auszuwählen, die für die Vorhersage des Verhaltens einer Person in einer bestimmten Situation erforderlich ist, und gleichzeitig die genaueste abstrahierte Darstellung von Beobachten, Vorhersagen und Verstehen zu finden [13]. Auch wenn das ultimative Ziel zwar eine vereinheitlichende Theorie des menschlichen Verhaltens, die das Verhalten einer Person in einer bestimmten Situation auf der Grundlage ihres Charakters erfassen und vorhersagen kann wäre, haben sich die bisherigen Forscher des Character Computing damit abgefunden, dass dieses Ziel zum heutigen Forschungsstand zu weit gegriffen und nicht erreichbar ist. Die Forscher grenzen daher ihr Ziel auf einen anwendungsspezifischen Bereich ein. Abhängig von der Domäne der jeweiligen Anwendung werden immer nur bestimmte Informationen berücksichtigt. So kann das Teil-Ziel, das Verhalten innerhalb der jeweiligen Domäne hervorsehen zu können, weitestgehend effizient erreicht werden. Forscher wie El Bolock et al. entwickeln also in der Regel ein psychologisch getriebenes Modell, das mit dem geringsten Aufwand auf menschliches Verhalten verallgemeinert werden kann, und zwar nur für die Zwecke der aktuellen Anwendung oder des Anwendungsbereichs [13].

Ausgehend von einer detaillierten Darstellung der Bestandteile des gesamten Charakters einer Person und der Situation, in der sie sich befindet, können Vorhersagen über das Verhaltens in Abhängigkeit mit dem Charakter und der Situation entwickelt werden. Auf der Grundlage des ganzheitlichen Dreiklangs von Charakter, Verhalten und Situation kann das Gleiche für die Erkennung des Charakters oder bestimmter Charakterkomponenten auf der Grundlage des Verhaltens in einer bestimmten Situation bzw. der Situation anhand des Charakters und des Verhaltens gelten.

Eine weitere Herausforderung des Character Computing besteht darin, dass die für eine genaue Vorhersage erforderlichen Informationen nicht immer verfügbar sind und möglicherweise nie für alle Personen beschafft werden können [13]. Daher werden in der Regel kleinerer Modelle entwickelt, die so trainiert werden können, dass sie das menschliche Verhalten in bestimmten Situationen genau vorhersagen können. Diese Modelle sollten die kleinste benötigte Teilmenge, die Charakter, Situation und Verhalten repräsentiert, finden und mit ihr arbeiten. Je nach Anwendungsfall oder Datenerfassungsmedium sind verschiedene Variablen, Merkmale und Ausprägungen möglich, die für die Situation (S), das Verhalten (B) und den Charakter (C) darstellen und als Indikatoren für C, B und S dienen können (Abb. 1).

Folgende Hauptkomponenten der Characters (C) werden im Rahmen des Character Computing betrachtet:

Komponenten des Character Computing

Character Computing basiert auf einer Vielzahl von Komponenten. Im folgenden Abschnitt werden die wichtigsten Komponenten beschrieben.

Persönlichkeitsmerkmale

Die Persönlichkeit ist eine der Hauptkomponenten des Charakters. Persönlichkeitsmerkmale sind eine der am meisten berücksichtigten Eigenschaften von Individuen in Interaktionen. Persönlichkeitsmerkmale werden als zeitlich stabil angesehen und wurden bereits in früheren Forschungen zum Personality Computing berücksichtigt [16].

In der Regel werden psychologische Persönlichkeitsmodelle mithilfe von validierten Fragebögen zur Bestimmung der Persönlichkeitseigenschaften einer Person entwickelt. Die an der Umfrage teilnehmenden Personen werden gebeten, den Wahrheitsgehalt bestimmter Aussagen zu beurteilen, die sie selbst oder andere Personen beschreiben. Das Hauptproblem bei dieser Art von Tests besteht darin, dass sie anfällig für bestimmte absichtliche oder unabsichtliche Antwortverzerrungen in Richtung sozial günstiger Antworten sind.

Das am häufigsten verwendete Modell ist das Fünf-Faktoren-Modell (FFM) oder die Big-Five (BF) [11, 12]. Die fünf Merkmale des FFM sind Extraversion, Annehmlichkeit, Gewissenhaftigkeit, Neurotizismus und Offenheit. Es gibt verschiedene Fragebögen zur Bewertung des FFM mit unterschiedlichen Längen, Items und entsprechender Validität.

Affektive Zustände und Stimmungen

Affektive Zustände ändern sich schnell und sind nicht stabil. Sie lassen sich leicht durch äußere Faktoren verändern und halten in der Regel nicht lange an. Menschen sind intuitiv mit der physiologischen Darstellung von Emotionen vertraut: Menschen schwitzen, ihre Stimme zittert in Stresssituationen oder die Wangen röten sich, wenn sie schüchtern sind. Es gibt auch einige körperliche Anzeichen, die nicht von außen beobachtbar sind, aber wahrgenommen werden können, wie zum Beispiel eine erschwerte Atmung oder ein erhöhter Herzschlag. Die Stimmung ist der allgemeinere affektive Zustand, in dem sich eine Person seit einiger Zeit befindet. Eine Person kann im Allgemeinen glücklich und somit positiv gestimmt sein, aber im Moment wütend sein, weil ihr beispielsweise jemand auf den Fuß getreten ist. Während sich die allgemeine Stimmung nicht ändert, hat der aktuelle affektive Zustand eine negative Tendenz. Die Dauer, die eine betroffene Person benötigt, um zu ihrer normalen, glücklichen Stimmung zurückzukehren, hängt jedoch von ihrer Emotionsregulation ab [17].

Kognitive und motivationale Zustände und Überzeugungen

Die Kognition macht einen großen Teil dessen aus, wie Menschen Informationen verarbeiten und damit handeln. Sie ist eine systematische Methode zur Darstellung des grundlegenden menschlichen Verhaltens als ein Zyklus von Reizeingängen aus der Umwelt, der Verarbeitung durch ein vermitteltes mentales Ereignis und der Erzeugung eines Ausgangs in Form eines Verhaltens oder einer Emotion. Oft wird erwartet, dass Menschen diesen Prozess des „rationalen“ Handelns perfekt beherrschen. Aber kognitive Verzerrungen sorgen dafür, dass das Verhalten eines Menschen auf unerwartete Weise beeinflusst werden kann. Sie werden als Fehler in der systematischen Informationsverarbeitung bezeichnet, die durch verschiedene Faktoren verursacht werden können, wie zum Beispiel mangelnde Aufmerksamkeit oder ungenaue Erinnerung. Diese Verzerrungen sind natürlich und treten häufig auf und bestimmen das Verhalten [18]. Einige Beispiele für Vorurteile, die das Verhalten beeinflussen können, sind folgende [13]:

Bandwagon-Effekt: Die eigene Überzeugung wird außer Kraft gesetzt, um sich den Handlungen und Gedanken anderer anzuschließen.
Hyperbolische Diskontierung: sich im Moment mit einer kleineren Belohnung zufriedengeben, anstatt auf eine größere zu warten.
Status-quo-Vorurteil: Entscheidungen treffen, die Veränderungen minimieren und die aktuelle Situation so weit wie möglich aufrechterhalten.
Verankerung: sich bei der Entscheidungsfindung stark auf eine Information (in der Regel die jüngste) stützen.
Vernachlässigung von Wahrscheinlichkeiten: Vernachlässigung tatsächlicher Wahrscheinlichkeiten aufgrund interner Faktoren und Überzeugungen (z. B. Phobien). Ein Beispiel wäre die Vermeidung von Flugzeugen aus Angst vor Unfällen, während man normalerweise Auto fährt.

Nach der Theorie des geplanten Verhaltens [19] bestimmen auch Überzeugungen das Verhalten. Überzeugungen sind sehr eng mit Kognition und kognitiven Zuständen verbunden [20, 21]. Überzeugungen werden also in hohem Maße durch den aktuellen kognitiven Zustand und die daraus resultierenden kognitiven Verzerrungen bestimmt.

Soziokulturelle Einbettung

Einer der wichtigsten Faktoren, die dazu beitragen, wer ein Mensch ist, ist der Ort, an dem sich die Person befindet bzw. wo der Mensch in der Vergangenheit bereits war. Die Kultur, in die jemand hineingeboren wurde, seine ethnische Zugehörigkeit, die Kultur, in der er aufgewachsen ist, und die Frage, ob diese beiden miteinander übereinstimmen, tragen alle dazu bei, bestimmte charakteristische Veranlagungen zu prägen. Das Gleiche gilt für den religiösen Glauben oder das Fehlen eines solchen. Der sozioökonomische Standard bestimmt, wie Menschen bestimmte Dinge wahrnehmen und wie sie darauf reagieren [15, 22]. Schließlich sind auch die gesprochenen Sprachen, der Zeitpunkt ihres Erwerbs und der Kontext, in dem sie verwendet werden, sehr aufschlussreiche Merkmale.

Moral

Moral und Ethik sind eine weitere treibende Kraft hinter dem Verhalten. Die Ethik diktiert die Moral durch die Unterscheidung und Kategorisierung von Handlungen als richtig oder falsch, gut oder böse. Die Moral gibt jedem Verhalten einen Wert. Es handelt sich also um eine Reihe von Prinzipien, die als Richtschnur dafür dienen, welches Verhalten anderen hilft oder schadet [23]. Dementsprechend neigen Menschen mit einer hohen Moral dazu, negatives Verhalten zu vermeiden und sich eher hilfreichem und harmlosem Verhalten zuzuwenden. Menschen, denen es an Moral mangelt, neigen dagegen eher zu negativem Verhalten, wenn es ihnen passt. Die Menschen glauben vielmals, dass sie nach ihren ethischen Normen leben und danach handeln. Trotz dieser Tatsache ist Moral situationsabhängig [24]. Selbst der hilfsbereiteste Altruist könnte jemandem helfen, wenn er genug Zeit hat, aber an ihm vorbeilaufen, wenn er in Eile ist.

Die drei Steps des Character Computing

Es gibt viele Möglichkeiten, den Charakter, das Verhalten und die Situation darzustellen, die jeweils unterschiedliche Komponenten haben. Der Charakter besteht aus einem stabilen, allgemeinen und einem aktuellen Zustand. Der allgemeine stabile Faktor bezieht sich auf die individuelle Persönlichkeit und die soziokulturelle Einbettung der Person. Obwohl sich die Persönlichkeit im Laufe der Zeit geringfügig verändern kann, bleibt sie in der Regel gleich, es sei denn, wesentliche äußere oder innere Faktoren beeinflussen sie. Der aktuelle Zustand des Charakters einer Person setzt sich zusammen aus dem Affekt zu diesem Zeitpunkt, der Stimmung in der vergangenen Periode, dem aktuellen körperlichen Zustand einer Person sowie dem aktuellen Aussehen und dem kognitiven Zustand.

Das Verhalten wird durch den Verhaltensausdruck, den Gefühlsausdruck und den Eigenschaftsausdruck dargestellt, die jeweils das Verhalten auf verschiedenen Ebenen widerspiegeln. Der Verhaltensausdruck ist laut El Bolock et al. am stärksten externalisiert und daher am einfachsten zu erkennen, da er sich in Handlungen, Gesten und Mimik widerspiegelt, obwohl auch subtilere Verhaltensreaktionen berücksichtigt und einbezogen werden können [13]. Darüber hinaus könnten Verhaltensänderungen über physiologische Marker gemessen werden.

Die Situation, in der das Verhalten gezeigt wird, kann laut El Bolock et al. auf verschiedene Weise und in unterschiedlichen Kontexten definiert werden [13]. Sie kann soziale Interaktionen mit anderen Personen umfassen, einschließlich Selbstoffenbarung und Ausdruck von Emotionen oder Empathie. Es kann sich um ein einzelnes Ereignis oder um die Umgebung handeln. Es kann neue und vertraute Kontexte umfassen, die sich direkt auf den kognitiven, motivationalen und affektiven Zustand einer Person auswirken können, entweder in positiver oder negativer, intensiver oder leichter Weise. Character Computing untersucht verschiedene Szenarien und Aspekte, immer im Hinblick auf alle oben genannten Psychologiezweige und auf die Komponenten, die bei der Darstellung des (C, B, S‑)Dreiklangs einzubeziehen sind. Je nach den Situationen, in denen ein bestimmtes Verhalten vorhergesagt werden soll, müssen nicht alle Variablen und Merkmale, die jede der drei Komponenten des (C, B, S‑)Dreiklangs darstellen, auf einmal berücksichtigt werden.

Abb. 2 zeigt einen Überblick über den klassischen Character Computing-Ablauf, bei dem jeder Step für sich untersucht werden kann, aber auch dem Gesamtbild dient. Die Komponenten, aus denen jeder Step besteht, sind Variablen und können nach Belieben hinzugefügt oder entfernt werden.

Diese drei Steps des Character Computing ergänzen sich gegenseitig, aber es kann auch jedes für sich untersucht und genutzt werden:

Erfassen und Profilieren des Charakters durch allgegenwärtige oder invasive Sensoren, subjektive Maßnahmen und neuartige Erfassungsmethoden mithilfe verschiedener Technologien und Bereiche wie IoT, maschinelles Lernen, Big Data, Psychologie und Sicherheit. Ernsthafte Datenschutz- und Sicherheitsüberlegungen spielen in diesem Modul eine wesentliche Rolle.
Nutzung von Zeichen, um allgegenwärtige zeichenbewusste Systeme zu entwickeln und zu untersuchen, welche Anwendungsfälle von dieser Anpassung profitieren würden.
Untersuchung der Frage, wie künstliche Intelligenz erweitert werden kann, um künstliche Zeichen zu schaffen, und wann dies erforderlich sein könnte.

Zusammenfassung und wichtigste theoretische und praktische Implikationen

Der Charakter ist die Gesamtheit aller Komponenten, die das menschliche Verhalten in einer bestimmten Situation bestimmen. Er besteht aus allgemeinen, stabilen Faktoren (z. B., Persönlichkeit und soziokulturelle Einbettung) und aktuellen Faktoren (z. B. Affekt, Stimmung, körperlicher Zustand, Aussehen und kognitiver Zustand). Character Computing konzentriert sich auf die Erforschung des menschlichen Charakters aus der Perspektive der Informatik und der Psychologie. Die Trias Charakter – Verhalten– Situation ist eine mögliche Grundlage für diese Forschung, wobei die Interaktionen und Komponenten, die innerhalb der Trias von Interesse sind, je nach Anwendungsbereich variieren. Character Computing besteht aus drei Modulen: Erfassen des Charakters, Anpassen an den Charakter und Entwickeln künstlicher Charaktere. Jedes Modul ist ein eigener Forschungsbereich mit vielfältigen Herausforderungen und neuen Möglichkeiten.

Bislang wurde jedes Modul für sich in verschiedenen Forschungsbereichen untersucht. Die Forschung im Bereich Affective and Personality Computing zielte beispielswiese darauf ab, einige der genannten Probleme anzugehen, ohne jedoch alle Charakterkomponenten einzubeziehen. Stattdessen stützt sich jeder Bereich auf eine Charakterkomponente, wie z. B. Affekt oder Persönlichkeit, um so menschliches Verhalten zu erklären. Die meisten bestehenden Ansätze zum Verstehen und damit zur Anpassung eines Computers an das menschliche Verhalten haben ihre Wurzeln in einem der beiden Hauptforschungsbereiche: Informatik und Psychologie.

Character Computing gehört zu den Ansätzen, die die Fragen aus einer gemeinsamen Perspektive von Informatik und Psychologie parallel angehen und zu einem formalisierten Modell führen, das die Trias Charakter-Verhalten-Situation abbildet und damit alle sich daraus ergebenden Anwendungsmöglichkeiten ermöglicht.

Herausforderungen des Character Computing

Im wirklichen Leben wird emotionales Verhalten weitgehend durch Körpersignale ausgedrückt. Diese Signale lassen sich in zwei Hauptkategorien oder -bereiche einteilen: Verhaltenssignale (z. B. Mimik, Hand- und Körpergesten, Sprache oder geschriebener Text) einerseits und physiologische Signale (z. B. Veränderungen der Herzfrequenz, des Pulses, der Atmung, des Augenaufschlags, der Pupillengröße, der galvanischen Hautleitfähigkeit, der Hauttemperatur – um nur einige zu nennen) andererseits [13]. Dank neuer Technologien im Bereich der Human Computer Interaction (HCI) und der Entwicklung neuer Sensorgeräte ist es möglich, prinzipiell jede dieser offenen Verhaltensreaktionen oder stillschweigenden und impliziten physiologischen Signale des Benutzers aufzuzeichnen, zu sammeln und zu analysieren [13]. Die Fülle von Körpersignalen, die auf Emotionen hinweisen können, ihre Signalkomplexität und ihre dynamische Natur können Computer-Algorithmen jedoch vor Herausforderungen stellen: Während Menschen gut darin sind, Emotionen und Gefühle zu erkennen, zu benennen und zu interpretieren, wird die Erkennung, Interpretation und Vorhersage von Emotionen für Computer zu einer komplizierten Aufgabe, wenn der sensorische Input keine Interpretation zulässt [13]. Weiter stellt sich hier die große Frage, wie realistisch es ist, dass Computersysteme, die ihr Verhalten an den Menschen anpassen sollen, immer automatisch Zugang zu den Daten der möglichen Sensoren haben. Nutzen die Menschen die Sensoren überhaupt oder teilen sie ihre emotionalen und kognitiven Zustände lediglich mithilfe von Sprache, Mimik oder Körpersprache? El Bolock et al. geben ebenfalls zu bedenken, dass das Sammeln von „Charakter“-Daten von Nutzern und das Erfassen ihres Verhaltens aus verschiedenen Online-Quellen ethische und datenschutzrechtliche Bedenken aufwirft, wenn die Nutzer nicht über den Zweck der Datenerhebung belehrt werden können und wenn keine mündliche und schriftliche Zustimmung der Nutzer vorliegt [13].

Die Laborforschung hat gezeigt, dass die Selbstauskunft der Teilnehmenden mit individuellen Sorgen um die Privatsphäre und das persönliche Vertrauen in die Forschungsumgebung zusammenhängt. Daher muss jede Studie, in der die Teilnehmenden Selbstauskünfte geben und indirekt „Zeichen“, „Spuren“ oder implizite „Marker“ ihrer Persönlichkeit, über ihre Gesundheit oder ihre Gefühle und individuellen Präferenzen liefern, ethische Standards einhalten.

Conversational Theory

Dieser Abschnitt beschreibt die wichtigsten Grundlagen der Conversational Theory. Als Basis dazu dient die Arbeit von Pangaro zur Conversation Theory ([25], Abb. 3).

Wie oben gezeigt, nutzen Forscher des Character Computing eine Vielzahl von Userdaten und Sensoren, um den Character eines Users bestimmen zu können. Wir erwarten, dass wir auf die Mehrheit der Sensorendaten verzichten können, wenn wir die Erkenntnisse der Conversational Theory in unsere Forschungen integrieren.

Pangaro hat im Rahmen seiner Conversational Theory den Begriff Conversation wie folgt definiert: Die Konversation ist eine Abfolge von Gesprächen zwischen den Teilnehmern. Jeder Teilnehmer ist ein „lernendes System“, das heißt ein System, dass sich aufgrund von Erfahrungen innerlich verändert [25].

Laut Pangaro sind Conversations zwischen mindestens zwei sozialen Systemen die Grundlage zur Entstehung von Innovationen oder neuen Zuständen. Zur Entstehung dieser Innovationen, welche häufig auch eine Form von Agreement zwischen zwei oder mehreren Konversationsteilnehmern sein kann, wird laut Pangaro zunächst ein gemeinsamer Kontext und ein gemeinsames Interface benötigt [25]. Anschließend gilt es eine gemeinsame Sprache zu entwickeln. Dies sind die Grundvoraussetzungen zur Entstehung einer Konversation. Sobald diese gegeben sind, tauschen die Konversationspartner Nachrichten bzw. Informationen aus. Mit jeder neu geteilten Nachricht lernen sich die beiden Gegenüber besser kennen, passen sich aneinander an, bauen Vertrauen auf und kommen schlussendlich zum Agreement. Die folgende Grafik zeigt den Prozess analog zu Pangaros Anwendung der Conversational Theory [25].

Pangaro betrachtet im Rahmen der Conversational Theory soziale Systeme als symbolische, sprachorientierte Systeme, in denen die Antworten von der Interpretation des Verhaltens einer Person durch eine andere Person abhängen und in denen die Bedeutungen der Antworten durch Gespräche vereinbart werden. Durch wiederholende Interaktionen, die als „Konversation“ bezeichnet werden, können die Unterschiede zwischen den beiden Personen verringert werden. Dies geschieht so lange bis beide Gesprächspartner eine Einigung über die jeweils andere finden. Pangaro nennt diesen Punkt „Einigung über ein Verständnis“ [25].

Pangaro argumentiert an dieser Stelle ebenfalls, dass Maschinen, ähnlich wie Menschen, auch Teil solcher sozialen Systeme werden können [25]. Maschinen lernen dann ebenfalls wie Menschen, sich im Verlauf von Gesprächen, das heißt im ständigen Austausch von Nachrichten, anzupassen und zu optimieren.

Computing with Words and Perceptions und Fuzzy Classification

Fuzzylogic und Computing with Words and Perceptions

El Bolock et al. weisen in ihrer Arbeit zum Character Computing bereits daraufhin, dass die bisherigen Modelle des Character Computing in Zukunft mithilfe von Fuzzylogic erweitert werden sollten [13]. Dies soll dazu beitragen, dass die ursprüngliche Vision, dass sich ein Computersystem komplett an menschliches Verhalten anpassen kann, erreicht wird [13]. Die folgenden Abschnitte erklären die Grundideen des Computing with Words and Perceptions, welches ein Teilgebiet der Fuzzylogic ist. Weiter gehen wir davon aus, dass bei der Verschmelzung von Character Computing und Fuzzylogic die Fuzzy Classifications eine wichtige Komponente ausmachen werden. Sie werden ebenfalls in diesem Abschnitt genauer beschrieben.

Die von Zadeh eingeführte Fuzzylogic ist eine Erweiterung der binären Mengenlehre. Sie besagt, dass ein Element nicht nur zwei Werte wie wahr oder falsch (Crisp-Logik) annehmen kann, sondern auch dazwischenliegende Wahrheitswerte (z. B. eher wahr, weder wahr noch falsch, eher falsch; Fuzzylogic) [25].

Diese erweiterte Theorie der Mengenlehre bildet die Grundlage von Computing with Words and Perceptions (CPW), um natürlichsprachliche Aussagen durch computergestützte Modelle approximieren zu können. Diese Modelle basieren in erster Linie auf Wörtern, da z. B. Zahlen nicht bekannt sind, die Ungenauigkeit dieser Wörter als tolerierbar angesehen wird oder sie als Linguistic Summaries [25] von sprachlichen Informationen gelten.

Fuzzy Classification

Zumstein hat im Rahmen seiner Arbeit klassische Fuzzy-Modelle, um die Definition eines Fuzzy-Klassifikationsdatenbankschemas erweitert, um in seinem Case die Zugehörigkeitsgrade der Kunden zu den verschiedenen Klassen zu bestimmen [27]. Diese Fuzzy Classification erscheint auch bei der Integration der Fuzzylogic in das Character Computing sinnvoll.

Um Fuzzy-Klassen aus scharfen Kontexten abzuleiten, werden die Attribute als linguistische Variablen betrachtet und jeder Äquivalenzklasse werden verbale Begriffe zugeordnet [26]. Mithilfe von linguistischen Variablen, das heißt Wörtern oder Wortkombinationen, können die Äquivalenzklassen der Attribute intuitiver beschrieben werden.

Zumstein hat dazu in seiner Arbeit folgendes Beispiel gezeigt, bei dem die linguistische Variable „Kundenattraktivität“ durch die Begriffe „aussichtslos“ und „vielversprechend“ beschrieben wird. Die sprachliche Variable „Wettbewerbsposition“ wird in die Begriffe „schwach“ und „stark“ unterteilt (siehe Abb. 4; [27]).

Jeder Begriff der linguistischen Variablen stellt eine Fuzzy-Menge dar. Jede Fuzzy-Menge wird durch eine Zugehörigkeitsfunktion (μ) über den gesamten Bereich des entsprechenden Attributs bestimmt. Das Attribut „Kundenattraktivität“ enthält numerische Werte im Intervall [0,100] [27]. Folglich sind die Zugehörigkeitsfunktionen μ unpromising und μ promising stetige Funktionen. Im Gegensatz dazu enthält das Attribut „Wettbewerbsposition“ keine numerischen Werte, sondern allgemeine Terme [27]. In diesem Fall sind die Terme der linguistischen Variablen „schwach“ und „stark“ mit diskreten Funktionen verbunden, d. h. jeder Term entspricht einem diskreten Wert. Mithilfe des Kontextmodells, der linguistischen Variablen und der Zugehörigkeitsfunktionen wird der Klassifikationsraum unscharf. Diese unscharfe Partitionierung hat ein wichtiges Ergebnis, nämlich das Verschwinden der scharfen Grenzen zwischen den Klassen, d. h. es gibt kontinuierliche Übergänge zwischen den verschiedenen Klassen [28].

Multidimensionale Fuzzy Classification

Geht es um die Bestimmung des Characters einer einzelnen Person, so müssen meist mehrere Dimensionen berücksichtigt werden. Daher eignet sich die Anwendung von mehrdimensionalen Fuzzy Classifications, welche nicht auf zwei Dimensionen beschränkt ist. Bei mehrdimensionalen Fuzzy Classifications können auch mehrere Attribute oder Kriterien gleichzeitig berücksichtigt werden.

In Abb. 4 hat Zumstein das bereits erwähnte Beispiel um die dritte Dimension, Kundenpotenzial, mit den beiden Begriffen „geringes Potenzial“ und „hohes Potenzial“ ergänzt [27]. Bei einer scharfen Klassifizierung gehören Brown und Miller zur gleichen Klasse (C5), obwohl ihre Positionen sehr unterschiedlich sind. Brown und Smith hingegen befinden sich fast an der gleichen Position, gehören aber unterschiedlichen Klassen an, Brown zu C5 und Smith zu C3. Bei der unscharfen Klassifizierung (Abb. 5), also eine Fuzzy Klassifizierung verschwinden die scharfen Grenzen der acht Klassen und der dreidimensionale Klassifizierungsraum wird unscharf.

Brown und Smith gehören nun zu acht verschiedenen Klassen, mit folgenden absoluten M(Oi|Ck) und normalisierten Mnorm(Oi|Ck) Zugehörigkeitsgraden in Tab. 4. Berechnungsbeispiel für Smith bis C1:

$$\mathrm{M}(\text{OSmith}|\mathrm{C1})=(0,43-0,56-0,68)0,5-((1-((1-0,43)-(1-0,56)-(1-0,68)))0,5=0,40465-0,95903=0,38808$$

$$\text{Mnorm}(\text{OSmith}|\text{C1})=0,38808/2,60418=0,14902=14,9\%.$$

Weiter hat Zumstein das Beispiel der dreidimensionalen Fuzzy-Klassifikation eingeführt. Er zerlegt dabei beispielhaft die drei Attribute „Kundenattraktivität“, „Wettbewerbsposition“ und „Kundenpotenzial“, die den „Kundenwert“ auf der obersten Ebene der Hierarchie definieren [27]. Das Attribut „Kundenattraktivität“ wird zum Beispiel durch drei andere Attribute definiert: „RFM-Score“, „Gewinn“ und „Zahlungsverhalten“. Das Attribut „RFM-Score“ besteht wiederum aus den Attributen „Häufigkeit“, „Frequenz“ und „Geldwert“ der Wiederkäufe des Kunden.

Im Vergleich zu scharfen Klassifikationen müssen laut Zumstein bei Fuzzy Classifications weniger Begriffe beziehungsweise Äquivalenzklassen definiert werden, um jedes Attribut zu beschreiben [27]. Die Fuzzy Classification des Attributs „Gewinn“ benötigt dann beispielsweise nur zwei Begriffe: „niedriger Gewinn“ und „hoher Gewinn“. Bei einer scharfen Klassifizierung des Umsatzes müssen dagegen viel mehr Begriffe (Äquivalenzklassen) definiert werden: z. B. „sehr geringer“, „geringer“, „mittlerer“, „hoher“ und „sehr hoher“ (Abb. 6).

Synthese – Kombination der unterschiedlichen Methoden

In dem folgenden Abschnitt sollen die zuvor beschriebenen Methoden und Forschungsdisziplinen (Character Computing, Conversational Theory und Fuzzylogic bzw. Fuzzy Classification) geschickt miteinander verknüpft werden, sodass die Vision, welche vor allem die Forscher des Character Computing verfolgen – Computer Systeme, die sich eigenständig an das Verhalten ihrer menschlichen Gesprächspartner anpassen können – erreicht werden können.

Zunächst soll der von El Bolock et al. angesprochene Limitation, welche aufgrund fehlender Sensoren eintreffen kann, entgegengewirkt werden. Bislang erhalten die Computersysteme eine Vielzahl von Sensordaten, die Informationen über die emotionalen, kognitiven und situativen Zustände der User übermitteln sollen [13]. Diese müssen dann vom Computersystem interpretiert werden und in einem passenden Character-Modell abgebildet werden.

In dieser Arbeit werden als Computersysteme einfache Chat- und Voicebots, auch Conversational AI Systems oder Bots genannt, berücksichtigt. Die Bots haben nur in den seltensten Fällen Zugang zu Sensordaten. Im Regelfall tauschen sie lediglich Text- oder Sprachnachrichten mit dem User aus. Folglich erhalten sie von ihrem menschlichen Gegenüber nur linguistische Variablen und daraus müssen die Bots dann das User-Verhalten ableiten, um sich daraufhin anpassen zu können.

Anders ausgedrückt bedeutet dies, dass die zwei sozialen Systeme – der Mensch und die Maschine – lediglich über Konversationen im Austausch miteinander stehen und die Konversationen somit die einzige Möglichkeit sind, das Gegenüber kennen und verstehen zu lernen, um sich so auch daran anpassen zu können.

An dieser Stelle scheint die Verknüpfung zwischen Character Computing und Conversational Theory sinnvoll zu sein. Pangaro argumentiert in seinen Forschungen zur Conversational Theory, dass Konversationen nahezu die einzige Plattform bieten, in der zwei soziale Systeme – auch Computer und Menschen – sich austauschen und aneinander anpassen können. Es sollte also möglich sein, dass die Methoden der Conversational Theory die fehlenden Informationen aus Sensoren, ergänzen können und Computersysteme, gar nicht mehr wie von El Bolock et al. vorgeschlagen, eine Vielzahl an Sensordaten benötigen. Vielmehr müsste eine geschickt geleitete Konversation dem Computersystem helfen, den Character seines Gegenübers zu bestimmen und das Verhalten daraufhin anzupassen [13].

Laut Pangaro wird für eine erfolgreiche Konversation zunächst ein gemeinsamer Kontext und ein gemeinsames Interface benötigt [25]. Der gemeinsame Kontext könnte im Rahmen des Character Computing die Domäne sein, auf die sich das Modell fokussiert. Das gemeinsame Interface bildet der Chat, per Text- oder Sprachnachrichten, ab. Sobald diese beiden gegeben sind, tauschen die Konversationspartner Nachrichten bzw. Informationen aus. Mit jeder neu geteilten Nachricht lernen sich die beiden Gegenüber besser kennen, passen sich aneinander an, bauen Vertrauen auf und kommen schlussendlich zum Agreement.

Interessanterweise schreibt Pangaro immer von einem gemeinsamen Agreement, bei dem sich beide Gesprächspartner aneinander anpassen. El Bolock et al. gehen bei ihren Forschungen zum Character Computing jedoch immer nur davon aus, dass sich das Computersystem an das Verhalten des menschlichen Users anpasst [13].

Hier liegt vermutlich ein weiterer Vorteil innerhalb der Kombination von Character Computing und Conversational Theory. Neu ist es nicht mehr nur, der Computer, der sich anpassen sollte, auch der Mensch passt sich an und macht es dem Computer somit leichter sich anzupassen. Während der Konversation und dem Austausch an Informationen ist es dann nicht mehr nur der Computer, der Daten vom User sammelt, um sich anzupassen, sondern auch der User lernt den Bot sozusagen kennen und kann sein Verhalten daraufhin ebenfalls anpassen. So lernt der User beispielsweise, dass die Mehrheit der heutigen Conversational-AI-Systeme am besten kurze und einfache Sätze versteht. Der User wird folglich auch seine Ausdrucksweise an die einfache Sprache anpassen. Abgesehen davon, dass diese beidseitige Anpassung dazu führt, dass der Computer sich schneller und einfacher anpassen kann, erscheint dieses Vorgehen auch moralisch und ethisch korrekter. Das Ungleichgewicht zwischen Informationssammlung, Verarbeitung und Speicherung, welches beim klassischen Character Computing vielmals besteht, ist unter Verwendung der Conversational Theory wesentlich ausgeglichener.

Eine weitere Ergänzung zum klassischen Character Computing entsteht durch die Verwendung von Fuzzylogic und die Anwendung von Multidimensionalen Fuzzy-Klassifizierungen.

Bislang arbeiten Forscher wie El Bolock mit starren Werten. Sie versuchen also alle Charactere klar voneinander abzugrenzen und bilden starre Grenzen zwischen den einzelnen Merkmalen und den Character-Modellen [13]. In der Realität gibt es aber zwischen den einzelnen Characteren, den dazugehörigen Merkmalsausprägungen und dem erwarteten Verhalten der User vielmals Überschneidungen und die Grenzen sind eher Fuzzy. El Bolock et al. haben diese Herausforderung bereits erkannt und weisen in ihren Arbeiten daraufhin, dass die Anwendung der Fuzzylogic in Zukunft wünschenswert wäre [13].

Dank der Verwendung des von Zumstein angewendeten Fuzzy-Klassifikationsdatenbankschemas können bestehenden Modelle des Character Computing beziehungsweise die zuvor fix definierten Charactere „aufgeweicht“ werden. Anstelle von starren Grenzen zwischen den einzelnen Characteren und dem daraus erwarteten Verhalten hilft die Fuzzy-Klassifizierung Zugehörigkeitsgrade von Usern beziehungsweise deren Merkmalsausprägungen zu bestimmen und so realitätsnahe Charaktere zu bilden [27].

Zur Ableitung von Fuzzy-Klassen und Zugehörigkeiten aus scharfen Kontexten bzw. starren Character-Grenzen, werden die Attribute als linguistische Variablen betrachtet und jeder Äquivalenzklasse werden verbale Begriffe zugeordnet. Die Verwendung von linguistischen Variablen ist bereits in der Disziplin des Computing with Words and Percepetions eine gängige Anwendung. Dank der Verwendung von linguistischen Variablen, das heißt Wörtern oder Wortkombinationen, können die Äquivalenzklassen der Attribute intuitiver beschrieben werden.

Dabei stellt jeder Begriff der linguistischen Variablen eine Fuzzy-Menge dar. Jede Fuzzy-Menge wird durch eine Zugehörigkeitsfunktion (μ) über den gesamten Bereich des entsprechenden Attributs bestimmt. Ursprünglich enthalten die Attribute numerische Werte im Intervall [0,100]. Folglich sind die Zugehörigkeitsfunktionen stetige Funktionen. Neu enthalten die Attribute keine numerischen Werte, sondern allgemeine Terme. In diesem Fall sind die Terme der linguistischen Variablen „schwach“ und „stark“ mit diskreten Funktionen verbunden, das heißt jeder Term entspricht einem diskreten Wert. Mithilfe des Kontextmodells, der linguistischen Variablen und der Zugehörigkeitsfunktionen wird der Klassifikationsraum unscharf [27].

Am Ende wird das Computersystem also nicht mit starren Charakteren arbeiten, sondern eher mit „Zugehörigkeiten“. So gehören die User dann mehr oder weniger zu den bestimmten Character-Gruppen und auch deren Erwartungen sind nicht immer 100 % eindeutig, sondern gehören bestimmten Gruppen an.

Weiter merkt Zumstein an, dass im Vergleich zu scharfen Klassifikationen bei Fuzzy-Classifications weniger Begriffe beziehungsweise Äquivalenzklassen definiert, werden müssen, um jedes Attribut zu beschreiben [27]. Dies scheint auch die Entwicklung der Character-Modelle stark zu vereinfachen und die Characters näher an der Realität abzubilden.

Ausblick und Diskussion

Diese Arbeit basiert auf theoretischen Recherchen rund um die Themen des Character Computing und der Fuzzylogic. Das Ergebnis ist ein komplexes theoretisches Framework, was verschiedene Disziplinen der Psychologie und der Wirtschaftsinformatik miteinander verknüpft. Das Ziel dieser Synthese sind neuartige Chat- und Voicebots, die sowohl die Persönlichkeit und den Kontext ihrer User ableiten und spezifisch darauf eingehen können und gleichzeitig das Prinzip der Datensparsamkeit berücksichtigen.

Die Forscher beziehen ihr Wissen von gut erforschten Quellen, wie denen der Fuzzylogic und kombinieren diese mit neuen Forschungsgebieten, wie denen des Character Computing.

Die Ergebnisse dieser Arbeit sind bislang ein theoretisches Framework, was so noch nicht in der Praxis eingesetzt worden ist. Zwar sind die einzelnen Disziplinen von anderen Forschern und Praktikern in der Praxis angewendet worden, nie aber gemeinsam bzw. kombiniert in einem System.

In weiteren Studien empfiehlt es sich, die Ergebnisse dieser Arbeit in ein Artefakt zu überführen und in Form eines Praxistests die Stabilität des Systems zu überprüfen. Für ein erstes Artefakt müssten zunächst die einzelnen Ausprägen des User-Character definiert werden. Dabei empfiehlt es sich, den Use Case stark einzuschränken, sodass auch die verschiedenen Ausprägungen der Charaktere überschaubar bleiben. In einem zweiten Schritt müssen die Präferenzen dieser User ermittelt werden. Charactere und Präferenzen bilden dann die Basis für das geplante Artefakt, welches ein Chat- oder Voicebot sein kann, der sich an die Bedürfnisse seiner User anpasst. Und dies nicht nur rein inhaltlich, sondern auch hinsichtlich Tonalität und Wortwahl.

Ein weiterer Aspekt, welcher in Zukunft tiefer erforscht werden sollte, ist die Integration oder Kombination mit Large Language Models (LLM), wie ChatGPT. Der Chatbot des amerikanischen Unternehmens „OpenAI“ hat seit November 2022 immer mehr Bekanntheit erlangt [29]. Nutzer schätzen dabei vor allem die natürliche Art und Weise der Gesprächsführung [30]. Dabei basiert der Chatbot von OpenAI auf statistischen Modellen, die die Wahrscheinlichkeit für ein nächstes Wort berechnen [29]. ChatGPT stellt also weniger den User in den Mittelpunkt und versucht sich mittels Soft Computing an diesen anzunähern, vielmehr bezieht sich der Chatbot auf vergangene Daten. Forscher und Wirtschaftsanalysten wir Tomych gehen davon aus, dass LLMs wie ChatGPT in Zukunft breitere Anwendungen finden, und sie bald nicht mehr aus dem Alltag wegzudenken sind [31]. Es empfiehlt sich daher, auch die Verwendung von LLMs in dem hier vorgestellten Framework zu überlegen. Möglicherweise könnten LLMs als weitere Layer dienen, die die Conversational Systems in der Generierung der Inhalte unterstützen, während die Kombination aus Character Computing, Computing with Words and Perceptions und der Conversational Theory eher darauf abzielt, die geeignete Tonalität und das Format der Sprache zu bestimmen.

Open Access Dieser Artikel wird unter der Creative Commons Namensnennung 4.0 International Lizenz veröffentlicht, welche die Nutzung, Vervielfältigung, Bearbeitung, Verbreitung und Wiedergabe in jeglichem Medium und Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle ordnungsgemäß nennen, einen Link zur Creative Commons Lizenz beifügen und angeben, ob Änderungen vorgenommen wurden.

Die in diesem Artikel enthaltenen Bilder und sonstiges Drittmaterial unterliegen ebenfalls der genannten Creative Commons Lizenz, sofern sich aus der Abbildungslegende nichts anderes ergibt. Sofern das betreffende Material nicht unter der genannten Creative Commons Lizenz steht und die betreffende Handlung nicht nach gesetzlichen Vorschriften erlaubt ist, ist für die oben aufgeführten Weiterverwendungen des Materials die Einwilligung des jeweiligen Rechteinhabers einzuholen.

Weitere Details zur Lizenz entnehmen Sie bitte der Lizenzinformation auf http://creativecommons.org/licenses/by/4.0/deed.de.

Hinweis des Verlags

Der Verlag bleibt in Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und Institutsadressen neutral.

Vorheriger Artikel Digitaler Prozesspass

Nächster Artikel Herbert Bruderer: Meilensteine der Rechentechnik

Unsere Produktempfehlungen

Informatik-Spektrum

Hauptaufgabe dieser Zeitschrift ist die Publikation aktueller, praktisch verwertbarer Informationen über technische und wissenschaftliche Fortschritte aus allen Bereichen der Informatik und ihrer Anwendungen in Form von Übersichtsartikeln und einführenden Darstellungen sowie Berichten über Projekte und Fallstudien, die zukünftige Trends aufzeigen.

Jetzt informieren

Bittner EA, Oeste-Reiss S, Leimeister JM (2019) Where is the bot in our team? Toward a taxonomy of design option combinations for conversational agents. collaborative work. HICSS. https://doi.org/10.24251/HICSS.2019.035CrossRef

Diederich S, Brendel AB, Lichtenberg S, Kolbe LM (2019) Design for Fast Request Fulfillment or Natural Interaction? Insights from an Experiment with a Conversational Agent. Proceedings of the 27th European Conference on Information Systems (ECIS), Stockholm and Uppsala, Sweden, June 8–14

Følstad A, Skjuve M, Brandtzaeg PB (2019) Different Chatbots for Different Purposes: Towards a Typology of Chatbots to Understand Interaction Design. In: Bodrunova S, al (Hrsg) Internet Science. INSCI 2018. Lecture Notes in Computer Science, Bd. 11551. Springer, Cham https://doi.org/10.1007/978-3-030-17705-8_13CrossRef

Dale R (2016) The return of the chatbots. Nat Lang Eng 22(5):811–817CrossRef

Weizenbaum J (1966) ELIZA—a computer program for the study of natural language communication between man and machine. commun Acm 9(1):36–45CrossRef

McTear MF, Callejas Z, Griol D (2016) Conversational Interfaces: Devices, Wearables, Virtual Agents, and RobotsCrossRef

Frommert CH (2018) Using Chatbots to Assist Communication in Collaborative Networks. Springer, S 257–265

Kerly A, Hall P, Bull S (2017) Bringing chatbots into education: towards natural language negotiation of open learner models. Knowl Based Syst 20(2):177–185. https://doi.org/10.1016/j.knosys.2006.11.014CrossRef

El Bolock A (2018) Defining character computing from the perspective of computer science and psychology. In: Proceedings of the 17th international conference on mobile and ubiquitous multimedia. ACM, New York, S 567–572

10.

Picard RW (1997) Affective computing Bd. 252. MIT Press, Cambridge

11.

Allport GW, Odbert HS (1936) Trait-names: a psycho-lexical study. Psychol Monogr 47(1):11CrossRef

12.

Goldberg LR (1992) The development of markers for the big-five factor structure. Psychol Assess 4(1):26CrossRef

13.

El Bolock A, Abdelrahman Y, Abdennadher S (2020) Character ComputingCrossRef

14.

Corr PJ, Matthews G (2009) The Cambridge handbook of personality psychology. Cambridge University Press, CambridgeCrossRef

15.

Banks JA (1988) Ethnicity, class, cognitive, and motivational styles: research and teaching implications. J Negro Educ 57(4):452–466CrossRef

16.

Vinciarelli A, Mohammadi G (2014) A survey of personality computing. Ieee Trans Affect Comput 5(3):273–291CrossRef

17.

John OP, Gross JJ (2004) Healthy and unhealthy emotion regulation: personality processes, individual differences, and life span development. J Pers 72(6):1301–1334CrossRef

18.

Haselton MG, Nettle D, Murray DR (2015) The evolution of cognitive bias. In: The handbook of evolutionary psychology. Wiley, Hoboken, S 1–20

19.

Ajzen I (1991) The theory of planned behavior. Organ Behav Hum Decis Process 50(2):179–211CrossRef

20.

Gilbert DT, Hixon JG (1991) The trouble of thinking: activation and application of stereotypic beliefs. J Pers Soc Psychol 60(4):509CrossRef

21.

Klaczynski PA (2000) Motivated scientific reasoning biases, epistemological beliefs, and theory polarization: a two-process approach to adolescent cognition. Child Dev 71(5):1347–1366CrossRef

22.

Park CC (2002) Crosscultural differences in learning styles of secondary english learners. Biling Res J 26(2):443–459CrossRef

23.

Richard R, Egger Y (2011) The miniature guide to understanding the foundations of ethical reasoning. Foundation for critical thinking free press, United States

24.

Doris JM (2002) Lack of character: personality and moral behavior. Cambridge University Press, CambridgeCrossRef

25.

Pangaro P (2010) Rethinking design thinking. PICNIC Festival, Amsterdam, September

26.

Zimmermann H‑J (1992) Fuzzy Set Theory—and its Applications, 2. Aufl. Kluwer Academic Publishers, London

27.

Zumstein D (2007) Customer performance measurement—analysis of the benefit of a fuzzy classification approach in customer relationship. Management. https://doi.org/10.13140/RG.2.2.15682.58560CrossRef

28.

Werro N, Stormer H, Meier A (2006) A Hierarchical Fuzzy Classification of Online Customers. Proc. of the 8th International Conference on e‑Commerce Technology, Shanghai, China, 10.2006

29.

Open A (2022) Introducing ChatGPT. https://openai.com/blog/chatgpt. Zugegriffen: 26. Apr. 2023

30.

Hundertmark (2023) ChatGPT – Was denken die User, Kunden und Konsumenten wirklich? https://www.sophiehundertmark.com/chatgpt-was-denken-die-user-kunden-und-konsumenten-wirklich/. Zugegriffen: 26. Apr. 2023

31.

Tomych I (2023) ChatGPT For Fintech: How To Use ChatGPT In Banking. https://dashdevs.com/blog/chatgpt-for-fintech-how-to-use-chatgpt-in-banking/. Zugegriffen: 25. Apr. 2023

Titel: Fuzzy Conversational Character Computing
Für Chat- und Voicebots
verfasst von: Sophie Hundertmark
Edy Portmann
Nils Hafner
Publikationsdatum: 31.05.2023
Verlag: Springer Berlin Heidelberg
Erschienen in: Informatik Spektrum / Ausgabe 3/2023
Print ISSN: 0170-6012
Elektronische ISSN: 1432-122X
DOI: https://doi.org/10.1007/s00287-023-01538-8

Springer Professional

Fuzzy Conversational Character Computing

Für Chat- und Voicebots

Zusammenfassung

Hinweis des Verlags

Chat- und Voicebots

Character Computing

Character Computing in Abgrenzung zu anderen Disziplinen

Die Triade als Basis des Character Computing

Ziele des Character Computing

Komponenten des Character Computing

Persönlichkeitsmerkmale

Affektive Zustände und Stimmungen

Kognitive und motivationale Zustände und Überzeugungen

Soziokulturelle Einbettung

Moral

Die drei Steps des Character Computing

Zusammenfassung und wichtigste theoretische und praktische Implikationen

Herausforderungen des Character Computing

Conversational Theory

Computing with Words and Perceptions und Fuzzy Classification

Fuzzylogic und Computing with Words and Perceptions

Fuzzy Classification

Multidimensionale Fuzzy Classification

Synthese – Kombination der unterschiedlichen Methoden

Ausblick und Diskussion

Hinweis des Verlags

Unsere Produktempfehlungen

Informatik-Spektrum

Premium Partner

Springer Professional

Zusammenfassung

Hinweis des Verlags

Chat- und Voicebots

Character Computing

Character Computing in Abgrenzung zu anderen Disziplinen

Die Triade als Basis des Character Computing

Ziele des Character Computing

Komponenten des Character Computing

Persönlichkeitsmerkmale

Affektive Zustände und Stimmungen

Kognitive und motivationale Zustände und Überzeugungen

Soziokulturelle Einbettung

Moral

Die drei Steps des Character Computing

Zusammenfassung und wichtigste theoretische und praktische Implikationen

Herausforderungen des Character Computing

Conversational Theory

Computing with Words and Perceptions und Fuzzy Classification

Fuzzylogic und Computing with Words and Perceptions

Fuzzy Classification

Multidimensionale Fuzzy Classification

Synthese – Kombination der unterschiedlichen Methoden

Ausblick und Diskussion

Hinweis des Verlags

Unsere Produktempfehlungen

Informatik-Spektrum

Weitere Artikel der Ausgabe 3/2023

Strukturierte digitale Transformation von Lernen und Lehren

Verwirrende Informatik III – Beschreibungen und Beschriebenes

Herbert Bruderer: Meilensteine der Rechentechnik

Um etliche Ecken ged8

Philosophische und politische Gründe für Cybercrime

Hochleistungsrechnen und Künstliche Intelligenz

Premium Partner