Was ist Sentimentanalyse und warum ist sie wichtig?

Leftshift OneLesezeit: 12 Minuten

Die Fülle an Meinungen und Bewertungen im Web übersteigt unsere Aufnahmefähigkeit bei weitem. Eine Sentimentanalyse hilft dabei, diese Flut sinnorientiert aufzuarbeiten.

Meinungen im Web

Das Internet bietet großes Potential für Daten und Fakten. Trotzdem suchen wir als Internet-User lieber nach subjektiven Meinungen statt Hard Facts. Mittlerweile ist jedem klar, dassKundenbewertungen einer der wichtigsten Kaufimpulse überhaupt sind. Aber auch in der Politik oder Social Media suchen viele nach subjektive Meinungen oder veröffentlichen selbst eine solche zu einem Thema. Mittels Sentiment Analysis lesen wir aus einer wahren Flut derartiger Beiträge einen möglichen Konsens aus oder bringen wenigstens Ordnung in das Meinungschaos.

Vielseitige Anwendungsmöglichkeiten

Sentimentanalyse ist breit gefächert. Sie steht grundsätzlich vor der Herausforderung, welche subjektiven Meinungen und Emotionen aus Text herausgelesen werden können. Durch die riesige Menge an Daten durch Social Media, Online-Shops mit Reviews usw. wird das Thema immer wichtiger. Wir können durch Sentimentanalyse an verschiedenen Aufgaben arbeiten:
  • Die häufigsten Meinungen einer speziellen Demografik zu einem speziellen Thema zusammenfassen – beispielsweise basierend auf Social Media. Aber auch in Online-Marketplaces, kann es hilfreich sein, zusätzlich zu Reviews die häufigsten Meinungen zu einem Produkt zu analysieren und für Konsumenten geordnet aufzubereiten.
  • Emotionen erkennen: Verschiedene Emotionen aus Texten zu erkennen, kann in speziellen Fällen interessant sein.
  • Polarität erkennen: Ein grundlegendes Konzept in Sentiment Analysis ist Polarität. Sie wird in positiv, negativ und neutral unterteilt. Anwendungsgebiete sind Brand Monitoring und Customer Service.
UCLA-Studentin Joy Gracia Harjanto wertete im Juli 2018 Elon Musks Twitter-Konversationen aus und machte dabei die Potentiale von Sentimentanalyse deutlich. Sie fasste ihr Experiment in einemPost auf “towardsdatascience.com” zusammen.

Mit Polarität und Aktivität zur Emotion

Um Emotionen in Text leichter zu verstehen, können wir auf zwei Maßstäbe zurückgreifen: Polarität und Aktivität. Polarität beschreibt wie bereits zuvor erwähnt, wie positiv oder negativ eine Meinung ist. Wichtig ist, dass es dabei um die empfundene Positivität des Schreibers und nicht des Lesers geht. Wenn zum Beispiel ein Fußball-Fan seine Freude über ein gewonnenes Match seiner Mannschaft auf Twitter zum Ausdruck bringt, kann das bei Anhängern anderer Teams für Kopfschütteln sorgen, ist aber rein aufgrund der Wortwahl des Fans immer noch positives Sentiment.Aktivität wird mit der “Energie” des Textes in Verbindung gebracht. Das kann sowohl ein sehr stark ausgedrückte negative als auch positive Meinung sein.Mit dieser Terminologie können wir jetzt ein vereinfachtes Modell von Emotionen vorstellen: das “Circumplex Model of Affect”.
Circumplex model of emotion
In diesem Modell werden Emotionen auf einem zweidimensionalen Kreis dargestellt, und können über nur zwei Achsen bestimmt werden:
  • Negativ <-> Positiv (Polarity) und
  • Low Arousal <-> High Arousal (Activity)
Das Modell kann nicht alle Emotionen perfekt abbilden. Es gibt auf diesem Kreis zum Beispiel keinen Platz für Überraschung. Allerdings sind sich Psychologen immer noch nicht einig, ob Überraschung überhaupt eine Basis-Emotion ist. Eine interessante praktische Anwendung dieses Modells stammt von der NC State University. Dort wurde eine Web-App entwickelt, die Tweets zu Keywords lädt und auf dieses Modell plottet.
Anscheinend wird Österreich auf Twitter größtenteils positiv erwähnt.

Ist Polarität wichtiger als Aktivität

Wir können also theoretisch, wenn wir über die Polarität und Aktivität einer Aussage oder eines Textes Bescheid wissen, auf die dahinter liegende Emotion schlussfolgern. Sofern man nicht gerade eine Website zur Visualisierung von Emotionen baut, ist das aber in den meisten Fällen nicht zielführend. Ziehen wir dazu nur zwei von vielen möglichen Beispielen heran, in denen Firmen Sentimentanalyse verwenden könnten:
  • Brand Management -> Eine Firma möchte frühzeitig erkennen, wenn Kunden über Social Media schlecht über die Firma oder Produkte sprechen
  • Customer Service -> Eine Firma möchte Kunden, deren Stimmung schlecht zu sein scheint, schnelleren Service bieten, um sie nicht mehr zu verärgern.
In beiden Fällen ist die Aktivität der Texte/Aussagen unbedeutend, und es ist das Ziel, negative Polarität zu detektieren. In der Praxis ist bei der Analyse von Text eine Positiv-Negativ-Skala meist interessanter und besser zu verarbeiten als eine Aktiv-Inaktiv-Skala. Trotzdem sollte man die Möglichkeit, die Aktivität festzustellen, für Spezialfälle im Hinterkopf behalten. Auch die Möglichkeit, von Aktivität und Polarität auf Emotion zu schließen, kann manchmal nützlich sein.

Probleme mit Sentiment Analysis

Obwohl Sentimentanalyse ein bereits sehr gut erforschtes Feld ist, gibt es immer noch einige Probleme, die es zu lösen gilt.

Setzen wir die Technologie richtig ein?

Bevor wir uns den technischen Problemen widmen, wollen wir erwähnen, dass die größten Probleme mit einer Technologie wie Sentimentanalyse oft der konkrete Einsatz ist. Wenn wir zum Beispiel die Meinungen vieler Reviews mit Opinion Mining zusammenfassen, gibt es bereits viele kritische Fragen, welche die Technologie alleine nicht unbedingt lösen kann:
  • Wie stellen wir klar, dass der Benutzer versteht, dass es sich um Meinungen und nicht um Fakten handelt?
  • Wie sorgen wir dafür, dass die Analyse nicht manipuliert werden kann?
  • Wie zeigen wir Benutzern, was sie sehen wollen – nämlich echte Meinungen anderer?
  • Können wir eine einfache Skala von “Sehr Negativ” bis “Sehr Positiv” anders gestalten oder verbessern?
Diese sind natürlich nur einige der vielen Fragen, die man sich beim Einsatz von Opinion Mining stellen kann. Diese Fragen haben je nach Anwendungsfall unterschiedliche Antworten. Wir wollen nur darauf hinweisen, dass es wichtig ist, sich diese zu stellen und sich nicht nur auf die technischen Details von Sentiment Analysis zu versteifen.

Technische Schwierigkeiten

Natürlich gibt es aber auch noch technische Eigenheiten bei der Sentimentanalyse, die von Interesse sind.Polaritys ShiftWenn sich die Polarität eines Textblocks mitten in diesem ändert, kann das zu Schwierigkeiten bei der Analyse führen. Eine Review wie “Eigentlich ganz gut, aber nicht so ganz meins” kann nicht leicht klassifiziert werden. Es gibt bereits Machine-Learning-Modelle, welche eineeigene Phase zum Erkennen solcher Shifts einsetzen, um die Genauigkeit des Ergebnisses zu verbessern.Cross-DomainDie meisten Machine-Learning-Methoden lernen Dinge, die sie nicht lernen sollten, wenn sie auf einen speziellen Datensatz trainiert werden. Wenn zum Beispiel auf Film-Reviews hin trainiert wird, könnte ein Machine-Learning-Modell lernen, das Wort “dramatisch” mit positivem Sentiment zu assoziieren. In anderen Domänen (deswegen Cross-Domain), könnte “dramatisch” aber mit negativen Emotionen verbunden werden. Bereits unterschiedliche Medien (zum Beispiel: Tweets vs. Reviews) können zu schlechterer Performance führen. Wegen solcher Fälle ist es eine besondere Herausforderung, Sentimentanalyse allgemein und Domänen-übergreifend einsetzbar zu machen.SarkasmusEs ist offensichtlich, dass Sarkasmus für Sentimentanalyse schwer zu erkennen ist. Sogar wir Menschen haben Schwierigkeiten dabei. Deswegen ist es umso schwerer, Sarkasmus und Ironie bei Opinion Mining zu berücksichtigen. Vielversprechende Ansätze greifen auf mehr Kontext um den kritischen Text zurück. Es wird aber nie möglich sein, Sarkasmus in jedem Fall zu erkennen. Manchmal wird einfach mehr Kontext benötigt, oder der Text ist so subtil, dass viele Menschen ihn nicht als sarkastisch einstufen könnten und so dasselbe für einen Algorithmus ebenfalls nicht erreichbar ist.

Praxis: Beliebte Ansätze zur Sentimentanalyse

In diesem letzten Teil möchten wir zeigen, wie Sentiment Analysis in der Praxis funktionieren kann.

Lexical

Der sogenannte Lexical-Ansatz geht davon aus, dass gewisse Wörter bereits auf eine spezielle Polarität hindeuten. Zum Beispiel wird das Wort “gut” hauptsätzlich in positivem Kontext verwendet, während “schlecht” in negativen Sätzen zum Einsatz kommt. Natürlich bringt dieser Ansatz aber wieder Probleme mit sich, wie etwa bei Negierungen (“nicht gut”).

Bag of Words und Statistische Analyse

Ein sehr populärer Ansatz in der Sentimentanalyse ist der “Bag of Words”-Ansatz. Jeder Satz oder Textblock wird als ein Vektor mit allen möglichen Wortkombination im Vokabular des Korpus dargestellt. Eines geht dabei verloren: die Reihenfolge der Wörter. Diese Methode bringt den großen Vorteil mit sich, dass die Vektoren nun sehr einfach als Input für verschiedenste Machine-Learning-Modelle verwendet werden können, wie zum Beispiel Support Vector Machines.

Weitere Schritte

Abseits dieser beiden Methoden gibt es viele Möglichkeiten, Sentimentanalyse zu verbessern – andere Machine-Learning-Modelle (wie etwa CNNs), Stemming im Preprocessing,Word Embeddings – die Liste ist lang.Dieser Artikel ist dafür gedacht, einen grundsätzlichen Überblick über Opinion Mining und Sentimentanalyse zu geben. Er ist Teil einer Serie zum Thema:Opinion Mining & Sentimentanalyse: Ein Überblick
  • Sentimentanalyse im deutschsprachigen Raum (erscheint in Kürze)
  • Sentimentanalyse in der Praxis: Preprocessing (erscheint in Kürze)
  • Sentimentanalyse in der Praxis: Machine Learning (erscheint in Kürze)
#machine-learning

Ähnliche Artikel

INNOVATION

Conversational UI: Das User Interface der Zukunft

INNOVATION

Speech2Text - Outsourcing vs Custom-Model

INNOVATION

DSGVO 2018 - Umsetzung eines IT Start-Ups

Das könnte Sie auch interessieren: