Was ist eigentlich… Sentimentanalyse

Ohne Titel

Sentimentdetermination oder – analyse ist die automatische Auswertung von Texten mit dem Ziel, eine in diesem Text geäußerte Haltung als positiv oder negativ zu erkennen.

Die besondere Herausforderung dabei ist es, dass Informationen, die über (menschliche) Sprache übermittelt werden, weder eindeutig sind noch eine bestimmte, immer wiederkehrende Struktur aufweisen. Bemühungen, bei der maschinellen Analyse von einem umfassenderen Verständnis eines Textes auszugehen, können als gescheitert betrachtet werden. In der Computerlinguistik hat man deshalb einerseits Methoden entwickelt, die Texte analysieren ohne sie zu verstehen, und andererseits “nur noch” spezielles Wissen in ihm aufspüren oder die Haltung (“Sentiment”) des Autors oder der Autorin herausfinden.

Im Zentrum dieser Bemühungen stehen statistische Analysen. Mit ihrer Hilfe wird ein Text nach Begriffen durchsucht, die mit einer Sammlung von Worten, deren positive oder negative Tendenz bekannt ist, abgeglichen werden. Der so genannte Sentiment-Wortschatz umfasst mehrere tausend Worte unterschiedlicher Art, denen jeweils ein Wert zwischen 1 (positiv) und -1 (negativ) zugeordnet wurde. Die Häufigkeiten positiv und negativ bewerteter Begriffe in einem analysierten Text werden einander gegenübergestellt und geben Auskunft über die vermutete Haltung (“Sentiment”) des Autors oder der Autorin.

Burkhard Heinz

mediatpress®