Artikel Sentimentanalyse       txt-soft.com - freeware

M. Buelow 01.09.2023

Wörter sind im rein formalen Zusammenhang zu einem festen Ausmaß mit positiven oder negativen Stimmungen verbunden. Dies ist die positive oder negative Konnotation eines Wortes. Wurde für einen Text festgestellt, welche Worte wie oft Subjekte und welche Worte wie oft Objekte im Satzbau sind, kommt dies der Konnotation des Wortes nahe. Subjekte sind positiver konnotiert und Objekte negativer. Die Konnotation kann also durch eine solche Auszählung, Anzahl Vorkommen als Subjekt minus Anzahl Vorkommen als Objekt, berechnet werden. Je größer dieser Wert im Positiven ist, desto besser die Stimmung für das Wort, ein negativer Wert ist eine negative Stimmung, je deutlicher desto größer der Betrag. Allgemein ist es so, dass ein sprachlicher Gegensatz immer aus einem positiven und einem negativen Begriff besteht. Hier wird allerdings nicht jeder Gegensatz zugrunde gelegt, sondern nur der inhaltliche Unterschied zwischen Subjekt und Objekt. In einer Rede etwa hat das Subjekt den positiven Ethos (Wer spricht da?) und Pathos (Wie wird vorgetragen?), es bewirkt das Pragma (Was wird vorgetragen?). Das Objekt hingegen bildet nur den gegenteiligen Bezugspunkt, der typischerweise nicht aktiv ist. Die gefundene Stimmung für ein Wort ist streng genommen nur eine spezielle, auf den Unterschied zwischen Subjekt und Objekt beruhend, die Subjekt-Objekt-Stimmung sozusagen. Sie erzegut passable Ergebnisse für die allgemeine Konnotation von Worten. Dabei wird auf den Satzbau, also auf den wirklichen Inhalt von Subjekt und Objekt, abgestellt.

Sentimentanalyse aus ungekennzeichneten Daten kann ohne Vorbereitung für beliebige Sprachen die Stimmung erkennen, die mit den Worten verbunden sind. Beim obigen Ansatz ist es nicht nötig, einen Übungsdatensatz mit Lösungen zu erstellen, um etwa ein neuronales Netz zu trainieren. Die Stimmung wird nicht überwacht, autommatisch aus einen Originaltext gelernt. Jeder Text wird als Grundlage für die den eigenen Worten zugeordnete Stimmung verwendet. Dabei handelt es sich um die Stimmung, die im Text erzeugt wird. Speichert man darüber hinaus die positive oder negative Konnotation als Durchschnitt über mehrere Texte für die einzelnen Worte in einer Datenbank, gibt die Differenz zum aktuellen Text die Stimmungstendenz an. Es ist die Gesamtaussage des aktuellen Textes hinsichtlich einer Stimmungsverschiebung im Vergleich zur Norm der einzelnen Wörter.

Die Open-Source-Anwendung mbFXWords nutzt OpenNLP zur Zerlegung eines Textes in Sätze und die Bestimmung von Subjekt, Prädikat und Objekt jedes Satzes oder Nebensatzes. Im Wesentlichen macht sich die Anwendung zu Nutze, das Subjekt, Pädikat und Objekt eben in dieser Reihenfolge (S-P-O) in einem Satz vorkommen: Klasse OpenNLP.java: Ganz am Ende des Listings wird zwischen Subjekt, Prädikat und Objekt unterschieden. Die Freeware-Anwendung ShelfClauses zählt zusätzlich das Vorkommen jedes Wortes als Subjekt minus denen als Objekt aus und bestimmt so die Stimmung. Es ist die rote (negative Stimmung) oder gelbe (positive Stimmung) Hinterlegung der Wörter in der ShelfClauses Worttabelle. Je dunkler die rote Farbe oder je heller die gelbe Farbe, desto ausgeprägter ist die Stimmung.

zur Hauptseite

 oder über die