Automatically Creating a Lexicon of Verbal Polarity Shifters: Mono- and Cross-lingual Methods for German

Publikation
In Proceedings of the 27th International Conference on Computational Linguistics (COLING 2018).

Zusammenfassung

In dieser Arbeit untersuchen wir Methoden zur Erstellung eines deutschsprachigen Lexikons polaritätsverschiebender Verben. Diese Verben, die vielfach auch Polaritätsshifter genannt werden, sind Inhaltswörter, die die Polarität einer Phrase zu ihrem entgegengesetzten Wert verschieben, wie z.B. das Verb „aufgeben“ in der Verbalphrase „alle Hoffnung aufgeben“. Das Verhalten von Polaritätsshiftern ähnelt somit dem von Negationswörtern wie „nicht“. Für robuste Sentimentanalyse werden sowohl Negationswörter als auch Polaritätsshifter benötigt. Während Listen von Negationswörtern in vielen Sprachen verfügbar sind, existiert jedoch ein Polaritätsshifter-Lexikon hinreichender Größe nur für das Englische.

Jene Ressource wurde mittels Bootstrapping erzeugt, indem ein überwachter Klassifikator auf einer kleinen Stichprobe von Verben trainiert wurde. Dieser Klassifikator nutzt Daten- und Ressourcen-getriebene Merkmale. Wir reproduzieren diesen Ansatz und passen ihn soweit notwendig für das Deutsche an. Somit weisen wir die Übertragbarkeit dieses Ansatzes auf andere Sprachen nach. Wir verbessern die Qualität der Klassifikation zudem weiterhin, indem wir Informationen aus dem existierenden englischen Polaritätsshifter-Lexikon nutzten. Mittels dieses verbesserten Ansatzes finden wir per Bootstrapping eine große Anzahl deutscher Polaritätsshifter und verringern somit deutlich den manuellen Annotationsaufwand. Das resultierende deutsche Lexikon polaritätsverschiebender Verben ist frei verfügbar.

Avatar
Marc Schulder
Wissenschaftlicher Mitarbeiter für Computerlinguistik

Meine Forschungsinteressen umfassen Computerlinguistik, Gebärdensprachen und Sentimentanalyse.