Zum Inhalt springen
unterstützt von

Kilian Evang
Kollaborativ und tiefensemantisch annotieren: die Groningen Meaning Bank

Vortragsfolien

online auf prezi.com

Abstract

Die Groningen Meaning Bank ist ein im Aufbau begriffenes, freies Textkorpus des Englischen mit formaler tiefensemantischer Annotation gemäß der Discourse Representation Theory. Ihr Ziel ist es, die Computersemantik für den Einsatz statistischer Methoden zu öffnen, die große annotierte Korpora benötigen, ähnlich wie Baumbanken für statistische Parser. Da rein manuelle Annotation sehr aufwändig wäre, versuchen wir, die Stärken von Menschen (Linguist/inn/en und Laien) und Maschinen (Tokenizer, POS-Tagger, NE-Tagger, Parser, "Boxer") möglichst geschickt miteinander zu kombinieren. Wir lassen Annotationen von Maschinen produzieren und von Menschen korrigieren, und zwar öffentlich über ein web-basiertes, wiki-artiges Interface für Linguist/inn/en sowie über ein "Game with a Purpose" ähnlich Phrase Detectives. Korrekturen werden nicht nur einmal vorgenommen, sondern in Form von "Bits of Wisdom" gespeichert, die im Gegensatz zu schlichten Änderungen zukünftige Änderungen auf tieferen Annotationsebenen überleben. In diesem Vortrag will ich erklären, wie das funktioniert, und in die Benutzung des wiki-artigen Interface einführen - in der Hoffnung, dass einige der Zuhörer/innen selbst anfangen mitzuannotieren!