Annotation von kausalen Relationen mit WebAnno -- ein Erfahrungsbericht.

Jiayin Feng

Kurzbeschreibung:
Dieses Poster berichtet über die Annotation von kausalen Relationen, die im Rahmen des Promotionsprojekts Argumentation in der Lernersprache an der Universität Hamburg durchgeführt wird. Hierbei werden schriftliche Erörterungen von L2-Lernenden mithilfe des Annotationstools WebAnno (Yimam et al. 2014) annotiert. Kausale Relationen gehören zu fundamentalen Kategorien der Diskurskohärenz und der Argumentationsstruktur. Sie können sich einzelsprachlich unterschiedlich realisieren. In diesem Zusammenhang untersucht das Promotionsprojekt kausale Relationen in Texten von chinesischen Deutschlernenden (L2.Texte) und von deutschen bzw. chinesischen Muttersprachlern (L1-Texte). Die deutschen Texte sind Teil des Lernerkorpus Kobalt (Zinsmeister et al. 2012). Die chinesischen Texte wurden im Rahmen des Promotionsprojekts analog erhoben. Ziel ist es, den Ausdruck kausaler Relationen in L1-und L2-Texten systematisch zu beschreiben und Transfereffekte zu analysieren.
Um dies zu erreichen, spielt die Annotation eine bedeutende Rolle. WebAnno stellt bestimmte Tagsets zur Verfügung (STTS, Tiger...). Für die Annotation von kausalen Relationen wurde ein neues Tagset definiert (causal markers, causal relations...). Das neue Tagset und seine Annotationsrichtlinien lehnen sich an die Penn Discourse Treebank 2.0 (2007) an. Die Annotation wird zyklisch durchgeführt, so dass während der Annotation das Tagset und die Richtlinien iterativ modifiziert werden, um kausale Relationen besser verstehen und markieren zu können. Der Posterbeitrag fasst den Prozess der manuellen Annotation mit der Standalone-Version von WebAnno auf dem Hintergrund von Evaluationskriterien für sprachverarbeitende Software zusammen (vgl. EAGLES (1996), basierend auf dem allgemeinen Qualitätsmodell für Software ISO 9126).

Literatur

EAGLES (1996)
IEvaluation of natural language processing systems. Final report. EAGLES
DOCUMENT EAG-EWG-PR.2.
The PDTB Research Group. 2007.
The Penn Discourse Treebank 2.0 Annotation Manual.
Yimam, S.M., Eckart de Castilho, R., Gurevych, I., und Biemann C. 2014.
Automatic Annotation Suggestions and Custom Annotation Layers in WebAnno, in: Proceedings of ACL-2014, demo session, Baltimore, MD, USA.
Zinsmeister, H., Reznicek, M., Brede, J.R., Rosén, C. und Skiba, D. 2012.
Das Wissenschaftliche Netzwerk “Kobalt-DaF”: Korpusbasierte Analyse von Lernertexten für Deutsch als Fremdsprache, in: Zeitschrift für Germanistische Linguistik (ZGL) 40, 457–458.