Korpus-basierte Studierenden-Projekte zur internetbasierten Kommunikation an der Universität Mannheim

Johannes Götz, Laura Herzberg, Tassja Weber, Universität Mannheim

Das Poster illustriert den Einsatz von CLARIN-D-Sprachressourcen in der Hochschullehre. Projekt- und Abschlussarbeiten im Master-Studiengang Sprache und Kommunikation an der Universität Mannheim untersuchten die Verbreitung und die Verwendungsweisen typischer Einheiten der internetbasierten Kommunikation, z.B. Smileys, Inflektive (seufz, grübel), Responsive und Interjektionen. Datengrundlage waren die IDS-Korpora zu Diskussionen in der deutschen Wikipedia (Wiki-D), zu den Wikipedia-Artikelseiten (Wiki-A) sowie das DWDS Kernkorpus (DWDS-KK). Betreut wurden die Arbeiten am Lehrstuhl für Germanisti- sche Linguistik der Universität Mannheim (Angelika Storrer, Tassja Weber) und am Institut für deutsche Sprache (IDS) (Thomas Spranz-Fogasy, Harald Lüngen).

Die Studierenden-Projekte nutzen Werkzeuge und Verfahren aus dem BMBF-Verbundprojekt Korpus-basierte linguistische Recherche und Analyse mit Hilfe von Data-Mining (KobRA). In diesem Projekt wurden Data-Mining-Verfahren zur Verbesserung der empirischen linguisti- schen Arbeit mit strukturierten Sprachressourcen entwickelt und an Fallstudien evaluiert. Durch ein Plug-in können Daten aus CLARIN-D-Ressourcen in die Data-Mining-Umgebung RapidMiner eingelesen und mit den dort verfügbaren Methoden ausgewertet werden. Um die Nutzung dieser Methoden auch in Studiengängen ohne computerlinguistische Ausrichtung zu erleichtern, wurden häufig benötigte Prozessketten und Abläufe zum Filtern, Klassifizieren und Disambiguieren von Datensätzen als vorgefertigte Templates angeboten. Die Konfigura- tion der Templates und die Benutzung der Umgebung sind in einem Handbuch beschrieben, das mit Studierenden konzipiert und getestet wurde. Das Handbuch und weitere Informationen zum KobRA-Projekt finden sich auf der Projektwebsite. Das Poster wird von den Studierenden präsentiert.

Korpusquellen:

DWDS-KK: Kernkorpus des Projekts DWDS (Digitales Wörterbuch der deutschen Sprache). Berlin- Brandenburgische Akademie der Wissenschaften. http://www.dwds.de/ressourcen/kernkorpus/ (22.04.2016).

Wiki-A/Wiki-D: Artikel- und Diskussionsseiten der deutschsprachigen Wikipedia. IDS Mannheim. http://corpora.ids-mannheim.de/pub/wikipedia-deutsch/2015/ (22.04.2016).