CLARIN-D für Computerlinguistik und Angewandte Sprachwissenschaft

CLARIN-D unterstützt die computerlinguistische Forschung durch die Bereitstellung von Services zum Auffinden von Sprachdaten, zur computegrestützten Analyse von natürlichsprachigem Text und zur langfristigen Verfügbarmachung und Bereitstellung von Korpora und Forschungsergebnissen. Zur Unterstützung der Computerlinguistik durch die digitale Forschungsinfrastruktur vernetzen sich Forschende in der F6 »Angewandte Sprachwissenschaft, Computerlinguistik« des CLARIN-D-Projekts.

 

Daten für die Forschung

Über das Virtual Language Observatory (VLO) haben Computerlinguist_innen Zugriff auf eine Vielzahl von Ressourcen für ihre Forschung, zum Beispiel annotierte Tree-Bank Korpora in deutscher Sprache.

Über eine spezielle Volltextsuche, die Federated Content Search (FCS) von CLARIN-D, sind viele in der CLARIN-Gemeinschaft verfügbaren Ressourcen im Volltext durchsuchbar, etwa um Beispiele für die Verwendung bestimmter Begriffe zu finden. Gefundene Belegstellen und die zugehörigen Dokumente können für weitere Analysen als Textkorpus heruntergeladen werden.

→ Mehr zum Thema "Auffinden"

 

Softwarewerkzeuge für Forschungsprojekte

CLARIN-D stellt viele Programme und Webservices zur Analyse und Aufbereitung von Sprachdaten bereit. Darunter beispielsweise WebAnno zur manuellen und halb-automatischen Annotation von Texten oder WebLicht zur automatischen Annotation von Texten mit unterschiedlichen Werkzeugen, die ganz nach Bedarf und Vorliebe miteinander kombiniert werden können.

→ Mehr zum Thema "Auswerten"

 

Eigene Forschungsdaten bereitstellen

Neben Tools zur Analyse von Sprachdaten erlaubt das CLARIN-Netzwerk, eigene Daten nachhaltig zu archivieren und der Fachgemeinschaft zur Weiternutzung verfügbar zu machen. In Kooperation mit einem CLARIN-Zentrum kann man seine Daten so aufbereiten, dass sie gut beschrieben sind. Ein Werkzeug zur Beschreibung von Daten ist etwa der CMDI-Maker zur einfachen Erzeugung von Beschreibungen, durch die Ihre eigenen Daten und Forschungsergebnisse der Fachcommunity leicht zugänglich machen können.

Haben Sie Interesse Ihre Daten in der CLARIN-D-Infrastruktur unterzubringen? Setzen Sie sich mit dem zuständigen Zentrum in Verbindung oder wenden Sie sich an den CLARIN-D-Helpdesk.

→ Mehr zum Thema "Aufbereiten und Aufbewahren"

 

AnsprechpartnerInnen aus der Fachgemeinschaft

Innerhalb von CLARIN-D sind die Arbeitsgebiete in Facharbeitsgruppen (F) organisiert. Die F6 "Angewandte Sprachwissenschaft, Computerlinguistik" stellt sich als Aufgabe, Ressourcen und Werkzeuge zu identifizieren, die in der webbasierten E-Science-Architektur von CLARIN-D zur automatischer Sprachverarbeitung in den Digital Humanities bereitgestellt werden sollen. Die Facharbeitsgruppe

  • entwickelt Kriterien für die Aufnahme von Ressourcen in die Servicearchitektur von CLARIN-D
  • erarbeitet einen Integrationsplan für die Einbindung von Ressourcen und Werkzeugen durch die CLARIN-D-Zentren
  • identifiziert Lücken im Ressourcenbestand für die deutsche Sprache und
  • definiert und begleitet entsprechende Kurationsprojekte

Dabei sollen notwendige "Arbeitsabläufe" für automatische Sprachverarbeitung in den Digital Humanities identifiziert und berücksichtigt werden, die von vollautomatischer Verarbeitung bis zu selektiver Annotation mit Annotationskontrolle reichen können. Die F-AG stellt in diesem Sinne ein wichtiges Bindeglied zwischen Anwendern in den Digital Humanities und der zielgerichteten Weiterentwicklung flexibler Werkzeuge in der Computerlinguistik-Gemeinde dar.

Die Facharbeitsgruppe sichert im Rahmen von CLARIN-D die Kommunikation mit FachwissenschaftlerInnen aus den Bereichen Angewandte Sprachwissenschaft, Sprachlernforschung und Computerlinguistik. Dies wird verstärkt durch die Einbindung von Vertretenden fachwissenschaftlicher Organisationen. Auch über die Kernaktivitäten der Facharbeitsgruppe hinaus sollen Anregungen der F6 zur gemeinschaftlichen Entwicklung von Ressourcen für das Deutsche in die Fachgemeinschaften hineingetragen werden.

 

Zugeordnetes CLARIN-D-Zentrum

  • Universität Tübingen: Prof. Dr. Erhard Hinrich, Dr. Daniel de Kok

 

Mitglieder

  • Prof. Dr. Michael Beißwenger, Universität Duisburg-Essen
  • Prof. Dr. Beatrix Busse, Universität Heidelberg
  • Prof. Dr. Stefanie Dipper, Ruhr-Universität Bochum
  • Prof. Dr. Stefan Evert, Universität Erlangen
  • Jun-Prof. Dr. Chris Biemann, Technische Universität Darmstadt
  • Prof. Dr. Iryna Gurevych, Technische Universität Darmstadt
  • Prof. Dr. Christiane Fellbaum, Princeton University
  • Prof. Dr. Uli Heid, Universität Hildesheim
  • Prof. Dr. Anke Lüdeling, Humboldt-Universität Berlin
  • Prof. Dr. Sebastian Padó, Universität Stuttgart
  • Dr. Nils Reiter, Universität Stuttgart
  • PD Dr. Sabine Schulte im Walde, Universität Stuttgart
  • Prof. Dr. Stefan Schierholz, Universität Erlangen
  • Dr. Caroline Sporleder, Universität Göttingen
  • Prof. Dr. Manfred Stede, Universität Potsdam
  • Prof. Dr. Angelika Storrer, Universität Mannheim
  • Dr. Yannick Versley, Universität Heidelberg
  • Dr. Andrea Zielinski, Fraunhofer-Institut für Optronik, Systemtechnik und Bildauswertung (IOSB), Karlsruhe
  • Prof. Dr. Heike Zinsmeister, Universität Hamburg
  • Dr. Andreas Witt, IDS Mannheim
  • Prof. Dr. Philipp Cimiano, Universität Bielefeld
  • Prof. Dr. Beatrix Busse, Univesität Heidelberg

 

Vorsitz und Kontakt

  • Prof. Dr. Erhard Hinrichs, Universität Tübingen
  • Dr. Thorsten Trippel, Universität Tübingen

 

Ressourcen von der Fachgemeinschaft für die Fachgemeinschaft

Im Rahmen der Implementierungsphase von CLARIN-D wurden von den Facharbeitsgruppen wichtige Ressourcen und Werkzeuge identifiziert, weiterentwickelt und für die Fachgemeinschaft verfügbar gemacht. Diese kleinen Projekte werden in CLARIN-D als Kurationsprojekte bezeichnet.

 

Kurationsprojekte