Vom Korpus zum Netz: Zum Zusammenhang zwischen digitalen Forschungsinfrastrukturen und wissenschaftlichem Forstschritt am Beispiel der Sprachwissenschaften – 1990 – 2016

Christian Mair, Freiburg

Am Beispiel der Linguistik demonstriert der Vortrag die umfassende Digitalisierung des wissenschaftlichen Arbeitens während der letzten 25 Jahre. Am Anfang des untersuchten Zeitraums (ca. 1990) spielten digitale Daten und Methoden im Wesentlichen in der technisch orientierten Computerlinguistik und der deskriptiv-philologisch arbeitenden Korpuslinguistik eine Rolle – zwei jeweils in sich sehr kohärente Gemeinschaften, die anfangs zahlenmäßig klein, in Bezug auf den mainstream in der Linguistik marginal waren und – trotz des verbindenden Interesses an Sprache und Informationstechnologie – zunehmend auch den engen Bezug zueinander verloren.

25 Jahre später sind digitale Daten und Tools in Forschung und Lehre umfassend im Einsatz, gerade auch in denjenigen Teilbereichen des Faches, die sich nicht primär in der Computerlinguistik und Korpuslinguistik verorten. In den geistes- und sozialwissenschaftlichen Nachbardisziplinen der Linguistik (Literaturwissenchaft, Geschichte, etc.) wird zum Teil mit denselben digitalen Texten und Daten gearbeitet wie in der Linguistik selbst, wodurch sich faszinierende interdisziplinäre Bezüge eröffnen. In anderen Worten: Die Linguistik ist in den Digital Humanities angekommen, und die digitalen Sprachwissenchaften müssen und werden einen entscheidenden Beitrag für die Entwicklung der Forschungsagenda der Digital Humanities leisten. Dabei verlieren einzelne Forscherinnen und Forscher zunehmend den Überblick über die gesamte zur Verfügung stehende Palette der Möglichkeiten und haben immer weniger direkten Einfluss auf die Entwicklung neuer Ressourcen. Die digitalen Forschungsinfrastrukturen werden besser, aber auch aufwendiger und komplexer in Gebrauch und Wartung sowie teurer.

Die Herausforderungen, die mit dieser Situation verbunden sind, lassen sich in die folgenden beiden Fragen bündeln:

  1. Wie verhalten sich technische und konzeptuell-theoretische Innovation in Bezug auf wissenschaftlichen Fortschritt?
  2. (2)Was ist die „richtige“ Position für CLARIN-D in der nun kommenden Nutzungsphase im Spannungsfeld zwischen öffentlich geförderter Infrastrukturentwicklung (auf nationaler und EU-Ebene), privatwirtschaftlichen Akteuren und informell, aber international kooperierenden Verbünden von Einzelforschern?

Diese Fragen werden im Vortrag zur Diskussion gestellt. Ansätze für eine Antwort ergeben sich aus den Erfahrungen mit dem Kurationsprojekt „CLARIN-Integration des Old Bailey Corpus“ (Magnus Huber, Giessen), das im Rahmen der CLARIN-D F-AG 2 „Andere Philologien“ durchgeführt wurde.