INEL ­  Eine Infrastruktur zur Dokumentation indigener nordeurasischer Sprachen

Alexandre Arkhipov, Hanna Hedeland, Timm Lehmberg, Universität Hamburg

Gegenstand des Beitrages sind die Arbeiten zu Beginn des Langzeitprojektes INEL. Dabei handelt es sich um ein auf auf 18 Jahre angelegtes Langzeitvorhaben im Rahmen des Akademieprogramms der Bundesrepublik Deutschland und der Freien Universität Hamburg, dessen Laufzeit im Januar 2016 begonnen hat. Das Projekt wurde von Prof. Dr. Beata Wagner-Nagy (UHH, Institut für Finnougristik/Uralistik, Hauptantragstellerin) sowie von Dr. Michael Rießler (Skandinavisches Seminar Albert-Ludwigs-Universität Freiburg) und der Geschäftsführung des Hamburger Zentrums für Sprachkorpora (Hanna Hedeland und Timm Lehmberg) beantragt.

Ziel des Projektes ist es, die dringend erforderliche Erschließung der sprachlichen Ressourcen des genealogisch diversen nordeurasischen Sprachraums zu leisten. Durch den Einsatz nachhaltiger Methoden, Werkzeuge und Standards der linguistischen Datenaufbereitung, die bisher nur für gut erforschte Sprachen und Varietäten zum Einsatz kamen, wird dabei eine Lücke in diesen für die empirische Sprachwissenschaft bisher schlecht zugänglichen Arealen der Welt dauerhaft geschlossen. Jenseits seiner  linguistischen Ausrichtung leistet das Projekt durch diese Adaption existierender Verfahren und die Integration neuer Fachcommunities einen wichtigen Beitrag für die Digital  Humanities und die internationale Infrastrukturlandschaft. Diese ehrgeizigen Ziele stellen hohe Anforderungen an die Organisation der Projektworkflows und erfordern zudem die Schaffung einer eigenen nachhaltigen und international vernetzten digitalen Forschungsinfrastruktur.

In dem Beitrag wird der aktuelle Erkenntnissstand hinsichtlich der Modularisierung von Projektabläufen sowie der Priorisierung von Verarbeitungsschritten der Datenaufbereitung dargestellt. So liegt beispielsweise der technische Fokus zunächst nicht auf der Neuentwicklung weiterer Werkzeuge und Standards der Datenaufbereitung, sondern auf der Entwicklung von modularisierten Infrastrukturen und Workflows, die auf die Interoperabilität, Interaktion und Integration existierender Komponenten abzielen.

Von der Entwicklung und Erprobung kontrollierter und modularisierter Workflows der Datenaufbereitung, die beispielsweise eine transparente Dokumentation und Publikation entstehender Versionen von Forschungsdatensammlungen erlauben, sindzudem wichtige Beiträge auf dem Feld des Forschungsdatenmanagements von Projekten in den Digital Humanities zu erhoffen.