Prof. Dr. Geoffrey Haig von der Universität Bamberg stellte auf dem Forum CA3 in Hamburg das in der CLARIN F-AG 3 "Linguistische Feldforschung, Ethnologie, Sprachtypologie" entstandene Multilingual Corpus of Annotated Spoken Text, kurz Multi-CAST vor. Der Forschungskontext innerhalb dessen Multi-CAST entstanden ist, ist Korpusbasierte Sprachtypologie. Was genau das heißt ist im Video und in diesem Blogpost zu sehen.
Mit Sprachtypologie beziehen sich die Entwickler auf die Untersuchung der Gesamtheit aller möglicher menschlicher Sprachen, und das Identifizieren der Grenzen ihrer Variationen. Da es nicht möglich, ist alle Sprachen zu untersuchen, werden die Untersuchungen an einer möglichst ausgewogenen Stichprobe gemacht. Ausgewogen heißt hierbei, dass idealerweise möglichst weit entfernte Sprachen auszuwählen sind.