Auffinden geeigneter Daten in CLARIN-D

Eine zentrale Aufgabe für die Nutzung von Daten ist das Auffinden: Zum einen sucht man nach bestimmten Daten, die man als Ganzes nachnutzen kann, zum anderen werden Daten nach Beispielen durchsucht. Das Virtual Language Observatory (VLO) ist eine Spezialsuchmaschine für Forschungsdaten, die für CLARIN-Nutzende und durch CLARIN-Zentren bereitgestellt werden. Um Beispielsätze für Zeichenketten, z.B. Wörter, zu finden, kann man mit dem Federated Content Search (FCS) zugängliche Ressourcen direkt durchsuchen und erhält auch die Information zur Quelle der Beispiele. Schließlich bieten Portale zu bestimmten Ressourcen auch Oberflächen, mit deren Hilfe man wesentlich gezielter die Strukturen der Daten ausnutzen kann. Insbesondere prominente Ressourcen und Referenzkorpora bieten die Möglichkeit, mit speziellen Anfragesprachen zu suchen. Unten erhalten Sie einen Direktzugriff zum VLO, zum FCS und zu einigen prominenten Ressourcen innerhalb von CLARIN.

Suchmaschine für Sprachressourcen in CLARIN

Suche in Ressourcen innerhalb von CLARIN

Anfragewerkzeuge für spezielle Ressourcen

GermaNet ist ein von der Universität Tübingen betriebenes maschinenlesbares lexikalisch-semantisches Netz der deutschen Sprache. Ein Teil davon ist in EuroWordNet integriert, das die Wortnetze mehrerer europäischer Sprachen über einen interlingualen Index miteinander verbindet.

Mehr erfahren »

Das Deutsche Referenzkorpus (kurz DeReKo) ist ein elektronisches Archiv von deutschsprachigen Textkorpora geschriebener Sprache, das seit 1964 existiert und vom Institut für Deutsche Sprache (IDS) in Mannheim gepflegt und kontinuierlich ausgebaut wird.

Mehr erfahren »

Das Deutsche Textarchiv (DTA) ist ein seit Juli 2007 an der Berlin-Brandenburgischen Akademie der Wissenschaften beheimatetes und von der Deutschen Forschungsgemeinschaft gefördertes wissenschaftliches digitales Textarchiv. Disziplinübergreifende Auswahl deutschsprachiger Texte.

Mehr erfahren »

Umfangreiche Wortschatz-Datenbank: 35 Millionen Sätze mit 500 Millionen laufenden Wörtern; mehr als 9 Millionen verschiedene Wörter und Wortgruppen. Die Daten werden aus sorgfältig ausgewählten öffentlich zugänglichen Quellen automatisch erhoben.

Mehr erfahren »

Das „Digitale Wörterbuch der deutschen Sprache“ (DWDS) aggregiert mehrere gegenwartssprachliche und historische Wörterbücher und verknüpft diese mit Textkorpora von 1600 bis heute sowie mit Wortstatistiken.

Mehr erfahren »