WebLicht Experteninterview - Extraktion Prädikativer Nominalphrasen

https://youtu.be/z6Y6m_oj-XU

In diesem Experteninterview wird ein Anwendungsszenario von CLARINs WebLicht besprochen. Genau wird gezeigt, wie prädikativ verwendete Nominalphrasen mittels WebLicht aus literarischen Texten extrahiert werden können. Der Forschungskontext innerhalb dessen diese Arbeitsweise genutzt wurde waren Formen und Funktionen von NPs beim Entwurf literarischer Figuren

Bei prädikativ verwendeten NPs im literarischen Kontext handelt es sich zum Beispiel um Charakterisierungen, wie die im folgenden Textausschnitt aus Thomas Manns Mario und der Zauberberg fett markierte Stelle: 

Ohne Schwierigkeiten fand sich ein junger Mann aus den hinteren Sitzreihen, der bereit war, diktierte Ziffern auf die Tafel zu schreiben. Wir kannten ihn auch: die ganze Unterhaltung gewann etwas Familiärs dadurch, dass man so viele Gesichter kannte. Er war der Angestellte des Kolonialwaren- und Obstladens in der Hauptstraße und hatte uns mehrmals in guter Form bedient. 
Mann 1930: 61
 

Es handelt sich also um NPs die gemeinsam mit einer Form von sein auftreten und der Charakterisierung einer Figur dienen

Um diese NPs zu extrahieren beziehungsweise zu visualisieren, kann WebLicht verwendet werden. Hierfür muss der zu untersuchende Text innerhalb von Weblicht unter Input Selection eingefügt werden, der Dokumenttyp auf Plain text und die Sprache auf Deutsch gestellt werden. Im nächsten Schritt wird der Advanced Mode ausgewählt und dann die Prozesskette zusammengestellt. In diesem Fall sah diese folgendermaßen aus: 

SFS: to TCF Converter - IMS: Tokenizer - IMS: TreeTagger - IMS: Constituent Parser

Nach einem Klick auf Run Tools lässt sich die Baumstruktur des Parsers auswählen und grafisch darstellen. Hier sieht man nun wo die gesuchten prädikativ verwendeten Nominalphrasen vorkommen, im Beispiel der Angestellte des Kolonialwaren- und Obstladens in der Hauptstraße.

Die Vorgehensweise in Kürze: 

Text einfügen - Dokumenttyp festlegen - Sprache auswählen - Advanced Mode auswählen - Prozesskette zusammenstellen - Baumstruktur anklicken - Grafische Ansicht des Parsings auswählen - nach den gesuchten NPs innerhalb der Graphenstruktur schauen 

Dieses Beispiel veranschaulicht also schön ein Anwendungsszenario von WebLicht, in dem ganz bestimmte gesuchte Textstellen identifiziert, extrahiert und anschließend analysiert werden können.  

Written by : Sarah Schneider

1000 Characters left