zum Inhalt springen

ARC - Annotierte Rätoromanische Chrestomathie

Linguistische Annotation der „Rätoromanischen Chrestomathie“ (RC) von Caspar Decurtins

Projektverantwortliche:

Prof. Dr. Jürgen Rolshoven
Sprachliche Informationsverarbeitung
Institut für Linguistik
Universität zu Köln

Prof. Dr. Wolfgang Schmitz/ Dr. Hubertus Neuhausen
Universitäts- und Stadtbibliothek Köln

Gefördert durch:

DFG

Förderzeitraum:

05/2013 - 08/2015

Projektmitarbeiter:

Mihail Atanassov, Alena Geduldig, Dr. Jürgen Hermes, Francisco MondacaClaes Neuefeind, David Rival, Andreas Vogt

Projekt Website:

www.crestomazia.ch

hydra.spinfo.uni-koeln.de/

Verwendet Technologie aus:

DRC

Prof. Dr. Jürgen Rolshoven

Sprachliche Informationsverarbeitung

Institut für Linguistik

Universität zu Köln


Prof. Dr. Wolfgang Schmitz

Universitäts- und Stadtbibliothek Köln

Prof. Dr. Jürgen Rolshoven

Sprachliche Informationsverarbeitung

Institut für Linguistik

Universität zu Köln


Prof. Dr. Wolfgang Schmitz

Universitäts- und Stadtbibliothek Köln

Prof. Dr. Jürgen Rolshoven

Sprachliche Informationsverarbeitung

Institut für Linguistik

Universität zu Köln


Prof. Dr. Wolfgang Schmitz

Universitäts- und Stadtbibliothek Köln

Beschreibung:

Ziel des Projekts ist die linguistische Annotation der „Rätoromanischen Chrestomathie“ (RC) von Caspar Decurtins. Die Volltexte der RC wurden im Vorgängerprojekt „Digitale Rätoromanische Chrestomathie“ automatisch tiefenerschlossen und werden derzeit mithilfe eines für diesen Zweck entwickelten netzbasierten Editors kollaborativ durch die Sprachgemeinschaft korrigiert. Analog dazu soll auch die linguistische Annotation der RC durch die Kombination automatischer und manueller Verfahren erfolgen. Um der weitgehend fehlenden orthographischen Normierung der RC zu begegnen, müssen zunächst die für die fünf Hauptidiome verfügbaren lexikalischen Ressourcen digital aufbereitet werden. Auf dieser Grundlage automatisch vorgenommene Annotationen werden über das entsprechend erweiterte Editor-Werkzeug durch Muttersprachler und Interessierte kollaborativ überprüft und ggf. korrigiert bzw. ergänzt. Das aus lexikalischer und manueller Annotation gewonnene Wissen kann mittels spezialisierter Lernverfahren zur erneuten automatischen Annotation der Texte genutzt werden. Die erschlossenen Quellen linguistischen Wissens (Lexika, Grammatiken) sowie die darauf aufbauenden Methoden zur (semi-)automatischen Annotation (Tagger, Klassifikatoren) können in der Folge auf weitere rätoromanische Texte angewendet werden, um das mit der RC begründete Korpus zu erweitern.