zum Inhalt springen

DFG-Projekt "Digitale Rätoromanische Chrestomathie"

Ziele

Die Rätoromanische Chrestomathie ist die Grundlage für die Erstellung eines bünderromanischen Textkorpus als Basis korpuslinguistischer, philologischer, historischer und volkskundlicher Forschungen. Wesentliches Ziel ist es, diese Textbasis in für kleine Sprachgemeinschaften prototypischer Weise in neuer medialer Form zu erfassen, dynamisch zu erweitern und damit sehr viel einfacher und effizienter für weitreichenden Gebrauch, sowohl in allen interessierten Kulturwissenschaften als auch durch die Sprachgemeinschaft, zu erstellen und zu nutzen.

Teil des Vorhabens ist die Entwicklung spezialisierter Korrekturverfahren in vernetzten Systemen. Dabei steht mit Tesla (Text Engineering Software Laboratory, siehe Tesla) eine informationstechnologische Infrastruktur zur Verfügung. Zum einen kann auf die in Tesla eingebundenen sprachverarbeitenden Komponenten zurückgegriffen werden, zum anderen werden im Rahmen von Begleitforschungen neue Komponenten erstellt und eingebunden.

Weitere Formen der Korrektur werden im Rahmen eines auch in der Versionierung an Wiki-Technologien angelehnten Verfahrens interaktiv und kollaborativ unter Einbeziehung von Angehörigen und Interessierten der Sprachgemeinschaft in Kooperation mit der Societad Retorumantscha durchgeführt. Dadurch werden die bekannten Probleme der OCR gerade bei älteren und typographisch varianten Schriftsystemen abgefangen; über das konkrete materielle Ziel hinaus werden damit übertragbare und somit nachhaltige, kompetenzorientierte Verfahren entwickelt, die für die Tiefendigitalisierung des schriftlichen kulturellen Erbes kleinerer Sprachgemeinschaften prototypisch sind. Von besonderem Interesse ist hier auch die Möglichkeit für Mitglieder solcher Sprachgemeinschaften, über Wiki-Technologien den Erhalt des sprachlichen und kulturellen Erbes aktiv zu unterstützen und zu pflegen und dadurch die kulturelle Identität zu stärken.

Bei der Einbindung der Sprachgemeinschaft können die Erfahrungen der Societad Retorumantscha genutzt werden. Seit ihrer Gründung vor über 100 Jahren führt die Societad Retorumantscha Sprachdatensammlungen für die Dokumentation des Bündnerromanischen durch und steht dadurch in engem Kontakt zur Sprachgemeinschaft. Dank der Kooperation mit der Societad Retorumantscha, durch Verweise in den Medien (Graubündens), durch die Web- und Wikipräsenz des Projekts und aufgrund der o. referierten Erfahrungen glauben wir, dass die Zahl von 500 Lesern und Korrektoren ein sehr vorsichtige Schätzung der Beteiligung der Sprachgemeinschaft und ihrer Freunde ist.

Neben Korrekturverfahren werden Methoden zur korpuslinguistischen Aufbereitung eingesetzt und weiterentwickelt. Langfristiges Ziel ist es, die Volltexte einerseits als annotiertes Korpus, andererseits als Textsammlung für strukturierten Zugriff (u.a. Volltextsuche) zur Verfügung zu stellen. Der Übergang von Texterstellung und -nutzung – d.h. zur Nachnutzung – ist dabei fließend. Dies liegt in der Natur digitaler Daten, die im Gegensatz zu Printdaten ("readonly") sowohl lesbar als auch schreibbar sind. Die Algorithmen zur Textaufbereitung und zur Textkorrektur sind auch für die Nutzung einzusetzen; dies gilt z.B. für Indizierungs-, Konkordanz-, Such- oder Musterbildungsalgorithmen.

Die im Vorhaben eingesetzten Erschließungs- und Auszeichnungstechniken sollen in der Folge auf weitere Textsammlungen des Bündnerromanischen angewandt werden, um den Bestand an Korpora zu erhöhen. Als Quelle für weitere bündnerromanische Texte bietet sich u.a. das seit 1886 erscheinende Jahrbuch "Annalas" der Societad Retorumantscha an. Neben Aufsätzen über die rätoromanische Sprache und Kultur finden sich hier auch Editionen älterer bündnerromanischer Texte.

Weiter zu: