Projektbeschreibung/Entstehende Ressourcen: Unterschied zwischen den Versionen
(→Entstehende Ressourcen) |
K (→Entstehende Ressourcen) |
||
Zeile 12: | Zeile 12: | ||
=Entstehende Ressourcen= | =Entstehende Ressourcen= | ||
− | Alle entwickelten und erprobten technischen Verfahren werden nach Ablauf des Projekts in Form weiter entwickelbarer Open-Source-Software zur Verfügung stehen. Weiterhin werden die Verfahren in die | + | Alle entwickelten und erprobten technischen Verfahren werden nach Ablauf des Projekts in Form weiter entwickelbarer Open-Source-Software zur Verfügung stehen. Weiterhin werden die Verfahren in die Infrastrukturen der Sprachtechnologie-Partner eingebunden; konkret sind folgende Integrationsarbeiten geplant: |
*'''Berlin-Brandenburgische Akademie der Wissenschaften (BBAW):''' Integration als APIs auf der Arbeitsoberfläche der am Ausbau des DWDS-Wörterbuchs beteiligten Lexikographen. | *'''Berlin-Brandenburgische Akademie der Wissenschaften (BBAW):''' Integration als APIs auf der Arbeitsoberfläche der am Ausbau des DWDS-Wörterbuchs beteiligten Lexikographen. | ||
*'''Seminar für Sprachwissenschaft (SfS), Universität Tübingen:''' Integration in die Nutzerschnittstelle von '''[http://weblicht.sfs.uni-tuebingen.de/ WebLicht]'''. | *'''Seminar für Sprachwissenschaft (SfS), Universität Tübingen:''' Integration in die Nutzerschnittstelle von '''[http://weblicht.sfs.uni-tuebingen.de/ WebLicht]'''. |
Aktuelle Version vom 18. Juli 2013, 12:26 Uhr
KobRA (Korpus-basierte Recherche und Analyse mit Hilfe von Data-Mining)
Die folgenden Seiten bieten einen Überblick über Anwendungsfelder, Methode und Ressourcen des Projekts: Wissenschaftliche Anwendungsfelder Methode Genutzte Ressourcen Entstehende Ressourcen Entstehende RessourcenAlle entwickelten und erprobten technischen Verfahren werden nach Ablauf des Projekts in Form weiter entwickelbarer Open-Source-Software zur Verfügung stehen. Weiterhin werden die Verfahren in die Infrastrukturen der Sprachtechnologie-Partner eingebunden; konkret sind folgende Integrationsarbeiten geplant:
Da alle Sprachtechnologiepartner auch als CLARIN-D-Zentren fungieren, sichert diese Integration die nachhaltige Verwertbarkeit der Verfahren über die Projektlaufzeit hinaus. Für die korpus-basierte Erforschung der internetbasierten Kommunikation gibt es bislang keine Referenzkorpora. Die Dortmunder Linguistik und die DWDS-Arbeitsgruppe an der BBAW arbeiten deshalb gemeinsam am Aufbau eines Referenzkorpus zur deutschprachigen internetbasierten Kommunikation IBK (DeRiK) und kooperieren dabei mit Partnern aus anderen europäischen Initiativen, die ähnliche Zielsetzungen verfolgen. Um die Nachhaltigkeit der Ressourcen und die Interoperabilität der dafür entwickelten Werkzeuge zu sichern, werden gemeinsam mit diesen Partnern im Rahmen der Text Encoding Initiative (TEI) Annotationsrichtlinien erarbeitet, die auch die Basis für geplante KobRA-Verfahren bilden (vgl. u.a. Beißwenger et al. 2012). Wissenschaftliche Anwendungsfelder Methode Genutzte Ressourcen Entstehende Ressourcen |