Projektbeschreibung/Anwendungsfelder: Unterschied zwischen den Versionen
(Navi-Bar am Seitenende wiederholt) |
K |
||
Zeile 20: | Zeile 20: | ||
*'''Varietätenlinguistik/Internetbasierte Kommunikation:''' Untersuchung von Sprachmerkmalen in Genres internetbasierter Kommunikation, auch im Vergleich zu standardkonformer redigierter Schriftlichkeit in anderen Textsortenbereichen (Belletristik, Zeitung, Wissenschaft, Gebrauchstexte). Studien zur sprachlichen Variation zwischen verschiedenen Genres der internetbasierten Kommunikation; Studien zum Einfluss diatopischer Varietäten und sprachvergleichende Untersuchungen. | *'''Varietätenlinguistik/Internetbasierte Kommunikation:''' Untersuchung von Sprachmerkmalen in Genres internetbasierter Kommunikation, auch im Vergleich zu standardkonformer redigierter Schriftlichkeit in anderen Textsortenbereichen (Belletristik, Zeitung, Wissenschaft, Gebrauchstexte). Studien zur sprachlichen Variation zwischen verschiedenen Genres der internetbasierten Kommunikation; Studien zum Einfluss diatopischer Varietäten und sprachvergleichende Untersuchungen. | ||
*'''Lexikographie:''' Unterstützung des lexikographischen Arbeitsprozesses, z.B.: Suche nach interessanten, ungewöhnlichen Belegen (Metapher, Metonymie); Frequenzdaten zu disambiguierten lexikalischen Einheiten; Rekonstruktion und Visualisierung von Bedeutungswandel (z.B. ''billig'', ''toll'', ''zeitnah'') und von Prozessen der Ausdifferenzierung von Teilbedeutungen über Zeiträume und Textsortenbereiche hinweg (z.B. ''Ampel'' als Hängelampe, als Lichtzeichenanlage, als politische Koalition etc.). | *'''Lexikographie:''' Unterstützung des lexikographischen Arbeitsprozesses, z.B.: Suche nach interessanten, ungewöhnlichen Belegen (Metapher, Metonymie); Frequenzdaten zu disambiguierten lexikalischen Einheiten; Rekonstruktion und Visualisierung von Bedeutungswandel (z.B. ''billig'', ''toll'', ''zeitnah'') und von Prozessen der Ausdifferenzierung von Teilbedeutungen über Zeiträume und Textsortenbereiche hinweg (z.B. ''Ampel'' als Hängelampe, als Lichtzeichenanlage, als politische Koalition etc.). | ||
− | *'''Diachronische Sprachforschung:''' Entwicklung von Wortschatz, Syntax, Morphologie in einem bestimmten Untersuchungszeitraum. Z.B. Entwicklung und Ausdifferenzierung des Systems deutscher Stützverbgefüge (''zur Anwendung bringen'', ''zur Anwendung kommen'' und ''Anwendung finden''). Studien zu Prozessen des lexikalischen Wandels (Metapher, Metonymie, Grammatikalisierung etc.). Einfluss von Kontaktsprachen und diatopischen Varietäten. | + | *'''Diachronische Sprachforschung:''' Entwicklung von Wortschatz, Syntax, Morphologie in einem bestimmten Untersuchungszeitraum. Z.B. Entwicklung und Ausdifferenzierung des '''Systems deutscher Stützverbgefüge''' (''zur Anwendung bringen'', ''zur Anwendung kommen'' und ''Anwendung finden''). Studien zu Prozessen des lexikalischen Wandels (Metapher, Metonymie, Grammatikalisierung etc.). Einfluss von Kontaktsprachen und diatopischen Varietäten. |
Eine wichtige Zielgruppe für die Projektergebnisse sind '''Nachwuchswissenschaftler und fortgeschrittene Studierende''': Als wichtige Multiplikatoren bei der Verbreitung korpus-basierter Zugänge zur Sprachforschung werden sie in die linguistischen Fallstudien und in die Erprobung der Verfahren mit eingebunden. In Verbindung mit Konzepten des '''"forschenden Lernens"''' sollen die Projektergebnisse auch der '''Sprachvermittlung in der Schule''' zugutekommen. Darüber hinaus können auch andere Fachbereiche profitieren, in denen das Aufspüren interessanter und ungewöhnlicher Sprachverwendungen eine wichtige Rolle spielt (z.B. die Literaturwissenschaft). | Eine wichtige Zielgruppe für die Projektergebnisse sind '''Nachwuchswissenschaftler und fortgeschrittene Studierende''': Als wichtige Multiplikatoren bei der Verbreitung korpus-basierter Zugänge zur Sprachforschung werden sie in die linguistischen Fallstudien und in die Erprobung der Verfahren mit eingebunden. In Verbindung mit Konzepten des '''"forschenden Lernens"''' sollen die Projektergebnisse auch der '''Sprachvermittlung in der Schule''' zugutekommen. Darüber hinaus können auch andere Fachbereiche profitieren, in denen das Aufspüren interessanter und ungewöhnlicher Sprachverwendungen eine wichtige Rolle spielt (z.B. die Literaturwissenschaft). |
Aktuelle Version vom 16. Juni 2013, 18:08 Uhr
KobRA (Korpus-basierte Recherche und Analyse mit Hilfe von Data-Mining)
Die folgenden Seiten bieten einen Überblick über Anwendungsfelder, Methode und Ressourcen des Projekts: Wissenschaftliche Anwendungsfelder Wissenschaftliche Anwendungsfelder ("use cases")Korpus-basierte Linguistik hat sich in den letzten Jahren zu einem wichtigen Gebiet der Sprachforschung entwickelt. In Infrastrukturprojekten wie CLARIN werden umfangreiche, strukturierte Sprachressourcen (Textkorpora, Baumbanken, lexikalische Wortnetze) bereitgestellt, die hervorragende Möglichkeiten für die empirische Untersuchung sprachlicher Phänomene eröffnen. Das Projekt setzt auf diesen Infrastrukturen auf und nutzt innovative Data-Mining-Verfahren (insbesondere Lernverfahren), die über die reine Suche hinausgehen, indem sie die Suchergebnisse filtern, sortieren oder strukturieren und ggf. die weitere Aufbereitung der Daten für eine konkrete Fragestellung erleichtern. Um die Nutzer bei der Exploration verschiedener strukturierter Datenbestände zu unterstützen, sollen auch innovative Formen der Visualisierung für typische sprachbezogene Forschungsfragen erprobt werden. Durch diese Verfahren sollen korpus-basiert arbeitende Linguisten und Lexikographen bei typischen Routineaufgaben unterstützt werden, sodass sie diese künftig schneller und mit besserem Ergebnis durchführen können. Die zu entwickelnden Verfahren werden an Fallstudien aus drei linguistischen Anwendungsfeldern erprobt und evaluiert:
Eine wichtige Zielgruppe für die Projektergebnisse sind Nachwuchswissenschaftler und fortgeschrittene Studierende: Als wichtige Multiplikatoren bei der Verbreitung korpus-basierter Zugänge zur Sprachforschung werden sie in die linguistischen Fallstudien und in die Erprobung der Verfahren mit eingebunden. In Verbindung mit Konzepten des "forschenden Lernens" sollen die Projektergebnisse auch der Sprachvermittlung in der Schule zugutekommen. Darüber hinaus können auch andere Fachbereiche profitieren, in denen das Aufspüren interessanter und ungewöhnlicher Sprachverwendungen eine wichtige Rolle spielt (z.B. die Literaturwissenschaft). Im Rahmen des Projekts wird erprobt, welche Routineaufgaben mithilfe welcher Data-Mining-Verfahren beschleunigt und/oder im Ergebnis verbessert werden können. Dabei kommen verschiedene Lernverfahren in Verbindung mit strukturierten Daten und Annotationen vielfältiger Art zum Einsatz. Auf diese Weise lassen sich Einsichten im Hinblick auf die Frage gewinnen, welche Merkmale in welchen Repräsentationen für welche Lernaufgaben am besten geeignet sind. Diese Frage ist für Informatik, Linguistik und Sprachtechnologie gleichermaßen interessant. Wissenschaftliche Anwendungsfelder |