Projektbeschreibung/Genutzte Ressourcen
KobRA (Korpus-basierte Recherche und Analyse mit Hilfe von Data-Mining)
Die folgenden Seiten bieten einen Überblick über Anwendungsfelder, Methode und Ressourcen des Projekts: Wissenschaftliche Anwendungsfelder Genutzte RessourcenVerfahren: Die am Lehrstuhl für künstliche Intelligenz der TU Dortmund entwickelten Softwaresysteme SVMlight und RapidMiner befinden sich weltweit im Einsatz und werden auch für die Entwicklung innovativer Verfahren im vorliegenden Projekt genutzt. Bei beiden Systemen handelt es sich um für wissenschaftliche Zwecke frei verfügbare und erweiterbare Software (ggf. nach Rücksprache mit den Herausgebern). Daten: Datengrundlage für die Lernverfahren und linguistischen Fallstudien sind strukturierte, linguistisch annotierte große Korpora/Baumbanken und lexikalische Ressourcen, die von den Sprachtechnologie-Partnern bereitgestellt werden und über Abfragewerkzeuge und/oder Webservices in CLARIN-D zur Verfügung stehen. Die folgende Tabelle gibt einen Überblick über diese Sprachressourcen und ihre Merkmale: Wissenschaftliche Anwendungsfelder |