Hauptseite: Unterschied zwischen den Versionen

Aus Kobra
Wechseln zu: Navigation, Suche
 
(112 dazwischenliegende Versionen von 4 Benutzern werden nicht angezeigt)
Zeile 4: Zeile 4:
 
|-  
 
|-  
 
| style="background:#ffffff; padding:1em" |  
 
| style="background:#ffffff; padding:1em" |  
[[Datei:Kwic-kobra-2geo.png|links]] [[Datei:KobRA-RM.png|rechts]] '''KobRA (Korpus-basierte Recherche und Analyse mit Hilfe von Data-Mining)''' ist ein Verbundprojekt, das seit September 2012 vom [http://www.bmbf.de Bundesministerium für Bildung und Forschung (BMBF)] im Rahmen des '''[http://www.bmbf.de/foerderungen/16466.php Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities]''' gefördert wird (Förderkennzeichen: 01UG1245A).
+
[[Datei:Kwic-kobra-2geo.png|links]] [[Datei:KobRA-RM.png|rechts]] '''KobRA (Korpus-basierte linguistische Recherche und Analyse mit Hilfe von Data-Mining)''' war ein Verbundprojekt, das von September 2012 bis Dezember 2015 vom [http://www.bmbf.de Bundesministerium für Bildung und Forschung (BMBF)] im Rahmen des '''[http://www.bmbf.de/foerderungen/16466.php Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities]''' gefördert wurde (Förderkennzeichen: 01UG1245A-E).
  
'''Ziel des Projektes ist es, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern.''' Strukturierte Sprachressourcen (annotierte Textkorpora, Baumbanken, Wortnetze) bieten neuartige und attraktive Möglichkeiten, linguistische Fragestellungen an authentischen Sprachverwendungsdaten zu untersuchen und quantitativ auszuwerten.  
+
Im Projekt arbeiteten Partner aus Informatik, Linguistik und Sprachtechnologie gemeinsam daran, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern. Koordinatorin des Projekts war [http://germanistik.uni-mannheim.de/abteilungen/germanistische_linguistik/prof_dr_angelika_storrer/index.html Prof. Dr. Angelika Storrer (Universität Mannheim)].  
  
Koordinatorin des Projekts ist [http://germanistik.uni-mannheim.de/abteilungen/germanistische_linguistik/prof_dr_angelika_storrer/index.html Prof. Dr. Angelika Storrer (Universität Mannheim)].
+
<div style="clear: left"></div> Auf diesen Seiten finden Sie weitere Informationen über:
 
 
<div style="clear: left"></div> Auf diesen Seiten bieten wir einen Überblick und detailliertere Informationen über:
 
 
* '''[[Projektbeschreibung|die Ziele, Fragestellungen und Methoden des Projekts]]'''
 
* '''[[Projektbeschreibung|die Ziele, Fragestellungen und Methoden des Projekts]]'''
 
* '''[[Team|die beteiligten Personen und Forschungseinrichtungen]]'''
 
* '''[[Team|die beteiligten Personen und Forschungseinrichtungen]]'''
 
* '''[[Fallstudien|die Fallstudien des Projekts]]'''
 
* '''[[Fallstudien|die Fallstudien des Projekts]]'''
* '''sowie über Aktivitäten und aktuelle Veröffentlichungen (s.u.).'''
+
*'''[[Fachtagung 30.10.2015|die Fachtagung ''Neue Wege in der Nutzung von Korpora: Data Mining für die textorientierten Geisteswissenschaften'' am 30.10.2015]]'''
 +
* '''sowie über Aktivitäten und Veröffentlichungen (s.u.).'''
 +
|}
 +
 
 +
{| class="wikitable" width="99%"
 +
|-
 +
! <big> KobRA-Software </big>
 +
|-
 +
| style="background:#ffffff; padding:1em" |
 +
[[Datei:Gnome-System-Software-Installer-48.png|links]] Die im Projekt entwickelten und erprobten Softwarekomponenten finden Sie unter: [[Software]].<br /> Die Installation und Anwendung der Komponenten ist im [http://kobra.tu-dortmund.de/mediawiki/index.php?title=Datei:KobRA-Software-Handbuch_5.3.002.pdf KobRA-Software-Handbuch (PDF)] beschrieben.
 
|}
 
|}
  
Zeile 23: Zeile 30:
 
| style="background:#ffffff; padding:1em" |
 
| style="background:#ffffff; padding:1em" |
  
* Vortrag [http://clarin2015.informatik.uni-leipzig.de/program#Kobra Korpusbasierte Sprachanalyse mit CLARIN-D-Ressourcen: Anwendungsszenarien und Erfahrungen aus dem Projekt KobRA]  auf dem CLARIN-D Workshop "Fächerübergreifende Perspektiven durch digitale Forschungsinfrastrukturen" am 30.6/1.7. in Leipzig.
+
*Auf der [[Fachtagung_30.10.2015:_Eindrücke_und_Einblicke|Fachtagung ''Neue Wege in der Nutzung von Textkorpora: Data Mining für die textorientierten Geisteswissenschaften]] am 30.10.2015 an der BBAW präsentierten die Projektbeteiligten ihre Ergebnisse und diskutierten weiterführende Perspektiven. Das Tagungsprogramm und E-Folien zu den Präsentationen und Postern finden Sie [[Fachtagung 30.10.2015|hier]].
  
* Paper angenommen für die Internationalen Fachtagung ''Text, Speech and Dialogue'': Poelitz, C.; Bartz, T.; Morik, K.; Storrer, A. (2015), Investigation of Word Senses over Time using Linguistic Corpora,  in Vaclav Matousek et al., ed. (2015), Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer.
+
*Vortrag ''A Data Mining Environment for Linguistic Research Based on CLARIN-D Language Resources'' (Katharina Morik, Thomas Bartz, Christian Pölitz, Angelika Storrer) auf der [http://dch2015.net/abstracts_submission.shtml ''DCH2015 - Interdisciplinary Conference on Digital Cultural Heritage''] am 28.-30. Oktober 2015 in Berlin.
  
* Paper angenommen für die Internationale Fachtagung ''eLexicography 2015'': Lemnitzer, L.; Poelitz, C.; Didakowski, J.; Geyken, A. (2015), A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries., in I Kosem et al., ed., 'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.
+
* Panel: Am 29.10.15 fand ein von Michael Beißwenger & Thierry Chanier organisiertes Panel [http://tei2015.huma-num.fr/en/panelsround-tables/#acc-3 TEI across corpora, languages and genres: Towards a standard for the representation of social media and computer-mediated communication]" im Rahmen der [http://tei2015.huma-num.fr/en/ Jahreskonferenz der Text encoding Initiative] statt. Am Panel waren verschiedene KobRA-Akteure beteiligt.
  
* Paper angenommen für die Internationale Fachtagung ''eLexicography 2015'': Geyken, A.; Poelitz, C.; Bartz, T. (2015), A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries., in I Kosem et al., ed., 'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.
+
* Vortrag: "Wikipedia as a corpus resource for linguistic research" (Angelika Storrer) auf der [http://ird-cmc-rennes.sciencesconf.org/ internationalen ''ird-cmc''-Konferenz in Rennes/Frankreich] am 23.10.2015.
  
* [[Aktivitäten#Herrenhäuser Symposium Visuelle Linguistik, 19.-21. November 2014 (Hannover)|Posterpräsentation zu neuen Möglichkeiten frequenzbasierter Visualisierungen disambiguierter lexikalischer Einheiten mithilfe von KobRA-Verfahren im Rahmen des Symposiums ''Visuelle Linguistik'', Schloss Herrenhausen, Hannover]]
+
* Panel: "Towards an encoding standard for social media and CMC: Experiences from German and French corpus projects using TEI" (organisiert von Michael Beißwenger & Thierry Chanier mit Beiträgen u.a. aus verschiedenen Korpusprojekten im KobRA-Kontext) auf der [http://ird-cmc-rennes.sciencesconf.org/ internationalen ''ird-cmc''-Konferenz in Rennes/Frankreich] am 23.10.2015.
 +
 
 +
*Posterpräsentation ''Verb Valency and Prepositional Complements in Learner Corpora - A Case Study in the German MERLIN Corpus'' (Tassja Weber) 3. Learner Corpus Research Conference (LCR) 2015, Nijmegen (Niederlande), 11-13.09.2015.
 +
 
 +
* Paper auf der Internationalen Fachtagung [http://www.kiv.zcu.cz/tsd2015/ ''Text, Speech and Dialogue'']: Pölitz, Christian; Bartz, Thomas; Morik, Katharina; Storrer, Angelika (2015): ''Investigation of Word Senses over Time using Linguistic Corpora'' In: Matousek, Vaclav et al. (Hrsg.): Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer.
  
* [[Aktivitäten#CAC 2014, 23.-25. Oktober 2014 (Soesterberg)|Vortrag und Austausch zu neuen Ergebnissen und zur Gesamtarchitektur des KobRA-Projekts im Rahmen der ''CLARIN-Jahrestagung (CAC 2014)'' in Soesterberg (Niederlande)]]
 
  
 
----
 
----
Zeile 42: Zeile 52:
 
{| class="wikitable" width="49%" style="float:left"
 
{| class="wikitable" width="49%" style="float:left"
 
|-
 
|-
! <big>Veröffentlichungen</big>
+
! <big>Veröffentlichungen und Dokumentationen</big>
 
|-
 
|-
 
| style="background:#ffffff; padding:1em" |
 
| style="background:#ffffff; padding:1em" |
 +
*Bartz,Thomas; Pölitz, Christian; Morik, Katharina; Storrer, Angelika (2015): '''Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research'''. In: Jan Odijk (Ed): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=116;article=001 Selected Papers from the CLARIN 2014 Conference], October 24-25, 2014, Soesterberg, The Netherlands, 1-13.
 +
 +
*Geyken, Alexander; Jurish, Bryan; Würzner, Kay-Michael (2016): '''KobRA-Integration in die Rechercheumgebung am Zentrum Sprache der BBAW'''. Technischer Bericht, BBAW. [[Media: KobRA_Technischer_Bericht_BBAW_Meilenstein_4b.pdf|Online-Veröffentlichung (PDF)]].
 +
 +
* Hinrichs, Marie (2016): '''Integration der KobRA-Verfahren in WebLicht'''. Technischer Bericht, Universität Tübingen. [[Media: KobRA_Technischer_Bericht_TUEB_Meilenstein_4b.pdf|Online-Veröffentlichung (PDF)]].
 +
 +
*Diewald, Nils; Kupietz, Marc (2016): ''' Integration der KobRA-Verfahren in die IDS-Infrastrukturen'''. Technischer Bericht, IDS Mannheim [[Media: KobRA_Technischer_Bericht_IDS_Meilenstein_4c.pdf|Online-Veröffentlichung (PDF)]].
 +
 +
*Bingel, Joachim; Diewald, Nils (2015): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=111;article=001 '''KoralQuery – a General Corpus Query Protocol''']. In: Proceedings of the Workshop on Innovative Corpus Query and Visualization Tools at NODALIDA 2015, Vilnius, Lithuania, May 11-13, 2015.
 +
 +
*Diewald,Nils; Bingel, Joachim (2015): [http://KorAP.github.io/Koral '''KoralQuery 0.3. Technical Report, Working draft''']. IDS, Mannheim, Germany.
 +
 
*Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): '''Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods.''' In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. [http://www.uni-hildesheim.de/konvens2014/data/konvens2014-workshop-proceedings.pdf Proceedings-Band als PDF]
 
*Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): '''Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods.''' In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. [http://www.uni-hildesheim.de/konvens2014/data/konvens2014-workshop-proceedings.pdf Proceedings-Band als PDF]
 +
 +
*Thomas Bartz, Michael Beißwenger, Christian Pölitz, Nadja Radtke & Angelika Storrer (2014): '''Neue Möglichkeiten der Arbeit mit strukturierten Sprachressourcen in den Digital Humanities mithilfe von Data-­Mining.'''  [http://dharchive.org/paper/DH2014/Poster-894.xml Online Proceedings of the Digital Humanities 2014 annual international conference of the Alliance of Digital Humanities Organizations],  Universität Lausanne, 10. Juli 2014
  
 
*Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael  (2014): '''Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014.''' Technischer Bericht, Technische Universität Dortmund. [[Media: KobRA-MS2_Verfahren.pdf|Online-Veröffentlichung (PDF)]]
 
*Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael  (2014): '''Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014.''' Technischer Bericht, Technische Universität Dortmund. [[Media: KobRA-MS2_Verfahren.pdf|Online-Veröffentlichung (PDF)]]
  
 
*Didakowski, Jörg; Radtke, Nadja (2014): '''Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. ''' In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. [http://euralex2014.eurac.edu/en/callforpapers/Documents/EURALEX%202014_gesamt.pdf Online-Veröffentlichung (PDF)]
 
*Didakowski, Jörg; Radtke, Nadja (2014): '''Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. ''' In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. [http://euralex2014.eurac.edu/en/callforpapers/Documents/EURALEX%202014_gesamt.pdf Online-Veröffentlichung (PDF)]
 +
  
 
----
 
----

Aktuelle Version vom 24. März 2016, 13:49 Uhr

Herzlich willkommen
Kwic-kobra-2geo.png
KobRA-RM.png
KobRA (Korpus-basierte linguistische Recherche und Analyse mit Hilfe von Data-Mining) war ein Verbundprojekt, das von September 2012 bis Dezember 2015 vom Bundesministerium für Bildung und Forschung (BMBF) im Rahmen des Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities gefördert wurde (Förderkennzeichen: 01UG1245A-E).

Im Projekt arbeiteten Partner aus Informatik, Linguistik und Sprachtechnologie gemeinsam daran, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern. Koordinatorin des Projekts war Prof. Dr. Angelika Storrer (Universität Mannheim).

Auf diesen Seiten finden Sie weitere Informationen über:
KobRA-Software
Gnome-System-Software-Installer-48.png
Die im Projekt entwickelten und erprobten Softwarekomponenten finden Sie unter: Software.
Die Installation und Anwendung der Komponenten ist im KobRA-Software-Handbuch (PDF) beschrieben.
Aktivitäten
  • Panel: "Towards an encoding standard for social media and CMC: Experiences from German and French corpus projects using TEI" (organisiert von Michael Beißwenger & Thierry Chanier mit Beiträgen u.a. aus verschiedenen Korpusprojekten im KobRA-Kontext) auf der internationalen ird-cmc-Konferenz in Rennes/Frankreich am 23.10.2015.
  • Posterpräsentation Verb Valency and Prepositional Complements in Learner Corpora - A Case Study in the German MERLIN Corpus (Tassja Weber) 3. Learner Corpus Research Conference (LCR) 2015, Nijmegen (Niederlande), 11-13.09.2015.
  • Paper auf der Internationalen Fachtagung Text, Speech and Dialogue: Pölitz, Christian; Bartz, Thomas; Morik, Katharina; Storrer, Angelika (2015): Investigation of Word Senses over Time using Linguistic Corpora In: Matousek, Vaclav et al. (Hrsg.): Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer.



Überblick über weitere Konferenzbeiträge und Projekt-Workshops: Aktivitäten

Veröffentlichungen und Dokumentationen
  • Bartz,Thomas; Pölitz, Christian; Morik, Katharina; Storrer, Angelika (2015): Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research. In: Jan Odijk (Ed): Selected Papers from the CLARIN 2014 Conference, October 24-25, 2014, Soesterberg, The Netherlands, 1-13.
  • Geyken, Alexander; Jurish, Bryan; Würzner, Kay-Michael (2016): KobRA-Integration in die Rechercheumgebung am Zentrum Sprache der BBAW. Technischer Bericht, BBAW. Online-Veröffentlichung (PDF).
  • Diewald, Nils; Kupietz, Marc (2016): Integration der KobRA-Verfahren in die IDS-Infrastrukturen. Technischer Bericht, IDS Mannheim Online-Veröffentlichung (PDF).
  • Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods. In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. Proceedings-Band als PDF
  • Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael (2014): Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014. Technischer Bericht, Technische Universität Dortmund. Online-Veröffentlichung (PDF)
  • Didakowski, Jörg; Radtke, Nadja (2014): Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. Online-Veröffentlichung (PDF)



Überblick über weitere Veröffentlichungen mit Projektbezug: Publikationen