Hauptseite: Unterschied zwischen den Versionen

Aktuelle Version vom 24. März 2016, 13:49 Uhr

Herzlich willkommen
KobRA (Korpus-basierte linguistische Recherche und Analyse mit Hilfe von Data-Mining) war ein Verbundprojekt, das von September 2012 bis Dezember 2015 vom Bundesministerium für Bildung und Forschung (BMBF) im Rahmen des Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities gefördert wurde (Förderkennzeichen: 01UG1245A-E). Im Projekt arbeiteten Partner aus Informatik, Linguistik und Sprachtechnologie gemeinsam daran, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern. Koordinatorin des Projekts war Prof. Dr. Angelika Storrer (Universität Mannheim). Auf diesen Seiten finden Sie weitere Informationen über: die Ziele, Fragestellungen und Methoden des Projekts die beteiligten Personen und Forschungseinrichtungen die Fallstudien des Projekts *die Fachtagung Neue Wege in der Nutzung von Korpora: Data Mining für die textorientierten Geisteswissenschaften* am 30.10.2015 sowie über Aktivitäten und Veröffentlichungen (s.u.).**

KobRA-Software
Die im Projekt entwickelten und erprobten Softwarekomponenten finden Sie unter: Software. Die Installation und Anwendung der Komponenten ist im KobRA-Software-Handbuch (PDF) beschrieben.

Aktivitäten
Auf der Fachtagung Neue Wege in der Nutzung von Textkorpora: Data Mining für die textorientierten Geisteswissenschaften am 30.10.2015 an der BBAW präsentierten die Projektbeteiligten ihre Ergebnisse und diskutierten weiterführende Perspektiven. Das Tagungsprogramm und E-Folien zu den Präsentationen und Postern finden Sie hier. Vortrag A Data Mining Environment for Linguistic Research Based on CLARIN-D Language Resources (Katharina Morik, Thomas Bartz, Christian Pölitz, Angelika Storrer) auf der DCH2015 - Interdisciplinary Conference on Digital Cultural Heritage am 28.-30. Oktober 2015 in Berlin. Panel: Am 29.10.15 fand ein von Michael Beißwenger & Thierry Chanier organisiertes Panel TEI across corpora, languages and genres: Towards a standard for the representation of social media and computer-mediated communication" im Rahmen der Jahreskonferenz der Text encoding Initiative statt. Am Panel waren verschiedene KobRA-Akteure beteiligt. Vortrag: "Wikipedia as a corpus resource for linguistic research" (Angelika Storrer) auf der internationalen ird-cmc-Konferenz in Rennes/Frankreich am 23.10.2015. Panel: "Towards an encoding standard for social media and CMC: Experiences from German and French corpus projects using TEI" (organisiert von Michael Beißwenger & Thierry Chanier mit Beiträgen u.a. aus verschiedenen Korpusprojekten im KobRA-Kontext) auf der internationalen ird-cmc-Konferenz in Rennes/Frankreich am 23.10.2015. Posterpräsentation Verb Valency and Prepositional Complements in Learner Corpora - A Case Study in the German MERLIN Corpus (Tassja Weber) 3. Learner Corpus Research Conference (LCR) 2015, Nijmegen (Niederlande), 11-13.09.2015. Paper auf der Internationalen Fachtagung Text, Speech and Dialogue: Pölitz, Christian; Bartz, Thomas; Morik, Katharina; Storrer, Angelika (2015): Investigation of Word Senses over Time using Linguistic Corpora In: Matousek, Vaclav et al. (Hrsg.): Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer. Überblick über weitere Konferenzbeiträge und Projekt-Workshops: Aktivitäten

Veröffentlichungen und Dokumentationen
Bartz,Thomas; Pölitz, Christian; Morik, Katharina; Storrer, Angelika (2015): Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research. In: Jan Odijk (Ed): Selected Papers from the CLARIN 2014 Conference, October 24-25, 2014, Soesterberg, The Netherlands, 1-13. Geyken, Alexander; Jurish, Bryan; Würzner, Kay-Michael (2016): KobRA-Integration in die Rechercheumgebung am Zentrum Sprache der BBAW. Technischer Bericht, BBAW. Online-Veröffentlichung (PDF). Hinrichs, Marie (2016): Integration der KobRA-Verfahren in WebLicht. Technischer Bericht, Universität Tübingen. Online-Veröffentlichung (PDF). Diewald, Nils; Kupietz, Marc (2016): Integration der KobRA-Verfahren in die IDS-Infrastrukturen. Technischer Bericht, IDS Mannheim Online-Veröffentlichung (PDF). Bingel, Joachim; Diewald, Nils (2015): KoralQuery – a General Corpus Query Protocol. In: Proceedings of the Workshop on Innovative Corpus Query and Visualization Tools at NODALIDA 2015, Vilnius, Lithuania, May 11-13, 2015. Diewald,Nils; Bingel, Joachim (2015): KoralQuery 0.3. Technical Report, Working draft. IDS, Mannheim, Germany. Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods. In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. Proceedings-Band als PDF Thomas Bartz, Michael Beißwenger, Christian Pölitz, Nadja Radtke & Angelika Storrer (2014): Neue Möglichkeiten der Arbeit mit strukturierten Sprachressourcen in den Digital Humanities mithilfe von Data-Mining. Online Proceedings of the Digital Humanities 2014 annual international conference of the Alliance of Digital Humanities Organizations, Universität Lausanne, 10. Juli 2014 Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael (2014): Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014. Technischer Bericht, Technische Universität Dortmund. Online-Veröffentlichung (PDF) Didakowski, Jörg; Radtke, Nadja (2014): Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. Online-Veröffentlichung (PDF) Überblick über weitere Veröffentlichungen mit Projektbezug: Publikationen

@@ Zeile 1: / Zeile 1: @@
 {| class="wikitable" width="99%"
-|- class="hintergrundfarbe6"
-! <big>Herzlich willkommen</big>
 |-
-|style="background:#ffffff" |KobRA (Korpus-basierte Recherche und Analyse mit Hilfe von Data-Mining) ist ein Verbundprojekt, das seit September 2012 vom Bundesministerium für Bildung und Forschung (BMBF) im Rahmen des Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities gefördert wird.
+! <big> Herzlich willkommen </big>
+|-
+| style="background:#ffffff; padding:1em" |
+[[Datei:Kwic-kobra-2geo.png|links]] [[Datei:KobRA-RM.png|rechts]] '''KobRA&nbsp;(Korpus-basierte linguistische Recherche und Analyse mit Hilfe von Data-Mining)''' war ein Verbundprojekt, das von September 2012 bis Dezember 2015 vom [http://www.bmbf.de Bundesministerium für Bildung und Forschung (BMBF)] im Rahmen des '''[http://www.bmbf.de/foerderungen/16466.php Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities]''' gefördert wurde (Förderkennzeichen: 01UG1245A-E).
-Auf diesen Seiten bieten wir einen Überblick über:
+Im Projekt arbeiteten Partner aus Informatik, Linguistik und Sprachtechnologie gemeinsam daran, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern. Koordinatorin des Projekts war [http://germanistik.uni-mannheim.de/abteilungen/germanistische_linguistik/prof_dr_angelika_storrer/index.html Prof. Dr. Angelika Storrer (Universität Mannheim)].
-* [[Projektbeschreibung|die Ziele, Fragestellungen und Methoden des Projekts]]
-* [[Team|die beteiligten Personen und Forschungseinrichtungen]]
-* [[:Kategorie:Fallstudien|die Fallstudien des Projekts]]
-* sowie über Aktivitäten und aktuelle Veröffentlichungen (s.u.).
-[[Datei:KobRA-RM.jpg|800px|KobRA]]
+<div style="clear: left"></div> Auf diesen Seiten finden Sie weitere Informationen über:
+* '''[[Projektbeschreibung|die Ziele, Fragestellungen und Methoden des Projekts]]'''
+* '''[[Team|die beteiligten Personen und Forschungseinrichtungen]]'''
+* '''[[Fallstudien|die Fallstudien des Projekts]]'''
+*'''[[Fachtagung 30.10.2015|die Fachtagung ''Neue Wege in der Nutzung von Korpora: Data Mining für die textorientierten Geisteswissenschaften'' am 30.10.2015]]'''
+* '''sowie über Aktivitäten und Veröffentlichungen (s.u.).'''
+|}
+{| class="wikitable" width="99%"
+|-
+! <big> KobRA-Software </big>
+|-
+| style="background:#ffffff; padding:1em" |
+[[Datei:Gnome-System-Software-Installer-48.png|links]] Die im Projekt entwickelten und erprobten Softwarekomponenten finden Sie unter: [[Software]].<br /> Die Installation und Anwendung der Komponenten ist im [http://kobra.tu-dortmund.de/mediawiki/index.php?title=Datei:KobRA-Software-Handbuch_5.3.002.pdf KobRA-Software-Handbuch (PDF)] beschrieben.
 |}
 {| class="wikitable" width="49%" style="float:left; margin-right:1em"
-|- class="hintergrundfarbe6"
+|-
 ! <big>Aktivitäten</big>
 |-
-|style="background:#ffffff" |
+| style="background:#ffffff; padding:1em" |
-* [[Aktivitäten#DH_2014.2C_7.-12._Juni_2014_.28Lausanne.29|Erkenntnisreicher Austausch bei Posterpräsentation im Rahmen der internationalen Jahreskonferenz der ''Alliance of Digital Humanities Organizations'', ''Digital Humanities 2014'', in Lausanne]]
+*Auf der [[Fachtagung_30.10.2015:_Eindrücke_und_Einblicke|Fachtagung ''Neue Wege in der Nutzung von Textkorpora: Data Mining für die textorientierten Geisteswissenschaften]] am 30.10.2015 an der BBAW präsentierten die Projektbeteiligten ihre Ergebnisse und diskutierten weiterführende Perspektiven. Das Tagungsprogramm und E-Folien zu den Präsentationen und Postern finden Sie [[Fachtagung 30.10.2015|hier]].
+*Vortrag ''A Data Mining Environment for Linguistic Research Based on CLARIN-D Language Resources'' (Katharina Morik, Thomas Bartz, Christian Pölitz, Angelika Storrer) auf der [http://dch2015.net/abstracts_submission.shtml ''DCH2015 - Interdisciplinary Conference on Digital Cultural Heritage''] am 28.-30. Oktober 2015 in Berlin.
+* Panel: Am 29.10.15 fand ein von Michael Beißwenger & Thierry Chanier organisiertes Panel [http://tei2015.huma-num.fr/en/panelsround-tables/#acc-3 TEI across corpora, languages and genres: Towards a standard for the representation of social media and computer-mediated communication]" im Rahmen der [http://tei2015.huma-num.fr/en/ Jahreskonferenz der Text encoding Initiative] statt. Am Panel waren verschiedene KobRA-Akteure beteiligt.
+* Vortrag: "Wikipedia as a corpus resource for linguistic research" (Angelika Storrer) auf der [http://ird-cmc-rennes.sciencesconf.org/ internationalen ''ird-cmc''-Konferenz in Rennes/Frankreich] am 23.10.2015.
+* Panel: "Towards an encoding standard for social media and CMC: Experiences from German and French corpus projects using TEI" (organisiert von Michael Beißwenger & Thierry Chanier mit Beiträgen u.a. aus verschiedenen Korpusprojekten im KobRA-Kontext) auf der [http://ird-cmc-rennes.sciencesconf.org/ internationalen ''ird-cmc''-Konferenz in Rennes/Frankreich] am 23.10.2015.
+*Posterpräsentation ''Verb Valency and Prepositional Complements in Learner Corpora - A Case Study in the German MERLIN Corpus'' (Tassja Weber) 3. Learner Corpus Research Conference (LCR) 2015, Nijmegen (Niederlande), 11-13.09.2015.
-* [[Aktivitäten#LaTeCH_2013.2C_26._April_2013_.28G.C3.B6teborg.29|Vortrag zu bislang angewendeten Verfahren im Anwendungsfeld Lexikographie beim 8. Workshop ''Language Technology for Cultural Heritage, Social Sciences, and Humanities (LaTeCH 2014)'' im Rahmen der 14. Jahrestagung des ''European Chapter of the Association for Computational Linguistics (EACL 2014)'']]
+* Paper auf der Internationalen Fachtagung [http://www.kiv.zcu.cz/tsd2015/ ''Text, Speech and Dialogue'']: Pölitz, Christian; Bartz, Thomas; Morik, Katharina; Storrer, Angelika (2015): ''Investigation of Word Senses over Time using Linguistic Corpora'' In: Matousek, Vaclav et al. (Hrsg.): Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer.
-* [[Aktivitäten#DHd_2014.2C_25.-28._M.C3.A4rz_2014_.28Passau.29|Kurzvortrag und Poster mit Projektergebnissen für die erste Jahreskonferenz der ''Digital Humanities im deutschsprachigen Raum 2014'' in Passau]]
-Überblick über Konferenzbeiträge und Projekt-Workshops: s. '''[[Aktivitäten|Aktivitäten]]'''
+----
-'''Liste der [[Publikationen|Publikationen]] und [[Präsentationen|Präsentationen]] mit Projektbezug'''
+Überblick über weitere Konferenzbeiträge und Projekt-Workshops: '''[[Aktivitäten]]'''
 |}
 {| class="wikitable" width="49%" style="float:left"
-|- class="hintergrundfarbe6"
-! <big>Veröffentlichungen</big>
 |-
-|style="background:#ffffff" |
+! <big>Veröffentlichungen und Dokumentationen</big>
-*Bartz, Thomas; Radtke, Nadja (im Druck): '''Digitale Korpora in der Internet-Lexikographie. Bericht zur Sektion „Lexikographie“ der 2. Sektionentagung der Gesellschaft für Angewandte Linguistik (GAL e.V.) am 20. September 2013 an der RWTH Aachen''' In: Lexicographica 30/1, 603–608.
+|-
+| style="background:#ffffff; padding:1em" |
+*Bartz,Thomas; Pölitz, Christian; Morik, Katharina; Storrer, Angelika (2015): '''Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research'''. In: Jan Odijk (Ed): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=116;article=001 Selected Papers from the CLARIN 2014 Conference], October 24-25, 2014, Soesterberg, The Netherlands, 1-13.
+*Geyken, Alexander; Jurish, Bryan; Würzner, Kay-Michael (2016): '''KobRA-Integration in die Rechercheumgebung am Zentrum Sprache der BBAW'''. Technischer Bericht, BBAW. [[Media: KobRA_Technischer_Bericht_BBAW_Meilenstein_4b.pdf|Online-Veröffentlichung (PDF)]].
+* Hinrichs, Marie (2016): '''Integration der KobRA-Verfahren in WebLicht'''. Technischer Bericht, Universität Tübingen. [[Media: KobRA_Technischer_Bericht_TUEB_Meilenstein_4b.pdf|Online-Veröffentlichung (PDF)]].
+*Diewald, Nils; Kupietz, Marc (2016): ''' Integration der KobRA-Verfahren in die IDS-Infrastrukturen'''. Technischer Bericht, IDS Mannheim [[Media: KobRA_Technischer_Bericht_IDS_Meilenstein_4c.pdf|Online-Veröffentlichung (PDF)]].
+*Bingel, Joachim; Diewald, Nils (2015): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=111;article=001 '''KoralQuery – a General Corpus Query Protocol''']. In: Proceedings of the Workshop on Innovative Corpus Query and Visualization Tools at NODALIDA 2015, Vilnius, Lithuania, May 11-13, 2015.
+*Diewald,Nils; Bingel, Joachim (2015): [http://KorAP.github.io/Koral '''KoralQuery 0.3. Technical Report, Working draft''']. IDS, Mannheim, Germany.
+*Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): '''Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods.''' In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. [http://www.uni-hildesheim.de/konvens2014/data/konvens2014-workshop-proceedings.pdf Proceedings-Band als PDF]
+*Thomas Bartz, Michael Beißwenger, Christian Pölitz, Nadja Radtke & Angelika Storrer (2014): '''Neue Möglichkeiten der Arbeit mit strukturierten Sprachressourcen in den Digital Humanities mithilfe von Data-Mining.'''  [http://dharchive.org/paper/DH2014/Poster-894.xml Online Proceedings of the Digital Humanities 2014 annual international conference of the Alliance of Digital Humanities Organizations],  Universität Lausanne, 10. Juli 2014
+*Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael  (2014): '''Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014.''' Technischer Bericht, Technische Universität Dortmund. [[Media: KobRA-MS2_Verfahren.pdf|Online-Veröffentlichung (PDF)]]
+*Didakowski, Jörg; Radtke, Nadja (2014): '''Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. ''' In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. [http://euralex2014.eurac.edu/en/callforpapers/Documents/EURALEX%202014_gesamt.pdf Online-Veröffentlichung (PDF)]
-*Bartz, Thomas; Radtke, Nadja (2014): '''Digitale Korpora im Deutschunterricht: Didaktisches Potenzial''' In: Zeitschrift für germanistische Linguistik 42/1, 130–143.
-*Bartz, Thomas; Beißwenger, Michael; Storrer, Angelika (2014): '''Optimierung des Stuttgart-Tübingen-Tagset für die linguistische Annotation von Korpora zur internetbasierten Kommunikation: Phänomene, Herausforderungen, Erweiterungsvorschläge.''' In: Journal for Language Technology and Computational Linguistics (Themenheft "Das STTS-Tagset für Wortartentagging - Stand und Perspektiven"). [http://www.jlcl.org/2013_Heft1/7Bartz.pdf PDF-Version]
+----
-*Angelika Storrer (2014): '''Sprachverfall durch internetbasierte Kommunikation? Linguistische Erklärungsansätze – empirische Befunde'''. In: Sprachverfall? Dynamik – Wandel – Variation. Jahrbuch des Instituts für Deutsche Sprache 2013. [http://www.studiger.tu-dortmund.de/images/Storrer-ids2013.pdf PDF-Preprint]
+Überblick über weitere Veröffentlichungen mit Projektbezug: '''[[Publikationen]]'''
 |}

Hauptseite: Unterschied zwischen den Versionen

Aktuelle Version vom 24. März 2016, 13:49 Uhr

Navigationsmenü

Ansichten

Meine Werkzeuge

Projekt KobRA:

Wiki:

Suche

Werkzeuge