http://kobra.tu-dortmund.de/mediawiki/api.php?action=feedcontributions&user=Storrer&feedformat=atomKobra - Benutzerbeiträge [de]2024-03-29T05:07:29ZBenutzerbeiträgeMediaWiki 1.27.7http://kobra.tu-dortmund.de/mediawiki/index.php?title=Hauptseite&diff=1388Hauptseite2016-03-24T11:49:35Z<p>Storrer: </p>
<hr />
<div>{| class="wikitable" width="99%"<br />
|-<br />
! <big> Herzlich willkommen </big><br />
|- <br />
| style="background:#ffffff; padding:1em" | <br />
[[Datei:Kwic-kobra-2geo.png|links]] [[Datei:KobRA-RM.png|rechts]] '''KobRA&nbsp;(Korpus-basierte linguistische Recherche und Analyse mit Hilfe von Data-Mining)''' war ein Verbundprojekt, das von September 2012 bis Dezember 2015 vom [http://www.bmbf.de Bundesministerium für Bildung und Forschung (BMBF)] im Rahmen des '''[http://www.bmbf.de/foerderungen/16466.php Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities]''' gefördert wurde (Förderkennzeichen: 01UG1245A-E).<br />
<br />
Im Projekt arbeiteten Partner aus Informatik, Linguistik und Sprachtechnologie gemeinsam daran, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern. Koordinatorin des Projekts war [http://germanistik.uni-mannheim.de/abteilungen/germanistische_linguistik/prof_dr_angelika_storrer/index.html Prof. Dr. Angelika Storrer (Universität Mannheim)]. <br />
<br />
<div style="clear: left"></div> Auf diesen Seiten finden Sie weitere Informationen über:<br />
* '''[[Projektbeschreibung|die Ziele, Fragestellungen und Methoden des Projekts]]'''<br />
* '''[[Team|die beteiligten Personen und Forschungseinrichtungen]]'''<br />
* '''[[Fallstudien|die Fallstudien des Projekts]]'''<br />
*'''[[Fachtagung 30.10.2015|die Fachtagung ''Neue Wege in der Nutzung von Korpora: Data Mining für die textorientierten Geisteswissenschaften'' am 30.10.2015]]'''<br />
* '''sowie über Aktivitäten und Veröffentlichungen (s.u.).'''<br />
|}<br />
<br />
{| class="wikitable" width="99%"<br />
|-<br />
! <big> KobRA-Software </big><br />
|- <br />
| style="background:#ffffff; padding:1em" | <br />
[[Datei:Gnome-System-Software-Installer-48.png|links]] Die im Projekt entwickelten und erprobten Softwarekomponenten finden Sie unter: [[Software]].<br /> Die Installation und Anwendung der Komponenten ist im [http://kobra.tu-dortmund.de/mediawiki/index.php?title=Datei:KobRA-Software-Handbuch_5.3.002.pdf KobRA-Software-Handbuch (PDF)] beschrieben.<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left; margin-right:1em"<br />
|-<br />
! <big>Aktivitäten</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
*Auf der [[Fachtagung_30.10.2015:_Eindrücke_und_Einblicke|Fachtagung ''Neue Wege in der Nutzung von Textkorpora: Data Mining für die textorientierten Geisteswissenschaften]] am 30.10.2015 an der BBAW präsentierten die Projektbeteiligten ihre Ergebnisse und diskutierten weiterführende Perspektiven. Das Tagungsprogramm und E-Folien zu den Präsentationen und Postern finden Sie [[Fachtagung 30.10.2015|hier]].<br />
<br />
*Vortrag ''A Data Mining Environment for Linguistic Research Based on CLARIN-D Language Resources'' (Katharina Morik, Thomas Bartz, Christian Pölitz, Angelika Storrer) auf der [http://dch2015.net/abstracts_submission.shtml ''DCH2015 - Interdisciplinary Conference on Digital Cultural Heritage''] am 28.-30. Oktober 2015 in Berlin.<br />
<br />
* Panel: Am 29.10.15 fand ein von Michael Beißwenger & Thierry Chanier organisiertes Panel [http://tei2015.huma-num.fr/en/panelsround-tables/#acc-3 TEI across corpora, languages and genres: Towards a standard for the representation of social media and computer-mediated communication]" im Rahmen der [http://tei2015.huma-num.fr/en/ Jahreskonferenz der Text encoding Initiative] statt. Am Panel waren verschiedene KobRA-Akteure beteiligt.<br />
<br />
* Vortrag: "Wikipedia as a corpus resource for linguistic research" (Angelika Storrer) auf der [http://ird-cmc-rennes.sciencesconf.org/ internationalen ''ird-cmc''-Konferenz in Rennes/Frankreich] am 23.10.2015.<br />
<br />
* Panel: "Towards an encoding standard for social media and CMC: Experiences from German and French corpus projects using TEI" (organisiert von Michael Beißwenger & Thierry Chanier mit Beiträgen u.a. aus verschiedenen Korpusprojekten im KobRA-Kontext) auf der [http://ird-cmc-rennes.sciencesconf.org/ internationalen ''ird-cmc''-Konferenz in Rennes/Frankreich] am 23.10.2015.<br />
<br />
*Posterpräsentation ''Verb Valency and Prepositional Complements in Learner Corpora - A Case Study in the German MERLIN Corpus'' (Tassja Weber) 3. Learner Corpus Research Conference (LCR) 2015, Nijmegen (Niederlande), 11-13.09.2015. <br />
<br />
* Paper auf der Internationalen Fachtagung [http://www.kiv.zcu.cz/tsd2015/ ''Text, Speech and Dialogue'']: Pölitz, Christian; Bartz, Thomas; Morik, Katharina; Storrer, Angelika (2015): ''Investigation of Word Senses over Time using Linguistic Corpora'' In: Matousek, Vaclav et al. (Hrsg.): Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer.<br />
<br />
<br />
----<br />
<br />
Überblick über weitere Konferenzbeiträge und Projekt-Workshops: '''[[Aktivitäten]]'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left"<br />
|-<br />
! <big>Veröffentlichungen und Dokumentationen</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
*Bartz,Thomas; Pölitz, Christian; Morik, Katharina; Storrer, Angelika (2015): '''Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research'''. In: Jan Odijk (Ed): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=116;article=001 Selected Papers from the CLARIN 2014 Conference], October 24-25, 2014, Soesterberg, The Netherlands, 1-13.<br />
<br />
*Geyken, Alexander; Jurish, Bryan; Würzner, Kay-Michael (2016): '''KobRA-Integration in die Rechercheumgebung am Zentrum Sprache der BBAW'''. Technischer Bericht, BBAW. [[Media: KobRA_Technischer_Bericht_BBAW_Meilenstein_4b.pdf|Online-Veröffentlichung (PDF)]].<br />
<br />
* Hinrichs, Marie (2016): '''Integration der KobRA-Verfahren in WebLicht'''. Technischer Bericht, Universität Tübingen. [[Media: KobRA_Technischer_Bericht_TUEB_Meilenstein_4b.pdf|Online-Veröffentlichung (PDF)]].<br />
<br />
*Diewald, Nils; Kupietz, Marc (2016): ''' Integration der KobRA-Verfahren in die IDS-Infrastrukturen'''. Technischer Bericht, IDS Mannheim [[Media: KobRA_Technischer_Bericht_IDS_Meilenstein_4c.pdf|Online-Veröffentlichung (PDF)]].<br />
<br />
*Bingel, Joachim; Diewald, Nils (2015): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=111;article=001 '''KoralQuery – a General Corpus Query Protocol''']. In: Proceedings of the Workshop on Innovative Corpus Query and Visualization Tools at NODALIDA 2015, Vilnius, Lithuania, May 11-13, 2015. <br />
<br />
*Diewald,Nils; Bingel, Joachim (2015): [http://KorAP.github.io/Koral '''KoralQuery 0.3. Technical Report, Working draft''']. IDS, Mannheim, Germany. <br />
<br />
*Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): '''Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods.''' In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. [http://www.uni-hildesheim.de/konvens2014/data/konvens2014-workshop-proceedings.pdf Proceedings-Band als PDF]<br />
<br />
*Thomas Bartz, Michael Beißwenger, Christian Pölitz, Nadja Radtke & Angelika Storrer (2014): '''Neue Möglichkeiten der Arbeit mit strukturierten Sprachressourcen in den Digital Humanities mithilfe von Data-Mining.''' [http://dharchive.org/paper/DH2014/Poster-894.xml Online Proceedings of the Digital Humanities 2014 annual international conference of the Alliance of Digital Humanities Organizations], Universität Lausanne, 10. Juli 2014<br />
<br />
*Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael (2014): '''Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014.''' Technischer Bericht, Technische Universität Dortmund. [[Media: KobRA-MS2_Verfahren.pdf|Online-Veröffentlichung (PDF)]]<br />
<br />
*Didakowski, Jörg; Radtke, Nadja (2014): '''Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. ''' In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. [http://euralex2014.eurac.edu/en/callforpapers/Documents/EURALEX%202014_gesamt.pdf Online-Veröffentlichung (PDF)]<br />
<br />
<br />
----<br />
<br />
Überblick über weitere Veröffentlichungen mit Projektbezug: '''[[Publikationen]]'''<br />
|}</div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Hauptseite&diff=1387Hauptseite2016-03-24T11:48:49Z<p>Storrer: </p>
<hr />
<div>{| class="wikitable" width="99%"<br />
|-<br />
! <big> Herzlich willkommen </big><br />
|- <br />
| style="background:#ffffff; padding:1em" | <br />
[[Datei:Kwic-kobra-2geo.png|links]] [[Datei:KobRA-RM.png|rechts]] '''KobRA&nbsp;(Korpus-basierte linguistische Recherche und Analyse mit Hilfe von Data-Mining)''' war ein Verbundprojekt, das von September 2012 bis Dezember 2015 vom [http://www.bmbf.de Bundesministerium für Bildung und Forschung (BMBF)] im Rahmen des '''[http://www.bmbf.de/foerderungen/16466.php Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities]''' gefördert wurde (Förderkennzeichen: 01UG1245A-E).<br />
<br />
Im Projekt arbeiteten Partner aus Informatik, Linguistik und Sprachtechnologie gemeinsam daran, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern. Koordinatorin des Projekts war [http://germanistik.uni-mannheim.de/abteilungen/germanistische_linguistik/prof_dr_angelika_storrer/index.html Prof. Dr. Angelika Storrer (Universität Mannheim)]. <br />
<br />
<div style="clear: left"></div> Auf diesen Seiten bieten wir einen Überblick und detailliertere Informationen über:<br />
* '''[[Projektbeschreibung|die Ziele, Fragestellungen und Methoden des Projekts]]'''<br />
* '''[[Team|die beteiligten Personen und Forschungseinrichtungen]]'''<br />
* '''[[Fallstudien|die Fallstudien des Projekts]]'''<br />
*'''[[Fachtagung 30.10.2015|die Fachtagung ''Neue Wege in der Nutzung von Korpora: Data Mining für die textorientierten Geisteswissenschaften'' am 30.10.2015]]'''<br />
* '''sowie über Aktivitäten und Veröffentlichungen (s.u.).'''<br />
|}<br />
<br />
{| class="wikitable" width="99%"<br />
|-<br />
! <big> KobRA-Software </big><br />
|- <br />
| style="background:#ffffff; padding:1em" | <br />
[[Datei:Gnome-System-Software-Installer-48.png|links]] Die im Projekt entwickelten und erprobten Softwarekomponenten finden Sie unter: [[Software]].<br /> Die Installation und Anwendung der Komponenten ist im [http://kobra.tu-dortmund.de/mediawiki/index.php?title=Datei:KobRA-Software-Handbuch_5.3.002.pdf KobRA-Software-Handbuch (PDF)] beschrieben.<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left; margin-right:1em"<br />
|-<br />
! <big>Aktivitäten</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
*Auf der [[Fachtagung_30.10.2015:_Eindrücke_und_Einblicke|Fachtagung ''Neue Wege in der Nutzung von Textkorpora: Data Mining für die textorientierten Geisteswissenschaften]] am 30.10.2015 an der BBAW präsentierten die Projektbeteiligten ihre Ergebnisse und diskutierten weiterführende Perspektiven. Das Tagungsprogramm und E-Folien zu den Präsentationen und Postern finden Sie [[Fachtagung 30.10.2015|hier]].<br />
<br />
*Vortrag ''A Data Mining Environment for Linguistic Research Based on CLARIN-D Language Resources'' (Katharina Morik, Thomas Bartz, Christian Pölitz, Angelika Storrer) auf der [http://dch2015.net/abstracts_submission.shtml ''DCH2015 - Interdisciplinary Conference on Digital Cultural Heritage''] am 28.-30. Oktober 2015 in Berlin.<br />
<br />
* Panel: Am 29.10.15 fand ein von Michael Beißwenger & Thierry Chanier organisiertes Panel [http://tei2015.huma-num.fr/en/panelsround-tables/#acc-3 TEI across corpora, languages and genres: Towards a standard for the representation of social media and computer-mediated communication]" im Rahmen der [http://tei2015.huma-num.fr/en/ Jahreskonferenz der Text encoding Initiative] statt. Am Panel waren verschiedene KobRA-Akteure beteiligt.<br />
<br />
* Vortrag: "Wikipedia as a corpus resource for linguistic research" (Angelika Storrer) auf der [http://ird-cmc-rennes.sciencesconf.org/ internationalen ''ird-cmc''-Konferenz in Rennes/Frankreich] am 23.10.2015.<br />
<br />
* Panel: "Towards an encoding standard for social media and CMC: Experiences from German and French corpus projects using TEI" (organisiert von Michael Beißwenger & Thierry Chanier mit Beiträgen u.a. aus verschiedenen Korpusprojekten im KobRA-Kontext) auf der [http://ird-cmc-rennes.sciencesconf.org/ internationalen ''ird-cmc''-Konferenz in Rennes/Frankreich] am 23.10.2015.<br />
<br />
*Posterpräsentation ''Verb Valency and Prepositional Complements in Learner Corpora - A Case Study in the German MERLIN Corpus'' (Tassja Weber) 3. Learner Corpus Research Conference (LCR) 2015, Nijmegen (Niederlande), 11-13.09.2015. <br />
<br />
* Paper auf der Internationalen Fachtagung [http://www.kiv.zcu.cz/tsd2015/ ''Text, Speech and Dialogue'']: Pölitz, Christian; Bartz, Thomas; Morik, Katharina; Storrer, Angelika (2015): ''Investigation of Word Senses over Time using Linguistic Corpora'' In: Matousek, Vaclav et al. (Hrsg.): Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer.<br />
<br />
<br />
----<br />
<br />
Überblick über weitere Konferenzbeiträge und Projekt-Workshops: '''[[Aktivitäten]]'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left"<br />
|-<br />
! <big>Veröffentlichungen und Dokumentationen</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
*Bartz,Thomas; Pölitz, Christian; Morik, Katharina; Storrer, Angelika (2015): '''Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research'''. In: Jan Odijk (Ed): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=116;article=001 Selected Papers from the CLARIN 2014 Conference], October 24-25, 2014, Soesterberg, The Netherlands, 1-13.<br />
<br />
*Geyken, Alexander; Jurish, Bryan; Würzner, Kay-Michael (2016): '''KobRA-Integration in die Rechercheumgebung am Zentrum Sprache der BBAW'''. Technischer Bericht, BBAW. [[Media: KobRA_Technischer_Bericht_BBAW_Meilenstein_4b.pdf|Online-Veröffentlichung (PDF)]].<br />
<br />
* Hinrichs, Marie (2016): '''Integration der KobRA-Verfahren in WebLicht'''. Technischer Bericht, Universität Tübingen. [[Media: KobRA_Technischer_Bericht_TUEB_Meilenstein_4b.pdf|Online-Veröffentlichung (PDF)]].<br />
<br />
*Diewald, Nils; Kupietz, Marc (2016): ''' Integration der KobRA-Verfahren in die IDS-Infrastrukturen'''. Technischer Bericht, IDS Mannheim [[Media: KobRA_Technischer_Bericht_IDS_Meilenstein_4c.pdf|Online-Veröffentlichung (PDF)]].<br />
<br />
*Bingel, Joachim; Diewald, Nils (2015): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=111;article=001 '''KoralQuery – a General Corpus Query Protocol''']. In: Proceedings of the Workshop on Innovative Corpus Query and Visualization Tools at NODALIDA 2015, Vilnius, Lithuania, May 11-13, 2015. <br />
<br />
*Diewald,Nils; Bingel, Joachim (2015): [http://KorAP.github.io/Koral '''KoralQuery 0.3. Technical Report, Working draft''']. IDS, Mannheim, Germany. <br />
<br />
*Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): '''Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods.''' In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. [http://www.uni-hildesheim.de/konvens2014/data/konvens2014-workshop-proceedings.pdf Proceedings-Band als PDF]<br />
<br />
*Thomas Bartz, Michael Beißwenger, Christian Pölitz, Nadja Radtke & Angelika Storrer (2014): '''Neue Möglichkeiten der Arbeit mit strukturierten Sprachressourcen in den Digital Humanities mithilfe von Data-Mining.''' [http://dharchive.org/paper/DH2014/Poster-894.xml Online Proceedings of the Digital Humanities 2014 annual international conference of the Alliance of Digital Humanities Organizations], Universität Lausanne, 10. Juli 2014<br />
<br />
*Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael (2014): '''Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014.''' Technischer Bericht, Technische Universität Dortmund. [[Media: KobRA-MS2_Verfahren.pdf|Online-Veröffentlichung (PDF)]]<br />
<br />
*Didakowski, Jörg; Radtke, Nadja (2014): '''Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. ''' In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. [http://euralex2014.eurac.edu/en/callforpapers/Documents/EURALEX%202014_gesamt.pdf Online-Veröffentlichung (PDF)]<br />
<br />
<br />
----<br />
<br />
Überblick über weitere Veröffentlichungen mit Projektbezug: '''[[Publikationen]]'''<br />
|}</div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Hauptseite&diff=1386Hauptseite2016-03-24T11:47:55Z<p>Storrer: </p>
<hr />
<div>{| class="wikitable" width="99%"<br />
|-<br />
! <big> Herzlich willkommen </big><br />
|- <br />
| style="background:#ffffff; padding:1em" | <br />
[[Datei:Kwic-kobra-2geo.png|links]] [[Datei:KobRA-RM.png|rechts]] '''KobRA&nbsp;(Korpus-basierte linguistische Recherche und Analyse mit Hilfe von Data-Mining)''' war ein Verbundprojekt, das von September 2012 bis Dezember 2015 vom [http://www.bmbf.de Bundesministerium für Bildung und Forschung (BMBF)] im Rahmen des '''[http://www.bmbf.de/foerderungen/16466.php Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities]''' gefördert wurde (Förderkennzeichen: 01UG1245A-E).<br />
<br />
Im Projekt arbeiteten Partner aus Informatik, Linguistik und Sprachtechnologie gemeinsam daran, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern. Koordinatorin des Projekts war [http://germanistik.uni-mannheim.de/abteilungen/germanistische_linguistik/prof_dr_angelika_storrer/index.html Prof. Dr. Angelika Storrer (Universität Mannheim)]. <br />
<br />
<div style="clear: left"></div> Auf diesen Seiten bieten wir einen Überblick und detailliertere Informationen über:<br />
* '''[[Projektbeschreibung|die Ziele, Fragestellungen und Methoden des Projekts]]'''<br />
* '''[[Team|die beteiligten Personen und Forschungseinrichtungen]]'''<br />
* '''[[Fallstudien|die Fallstudien des Projekts]]'''<br />
*'''[[Fachtagung 30.10.2015|die Fachtagung ''Neue Wege in der Nutzung von Korpora'' am 30.10.2015]]'''<br />
* '''sowie über Aktivitäten und Veröffentlichungen (s.u.).'''<br />
|}<br />
<br />
{| class="wikitable" width="99%"<br />
|-<br />
! <big> KobRA-Software </big><br />
|- <br />
| style="background:#ffffff; padding:1em" | <br />
[[Datei:Gnome-System-Software-Installer-48.png|links]] Die im Projekt entwickelten und erprobten Softwarekomponenten finden Sie unter: [[Software]].<br /> Die Installation und Anwendung der Komponenten ist im [http://kobra.tu-dortmund.de/mediawiki/index.php?title=Datei:KobRA-Software-Handbuch_5.3.002.pdf KobRA-Software-Handbuch (PDF)] beschrieben.<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left; margin-right:1em"<br />
|-<br />
! <big>Aktivitäten</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
*Auf der [[Fachtagung_30.10.2015:_Eindrücke_und_Einblicke|Fachtagung ''Neue Wege in der Nutzung von Textkorpora: Data Mining für die textorientierten Geisteswissenschaften]] am 30.10.2015 an der BBAW präsentierten die Projektbeteiligten ihre Ergebnisse und diskutierten weiterführende Perspektiven. Das Tagungsprogramm und E-Folien zu den Präsentationen und Postern finden Sie [[Fachtagung 30.10.2015|hier]].<br />
<br />
*Vortrag ''A Data Mining Environment for Linguistic Research Based on CLARIN-D Language Resources'' (Katharina Morik, Thomas Bartz, Christian Pölitz, Angelika Storrer) auf der [http://dch2015.net/abstracts_submission.shtml ''DCH2015 - Interdisciplinary Conference on Digital Cultural Heritage''] am 28.-30. Oktober 2015 in Berlin.<br />
<br />
* Panel: Am 29.10.15 fand ein von Michael Beißwenger & Thierry Chanier organisiertes Panel [http://tei2015.huma-num.fr/en/panelsround-tables/#acc-3 TEI across corpora, languages and genres: Towards a standard for the representation of social media and computer-mediated communication]" im Rahmen der [http://tei2015.huma-num.fr/en/ Jahreskonferenz der Text encoding Initiative] statt. Am Panel waren verschiedene KobRA-Akteure beteiligt.<br />
<br />
* Vortrag: "Wikipedia as a corpus resource for linguistic research" (Angelika Storrer) auf der [http://ird-cmc-rennes.sciencesconf.org/ internationalen ''ird-cmc''-Konferenz in Rennes/Frankreich] am 23.10.2015.<br />
<br />
* Panel: "Towards an encoding standard for social media and CMC: Experiences from German and French corpus projects using TEI" (organisiert von Michael Beißwenger & Thierry Chanier mit Beiträgen u.a. aus verschiedenen Korpusprojekten im KobRA-Kontext) auf der [http://ird-cmc-rennes.sciencesconf.org/ internationalen ''ird-cmc''-Konferenz in Rennes/Frankreich] am 23.10.2015.<br />
<br />
*Posterpräsentation ''Verb Valency and Prepositional Complements in Learner Corpora - A Case Study in the German MERLIN Corpus'' (Tassja Weber) 3. Learner Corpus Research Conference (LCR) 2015, Nijmegen (Niederlande), 11-13.09.2015. <br />
<br />
* Paper auf der Internationalen Fachtagung [http://www.kiv.zcu.cz/tsd2015/ ''Text, Speech and Dialogue'']: Pölitz, Christian; Bartz, Thomas; Morik, Katharina; Storrer, Angelika (2015): ''Investigation of Word Senses over Time using Linguistic Corpora'' In: Matousek, Vaclav et al. (Hrsg.): Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer.<br />
<br />
<br />
----<br />
<br />
Überblick über weitere Konferenzbeiträge und Projekt-Workshops: '''[[Aktivitäten]]'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left"<br />
|-<br />
! <big>Veröffentlichungen und Dokumentationen</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
*Bartz,Thomas; Pölitz, Christian; Morik, Katharina; Storrer, Angelika (2015): '''Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research'''. In: Jan Odijk (Ed): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=116;article=001 Selected Papers from the CLARIN 2014 Conference], October 24-25, 2014, Soesterberg, The Netherlands, 1-13.<br />
<br />
*Geyken, Alexander; Jurish, Bryan; Würzner, Kay-Michael (2016): '''KobRA-Integration in die Rechercheumgebung am Zentrum Sprache der BBAW'''. Technischer Bericht, BBAW. [[Media: KobRA_Technischer_Bericht_BBAW_Meilenstein_4b.pdf|Online-Veröffentlichung (PDF)]].<br />
<br />
* Hinrichs, Marie (2016): '''Integration der KobRA-Verfahren in WebLicht'''. Technischer Bericht, Universität Tübingen. [[Media: KobRA_Technischer_Bericht_TUEB_Meilenstein_4b.pdf|Online-Veröffentlichung (PDF)]].<br />
<br />
*Diewald, Nils; Kupietz, Marc (2016): ''' Integration der KobRA-Verfahren in die IDS-Infrastrukturen'''. Technischer Bericht, IDS Mannheim [[Media: KobRA_Technischer_Bericht_IDS_Meilenstein_4c.pdf|Online-Veröffentlichung (PDF)]].<br />
<br />
*Bingel, Joachim; Diewald, Nils (2015): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=111;article=001 '''KoralQuery – a General Corpus Query Protocol''']. In: Proceedings of the Workshop on Innovative Corpus Query and Visualization Tools at NODALIDA 2015, Vilnius, Lithuania, May 11-13, 2015. <br />
<br />
*Diewald,Nils; Bingel, Joachim (2015): [http://KorAP.github.io/Koral '''KoralQuery 0.3. Technical Report, Working draft''']. IDS, Mannheim, Germany. <br />
<br />
*Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): '''Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods.''' In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. [http://www.uni-hildesheim.de/konvens2014/data/konvens2014-workshop-proceedings.pdf Proceedings-Band als PDF]<br />
<br />
*Thomas Bartz, Michael Beißwenger, Christian Pölitz, Nadja Radtke & Angelika Storrer (2014): '''Neue Möglichkeiten der Arbeit mit strukturierten Sprachressourcen in den Digital Humanities mithilfe von Data-Mining.''' [http://dharchive.org/paper/DH2014/Poster-894.xml Online Proceedings of the Digital Humanities 2014 annual international conference of the Alliance of Digital Humanities Organizations], Universität Lausanne, 10. Juli 2014<br />
<br />
*Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael (2014): '''Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014.''' Technischer Bericht, Technische Universität Dortmund. [[Media: KobRA-MS2_Verfahren.pdf|Online-Veröffentlichung (PDF)]]<br />
<br />
*Didakowski, Jörg; Radtke, Nadja (2014): '''Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. ''' In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. [http://euralex2014.eurac.edu/en/callforpapers/Documents/EURALEX%202014_gesamt.pdf Online-Veröffentlichung (PDF)]<br />
<br />
<br />
----<br />
<br />
Überblick über weitere Veröffentlichungen mit Projektbezug: '''[[Publikationen]]'''<br />
|}</div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Hauptseite&diff=1150Hauptseite2016-01-09T08:19:59Z<p>Storrer: </p>
<hr />
<div>{| class="wikitable" width="99%"<br />
|-<br />
! <big> Herzlich willkommen </big><br />
|- <br />
| style="background:#ffffff; padding:1em" | <br />
[[Datei:Kwic-kobra-2geo.png|links]] [[Datei:KobRA-RM.png|rechts]] '''KobRA&nbsp;(Korpus-basierte Recherche und Analyse mit Hilfe von Data-Mining)''' ist ein Verbundprojekt, das von September 2012 bis Dezember 2015 vom [http://www.bmbf.de Bundesministerium für Bildung und Forschung (BMBF)] im Rahmen des '''[http://www.bmbf.de/foerderungen/16466.php Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities]''' gefördert wurde (Förderkennzeichen: 01UG1245A).<br />
<br />
Im Projekt arbeiteten Partner aus Informatik, Linguistik und Sprachtechnologie gemeinsam daran, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern. Koordinatorin des Projekts war [http://germanistik.uni-mannheim.de/abteilungen/germanistische_linguistik/prof_dr_angelika_storrer/index.html Prof. Dr. Angelika Storrer (Universität Mannheim)]. <br />
<br />
<div style="clear: left"></div> Auf diesen Seiten bieten wir einen Überblick und detailliertere Informationen über:<br />
* '''[[Projektbeschreibung|die Ziele, Fragestellungen und Methoden des Projekts]]'''<br />
* '''[[Team|die beteiligten Personen und Forschungseinrichtungen]]'''<br />
* '''[[Fallstudien|die Fallstudien des Projekts]]'''<br />
*'''[[Fachtagung 30.10.2015|die Projekt-Abschlusstagung]]'''<br />
* '''sowie über Aktivitäten und aktuelle Veröffentlichungen (s.u.).'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left; margin-right:1em"<br />
|-<br />
! <big>Aktivitäten</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
*Auf der [[Fachtagung_30.10.2015:_Eindrücke_und_Einblicke|Fachtagung ''Neue Wege in der Nutzung von Textkorpora: Data Mining für die textorientierten Geisteswissenschaften]] am 30.10.2015 an der BBAW präsentierten die Projektbeteiligten ihre Ergebnisse und diskutierten weiterführende Perspektiven. Das Tagungsprogramm und E-Folien zu den Präsentationen und Postern finden Sie [[Fachtagung 30.10.2015|hier]].<br />
<br />
*Vortrag ''A Data Mining Environment for Linguistic Research Based on CLARIN-D Language Resources'' (Katharina Morik, Thomas Bartz, Christian Pölitz, Angelika Storrer) auf der [http://dch2015.net/abstracts_submission.shtml ''DCH2015 - Interdisciplinary Conference on Digital Cultural Heritage''] am 28.-30. Oktober 2015 in Berlin.<br />
<br />
* Panel: Am 29.10.15 wird ein von von Michael Beißwenger & Thierry Chanier organisiertes Panel [http://tei2015.huma-num.fr/en/panelsround-tables/#acc-3 TEI across corpora, languages and genres: Towards a standard for the representation of social media and computer-mediated communication]" im Rahmen der [http://tei2015.huma-num.fr/en/ Jahreskonferenz der Text encoding Initiative] stattfinden. Am Panel sind verschiedene KobRA-Akteure beteiligt.<br />
<br />
* Vortrag: "Wikipedia as a corpus resource for linguistic research" (Angelika Storrer) auf der [http://ird-cmc-rennes.sciencesconf.org/ internationalen ''ird-cmc''-Konferenz in Rennes/Frankreich] am 23.10.2015.<br />
<br />
* Panel: "Towards an encoding standard for social media and CMC: Experiences from German and French corpus projects using TEI" (organisiert von Michael Beißwenger & Thierry Chanier mit Beiträgen u.a. aus verschiedenen Korpusprojekten im KobRA-Kontext) auf der [http://ird-cmc-rennes.sciencesconf.org/ internationalen ''ird-cmc''-Konferenz in Rennes/Frankreich] am 23.10.2015.<br />
<br />
*Posterpräsentation ''Verb Valency and Prepositional Complements in Learner Corpora - A Case Study in the German MERLIN Corpus'' (Tassja Weber) 3. Learner Corpus Research Conference (LCR) 2015, Nijmegen (Niederlande), 11-13.09.2015. <br />
<br />
* Paper auf der Internationalen Fachtagung [http://www.kiv.zcu.cz/tsd2015/ ''Text, Speech and Dialogue'']: Pölitz, Christian; Bartz, Thomas; Morik, Katharina; Storrer, Angelika (2015): ''Investigation of Word Senses over Time using Linguistic Corpora'' In: Matousek, Vaclav et al. (Hrsg.): Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer.<br />
<br />
<br />
----<br />
<br />
Überblick über weitere Konferenzbeiträge und Projekt-Workshops: '''[[Aktivitäten]]'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left"<br />
|-<br />
! <big>Veröffentlichungen und Dokumentationen</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
*<span style= "color:#FF0000;">'''NEU: '''</span>Anleitung zur [[Visualisierung von diachronen Kollokationen]] mithilfe von KobRA-Werkzeugen und RapidMiner. [[Visualisierung von diachronen Kollokationen|Direkt zur Anleitung]].<br />
<br />
*<span style= "color:#FF0000;">'''NEU: '''</span><b>Handbuch: Korpus-basierte linguistische Recherche und Analyse mithilfe des RapidMiner. Nutzung des KobRA-Plug-ins.</b> [http://kobra.tu-dortmund.de/mediawiki/index.php?title=Datei:RapidMiner-Handbuch_2015-20-10.pdf PDF] Stand: 20.10.2015. <br />
<br />
*Bartz,Thomas; Pölitz, Christian; Morik, Katharina; Storrer, Angelika (2015): '''Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research'''. In: Jan Odijk (Ed): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=116;article=001 Selected Papers from the CLARIN 2014 Conference], October 24-25, 2014, Soesterberg, The Netherlands, 1-13.<br />
<br />
*Bingel, Joachim; Diewald, Nils (2015): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=111;article=001 '''KoralQuery – a General Corpus Query Protocol''']. In: Proceedings of the Workshop on Innovative Corpus Query and Visualization Tools at NODALIDA 2015, Vilnius, Lithuania, May 11-13, 2015. <br />
<br />
*Diewald,Nils; Bingel, Joachim (2015): [http://KorAP.github.io/Koral '''KoralQuery 0.3. Technical Report, Working draft''']. IDS, Mannheim, Germany. <br />
<br />
*Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): '''Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods.''' In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. [http://www.uni-hildesheim.de/konvens2014/data/konvens2014-workshop-proceedings.pdf Proceedings-Band als PDF]<br />
<br />
*Thomas Bartz, Michael Beißwenger, Christian Pölitz, Nadja Radtke & Angelika Storrer (2014): '''Neue Möglichkeiten der Arbeit mit strukturierten Sprachressourcen in den Digital Humanities mithilfe von Data-Mining.''' [http://dharchive.org/paper/DH2014/Poster-894.xml Online Proceedings of the Digital Humanities 2014 annual international conference of the Alliance of Digital Humanities Organizations], Universität Lausanne, 10. Juli 2014<br />
<br />
*Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael (2014): '''Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014.''' Technischer Bericht, Technische Universität Dortmund. [[Media: KobRA-MS2_Verfahren.pdf|Online-Veröffentlichung (PDF)]]<br />
<br />
*Didakowski, Jörg; Radtke, Nadja (2014): '''Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. ''' In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. [http://euralex2014.eurac.edu/en/callforpapers/Documents/EURALEX%202014_gesamt.pdf Online-Veröffentlichung (PDF)]<br />
<br />
<br />
----<br />
<br />
Überblick über weitere Veröffentlichungen mit Projektbezug: '''[[Publikationen]]'''<br />
|}</div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Fachtagung_30.10.2015&diff=1149Fachtagung 30.10.20152015-11-22T17:32:39Z<p>Storrer: </p>
<hr />
<div><table width="1000" border="0" cellpadding="7" cellspacing ="2"><br />
<tr><br />
<td bgcolor="#FEEAAB"><big>'''Fachtagung ''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'''''</big></td><br />
</tr><br />
<tr><br />
<td>'''Ort:''' [http://www.bbaw.de/ Berlin-Brandenburgische Akademie der Wissenschaften (BBAW)] Einsteinsaal.<br />
'''Termin:''' 30. Oktober 2015 9:30 - 19:00 Uhr<br />
<br />
[[Fachtagung_30.10.2015:_Eindrücke_und_Einblicke|Zusammenfassung und Bilder]] <br />
<br />
Auf dieser Fachtagung stellte das BMBF-Verbundprojekt KobRA (Korpus-basierte linguistische Recherche und Analyse mit Hilfe von Data-Mining) seine Ergebnisse vor und diskutierte weiterführende Perspektiven. [[Fachtagung_30.10.2015:_Eindrücke_und_Einblicke|Bilder ]] <br />
</td><br />
</tr><br />
</table><br />
<br />
'''Tagungsprogramm (mit PDF-Versionen von E-Folien und Postern)''' <br />
<table width="1000" border="0" bgcolor="#FEEAAB" cellpadding="7" cellspacing ="2"><br />
<tr><br />
<td bgcolor="#CDCDCD"> 9:30-9:40 </td><br />
<td> '''Begrüßung und Eröffnung'''</td><br />
</tr><br />
<tr><br />
<td> 9:40-10:05 </td><br />
<td bgcolor="#CDCDCD"> '''Korpusbasierte Recherche und Analyse mit Hilfe von Data-Mining: Das BMBF-Projekt KobRA''' (Prof. Dr. Angelika Storrer, Universität Mannheim) [[Media:Präsentation_Storrer_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD"> 10:05-10:30 </td><br />
<td> '''RapidMiner als Werkzeug für die textorientierten Geisteswissenschaften''' (Prof. Dr. Katharina Morik, TU Dortmund) [[Media:Präsentation_Morik_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td>10:30-11:00</td><br />
<td bgcolor="#CDCDCD">Kaffeepause</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">11:00-11:30</td><br />
<td>'''Routineaufgaben bei der Nutzung von Korpora: Disambiguieren, Klassifizieren, Annotieren mit KobRA-Verfahren'''<br/>(Thomas Bartz/Christian Pölitz, TU Dortmund) [[Media:Präsentation_Bartz_Poelitz_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td>11:30-12:00</td><br />
<td bgcolor="#CDCDCD">'''Extraktion guter Belege aus Textkorpora durch Kombination eines regelbasierten Verfahrens mit maschinellem Lernen'''<br/>(Dr. Alexander Geyken/Dr. Lothar Lemnitzer, BBAW) [[Media:Präsentation_Geyken_Lemnitzer_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">12:00-12:30</td><br />
<td>'''Korpusbasierte Analyse internetbasierter Kommunikation: Herausforderungen und Perspektiven'''<br/>(PD Dr. Michael Beißwenger, TU Dortmund/Dr. Harald Lüngen, IDS/Christian Pölitz, TU Dortmund) [[Media:Präsentation_Beisswenger_Luengen_Poelitz_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td>12:30-14:00</td><br />
<td bgcolor="#CDCDCD">Mittagspause</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">14:00-14:25</td><br />
<td>'''Neue Entwicklungen und Wege bei der Erstellung, Erweiterung und Nutzung von Korpora am Zentrum Sprache'''<br/>(Dr. Alexander Geyken/Bryan Jurish/Kay Michael Würzner, BBAW) [[Media:Präsentation_Geyken_Jurish_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td>14:25-14:50</td><br />
<td bgcolor="#CDCDCD">'''Schnittstellen zur Nutzung der Korpusanalyseplattform KorAP''' (Nils Diewald/Dr. Marc Kupietz, IDS) [[Media:Präsentation_Kupietz_Diewald_30.10.2015.pdf|(PDF)]] </td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">14:50-15:15</td><br />
<td>'''Integration von KobRA Services in die CLARIN Forschungsinfrastruktur''' (Prof. Dr. Erhard Hinrichs/Marie Hinrichs, SfS Universität Tübingen) [[Media:Präsentation_Hinrichs_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td>15:15-16:00</td><br />
<td bgcolor="#CDCDCD">Kaffeepause, z.T. parallel zur Postersession</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">15:30-16:50</td><br />
<td>'''Postersession und Systemdemonstrationen''' (Stand 22.10.):<br />
*Thomas Bartz/Christian Pölitz/Angelika Storrer:'' Korpus-basierte linguistische Recherche und Analyse mit Hilfe von Data-Mining („KobRA“). Erprobung innovativer Data-Mining-Verfahren für die empirische Arbeit mit strukturierten Sprachressourcen''<br />
*Michael Beißwenger/Thomas Bartz/Axel Herold/Marc Kupietz/Lothar Lemnitzer/Harald Lüngen/Angelika Storrer: ''Aufbau von Social-Media-Korpora für die Digital Humanities: Standards und Perspektiven'' [[Media:Poster_Beisswenger et al_Social Media Corpora_30.10.2015.pdf|(PDF)]] <br /><br />
*Michael Beißwenger/Christian Pölitz/Lena Meyer: ''KobRA @ Classroom: Ein interdisziplinäres Projektseminar zum Einsatz von Data-Mining bei der korpusgestützten Analyse internetbasierter Kommunikation'' [[Media:Poster_Beisswenger_Poelitz_Meyer_Classroom_30.10.2015.pdf|(PDF)]]<br /><br />
*Tassja Weber/Laura Herzberg: ''Studienarbeiten zur internetbasierten Kommunikation mit KobRA-Verfahren an der Universität Mannheim'' [[Media:Poster_Herzberg_Weber_Studienarbeiten Mannheim_30.10.2015.pdf|(PDF)]]<br />
*Jörg Didakowski/Nadja Radtke: ''Korpusbasierte Analyse von deutschen Stützverbgefügen'' [[Media:Poster_Didakowski_Radtke_SVG_30.10.2015.pdf|(PDF)]]<br /><br />
*Sebastian Buschjäger/Lukas Pfahler: ''Discovering Subtle Word Relations in Large German Corpora''<br /> <br />
*Maria Ermakova: ''Baby vs. Säugling: Wer gewinnt im XX. Jahrhundert? Eine korpusbasierte Studie zur Semantik und Pragmatik des Fremdwortgebrauchs''<br />
*Erik-Lân Do Dinh/Richard Eckart de Castilho/Iryna Gurevych: ''In-Tool Learning for Selective Manual Annotation in Large Corpora'' (Poster und Systemdemonstration)<br />
*Nils Diewald/Marc Kupietz: ''Korpusanalyseplattform (KorAP)'' (Poster + Systemdemonstration) [[Media:Präsentation_KorAP_Poster_30.10.2015.pdf|(PDF)]]<br /><br />
*Erhard Hinrichs/Marie Hinrichs: ''WebLicht'' (Systemdemonstration)<br /><br />
*Bryan Jurish: ''Deutsches Textarchiv'' (DTA) (Poster und Systemdemonstration) [[Media:Poster_Jurish_Diacollo_30.10.2015.pdf|(PDF)]]<br /><br />
*Christian Pölitz: ''RapidMiner als Werkzeug für die korpusbasierte Sprachanalyse'' (Systemdemonstration)<br /><br />
</td><br />
</tr><br />
<tr><br />
<td>17:00-19:00</td><br />
<td bgcolor="#CDCDCD">'''Podiumsdiskussion: ''Digitale Textkorpora in den Geisteswissenschaften: Standortbestimmung und Perspektiven''''' <br />
'''Moderation''': Prof. Dr. Angelika Storrer<br />
<br />
'''Podiumsgäste''': Prof. Dr. Thomas Gloning (Gießen), Prof. Dr. Erhardt Hinrichs (Tübingen), Prof. Dr. Katharina Morik (Dortmund), Prof. Dr. Caroline Sporleder (Göttingen) und Prof. Dr. Holger Wormer (Dortmund).<br />
</td><br />
</tr><br />
</table></div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Fachtagung_30.10.2015&diff=1148Fachtagung 30.10.20152015-11-22T17:32:13Z<p>Storrer: </p>
<hr />
<div><table width="1000" border="0" cellpadding="7" cellspacing ="2"><br />
<tr><br />
<td bgcolor="#FEEAAB"><big>'''Fachtagung ''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'''''</big></td><br />
</tr><br />
<tr><br />
<td>'''Ort:''' [http://www.bbaw.de/ Berlin-Brandenburgische Akademie der Wissenschaften (BBAW)] Einsteinsaal.<br />
'''Termin:''' 30. Oktober 2015 9:30 - 19:00 Uhr<br />
[[Fachtagung_30.10.2015:_Eindrücke_und_Einblicke|Zusammenfassung und Bilder]] <br />
<br />
Auf dieser Fachtagung stellte das BMBF-Verbundprojekt KobRA (Korpus-basierte linguistische Recherche und Analyse mit Hilfe von Data-Mining) seine Ergebnisse vor und diskutierte weiterführende Perspektiven. [[Fachtagung_30.10.2015:_Eindrücke_und_Einblicke|Bilder ]] <br />
</td><br />
</tr><br />
</table><br />
<br />
'''Tagungsprogramm (mit PDF-Versionen von E-Folien und Postern)''' <br />
<table width="1000" border="0" bgcolor="#FEEAAB" cellpadding="7" cellspacing ="2"><br />
<tr><br />
<td bgcolor="#CDCDCD"> 9:30-9:40 </td><br />
<td> '''Begrüßung und Eröffnung'''</td><br />
</tr><br />
<tr><br />
<td> 9:40-10:05 </td><br />
<td bgcolor="#CDCDCD"> '''Korpusbasierte Recherche und Analyse mit Hilfe von Data-Mining: Das BMBF-Projekt KobRA''' (Prof. Dr. Angelika Storrer, Universität Mannheim) [[Media:Präsentation_Storrer_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD"> 10:05-10:30 </td><br />
<td> '''RapidMiner als Werkzeug für die textorientierten Geisteswissenschaften''' (Prof. Dr. Katharina Morik, TU Dortmund) [[Media:Präsentation_Morik_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td>10:30-11:00</td><br />
<td bgcolor="#CDCDCD">Kaffeepause</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">11:00-11:30</td><br />
<td>'''Routineaufgaben bei der Nutzung von Korpora: Disambiguieren, Klassifizieren, Annotieren mit KobRA-Verfahren'''<br/>(Thomas Bartz/Christian Pölitz, TU Dortmund) [[Media:Präsentation_Bartz_Poelitz_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td>11:30-12:00</td><br />
<td bgcolor="#CDCDCD">'''Extraktion guter Belege aus Textkorpora durch Kombination eines regelbasierten Verfahrens mit maschinellem Lernen'''<br/>(Dr. Alexander Geyken/Dr. Lothar Lemnitzer, BBAW) [[Media:Präsentation_Geyken_Lemnitzer_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">12:00-12:30</td><br />
<td>'''Korpusbasierte Analyse internetbasierter Kommunikation: Herausforderungen und Perspektiven'''<br/>(PD Dr. Michael Beißwenger, TU Dortmund/Dr. Harald Lüngen, IDS/Christian Pölitz, TU Dortmund) [[Media:Präsentation_Beisswenger_Luengen_Poelitz_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td>12:30-14:00</td><br />
<td bgcolor="#CDCDCD">Mittagspause</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">14:00-14:25</td><br />
<td>'''Neue Entwicklungen und Wege bei der Erstellung, Erweiterung und Nutzung von Korpora am Zentrum Sprache'''<br/>(Dr. Alexander Geyken/Bryan Jurish/Kay Michael Würzner, BBAW) [[Media:Präsentation_Geyken_Jurish_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td>14:25-14:50</td><br />
<td bgcolor="#CDCDCD">'''Schnittstellen zur Nutzung der Korpusanalyseplattform KorAP''' (Nils Diewald/Dr. Marc Kupietz, IDS) [[Media:Präsentation_Kupietz_Diewald_30.10.2015.pdf|(PDF)]] </td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">14:50-15:15</td><br />
<td>'''Integration von KobRA Services in die CLARIN Forschungsinfrastruktur''' (Prof. Dr. Erhard Hinrichs/Marie Hinrichs, SfS Universität Tübingen) [[Media:Präsentation_Hinrichs_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td>15:15-16:00</td><br />
<td bgcolor="#CDCDCD">Kaffeepause, z.T. parallel zur Postersession</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">15:30-16:50</td><br />
<td>'''Postersession und Systemdemonstrationen''' (Stand 22.10.):<br />
*Thomas Bartz/Christian Pölitz/Angelika Storrer:'' Korpus-basierte linguistische Recherche und Analyse mit Hilfe von Data-Mining („KobRA“). Erprobung innovativer Data-Mining-Verfahren für die empirische Arbeit mit strukturierten Sprachressourcen''<br />
*Michael Beißwenger/Thomas Bartz/Axel Herold/Marc Kupietz/Lothar Lemnitzer/Harald Lüngen/Angelika Storrer: ''Aufbau von Social-Media-Korpora für die Digital Humanities: Standards und Perspektiven'' [[Media:Poster_Beisswenger et al_Social Media Corpora_30.10.2015.pdf|(PDF)]] <br /><br />
*Michael Beißwenger/Christian Pölitz/Lena Meyer: ''KobRA @ Classroom: Ein interdisziplinäres Projektseminar zum Einsatz von Data-Mining bei der korpusgestützten Analyse internetbasierter Kommunikation'' [[Media:Poster_Beisswenger_Poelitz_Meyer_Classroom_30.10.2015.pdf|(PDF)]]<br /><br />
*Tassja Weber/Laura Herzberg: ''Studienarbeiten zur internetbasierten Kommunikation mit KobRA-Verfahren an der Universität Mannheim'' [[Media:Poster_Herzberg_Weber_Studienarbeiten Mannheim_30.10.2015.pdf|(PDF)]]<br />
*Jörg Didakowski/Nadja Radtke: ''Korpusbasierte Analyse von deutschen Stützverbgefügen'' [[Media:Poster_Didakowski_Radtke_SVG_30.10.2015.pdf|(PDF)]]<br /><br />
*Sebastian Buschjäger/Lukas Pfahler: ''Discovering Subtle Word Relations in Large German Corpora''<br /> <br />
*Maria Ermakova: ''Baby vs. Säugling: Wer gewinnt im XX. Jahrhundert? Eine korpusbasierte Studie zur Semantik und Pragmatik des Fremdwortgebrauchs''<br />
*Erik-Lân Do Dinh/Richard Eckart de Castilho/Iryna Gurevych: ''In-Tool Learning for Selective Manual Annotation in Large Corpora'' (Poster und Systemdemonstration)<br />
*Nils Diewald/Marc Kupietz: ''Korpusanalyseplattform (KorAP)'' (Poster + Systemdemonstration) [[Media:Präsentation_KorAP_Poster_30.10.2015.pdf|(PDF)]]<br /><br />
*Erhard Hinrichs/Marie Hinrichs: ''WebLicht'' (Systemdemonstration)<br /><br />
*Bryan Jurish: ''Deutsches Textarchiv'' (DTA) (Poster und Systemdemonstration) [[Media:Poster_Jurish_Diacollo_30.10.2015.pdf|(PDF)]]<br /><br />
*Christian Pölitz: ''RapidMiner als Werkzeug für die korpusbasierte Sprachanalyse'' (Systemdemonstration)<br /><br />
</td><br />
</tr><br />
<tr><br />
<td>17:00-19:00</td><br />
<td bgcolor="#CDCDCD">'''Podiumsdiskussion: ''Digitale Textkorpora in den Geisteswissenschaften: Standortbestimmung und Perspektiven''''' <br />
'''Moderation''': Prof. Dr. Angelika Storrer<br />
<br />
'''Podiumsgäste''': Prof. Dr. Thomas Gloning (Gießen), Prof. Dr. Erhardt Hinrichs (Tübingen), Prof. Dr. Katharina Morik (Dortmund), Prof. Dr. Caroline Sporleder (Göttingen) und Prof. Dr. Holger Wormer (Dortmund).<br />
</td><br />
</tr><br />
</table></div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Hauptseite&diff=1147Hauptseite2015-11-22T17:29:41Z<p>Storrer: </p>
<hr />
<div>{| class="wikitable" width="99%"<br />
|-<br />
! <big> Herzlich willkommen </big><br />
|- <br />
| style="background:#ffffff; padding:1em" | <br />
[[Datei:Kwic-kobra-2geo.png|links]] [[Datei:KobRA-RM.png|rechts]] '''KobRA&nbsp;(Korpus-basierte Recherche und Analyse mit Hilfe von Data-Mining)''' ist ein Verbundprojekt, das seit September 2012 vom [http://www.bmbf.de Bundesministerium für Bildung und Forschung (BMBF)] im Rahmen des '''[http://www.bmbf.de/foerderungen/16466.php Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities]''' gefördert wird (Förderkennzeichen: 01UG1245A).<br />
<br />
Im Projekt arbeiten Partner aus Informatik, Linguistik und Sprachtechnologie gemeinsam daran, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern. Koordinatorin des Projekts ist [http://germanistik.uni-mannheim.de/abteilungen/germanistische_linguistik/prof_dr_angelika_storrer/index.html Prof. Dr. Angelika Storrer (Universität Mannheim)]. <br />
<br />
<div style="clear: left"></div> Auf diesen Seiten bieten wir einen Überblick und detailliertere Informationen über:<br />
* '''[[Projektbeschreibung|die Ziele, Fragestellungen und Methoden des Projekts]]'''<br />
* '''[[Team|die beteiligten Personen und Forschungseinrichtungen]]'''<br />
* '''[[Fallstudien|die Fallstudien des Projekts]]'''<br />
*'''[[Fachtagung 30.10.2015|die Projekt-Abschlusstagung]]'''<br />
* '''sowie über Aktivitäten und aktuelle Veröffentlichungen (s.u.).'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left; margin-right:1em"<br />
|-<br />
! <big>Aktivitäten</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
*Auf der [[Fachtagung_30.10.2015:_Eindrücke_und_Einblicke|Fachtagung ''Neue Wege in der Nutzung von Textkorpora: Data Mining für die textorientierten Geisteswissenschaften]] am 30.10.2015 an der BBAW präsentierten die Projektbeteiligten ihre Ergebnisse und diskutierten weiterführende Perspektiven. Das Tagungsprogramm und E-Folien zu den Präsentationen und Postern finden Sie [[Fachtagung 30.10.2015|hier]].<br />
<br />
*Vortrag ''A Data Mining Environment for Linguistic Research Based on CLARIN-D Language Resources'' (Katharina Morik, Thomas Bartz, Christian Pölitz, Angelika Storrer) auf der [http://dch2015.net/abstracts_submission.shtml ''DCH2015 - Interdisciplinary Conference on Digital Cultural Heritage''] am 28.-30. Oktober 2015 in Berlin.<br />
<br />
* Panel: Am 29.10.15 wird ein von von Michael Beißwenger & Thierry Chanier organisiertes Panel [http://tei2015.huma-num.fr/en/panelsround-tables/#acc-3 TEI across corpora, languages and genres: Towards a standard for the representation of social media and computer-mediated communication]" im Rahmen der [http://tei2015.huma-num.fr/en/ Jahreskonferenz der Text encoding Initiative] stattfinden. Am Panel sind verschiedene KobRA-Akteure beteiligt.<br />
<br />
* Vortrag: "Wikipedia as a corpus resource for linguistic research" (Angelika Storrer) auf der [http://ird-cmc-rennes.sciencesconf.org/ internationalen ''ird-cmc''-Konferenz in Rennes/Frankreich] am 23.10.2015.<br />
<br />
* Panel: "Towards an encoding standard for social media and CMC: Experiences from German and French corpus projects using TEI" (organisiert von Michael Beißwenger & Thierry Chanier mit Beiträgen u.a. aus verschiedenen Korpusprojekten im KobRA-Kontext) auf der [http://ird-cmc-rennes.sciencesconf.org/ internationalen ''ird-cmc''-Konferenz in Rennes/Frankreich] am 23.10.2015.<br />
<br />
*Posterpräsentation ''Verb Valency and Prepositional Complements in Learner Corpora - A Case Study in the German MERLIN Corpus'' (Tassja Weber) 3. Learner Corpus Research Conference (LCR) 2015, Nijmegen (Niederlande), 11-13.09.2015. <br />
<br />
* Paper auf der Internationalen Fachtagung [http://www.kiv.zcu.cz/tsd2015/ ''Text, Speech and Dialogue'']: Pölitz, Christian; Bartz, Thomas; Morik, Katharina; Storrer, Angelika (2015): ''Investigation of Word Senses over Time using Linguistic Corpora'' In: Matousek, Vaclav et al. (Hrsg.): Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer.<br />
<br />
<br />
----<br />
<br />
Überblick über weitere Konferenzbeiträge und Projekt-Workshops: '''[[Aktivitäten]]'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left"<br />
|-<br />
! <big>Veröffentlichungen und Dokumentationen</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
*<span style= "color:#FF0000;">'''NEU: '''</span>Anleitung zur [[Visualisierung von diachronen Kollokationen]] mithilfe von KobRA-Werkzeugen und RapidMiner. [[Visualisierung von diachronen Kollokationen|Direkt zur Anleitung]].<br />
<br />
*<span style= "color:#FF0000;">'''NEU: '''</span><b>Handbuch: Korpus-basierte linguistische Recherche und Analyse mithilfe des RapidMiner. Nutzung des KobRA-Plug-ins.</b> [http://kobra.tu-dortmund.de/mediawiki/index.php?title=Datei:RapidMiner-Handbuch_2015-20-10.pdf PDF] Stand: 20.10.2015. <br />
<br />
*Bartz,Thomas; Pölitz, Christian; Morik, Katharina; Storrer, Angelika (2015): '''Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research'''. In: Jan Odijk (Ed): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=116;article=001 Selected Papers from the CLARIN 2014 Conference], October 24-25, 2014, Soesterberg, The Netherlands, 1-13.<br />
<br />
*Bingel, Joachim; Diewald, Nils (2015): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=111;article=001 '''KoralQuery – a General Corpus Query Protocol''']. In: Proceedings of the Workshop on Innovative Corpus Query and Visualization Tools at NODALIDA 2015, Vilnius, Lithuania, May 11-13, 2015. <br />
<br />
*Diewald,Nils; Bingel, Joachim (2015): [http://KorAP.github.io/Koral '''KoralQuery 0.3. Technical Report, Working draft''']. IDS, Mannheim, Germany. <br />
<br />
*Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): '''Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods.''' In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. [http://www.uni-hildesheim.de/konvens2014/data/konvens2014-workshop-proceedings.pdf Proceedings-Band als PDF]<br />
<br />
*Thomas Bartz, Michael Beißwenger, Christian Pölitz, Nadja Radtke & Angelika Storrer (2014): '''Neue Möglichkeiten der Arbeit mit strukturierten Sprachressourcen in den Digital Humanities mithilfe von Data-Mining.''' [http://dharchive.org/paper/DH2014/Poster-894.xml Online Proceedings of the Digital Humanities 2014 annual international conference of the Alliance of Digital Humanities Organizations], Universität Lausanne, 10. Juli 2014<br />
<br />
*Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael (2014): '''Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014.''' Technischer Bericht, Technische Universität Dortmund. [[Media: KobRA-MS2_Verfahren.pdf|Online-Veröffentlichung (PDF)]]<br />
<br />
*Didakowski, Jörg; Radtke, Nadja (2014): '''Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. ''' In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. [http://euralex2014.eurac.edu/en/callforpapers/Documents/EURALEX%202014_gesamt.pdf Online-Veröffentlichung (PDF)]<br />
<br />
<br />
----<br />
<br />
Überblick über weitere Veröffentlichungen mit Projektbezug: '''[[Publikationen]]'''<br />
|}</div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Fachtagung_30.10.2015&diff=1146Fachtagung 30.10.20152015-11-22T17:28:20Z<p>Storrer: </p>
<hr />
<div><table width="1000" border="0" cellpadding="7" cellspacing ="2"><br />
<tr><br />
<td bgcolor="#FEEAAB"><big>'''Fachtagung ''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'''''</big></td><br />
</tr><br />
<tr><br />
<td>'''Ort:''' [http://www.bbaw.de/ Berlin-Brandenburgische Akademie der Wissenschaften (BBAW)] Einsteinsaal.<br />
'''Termin:''' 30. Oktober 2015 9:30 - 19:00 Uhr<br />
<br />
Auf dieser Fachtagung stellte das BMBF-Verbundprojekt KobRA (Korpus-basierte linguistische Recherche und Analyse mit Hilfe von Data-Mining) seine Ergebnisse vor und diskutierte weiterführende Perspektiven. <br />
</td><br />
</tr><br />
</table><br />
<br />
'''Tagungsprogramm (mit PDF-Versionen von E-Folien und Postern)''' <br />
<table width="1000" border="0" bgcolor="#FEEAAB" cellpadding="7" cellspacing ="2"><br />
<tr><br />
<td bgcolor="#CDCDCD"> 9:30-9:40 </td><br />
<td> '''Begrüßung und Eröffnung'''</td><br />
</tr><br />
<tr><br />
<td> 9:40-10:05 </td><br />
<td bgcolor="#CDCDCD"> '''Korpusbasierte Recherche und Analyse mit Hilfe von Data-Mining: Das BMBF-Projekt KobRA''' (Prof. Dr. Angelika Storrer, Universität Mannheim) [[Media:Präsentation_Storrer_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD"> 10:05-10:30 </td><br />
<td> '''RapidMiner als Werkzeug für die textorientierten Geisteswissenschaften''' (Prof. Dr. Katharina Morik, TU Dortmund) [[Media:Präsentation_Morik_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td>10:30-11:00</td><br />
<td bgcolor="#CDCDCD">Kaffeepause</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">11:00-11:30</td><br />
<td>'''Routineaufgaben bei der Nutzung von Korpora: Disambiguieren, Klassifizieren, Annotieren mit KobRA-Verfahren'''<br/>(Thomas Bartz/Christian Pölitz, TU Dortmund) [[Media:Präsentation_Bartz_Poelitz_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td>11:30-12:00</td><br />
<td bgcolor="#CDCDCD">'''Extraktion guter Belege aus Textkorpora durch Kombination eines regelbasierten Verfahrens mit maschinellem Lernen'''<br/>(Dr. Alexander Geyken/Dr. Lothar Lemnitzer, BBAW) [[Media:Präsentation_Geyken_Lemnitzer_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">12:00-12:30</td><br />
<td>'''Korpusbasierte Analyse internetbasierter Kommunikation: Herausforderungen und Perspektiven'''<br/>(PD Dr. Michael Beißwenger, TU Dortmund/Dr. Harald Lüngen, IDS/Christian Pölitz, TU Dortmund) [[Media:Präsentation_Beisswenger_Luengen_Poelitz_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td>12:30-14:00</td><br />
<td bgcolor="#CDCDCD">Mittagspause</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">14:00-14:25</td><br />
<td>'''Neue Entwicklungen und Wege bei der Erstellung, Erweiterung und Nutzung von Korpora am Zentrum Sprache'''<br/>(Dr. Alexander Geyken/Bryan Jurish/Kay Michael Würzner, BBAW) [[Media:Präsentation_Geyken_Jurish_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td>14:25-14:50</td><br />
<td bgcolor="#CDCDCD">'''Schnittstellen zur Nutzung der Korpusanalyseplattform KorAP''' (Nils Diewald/Dr. Marc Kupietz, IDS) [[Media:Präsentation_Kupietz_Diewald_30.10.2015.pdf|(PDF)]] </td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">14:50-15:15</td><br />
<td>'''Integration von KobRA Services in die CLARIN Forschungsinfrastruktur''' (Prof. Dr. Erhard Hinrichs/Marie Hinrichs, SfS Universität Tübingen) [[Media:Präsentation_Hinrichs_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td>15:15-16:00</td><br />
<td bgcolor="#CDCDCD">Kaffeepause, z.T. parallel zur Postersession</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">15:30-16:50</td><br />
<td>'''Postersession und Systemdemonstrationen''' (Stand 22.10.):<br />
*Thomas Bartz/Christian Pölitz/Angelika Storrer:'' Korpus-basierte linguistische Recherche und Analyse mit Hilfe von Data-Mining („KobRA“). Erprobung innovativer Data-Mining-Verfahren für die empirische Arbeit mit strukturierten Sprachressourcen''<br />
*Michael Beißwenger/Thomas Bartz/Axel Herold/Marc Kupietz/Lothar Lemnitzer/Harald Lüngen/Angelika Storrer: ''Aufbau von Social-Media-Korpora für die Digital Humanities: Standards und Perspektiven'' [[Media:Poster_Beisswenger et al_Social Media Corpora_30.10.2015.pdf|(PDF)]] <br /><br />
*Michael Beißwenger/Christian Pölitz/Lena Meyer: ''KobRA @ Classroom: Ein interdisziplinäres Projektseminar zum Einsatz von Data-Mining bei der korpusgestützten Analyse internetbasierter Kommunikation'' [[Media:Poster_Beisswenger_Poelitz_Meyer_Classroom_30.10.2015.pdf|(PDF)]]<br /><br />
*Tassja Weber/Laura Herzberg: ''Studienarbeiten zur internetbasierten Kommunikation mit KobRA-Verfahren an der Universität Mannheim'' [[Media:Poster_Herzberg_Weber_Studienarbeiten Mannheim_30.10.2015.pdf|(PDF)]]<br />
*Jörg Didakowski/Nadja Radtke: ''Korpusbasierte Analyse von deutschen Stützverbgefügen'' [[Media:Poster_Didakowski_Radtke_SVG_30.10.2015.pdf|(PDF)]]<br /><br />
*Sebastian Buschjäger/Lukas Pfahler: ''Discovering Subtle Word Relations in Large German Corpora''<br /> <br />
*Maria Ermakova: ''Baby vs. Säugling: Wer gewinnt im XX. Jahrhundert? Eine korpusbasierte Studie zur Semantik und Pragmatik des Fremdwortgebrauchs''<br />
*Erik-Lân Do Dinh/Richard Eckart de Castilho/Iryna Gurevych: ''In-Tool Learning for Selective Manual Annotation in Large Corpora'' (Poster und Systemdemonstration)<br />
*Nils Diewald/Marc Kupietz: ''Korpusanalyseplattform (KorAP)'' (Poster + Systemdemonstration) [[Media:Präsentation_KorAP_Poster_30.10.2015.pdf|(PDF)]]<br /><br />
*Erhard Hinrichs/Marie Hinrichs: ''WebLicht'' (Systemdemonstration)<br /><br />
*Bryan Jurish: ''Deutsches Textarchiv'' (DTA) (Poster und Systemdemonstration) [[Media:Poster_Jurish_Diacollo_30.10.2015.pdf|(PDF)]]<br /><br />
*Christian Pölitz: ''RapidMiner als Werkzeug für die korpusbasierte Sprachanalyse'' (Systemdemonstration)<br /><br />
</td><br />
</tr><br />
<tr><br />
<td>17:00-19:00</td><br />
<td bgcolor="#CDCDCD">'''Podiumsdiskussion: ''Digitale Textkorpora in den Geisteswissenschaften: Standortbestimmung und Perspektiven''''' <br />
'''Moderation''': Prof. Dr. Angelika Storrer<br />
<br />
'''Podiumsgäste''': Prof. Dr. Thomas Gloning (Gießen), Prof. Dr. Erhardt Hinrichs (Tübingen), Prof. Dr. Katharina Morik (Dortmund), Prof. Dr. Caroline Sporleder (Göttingen) und Prof. Dr. Holger Wormer (Dortmund).<br />
</td><br />
</tr><br />
</table></div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Fachtagung_30.10.2015&diff=1145Fachtagung 30.10.20152015-11-22T17:27:33Z<p>Storrer: </p>
<hr />
<div><table width="1000" border="0" cellpadding="7" cellspacing ="2"><br />
<tr><br />
<td bgcolor="#FEEAAB"><big>'''Fachtagung ''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'''''</big></td><br />
</tr><br />
<tr><br />
<td>'''Ort:''' [http://www.bbaw.de/ Berlin-Brandenburgische Akademie der Wissenschaften (BBAW)] Einsteinsaal.<br />
'''Termin:''' 30. Oktober 2015 9:30 - 19:00 Uhr<br />
<br />
Auf dieser Fachtagung stellte das BMBF-Verbundprojekt KobRA (Korpus-basierte linguistische Recherche und Analyse mit Hilfe von Data-Mining) seine Ergebnisse vor und diskutierte weiterführende Perspektiven. Die PDFs zu den Vorträgen und Präsentationen sind dem Tagungsprogramm beigefügt.<br />
</td><br />
</tr><br />
</table><br />
<br />
'''Tagungsprogramm (mit PDF-Versionen von E-Folien und Postern)''' <br />
<table width="1000" border="0" bgcolor="#FEEAAB" cellpadding="7" cellspacing ="2"><br />
<tr><br />
<td bgcolor="#CDCDCD"> 9:30-9:40 </td><br />
<td> '''Begrüßung und Eröffnung'''</td><br />
</tr><br />
<tr><br />
<td> 9:40-10:05 </td><br />
<td bgcolor="#CDCDCD"> '''Korpusbasierte Recherche und Analyse mit Hilfe von Data-Mining: Das BMBF-Projekt KobRA''' (Prof. Dr. Angelika Storrer, Universität Mannheim) [[Media:Präsentation_Storrer_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD"> 10:05-10:30 </td><br />
<td> '''RapidMiner als Werkzeug für die textorientierten Geisteswissenschaften''' (Prof. Dr. Katharina Morik, TU Dortmund) [[Media:Präsentation_Morik_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td>10:30-11:00</td><br />
<td bgcolor="#CDCDCD">Kaffeepause</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">11:00-11:30</td><br />
<td>'''Routineaufgaben bei der Nutzung von Korpora: Disambiguieren, Klassifizieren, Annotieren mit KobRA-Verfahren'''<br/>(Thomas Bartz/Christian Pölitz, TU Dortmund) [[Media:Präsentation_Bartz_Poelitz_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td>11:30-12:00</td><br />
<td bgcolor="#CDCDCD">'''Extraktion guter Belege aus Textkorpora durch Kombination eines regelbasierten Verfahrens mit maschinellem Lernen'''<br/>(Dr. Alexander Geyken/Dr. Lothar Lemnitzer, BBAW) [[Media:Präsentation_Geyken_Lemnitzer_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">12:00-12:30</td><br />
<td>'''Korpusbasierte Analyse internetbasierter Kommunikation: Herausforderungen und Perspektiven'''<br/>(PD Dr. Michael Beißwenger, TU Dortmund/Dr. Harald Lüngen, IDS/Christian Pölitz, TU Dortmund) [[Media:Präsentation_Beisswenger_Luengen_Poelitz_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td>12:30-14:00</td><br />
<td bgcolor="#CDCDCD">Mittagspause</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">14:00-14:25</td><br />
<td>'''Neue Entwicklungen und Wege bei der Erstellung, Erweiterung und Nutzung von Korpora am Zentrum Sprache'''<br/>(Dr. Alexander Geyken/Bryan Jurish/Kay Michael Würzner, BBAW) [[Media:Präsentation_Geyken_Jurish_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td>14:25-14:50</td><br />
<td bgcolor="#CDCDCD">'''Schnittstellen zur Nutzung der Korpusanalyseplattform KorAP''' (Nils Diewald/Dr. Marc Kupietz, IDS) [[Media:Präsentation_Kupietz_Diewald_30.10.2015.pdf|(PDF)]] </td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">14:50-15:15</td><br />
<td>'''Integration von KobRA Services in die CLARIN Forschungsinfrastruktur''' (Prof. Dr. Erhard Hinrichs/Marie Hinrichs, SfS Universität Tübingen) [[Media:Präsentation_Hinrichs_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td>15:15-16:00</td><br />
<td bgcolor="#CDCDCD">Kaffeepause, z.T. parallel zur Postersession</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">15:30-16:50</td><br />
<td>'''Postersession und Systemdemonstrationen''' (Stand 22.10.):<br />
*Thomas Bartz/Christian Pölitz/Angelika Storrer:'' Korpus-basierte linguistische Recherche und Analyse mit Hilfe von Data-Mining („KobRA“). Erprobung innovativer Data-Mining-Verfahren für die empirische Arbeit mit strukturierten Sprachressourcen''<br />
*Michael Beißwenger/Thomas Bartz/Axel Herold/Marc Kupietz/Lothar Lemnitzer/Harald Lüngen/Angelika Storrer: ''Aufbau von Social-Media-Korpora für die Digital Humanities: Standards und Perspektiven'' [[Media:Poster_Beisswenger et al_Social Media Corpora_30.10.2015.pdf|(PDF)]] <br /><br />
*Michael Beißwenger/Christian Pölitz/Lena Meyer: ''KobRA @ Classroom: Ein interdisziplinäres Projektseminar zum Einsatz von Data-Mining bei der korpusgestützten Analyse internetbasierter Kommunikation'' [[Media:Poster_Beisswenger_Poelitz_Meyer_Classroom_30.10.2015.pdf|(PDF)]]<br /><br />
*Tassja Weber/Laura Herzberg: ''Studienarbeiten zur internetbasierten Kommunikation mit KobRA-Verfahren an der Universität Mannheim'' [[Media:Poster_Herzberg_Weber_Studienarbeiten Mannheim_30.10.2015.pdf|(PDF)]]<br />
*Jörg Didakowski/Nadja Radtke: ''Korpusbasierte Analyse von deutschen Stützverbgefügen'' [[Media:Poster_Didakowski_Radtke_SVG_30.10.2015.pdf|(PDF)]]<br /><br />
*Sebastian Buschjäger/Lukas Pfahler: ''Discovering Subtle Word Relations in Large German Corpora''<br /> <br />
*Maria Ermakova: ''Baby vs. Säugling: Wer gewinnt im XX. Jahrhundert? Eine korpusbasierte Studie zur Semantik und Pragmatik des Fremdwortgebrauchs''<br />
*Erik-Lân Do Dinh/Richard Eckart de Castilho/Iryna Gurevych: ''In-Tool Learning for Selective Manual Annotation in Large Corpora'' (Poster und Systemdemonstration)<br />
*Nils Diewald/Marc Kupietz: ''Korpusanalyseplattform (KorAP)'' (Poster + Systemdemonstration) [[Media:Präsentation_KorAP_Poster_30.10.2015.pdf|(PDF)]]<br /><br />
*Erhard Hinrichs/Marie Hinrichs: ''WebLicht'' (Systemdemonstration)<br /><br />
*Bryan Jurish: ''Deutsches Textarchiv'' (DTA) (Poster und Systemdemonstration) [[Media:Poster_Jurish_Diacollo_30.10.2015.pdf|(PDF)]]<br /><br />
*Christian Pölitz: ''RapidMiner als Werkzeug für die korpusbasierte Sprachanalyse'' (Systemdemonstration)<br /><br />
</td><br />
</tr><br />
<tr><br />
<td>17:00-19:00</td><br />
<td bgcolor="#CDCDCD">'''Podiumsdiskussion: ''Digitale Textkorpora in den Geisteswissenschaften: Standortbestimmung und Perspektiven''''' <br />
'''Moderation''': Prof. Dr. Angelika Storrer<br />
<br />
'''Podiumsgäste''': Prof. Dr. Thomas Gloning (Gießen), Prof. Dr. Erhardt Hinrichs (Tübingen), Prof. Dr. Katharina Morik (Dortmund), Prof. Dr. Caroline Sporleder (Göttingen) und Prof. Dr. Holger Wormer (Dortmund).<br />
</td><br />
</tr><br />
</table></div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Hauptseite&diff=1144Hauptseite2015-11-22T17:25:55Z<p>Storrer: </p>
<hr />
<div>{| class="wikitable" width="99%"<br />
|-<br />
! <big> Herzlich willkommen </big><br />
|- <br />
| style="background:#ffffff; padding:1em" | <br />
[[Datei:Kwic-kobra-2geo.png|links]] [[Datei:KobRA-RM.png|rechts]] '''KobRA&nbsp;(Korpus-basierte Recherche und Analyse mit Hilfe von Data-Mining)''' ist ein Verbundprojekt, das seit September 2012 vom [http://www.bmbf.de Bundesministerium für Bildung und Forschung (BMBF)] im Rahmen des '''[http://www.bmbf.de/foerderungen/16466.php Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities]''' gefördert wird (Förderkennzeichen: 01UG1245A).<br />
<br />
Im Projekt arbeiten Partner aus Informatik, Linguistik und Sprachtechnologie gemeinsam daran, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern. Koordinatorin des Projekts ist [http://germanistik.uni-mannheim.de/abteilungen/germanistische_linguistik/prof_dr_angelika_storrer/index.html Prof. Dr. Angelika Storrer (Universität Mannheim)]. <br />
<br />
<div style="clear: left"></div> Auf diesen Seiten bieten wir einen Überblick und detailliertere Informationen über:<br />
* '''[[Projektbeschreibung|die Ziele, Fragestellungen und Methoden des Projekts]]'''<br />
* '''[[Team|die beteiligten Personen und Forschungseinrichtungen]]'''<br />
* '''[[Fallstudien|die Fallstudien des Projekts]]'''<br />
*'''[[Fachtagung 30.10.2015|die Projekt-Abschlusstagung]]'''<br />
* '''sowie über Aktivitäten und aktuelle Veröffentlichungen (s.u.).'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left; margin-right:1em"<br />
|-<br />
! <big>Aktivitäten</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
*<span style= "color:#FF0000;">'''NEU: '''</span>Anleitung zur [[Visualisierung von diachronen Kollokationen]] mithilfe von KobRA-Werkzeugen und RapidMiner. [[Visualisierung von diachronen Kollokationen|Direkt zur Anleitung]].<br />
<br />
*Auf der [[Fachtagung_30.10.2015:_Eindrücke_und_Einblicke|Fachtagung ''Neue Wege in der Nutzung von Textkorpora: Data Mining für die textorientierten Geisteswissenschaften]] am 30.10.2015 an der BBAW präsentierten die Projektbeteiligten ihre Ergebnisse und diskutierten weiterführende Perspektiven. Das Tagungsprogramm und E-Folien zu den Präsentationen und Postern finden Sie [[Fachtagung 30.10.2015|hier]].<br />
<br />
*Vortrag ''A Data Mining Environment for Linguistic Research Based on CLARIN-D Language Resources'' (Katharina Morik, Thomas Bartz, Christian Pölitz, Angelika Storrer) auf der [http://dch2015.net/abstracts_submission.shtml ''DCH2015 - Interdisciplinary Conference on Digital Cultural Heritage''] am 28.-30. Oktober 2015 in Berlin.<br />
<br />
* Panel: Am 29.10.15 wird ein von von Michael Beißwenger & Thierry Chanier organisiertes Panel [http://tei2015.huma-num.fr/en/panelsround-tables/#acc-3 TEI across corpora, languages and genres: Towards a standard for the representation of social media and computer-mediated communication]" im Rahmen der [http://tei2015.huma-num.fr/en/ Jahreskonferenz der Text encoding Initiative] stattfinden. Am Panel sind verschiedene KobRA-Akteure beteiligt.<br />
<br />
* Vortrag: "Wikipedia as a corpus resource for linguistic research" (Angelika Storrer) auf der [http://ird-cmc-rennes.sciencesconf.org/ internationalen ''ird-cmc''-Konferenz in Rennes/Frankreich] am 23.10.2015.<br />
<br />
* Panel: "Towards an encoding standard for social media and CMC: Experiences from German and French corpus projects using TEI" (organisiert von Michael Beißwenger & Thierry Chanier mit Beiträgen u.a. aus verschiedenen Korpusprojekten im KobRA-Kontext) auf der [http://ird-cmc-rennes.sciencesconf.org/ internationalen ''ird-cmc''-Konferenz in Rennes/Frankreich] am 23.10.2015.<br />
<br />
*Posterpräsentation ''Verb Valency and Prepositional Complements in Learner Corpora - A Case Study in the German MERLIN Corpus'' (Tassja Weber) 3. Learner Corpus Research Conference (LCR) 2015, Nijmegen (Niederlande), 11-13.09.2015. <br />
<br />
* Paper auf der Internationalen Fachtagung [http://www.kiv.zcu.cz/tsd2015/ ''Text, Speech and Dialogue'']: Pölitz, Christian; Bartz, Thomas; Morik, Katharina; Storrer, Angelika (2015): ''Investigation of Word Senses over Time using Linguistic Corpora'' In: Matousek, Vaclav et al. (Hrsg.): Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer.<br />
<br />
<br />
----<br />
<br />
Überblick über weitere Konferenzbeiträge und Projekt-Workshops: '''[[Aktivitäten]]'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left"<br />
|-<br />
! <big>Veröffentlichungen</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
*<span style= "color:#FF0000;">'''NEU: '''</span><b>Handbuch: Korpus-basierte linguistische Recherche und Analyse mithilfe des RapidMiner. Nutzung des KobRA-Plug-ins.</b> [http://kobra.tu-dortmund.de/mediawiki/index.php?title=Datei:RapidMiner-Handbuch_2015-20-10.pdf PDF] Stand: 20.10.2015. <br />
<br />
*Bartz,Thomas; Pölitz, Christian; Morik, Katharina; Storrer, Angelika (2015): '''Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research'''. In: Jan Odijk (Ed): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=116;article=001 Selected Papers from the CLARIN 2014 Conference], October 24-25, 2014, Soesterberg, The Netherlands, 1-13.<br />
<br />
*Bingel, Joachim; Diewald, Nils (2015): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=111;article=001 '''KoralQuery – a General Corpus Query Protocol''']. In: Proceedings of the Workshop on Innovative Corpus Query and Visualization Tools at NODALIDA 2015, Vilnius, Lithuania, May 11-13, 2015. <br />
<br />
*Diewald,Nils; Bingel, Joachim (2015): [http://KorAP.github.io/Koral '''KoralQuery 0.3. Technical Report, Working draft''']. IDS, Mannheim, Germany. <br />
<br />
*Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): '''Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods.''' In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. [http://www.uni-hildesheim.de/konvens2014/data/konvens2014-workshop-proceedings.pdf Proceedings-Band als PDF]<br />
<br />
*Thomas Bartz, Michael Beißwenger, Christian Pölitz, Nadja Radtke & Angelika Storrer (2014): '''Neue Möglichkeiten der Arbeit mit strukturierten Sprachressourcen in den Digital Humanities mithilfe von Data-Mining.''' [http://dharchive.org/paper/DH2014/Poster-894.xml Online Proceedings of the Digital Humanities 2014 annual international conference of the Alliance of Digital Humanities Organizations], Universität Lausanne, 10. Juli 2014<br />
<br />
*Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael (2014): '''Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014.''' Technischer Bericht, Technische Universität Dortmund. [[Media: KobRA-MS2_Verfahren.pdf|Online-Veröffentlichung (PDF)]]<br />
<br />
*Didakowski, Jörg; Radtke, Nadja (2014): '''Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. ''' In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. [http://euralex2014.eurac.edu/en/callforpapers/Documents/EURALEX%202014_gesamt.pdf Online-Veröffentlichung (PDF)]<br />
<br />
<br />
----<br />
<br />
Überblick über weitere Veröffentlichungen mit Projektbezug: '''[[Publikationen]]'''<br />
|}</div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Hauptseite&diff=1143Hauptseite2015-11-22T17:25:22Z<p>Storrer: </p>
<hr />
<div>{| class="wikitable" width="99%"<br />
|-<br />
! <big> Herzlich willkommen </big><br />
|- <br />
| style="background:#ffffff; padding:1em" | <br />
[[Datei:Kwic-kobra-2geo.png|links]] [[Datei:KobRA-RM.png|rechts]] '''KobRA&nbsp;(Korpus-basierte Recherche und Analyse mit Hilfe von Data-Mining)''' ist ein Verbundprojekt, das seit September 2012 vom [http://www.bmbf.de Bundesministerium für Bildung und Forschung (BMBF)] im Rahmen des '''[http://www.bmbf.de/foerderungen/16466.php Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities]''' gefördert wird (Förderkennzeichen: 01UG1245A).<br />
<br />
Im Projekt arbeiten Partner aus Informatik, Linguistik und Sprachtechnologie gemeinsam daran, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern. Koordinatorin des Projekts ist [http://germanistik.uni-mannheim.de/abteilungen/germanistische_linguistik/prof_dr_angelika_storrer/index.html Prof. Dr. Angelika Storrer (Universität Mannheim)]. <br />
<br />
<div style="clear: left"></div> Auf diesen Seiten bieten wir einen Überblick und detailliertere Informationen über:<br />
* '''[[Projektbeschreibung|die Ziele, Fragestellungen und Methoden des Projekts]]'''<br />
* '''[[Team|die beteiligten Personen und Forschungseinrichtungen]]'''<br />
* '''[[Fallstudien|die Fallstudien des Projekts]]'''<br />
*'''[[Fachtagung 30.10.2015|die Projekt-Abschlusstagung]]'''<br />
* '''sowie über Aktivitäten und aktuelle Veröffentlichungen (s.u.).'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left; margin-right:1em"<br />
|-<br />
! <big>Aktivitäten</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
*<span style= "color:#FF0000;">'''NEU: '''</span>Anleitung zur [[Visualisierung von diachronen Kollokationen]] mithilfe von KobRA-Werkzeugen und RapidMiner. [[Visualisierung von diachronen Kollokationen|Direkt zur Anleitung]].<br />
<br />
*Auf der Fachtagung [[Fachtagung_30.10.2015:_Eindrücke_und_Einblicke|Fachtagung ''Neue Wege in der Nutzung von Textkorpora: Data Mining für die textorientierten Geisteswissenschaften]] am 30.10.2015 an der BBAW präsentierten die Projektbeteiligten ihre Ergebnisse und diskutierten weiterführende Perspektiven. Das Tagungsprogramm und E-Folien zu den Präsentationen und Postern finden Sie [[Fachtagung 30.10.2015|hier]].<br />
<br />
*Vortrag ''A Data Mining Environment for Linguistic Research Based on CLARIN-D Language Resources'' (Katharina Morik, Thomas Bartz, Christian Pölitz, Angelika Storrer) auf der [http://dch2015.net/abstracts_submission.shtml ''DCH2015 - Interdisciplinary Conference on Digital Cultural Heritage''] am 28.-30. Oktober 2015 in Berlin.<br />
<br />
* Panel: Am 29.10.15 wird ein von von Michael Beißwenger & Thierry Chanier organisiertes Panel [http://tei2015.huma-num.fr/en/panelsround-tables/#acc-3 TEI across corpora, languages and genres: Towards a standard for the representation of social media and computer-mediated communication]" im Rahmen der [http://tei2015.huma-num.fr/en/ Jahreskonferenz der Text encoding Initiative] stattfinden. Am Panel sind verschiedene KobRA-Akteure beteiligt.<br />
<br />
* Vortrag: "Wikipedia as a corpus resource for linguistic research" (Angelika Storrer) auf der [http://ird-cmc-rennes.sciencesconf.org/ internationalen ''ird-cmc''-Konferenz in Rennes/Frankreich] am 23.10.2015.<br />
<br />
* Panel: "Towards an encoding standard for social media and CMC: Experiences from German and French corpus projects using TEI" (organisiert von Michael Beißwenger & Thierry Chanier mit Beiträgen u.a. aus verschiedenen Korpusprojekten im KobRA-Kontext) auf der [http://ird-cmc-rennes.sciencesconf.org/ internationalen ''ird-cmc''-Konferenz in Rennes/Frankreich] am 23.10.2015.<br />
<br />
*Posterpräsentation ''Verb Valency and Prepositional Complements in Learner Corpora - A Case Study in the German MERLIN Corpus'' (Tassja Weber) 3. Learner Corpus Research Conference (LCR) 2015, Nijmegen (Niederlande), 11-13.09.2015. <br />
<br />
* Paper auf der Internationalen Fachtagung [http://www.kiv.zcu.cz/tsd2015/ ''Text, Speech and Dialogue'']: Pölitz, Christian; Bartz, Thomas; Morik, Katharina; Storrer, Angelika (2015): ''Investigation of Word Senses over Time using Linguistic Corpora'' In: Matousek, Vaclav et al. (Hrsg.): Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer.<br />
<br />
<br />
----<br />
<br />
Überblick über weitere Konferenzbeiträge und Projekt-Workshops: '''[[Aktivitäten]]'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left"<br />
|-<br />
! <big>Veröffentlichungen</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
*<span style= "color:#FF0000;">'''NEU: '''</span><b>Handbuch: Korpus-basierte linguistische Recherche und Analyse mithilfe des RapidMiner. Nutzung des KobRA-Plug-ins.</b> [http://kobra.tu-dortmund.de/mediawiki/index.php?title=Datei:RapidMiner-Handbuch_2015-20-10.pdf PDF] Stand: 20.10.2015. <br />
<br />
*Bartz,Thomas; Pölitz, Christian; Morik, Katharina; Storrer, Angelika (2015): '''Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research'''. In: Jan Odijk (Ed): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=116;article=001 Selected Papers from the CLARIN 2014 Conference], October 24-25, 2014, Soesterberg, The Netherlands, 1-13.<br />
<br />
*Bingel, Joachim; Diewald, Nils (2015): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=111;article=001 '''KoralQuery – a General Corpus Query Protocol''']. In: Proceedings of the Workshop on Innovative Corpus Query and Visualization Tools at NODALIDA 2015, Vilnius, Lithuania, May 11-13, 2015. <br />
<br />
*Diewald,Nils; Bingel, Joachim (2015): [http://KorAP.github.io/Koral '''KoralQuery 0.3. Technical Report, Working draft''']. IDS, Mannheim, Germany. <br />
<br />
*Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): '''Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods.''' In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. [http://www.uni-hildesheim.de/konvens2014/data/konvens2014-workshop-proceedings.pdf Proceedings-Band als PDF]<br />
<br />
*Thomas Bartz, Michael Beißwenger, Christian Pölitz, Nadja Radtke & Angelika Storrer (2014): '''Neue Möglichkeiten der Arbeit mit strukturierten Sprachressourcen in den Digital Humanities mithilfe von Data-Mining.''' [http://dharchive.org/paper/DH2014/Poster-894.xml Online Proceedings of the Digital Humanities 2014 annual international conference of the Alliance of Digital Humanities Organizations], Universität Lausanne, 10. Juli 2014<br />
<br />
*Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael (2014): '''Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014.''' Technischer Bericht, Technische Universität Dortmund. [[Media: KobRA-MS2_Verfahren.pdf|Online-Veröffentlichung (PDF)]]<br />
<br />
*Didakowski, Jörg; Radtke, Nadja (2014): '''Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. ''' In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. [http://euralex2014.eurac.edu/en/callforpapers/Documents/EURALEX%202014_gesamt.pdf Online-Veröffentlichung (PDF)]<br />
<br />
<br />
----<br />
<br />
Überblick über weitere Veröffentlichungen mit Projektbezug: '''[[Publikationen]]'''<br />
|}</div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Hauptseite&diff=1142Hauptseite2015-11-22T17:18:35Z<p>Storrer: </p>
<hr />
<div>{| class="wikitable" width="99%"<br />
|-<br />
! <big> Herzlich willkommen </big><br />
|- <br />
| style="background:#ffffff; padding:1em" | <br />
[[Datei:Kwic-kobra-2geo.png|links]] [[Datei:KobRA-RM.png|rechts]] '''KobRA&nbsp;(Korpus-basierte Recherche und Analyse mit Hilfe von Data-Mining)''' ist ein Verbundprojekt, das seit September 2012 vom [http://www.bmbf.de Bundesministerium für Bildung und Forschung (BMBF)] im Rahmen des '''[http://www.bmbf.de/foerderungen/16466.php Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities]''' gefördert wird (Förderkennzeichen: 01UG1245A).<br />
<br />
Im Projekt arbeiten Partner aus Informatik, Linguistik und Sprachtechnologie gemeinsam daran, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern. Koordinatorin des Projekts ist [http://germanistik.uni-mannheim.de/abteilungen/germanistische_linguistik/prof_dr_angelika_storrer/index.html Prof. Dr. Angelika Storrer (Universität Mannheim)]. <br />
<br />
<div style="clear: left"></div> Auf diesen Seiten bieten wir einen Überblick und detailliertere Informationen über:<br />
* '''[[Projektbeschreibung|die Ziele, Fragestellungen und Methoden des Projekts]]'''<br />
* '''[[Team|die beteiligten Personen und Forschungseinrichtungen]]'''<br />
* '''[[Fallstudien|die Fallstudien des Projekts]]'''<br />
*'''[[Fachtagung 30.10.2015|die Projekt-Abschlusstagung]]'''<br />
* '''sowie über Aktivitäten und aktuelle Veröffentlichungen (s.u.).'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left; margin-right:1em"<br />
|-<br />
! <big>Aktivitäten</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
*<span style= "color:#FF0000;">'''NEU: '''</span>Anleitung zur [[Visualisierung von diachronen Kollokationen]] mithilfe von KobRA-Werkzeugen und RapidMiner. [[Visualisierung von diachronen Kollokationen|Direkt zur Anleitung]].<br />
<br />
*Auf der Fachtagung [[Fachtagung 30.10.2015|''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'']] am 30.10.2015 an der BBAW wurden die Ergebnisse des Projekts WissenschaftlerInnen und der interessierten Öffentlichkeit präsentiert und Perspektiven für die Zukunft korpusgestützter Arbeiten diskutiert. Das Tagungsprogramm und E-Folien zu den Präsentationen und Postern finden Sie [[Fachtagung 30.10.2015|hier]].<br />
<br />
*Vortrag ''A Data Mining Environment for Linguistic Research Based on CLARIN-D Language Resources'' (Katharina Morik, Thomas Bartz, Christian Pölitz, Angelika Storrer) auf der [http://dch2015.net/abstracts_submission.shtml ''DCH2015 - Interdisciplinary Conference on Digital Cultural Heritage''] am 28.-30. Oktober 2015 in Berlin.<br />
<br />
* Panel: Am 29.10.15 wird ein von von Michael Beißwenger & Thierry Chanier organisiertes Panel [http://tei2015.huma-num.fr/en/panelsround-tables/#acc-3 TEI across corpora, languages and genres: Towards a standard for the representation of social media and computer-mediated communication]" im Rahmen der [http://tei2015.huma-num.fr/en/ Jahreskonferenz der Text encoding Initiative] stattfinden. Am Panel sind verschiedene KobRA-Akteure beteiligt.<br />
<br />
* Vortrag: "Wikipedia as a corpus resource for linguistic research" (Angelika Storrer) auf der [http://ird-cmc-rennes.sciencesconf.org/ internationalen ''ird-cmc''-Konferenz in Rennes/Frankreich] am 23.10.2015.<br />
<br />
* Panel: "Towards an encoding standard for social media and CMC: Experiences from German and French corpus projects using TEI" (organisiert von Michael Beißwenger & Thierry Chanier mit Beiträgen u.a. aus verschiedenen Korpusprojekten im KobRA-Kontext) auf der [http://ird-cmc-rennes.sciencesconf.org/ internationalen ''ird-cmc''-Konferenz in Rennes/Frankreich] am 23.10.2015.<br />
<br />
*Posterpräsentation ''Verb Valency and Prepositional Complements in Learner Corpora - A Case Study in the German MERLIN Corpus'' (Tassja Weber) 3. Learner Corpus Research Conference (LCR) 2015, Nijmegen (Niederlande), 11-13.09.2015. <br />
<br />
* Paper auf der Internationalen Fachtagung [http://www.kiv.zcu.cz/tsd2015/ ''Text, Speech and Dialogue'']: Pölitz, Christian; Bartz, Thomas; Morik, Katharina; Storrer, Angelika (2015): ''Investigation of Word Senses over Time using Linguistic Corpora'' In: Matousek, Vaclav et al. (Hrsg.): Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer.<br />
<br />
<br />
----<br />
<br />
Überblick über weitere Konferenzbeiträge und Projekt-Workshops: '''[[Aktivitäten]]'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left"<br />
|-<br />
! <big>Veröffentlichungen</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
*<span style= "color:#FF0000;">'''NEU: '''</span><b>Handbuch: Korpus-basierte linguistische Recherche und Analyse mithilfe des RapidMiner. Nutzung des KobRA-Plug-ins.</b> [http://kobra.tu-dortmund.de/mediawiki/index.php?title=Datei:RapidMiner-Handbuch_2015-20-10.pdf PDF] Stand: 20.10.2015. <br />
<br />
*Bartz,Thomas; Pölitz, Christian; Morik, Katharina; Storrer, Angelika (2015): '''Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research'''. In: Jan Odijk (Ed): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=116;article=001 Selected Papers from the CLARIN 2014 Conference], October 24-25, 2014, Soesterberg, The Netherlands, 1-13.<br />
<br />
*Bingel, Joachim; Diewald, Nils (2015): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=111;article=001 '''KoralQuery – a General Corpus Query Protocol''']. In: Proceedings of the Workshop on Innovative Corpus Query and Visualization Tools at NODALIDA 2015, Vilnius, Lithuania, May 11-13, 2015. <br />
<br />
*Diewald,Nils; Bingel, Joachim (2015): [http://KorAP.github.io/Koral '''KoralQuery 0.3. Technical Report, Working draft''']. IDS, Mannheim, Germany. <br />
<br />
*Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): '''Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods.''' In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. [http://www.uni-hildesheim.de/konvens2014/data/konvens2014-workshop-proceedings.pdf Proceedings-Band als PDF]<br />
<br />
*Thomas Bartz, Michael Beißwenger, Christian Pölitz, Nadja Radtke & Angelika Storrer (2014): '''Neue Möglichkeiten der Arbeit mit strukturierten Sprachressourcen in den Digital Humanities mithilfe von Data-Mining.''' [http://dharchive.org/paper/DH2014/Poster-894.xml Online Proceedings of the Digital Humanities 2014 annual international conference of the Alliance of Digital Humanities Organizations], Universität Lausanne, 10. Juli 2014<br />
<br />
*Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael (2014): '''Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014.''' Technischer Bericht, Technische Universität Dortmund. [[Media: KobRA-MS2_Verfahren.pdf|Online-Veröffentlichung (PDF)]]<br />
<br />
*Didakowski, Jörg; Radtke, Nadja (2014): '''Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. ''' In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. [http://euralex2014.eurac.edu/en/callforpapers/Documents/EURALEX%202014_gesamt.pdf Online-Veröffentlichung (PDF)]<br />
<br />
<br />
----<br />
<br />
Überblick über weitere Veröffentlichungen mit Projektbezug: '''[[Publikationen]]'''<br />
|}</div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Hauptseite&diff=1141Hauptseite2015-11-22T17:18:01Z<p>Storrer: </p>
<hr />
<div>{| class="wikitable" width="99%"<br />
|-<br />
! <big> Herzlich willkommen </big><br />
|- <br />
| style="background:#ffffff; padding:1em" | <br />
[[Datei:Kwic-kobra-2geo.png|links]] [[Datei:KobRA-RM.png|rechts]] '''KobRA&nbsp;(Korpus-basierte Recherche und Analyse mit Hilfe von Data-Mining)''' ist ein Verbundprojekt, das seit September 2012 vom [http://www.bmbf.de Bundesministerium für Bildung und Forschung (BMBF)] im Rahmen des '''[http://www.bmbf.de/foerderungen/16466.php Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities]''' gefördert wird (Förderkennzeichen: 01UG1245A).<br />
<br />
Im Projekt arbeiten Partner aus Informatik, Linguistik und Sprachtechnologie gemeinsam daran, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern. Koordinatorin des Projekts ist [http://germanistik.uni-mannheim.de/abteilungen/germanistische_linguistik/prof_dr_angelika_storrer/index.html Prof. Dr. Angelika Storrer (Universität Mannheim)]. <br />
<br />
<div style="clear: left"></div> Auf diesen Seiten bieten wir einen Überblick und detailliertere Informationen über:<br />
* '''[[Projektbeschreibung|die Ziele, Fragestellungen und Methoden des Projekts]]'''<br />
* '''[[Team|die beteiligten Personen und Forschungseinrichtungen]]'''<br />
* '''[[Fallstudien|die Fallstudien des Projekts]]'''<br />
*'''[[Fachtagung 30.10.2015|die Projekt-Abschlusstagung]]'''<br />
* '''sowie über Aktivitäten und aktuelle Veröffentlichungen (s.u.).'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left; margin-right:1em"<br />
|-<br />
! <big>Aktivitäten</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
*<span style= "color:#FF0000;">'''NEU: '''</span>Anleitung zur [[Visualisierung von diachronen Kollokationen]] mithilfe von KobRA-Werkzeugen und RapidMiner. [[Visualisierung von diachronen Kollokationen|Direkt zur Anleitung]].<br />
<br />
*Auf der Fachtagung [[Fachtagung 30.10.2015|''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'']] am 30.10.2015 an der BBAW wurden die Ergebnisse des Projekts WissenschaftlerInnen und der interessierten Öffentlichkeit präsentiert und Perspektiven für die Zukunft korpusgestützter Arbeiten diskutiert. Das Tagungsprogramm und E-Folien zu den Präsentationen und Postern finden Sie [[[Fachtagung 30.10.2015|hier]].<br />
<br />
*Vortrag ''A Data Mining Environment for Linguistic Research Based on CLARIN-D Language Resources'' (Katharina Morik, Thomas Bartz, Christian Pölitz, Angelika Storrer) auf der [http://dch2015.net/abstracts_submission.shtml ''DCH2015 - Interdisciplinary Conference on Digital Cultural Heritage''] am 28.-30. Oktober 2015 in Berlin.<br />
<br />
* Panel: Am 29.10.15 wird ein von von Michael Beißwenger & Thierry Chanier organisiertes Panel [http://tei2015.huma-num.fr/en/panelsround-tables/#acc-3 TEI across corpora, languages and genres: Towards a standard for the representation of social media and computer-mediated communication]" im Rahmen der [http://tei2015.huma-num.fr/en/ Jahreskonferenz der Text encoding Initiative] stattfinden. Am Panel sind verschiedene KobRA-Akteure beteiligt.<br />
<br />
* Vortrag: "Wikipedia as a corpus resource for linguistic research" (Angelika Storrer) auf der [http://ird-cmc-rennes.sciencesconf.org/ internationalen ''ird-cmc''-Konferenz in Rennes/Frankreich] am 23.10.2015.<br />
<br />
* Panel: "Towards an encoding standard for social media and CMC: Experiences from German and French corpus projects using TEI" (organisiert von Michael Beißwenger & Thierry Chanier mit Beiträgen u.a. aus verschiedenen Korpusprojekten im KobRA-Kontext) auf der [http://ird-cmc-rennes.sciencesconf.org/ internationalen ''ird-cmc''-Konferenz in Rennes/Frankreich] am 23.10.2015.<br />
<br />
*Posterpräsentation ''Verb Valency and Prepositional Complements in Learner Corpora - A Case Study in the German MERLIN Corpus'' (Tassja Weber) 3. Learner Corpus Research Conference (LCR) 2015, Nijmegen (Niederlande), 11-13.09.2015. <br />
<br />
* Paper auf der Internationalen Fachtagung [http://www.kiv.zcu.cz/tsd2015/ ''Text, Speech and Dialogue'']: Pölitz, Christian; Bartz, Thomas; Morik, Katharina; Storrer, Angelika (2015): ''Investigation of Word Senses over Time using Linguistic Corpora'' In: Matousek, Vaclav et al. (Hrsg.): Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer.<br />
<br />
<br />
----<br />
<br />
Überblick über weitere Konferenzbeiträge und Projekt-Workshops: '''[[Aktivitäten]]'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left"<br />
|-<br />
! <big>Veröffentlichungen</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
*<span style= "color:#FF0000;">'''NEU: '''</span><b>Handbuch: Korpus-basierte linguistische Recherche und Analyse mithilfe des RapidMiner. Nutzung des KobRA-Plug-ins.</b> [http://kobra.tu-dortmund.de/mediawiki/index.php?title=Datei:RapidMiner-Handbuch_2015-20-10.pdf PDF] Stand: 20.10.2015. <br />
<br />
*Bartz,Thomas; Pölitz, Christian; Morik, Katharina; Storrer, Angelika (2015): '''Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research'''. In: Jan Odijk (Ed): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=116;article=001 Selected Papers from the CLARIN 2014 Conference], October 24-25, 2014, Soesterberg, The Netherlands, 1-13.<br />
<br />
*Bingel, Joachim; Diewald, Nils (2015): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=111;article=001 '''KoralQuery – a General Corpus Query Protocol''']. In: Proceedings of the Workshop on Innovative Corpus Query and Visualization Tools at NODALIDA 2015, Vilnius, Lithuania, May 11-13, 2015. <br />
<br />
*Diewald,Nils; Bingel, Joachim (2015): [http://KorAP.github.io/Koral '''KoralQuery 0.3. Technical Report, Working draft''']. IDS, Mannheim, Germany. <br />
<br />
*Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): '''Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods.''' In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. [http://www.uni-hildesheim.de/konvens2014/data/konvens2014-workshop-proceedings.pdf Proceedings-Band als PDF]<br />
<br />
*Thomas Bartz, Michael Beißwenger, Christian Pölitz, Nadja Radtke & Angelika Storrer (2014): '''Neue Möglichkeiten der Arbeit mit strukturierten Sprachressourcen in den Digital Humanities mithilfe von Data-Mining.''' [http://dharchive.org/paper/DH2014/Poster-894.xml Online Proceedings of the Digital Humanities 2014 annual international conference of the Alliance of Digital Humanities Organizations], Universität Lausanne, 10. Juli 2014<br />
<br />
*Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael (2014): '''Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014.''' Technischer Bericht, Technische Universität Dortmund. [[Media: KobRA-MS2_Verfahren.pdf|Online-Veröffentlichung (PDF)]]<br />
<br />
*Didakowski, Jörg; Radtke, Nadja (2014): '''Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. ''' In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. [http://euralex2014.eurac.edu/en/callforpapers/Documents/EURALEX%202014_gesamt.pdf Online-Veröffentlichung (PDF)]<br />
<br />
<br />
----<br />
<br />
Überblick über weitere Veröffentlichungen mit Projektbezug: '''[[Publikationen]]'''<br />
|}</div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Fachtagung_30.10.2015:_Eindr%C3%BCcke_und_Einblicke&diff=1140Fachtagung 30.10.2015: Eindrücke und Einblicke2015-11-20T18:27:48Z<p>Storrer: </p>
<hr />
<div>Auf der Fachtagung '''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften''' stellte das Projekt KobRA seine Arbeit der interessierten Öffentlichkeit vor.<br />
<br />
Im '''Vortragsteil''' erläuterten die Projektpartner zunächst die Ziele und Ergebnisse der verschiedenen Arbeitspakete.<br />
<br />
Anschließend konnten die Teilnehmerinnen und Teilnehmer bei den '''Systemdemonstrationen''' die Verfahren und Korpusschnittstellen genauer in Augenschein nehmen und sich bei den '''Posterbeiträgen''' darüber informieren, wie die Verfahren in konkreten Forschungs- und Lehrkontexten eingesetzt wurden.<br />
<br />
Auf der abschließenden '''Podiumsdiskussion ''Digitale Textkorpora in den Geisteswissenschaften: Standortbestimmung und Perspektiven'' ''' diskutierten Projektpartner und Expert(inn)en mit dem Publikum über weiterführende Perspektiven. <br />
<br />
Die Tagung fand am 30.10.2015 an der [http://www.bbaw.de/ Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW)] in Berlin statt. <br />
<br />
Details zum Ablauf der Tagung und PDF-Versionen zu Vorträgen und Postern finden Sie im [[Fachtagung 30.10.2015| Tagungsprogramm]]. <br />
<br />
<table border="0" align="center"><br />
<br />
<tr><br />
<td></td><br />
</tr><br />
<tr><br />
<td></td><br />
</tr><br />
<br />
<tr><br />
<td> [[Datei:KobRA_BBAW_30.10.2015_1.jpg|700px]]</td><br />
</tr><br />
<td>Vortrag Prof. Dr. Katharina Morik (Informatik)</td><br />
<br />
<br />
<tr><br />
<td></td><br />
</tr><br />
<tr><br />
<td></td><br />
<tr><br />
<br />
<br />
<tr><br />
<td> [[Datei:KobRA_BBAW_30.10.2015_3.jpg|700px]]</td><br />
</tr><br />
<tr><br />
<td> Systemdemonstration der KobRA-Verfahren in der Data-Mining-Umgebung ''RapidMiner'' durch Christian Pölitz.</td><br />
<tr><br />
<br />
<tr><br />
<td></td><br />
</tr><br />
<td></td><br />
<tr><br />
<br />
<tr><br />
<td> [[Datei:KobRA_BBAW_30.10.2015_4.jpg|700px]]</td><br />
</tr><br />
<tr><br />
<td>Posterpräsentationen zum KobRA-Einsatz in Forschungs- und Lehrkontexten.</td><br />
<tr><br />
<br />
<tr><br />
<td></td><br />
</tr><br />
<td></td><br />
<tr><br />
<br />
<br />
<tr><br />
<td> [[Datei:KobRA_BBAW_30.10.2015_2.jpg|700px]]</td><br />
</tr><br />
<tr><br />
<td>Podiumsdiskussion (v.l.): Prof. Carolin Sporleder (Göttingen), Prof. Erhard W. Hinrichs (Tübingen), Prof. Angelika Storrer (Mannheim), Prof. Katharina Morik (Dortmund), Prof. Holger Wormer (Dortmund), Prof. Thomas Gloning (Gießen)</td><br />
</tr></div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Fachtagung_30.10.2015&diff=1119Fachtagung 30.10.20152015-11-12T13:56:33Z<p>Storrer: </p>
<hr />
<div><table width="1000" border="0" cellpadding="7" cellspacing ="2"><br />
<tr><br />
<td bgcolor="#FEEAAB"><big>'''Fachtagung ''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'''''</big></td><br />
</tr><br />
<tr><br />
<td>'''Ort:''' [http://www.bbaw.de/ Berlin-Brandenburgische Akademie der Wissenschaften (BBAW)] Einsteinsaal.<br />
'''Termin:''' 30. Oktober 2015 9:30 - 19:00 Uhr<br />
<br />
Auf dieser Fachtagung stellte das BMBF-Verbundprojekt KobRA (Korpus-basierte linguistische Recherche und Analyse mit Hilfe von Data-Mining) seine Ergebnisse vor und diskutierte weiterführende Perspektiven. Die PDFs zu den Vorträgen und Präsentationen sind dem Tagungsprogramm beigefügt.<br />
</td><br />
</tr><br />
</table><br />
<br />
'''Tagungsprogramm''' (für eine Druckversion des Tagungsprogramms klicken Sie bitte [[Media: Fachtagung_Data Mining_Programm_Stand 28.10_2.pdf|hier]]).<br />
<table width="1000" border="0" bgcolor="#FEEAAB" cellpadding="7" cellspacing ="2"><br />
<tr><br />
<td bgcolor="#CDCDCD"> 9:30-9:40 </td><br />
<td> '''Begrüßung und Eröffnung'''</td><br />
</tr><br />
<tr><br />
<td> 9:40-10:05 </td><br />
<td bgcolor="#CDCDCD"> '''Korpusbasierte Recherche und Analyse mit Hilfe von Data-Mining: Das BMBF-Projekt KobRA''' (Prof. Dr. Angelika Storrer, Universität Mannheim) [[Media:Präsentation_Storrer_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD"> 10:05-10:30 </td><br />
<td> '''RapidMiner als Werkzeug für die textorientierten Geisteswissenschaften''' (Prof. Dr. Katharina Morik, TU Dortmund) [[Media:Präsentation_Morik_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td>10:30-11:00</td><br />
<td bgcolor="#CDCDCD">Kaffeepause</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">11:00-11:30</td><br />
<td>'''Routineaufgaben bei der Nutzung von Korpora: Disambiguieren, Klassifizieren, Annotieren mit KobRA-Verfahren'''<br/>(Thomas Bartz/Christian Pölitz, TU Dortmund) [[Media:Präsentation_Bartz_Poelitz_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td>11:30-12:00</td><br />
<td bgcolor="#CDCDCD">'''Extraktion guter Belege aus Textkorpora durch Kombination eines regelbasierten Verfahrens mit maschinellem Lernen'''<br/>(Dr. Alexander Geyken/Dr. Lothar Lemnitzer, BBAW) [[Media:Präsentation_Geyken_Lemnitzer_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">12:00-12:30</td><br />
<td>'''Korpusbasierte Analyse internetbasierter Kommunikation: Herausforderungen und Perspektiven'''<br/>(PD Dr. Michael Beißwenger, TU Dortmund/Dr. Harald Lüngen, IDS/Christian Pölitz, TU Dortmund) [[Media:Präsentation_Beisswenger_Luengen_Poelitz_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td>12:30-14:00</td><br />
<td bgcolor="#CDCDCD">Mittagspause</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">14:00-14:25</td><br />
<td>'''Neue Entwicklungen und Wege bei der Erstellung, Erweiterung und Nutzung von Korpora am Zentrum Sprache'''<br/>(Dr. Alexander Geyken/Bryan Jurish/Kay Michael Würzner, BBAW) [[Media:Präsentation_Geyken_Jurish_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td>14:25-14:50</td><br />
<td bgcolor="#CDCDCD">'''Schnittstellen zur Nutzung der Korpusanalyseplattform KorAP''' (Nils Diewald/Dr. Marc Kupietz, IDS) [[Media:Präsentation_Kupietz_Diewald_30.10.2015.pdf|(PDF)]] </td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">14:50-15:15</td><br />
<td>'''Integration von KobRA Services in die CLARIN Forschungsinfrastruktur''' (Prof. Dr. Erhard Hinrichs/Marie Hinrichs, SfS Universität Tübingen) [[Media:Präsentation_Hinrichs_30.10.2015.pdf|(PDF)]]</td><br />
</tr><br />
<tr><br />
<td>15:15-16:00</td><br />
<td bgcolor="#CDCDCD">Kaffeepause, z.T. parallel zur Postersession</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">15:30-16:50</td><br />
<td>'''Postersession und Systemdemonstrationen''' (Stand 22.10.):<br />
*Thomas Bartz/Christian Pölitz/Angelika Storrer:'' Korpus-basierte linguistische Recherche und Analyse mit Hilfe von Data-Mining („KobRA“). Erprobung innovativer Data-Mining-Verfahren für die empirische Arbeit mit strukturierten Sprachressourcen''<br />
*Michael Beißwenger/Thomas Bartz/Axel Herold/Marc Kupietz/Lothar Lemnitzer/Harald Lüngen/Angelika Storrer: ''Aufbau von Social-Media-Korpora für die Digital Humanities: Standards und Perspektiven''<br /><br />
*Michael Beißwenger/Christian Pölitz/Lena Meyer: ''KobRA @ Classroom: Ein interdisziplinäres Projektseminar zum Einsatz von Data-Mining bei der korpusgestützten Analyse internetbasierter Kommunikation''<br /><br />
*Tassja Weber/Laura Herzberg: ''Studienarbeiten zur internetbasierten Kommunikation mit KobRA-Verfahren an der Universität Mannheim'' [[Media:Poster_Herzberg_Weber_Studienarbeiten Mannheim_30.10.2015.pdf|(PDF)]]<br />
*Jörg Didakowski/Nadja Radtke: ''Korpusbasierte Analyse von deutschen Stützverbgefügen''<br /><br />
*Sebastian Buschjäger/Lukas Pfahler: ''Discovering Subtle Word Relations in Large German Corpora''<br /> <br />
*Maria Ermakova: ''Baby vs. Säugling: Wer gewinnt im XX. Jahrhundert? Eine korpusbasierte Studie zur Semantik und Pragmatik des Fremdwortgebrauchs''<br />
*Erik-Lân Do Dinh/Richard Eckart de Castilho/Iryna Gurevych: ''In-Tool Learning for Selective Manual Annotation in Large Corpora'' (Poster und Systemdemonstration)<br />
*Nils Diewald/Marc Kupietz: ''Korpusanalyseplattform (KorAP)'' (Poster + Systemdemonstration) [[Media:Präsentation_KorAP_Poster_30.10.2015.pdf|(PDF)]]<br /><br />
*Erhard Hinrichs/Marie Hinrichs: ''WebLicht'' (Systemdemonstration)<br /><br />
*Bryan Jurish: ''Deutsches Textarchiv'' (DTA) (Poster und Systemdemonstration) [[Media:Poster_Jurish_Diacollo_30.10.2015.pdf|(PDF)]]<br /><br />
*Christian Pölitz: ''RapidMiner als Werkzeug für die korpusbasierte Sprachanalyse'' (Systemdemonstration)<br /><br />
</td><br />
</tr><br />
<tr><br />
<td>17:00-19:00</td><br />
<td bgcolor="#CDCDCD">'''Podiumsdiskussion: ''Digitale Textkorpora in den Geisteswissenschaften: Standortbestimmung und Perspektiven''''' <br />
'''Moderation''': Prof. Dr. Angelika Storrer<br />
<br />
'''Podiumsgäste''': Prof. Dr. Thomas Gloning (Gießen), Prof. Dr. Erhardt Hinrichs (Tübingen), Prof. Dr. Katharina Morik (Dortmund), Prof. Dr. Caroline Sporleder (Göttingen) und Prof. Dr. Holger Wormer (Dortmund).<br />
</td><br />
</tr><br />
</table></div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Fachtagung_30.10.2015:_Eindr%C3%BCcke_und_Einblicke&diff=1118Fachtagung 30.10.2015: Eindrücke und Einblicke2015-11-12T13:53:34Z<p>Storrer: </p>
<hr />
<div>Auf der Fachtagung '''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften''' stellte das Projekt KobRA seine Arbeit der interessierten Öffentlichkeit vor.<br />
<br />
Im '''Vortragsteil''' erläuterten die Projektpartner zunächst die Ziele und Ergebnisse der verschiedenen Arbeitspakete.<br />
<br />
Anschließend konnten die Teilnehmerinnen und Teilnehmer bei den '''Systemdemonstrationen''' die Verfahren und Korpusschnittstellen genauer in Augenschein nehmen und sich bei den '''Posterbeiträgen''' darüber informieren, wie die Verfahren in konkreten Forschungs- und Lehrkontexten eingesetzt wurden.<br />
<br />
Auf der abschließenden '''Podiumsdiskussion ''Digitale Textkorpora in den Geisteswissenschaften: Standortbestimmung und Perspektiven'' ''' diskutierten Projektpartner und Expert(inn)en mit dem Publikum über weiterführende Perspektiven. <br />
<br />
Die Tagung fand am 30.10.2015 an der [http://www.bbaw.de/ Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW)] in Berlin statt. <br />
<br />
Details zum Ablauf der Tagung und PDF-Versionen zu Vorträgen und Postern finden Sie im [[Fachtagung 30.10.2015| Tagungsprogramm]]. <br />
<br />
<table border="0" align="center"><br />
<br />
<tr><br />
<td></td><br />
</tr><br />
<tr><br />
<td></td><br />
</tr><br />
<br />
<tr><br />
<td> [[Datei:KobRA_BBAW_30.10.2015_1.jpg|700px]]</td><br />
</tr><br />
<td>Vortrag Prof. Dr. Katharina Morik (Informatik)</td><br />
<br />
<br />
<tr><br />
<td></td><br />
</tr><br />
<tr><br />
<td></td><br />
<tr><br />
<br />
<br />
<tr><br />
<td> [[Datei:KobRA_BBAW_30.10.2015_3.jpg|700px]]</td><br />
</tr><br />
<tr><br />
<td> Systemdemonstration der KobRA-Verfahren in der Data-Mining-Umgebung ''RapidMiner'' durch Christian Poelitz.</td><br />
<tr><br />
<br />
<tr><br />
<td></td><br />
</tr><br />
<td></td><br />
<tr><br />
<br />
<tr><br />
<td> [[Datei:KobRA_BBAW_30.10.2015_4.jpg|700px]]</td><br />
</tr><br />
<tr><br />
<td>Posterpräsentationen zum KobRA-Einsatz in Forschungs- und Lehrkontexten.</td><br />
<tr><br />
<br />
<tr><br />
<td></td><br />
</tr><br />
<td></td><br />
<tr><br />
<br />
<br />
<tr><br />
<td> [[Datei:KobRA_BBAW_30.10.2015_2.jpg|700px]]</td><br />
</tr><br />
<tr><br />
<td>Podiumsdiskussion (v.l.): Prof. Dr. Sporleder, Prof. Dr. Hinrichs, Prof. Dr. Storrer, Prof. Dr. Morik, Prof. Dr. Wormer, Prof. Dr.Gloning</td><br />
</tr><br />
<br />
<tr> <br />
<td>[[Datei:KobRA_BBAW_30.10.2015.jpg|700px]]</td><br />
</tr><br />
<tr><br />
<td>Gruppenfoto einiger Projektpartner und Teilnehmer/innen vor dem Akademiegebäude in Berlin</td><br />
</tr><br />
</table></div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Fachtagung_30.10.2015:_Eindr%C3%BCcke_und_Einblicke&diff=1117Fachtagung 30.10.2015: Eindrücke und Einblicke2015-11-12T13:52:14Z<p>Storrer: </p>
<hr />
<div>Auf der Fachtagung '''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften''' stellte das Projekt KobRA seine Arbeit der interessierten Öffentlichkeit vor.<br />
<br />
Im '''Vortragsteil''' erläuterten die Projektpartner zunächst die Ziele und Ergebnisse der verschiedenen Arbeitspakete.<br />
<br />
Anschließend konnten die Teilnehmerinnen und Teilnehmer bei den '''Systemdemonstrationen''' die Verfahren und Korpusschnittstellen genauer in Augenschein nehmen und sich bei den '''Posterbeiträgen''' darüber informieren, wie die Verfahren in konkreten Forschungs- und Lehrkontexten eingesetzt wurden.<br />
<br />
Auf der abschließenden '''Podiumsdiskussion ''Digitale Textkorpora in den Geisteswissenschaften: Standortbestimmung und Perspektiven'' ''' diskutierten Projektpartner und Expert(inn)en mit dem Publikum über weiterführende Perspektiven. <br />
<br />
Die Tagung fand am 30.10.2015 an der [http://www.bbaw.de/ Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW)] in Berlin statt. <br />
<br />
Details zum Ablauf der Tagung und PDF-Versionen zu Vorträgen und Postern finden Sie im [[Media: Fachtagung_Data Mining_Programm_Stand 28.10_2.pdf| Tagungsprogramm]]. <br />
<br />
<table border="0" align="center"><br />
<br />
<tr><br />
<td></td><br />
</tr><br />
<tr><br />
<td></td><br />
</tr><br />
<br />
<tr><br />
<td> [[Datei:KobRA_BBAW_30.10.2015_1.jpg|700px]]</td><br />
</tr><br />
<td>Vortrag Prof. Dr. Katharina Morik (Informatik)</td><br />
<br />
<br />
<tr><br />
<td></td><br />
</tr><br />
<tr><br />
<td></td><br />
<tr><br />
<br />
<br />
<tr><br />
<td> [[Datei:KobRA_BBAW_30.10.2015_3.jpg|700px]]</td><br />
</tr><br />
<tr><br />
<td> Systemdemonstration der KobRA-Verfahren in der Data-Mining-Umgebung ''RapidMiner'' durch Christian Poelitz.</td><br />
<tr><br />
<br />
<tr><br />
<td></td><br />
</tr><br />
<td></td><br />
<tr><br />
<br />
<tr><br />
<td> [[Datei:KobRA_BBAW_30.10.2015_4.jpg|700px]]</td><br />
</tr><br />
<tr><br />
<td>Posterpräsentationen zum KobRA-Einsatz in Forschungs- und Lehrkontexten.</td><br />
<tr><br />
<br />
<tr><br />
<td></td><br />
</tr><br />
<td></td><br />
<tr><br />
<br />
<br />
<tr><br />
<td> [[Datei:KobRA_BBAW_30.10.2015_2.jpg|700px]]</td><br />
</tr><br />
<tr><br />
<td>Podiumsdiskussion (v.l.): Prof. Dr. Sporleder, Prof. Dr. Hinrichs, Prof. Dr. Storrer, Prof. Dr. Morik, Prof. Dr. Wormer, Prof. Dr.Gloning</td><br />
</tr><br />
<br />
<tr> <br />
<td>[[Datei:KobRA_BBAW_30.10.2015.jpg|700px]]</td><br />
</tr><br />
<tr><br />
<td>Gruppenfoto einiger Projektpartner und Teilnehmer/innen vor dem Akademiegebäude in Berlin</td><br />
</tr><br />
</table></div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Fachtagung_30.10.2015:_Eindr%C3%BCcke_und_Einblicke&diff=1116Fachtagung 30.10.2015: Eindrücke und Einblicke2015-11-12T13:43:59Z<p>Storrer: </p>
<hr />
<div>Auf der Fachtagung '''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften''' stellte das Projekt KobRA seine Arbeit der interessierten Öffentlichkeit vor.<br />
<br />
Im '''Vortragsteil''' erläuterten die Projektpartner zunächst die Ziele und Ergebnisse der verschiedenen Arbeitspakete.<br />
<br />
Anschließend konnten die Teilnehmerinnen und Teilnehmer bei den '''Systemdemonstrationen''' die Verfahren und Korpusschnittstellen genauer in Augenschein nehmen und sich bei den '''Posterbeiträgen''' darüber informieren, wie die Verfahren in konkreten Forschungs- und Lehrkontexten eingesetzt wurden.<br />
<br />
Auf der abschließenden '''Podiumsdiskussion ''Digitale Textkorpora in den Geisteswissenschaften: Standortbestimmung und Perspektiven'' ''' diskutierten Projektpartner und Expert(inn)en mit dem Publikum über weiterführende Perspektiven. <br />
<br />
Die Tagung fand am 30.10.2015 an der [http://www.bbaw.de/ Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW)] in Berlin statt. <br />
<br />
Details zum Ablauf der Tagung und PDF-Versionen zu Vorträgen und Postern finden Sie im [[Media: Fachtagung_Data Mining_Programm_Stand 28.10_2.pdf| Tagungsprogramm]]. <br />
<br />
<table border="0" align="center"><br />
<tr> <br />
<td>[[Datei:KobRA_BBAW_30.10.2015.jpg|700px]]</td><br />
</tr><br />
<tr><br />
<td>Einige Projektmitarbeiter und TeilnehmerInnen der Fachtagung vor dem Akademiegebäude in Berlin</td><br />
</tr><br />
<br />
<tr><br />
<td></td><br />
</tr><br />
<tr><br />
<td></td><br />
</tr><br />
<br />
<tr><br />
<td> [[Datei:KobRA_BBAW_30.10.2015_1.jpg|700px]]</td><br />
</tr><br />
<td>Prof. Dr. Katharina Morik (Informatik) stellte in Ihrem Vortrag die Projektpartner vor und informierte über die entwickelten Verfahren.</td><br />
<br />
<br />
<tr><br />
<td></td><br />
</tr><br />
<tr><br />
<td></td><br />
<tr><br />
<br />
<tr><br />
<td> [[Datei:KobRA_BBAW_30.10.2015_4.jpg|700px]]</td><br />
</tr><br />
<tr><br />
<td>In der Postersession wurden die Projekt-bezogenen Ergebnisse aus Forschungs- und Lehrkontexten präsentiert.</td><br />
<tr><br />
<br />
<tr><br />
<td></td><br />
</tr><br />
<td></td><br />
<tr><br />
<br />
<br />
<tr><br />
<td> [[Datei:KobRA_BBAW_30.10.2015_3.jpg|700px]]</td><br />
</tr><br />
<tr><br />
<td> Christian Pölitz stellte die Data-Mining-Umgebung ''RapidMiner'' vor, in der die KobRA-Verfahren durch ein Plug-In verfügbar sind.</td><br />
<tr><br />
<br />
<tr><br />
<td></td><br />
</tr><br />
<td></td><br />
<tr><br />
<br />
<tr><br />
<td> [[Datei:KobRA_BBAW_30.10.2015_2.jpg|700px]]</td><br />
</tr><br />
<tr><br />
<td>Podiumsdiskussion (v.l.): Prof. Dr. Sporleder, Prof. Dr. Hinrichs, Prof. Dr. Storrer, Prof. Dr. Morik, Prof. Dr. Wormer, Prof. Dr.Gloning</td><br />
</tr><br />
</table></div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Fachtagung_30.10.2015&diff=928Fachtagung 30.10.20152015-10-27T22:33:09Z<p>Storrer: </p>
<hr />
<div><table width="1000" border="0" cellpadding="7" cellspacing ="2"><br />
<tr><br />
<td bgcolor="#FEEAAB"><big>'''Fachtagung ''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'''''</big></td><br />
</tr><br />
<tr><br />
<td>'''Ort:''' [http://www.bbaw.de/veranstaltungen/2015/oktober/datamining Berlin-Brandenburgische Akademie der Wissenschaften (BBAW)] Einsteinsaal.<br />
'''Termin:''' 30. Oktober 2015 9:30 - 19:00 Uhr<br />
<br />
Auf dieser Fachtagung stellt das BMBF-Verbundprojekt KobRA (Korpus-basierte linguistische Recherche und Analyse mit Hilfe von Data-Mining) seine Ergebnisse vor und diskutiert weiterführende Perspektiven mit Anwendern und der interessierten Öffentlichkeit. <br />
<br />
</td><br />
</tr><br />
</table><br />
<br />
'''Tagungsprogramm''' (für eine Druckversion des aktuellen Tagungsprogramms klicken Sie bitte [[Media: Fachtagung_Data Mining_Programm_Stand 22.10.pdf|hier]]).<br />
<table width="1000" border="0" bgcolor="#FEEAAB" cellpadding="7" cellspacing ="2"><br />
<tr><br />
<td bgcolor="#CDCDCD"> 9:30-9:40 </td><br />
<td> '''Begrüßung und Eröffnung'''</td><br />
</tr><br />
<tr><br />
<td> 9:40-10:05 </td><br />
<td bgcolor="#CDCDCD"> '''Korpusbasierte Recherche und Analyse mit Hilfe von Data-Mining: Das BMBF-Projekt KobRA''' (Prof. Dr. Angelika Storrer, Universität Mannheim)</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD"> 10:05-10:30 </td><br />
<td> '''RapidMiner als Werkzeug für die textorientierten Geisteswissenschaften''' (Prof. Dr. Katharina Morik, TU Dortmund)</td><br />
</tr><br />
<tr><br />
<td>10:30-11:00</td><br />
<td bgcolor="#CDCDCD">Kaffeepause</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">11:00-11:30</td><br />
<td>'''Routineaufgaben bei der Nutzung von Korpora: Disambiguieren, Klassifizieren, Annotieren mit KobRA-Verfahren'''<br/>(Thomas Bartz/Christian Pölitz, TU Dortmund</td><br />
</tr><br />
<tr><br />
<td>11:30-12:00</td><br />
<td bgcolor="#CDCDCD">'''Extraktion guter Belege aus Textkorpora durch Kombination eines regelbasierten Verfahrens mit maschinellem Lernen'''<br/>(Dr. Alexander Geyken/Dr. Lothar Lemnitzer, BBAW)</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">12:00-12:30</td<br />
<td>'''Korpusbasierte Analyse internetbasierter Kommunikation: Herausforderungen und Perspektiven'''<br/>(PD Dr. Michael Beißwenger, TU Dortmund/Dr. Harald Lüngen, IDS/Christian Pölitz, TU Dortmund)</td><br />
</tr><br />
<tr><br />
<td>12:30-14:00</td><br />
<td bgcolor="#CDCDCD">Mittagspause</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">14:00-14:25</td><br />
<td>'''Neue Entwicklungen und Wege bei der Erstellung, Erweiterung und Nutzung von Korpora am Zentrum Sprache'''<br/>(Dr. Alexander Geyken/Bryan Jurish/Kay Michael Würzner, BBAW)</td><br />
</tr><br />
<tr><br />
<td>14:25-14:50</td><br />
<td bgcolor="#CDCDCD">'''Schnittstellen zur Nutzung der Korpusanalyseplattform KorAP''' (Nils Diewald/Dr. Marc Kupietz, IDS) </td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">14:50-15:15</td><br />
<td>'''Integration von KobRA Services in die CLARIN Forschungsinfrastruktur''' (Prof. Dr. Erhard Hinrichs/Marie Hinrichs, SfS Universität Tübingen)</td><br />
</tr><br />
<tr><br />
<td>15:15-16:00</td><br />
<td bgcolor="#CDCDCD">Kaffeepause, z.T. parallel zur Postersession</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">15:30-16:50</td><br />
<td>'''Postersession und Systemdemonstrationen''' (Stand 22.10.):<br />
*Thomas Bartz/Christian Pölitz/Angelika Storrer:'' Korpus-basierte linguistische Recherche und Analyse mit Hilfe von Data-Mining („KobRA“). Erprobung innovativer Data-Mining-Verfahren für die empirische Arbeit mit strukturierten Sprachressourcen''<br />
*Michael Beißwenger/Thomas Bartz/Axel Herold/Marc Kupietz/Lothar Lemnitzer/Harald Lüngen/Angelika Storrer: ''Aufbau von Social-Media-Korpora für die Digital Humanities: Standards und Perspektiven''<br /><br />
*Michael Beißwenger/Christian Pölitz/Lena Meyer: ''KobRA @ Classroom: Ein interdisziplinäres Projektseminar zum Einsatz von Data-Mining bei der korpusgestützten Analyse internetbasierter Kommunikation''<br /><br />
*Tassja Weber/Laura Herzberg: ''Studienarbeiten zur internetbasierten Kommunikation mit KobRA-Verfahren an der Universität Mannheim''<br />
*Jörg Didakowski/Nadja Radtke: ''Korpusbasierte Analyse von deutschen Stützverbgefügen''<br /><br />
*Sebastian Buschjäger/Lukas Pfahler: ''Discovering Subtle Word Relations in Large German Corpora''<br /> <br />
*Maria Ermakova: ''Baby vs. Säugling: Wer gewinnt im XX. Jahrhundert? Eine korpusbasierte Studie zur Semantik und Pragmatik des Fremdwortgebrauchs''<br />
*Erik-Lân Do Dinh/Richard Eckart de Castilho/Iryna Gurevych: ''In-Tool Learning for Selective Manual Annotation in Large Corpora'' (Poster und Systemdemonstration)<br />
*Nils Diewald/Marc Kupietz: ''Korpusanalyseplattform (KorAP)'' (Poster + Systemdemonstration) <br /><br />
*Erhard Hinrichs/Marie Hinrichs: ''WebLicht'' (Systemdemonstration)<br /><br />
*Bryan Jurish: ''Deutsches Textarchiv'' (DTA) (Poster und Systemdemonstration)<br /><br />
*Christian Pölitz: ''RapidMiner als Werkzeug für die korpusbasierte Sprachanalyse'' (Systemdemonstration)<br /><br />
</td><br />
</tr><br />
<tr><br />
<td>17:00-19:00</td><br />
<td bgcolor="#CDCDCD">'''Podiumsdiskussion: ''Digitale Textkorpora in den Geisteswissenschaften: Standortbestimmung und Perspektiven''''' <br />
'''Moderation''': Prof. Dr. Angelika Storrer<br />
<br />
'''Podiumsgäste''': Prof. Dr. Thomas Gloning (Gießen), Prof. Dr. Erhardt Hinrichs (Tübingen), Prof. Dr. Katharina Morik (Dortmund), Prof. Dr. Caroline Sporleder (Göttingen) und Prof. Dr. Holger Wormer (Dortmund).<br />
</td><br />
</tr><br />
</table></div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Fachtagung_30.10.2015&diff=927Fachtagung 30.10.20152015-10-27T19:37:17Z<p>Storrer: </p>
<hr />
<div><table width="1000" border="0" cellpadding="7" cellspacing ="2"><br />
<tr><br />
<td bgcolor="#FEEAAB"><big>'''Fachtagung ''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'''''</big></td><br />
</tr><br />
<tr><br />
<td>'''Ort:''' [http://www.bbaw.de/veranstaltungen/2015/oktober/datamining Berlin-Brandenburgische Akademie der Wissenschaften (BBAW)] Einsteinsaal.<br />
'''Termin:''' 30. Oktober 2015 9:30 - 19:00 Uhr<br />
<br />
Auf dieser Fachtagung stellt das BMBF-Verbundprojekt KobRA (Korpus-basierte linguistische Recherche und Analyse mit Hilfe von Data-Mining) seine Ergebnisse vor und diskutiert weiterführende Perspektiven mit Anwendern und der interessierten Öffentlichkeit. <br />
<br />
Die Teilnahme ist kostenlos.<br />
<br />
</td><br />
</tr><br />
</table><br />
<br />
'''Tagungsprogramm''' (für eine Druckversion des aktuellen Tagungsprogramms klicken Sie bitte [[Media: Fachtagung_Data Mining_Programm_Stand 22.10.pdf|hier]]).<br />
<table width="1000" border="0" bgcolor="#FEEAAB" cellpadding="7" cellspacing ="2"><br />
<tr><br />
<td bgcolor="#CDCDCD"> 9:30-9:40 </td><br />
<td> '''Begrüßung und Eröffnung'''</td><br />
</tr><br />
<tr><br />
<td> 9:40-10:05 </td><br />
<td bgcolor="#CDCDCD"> '''Korpusbasierte Recherche und Analyse mit Hilfe von Data-Mining: Das BMBF-Projekt KobRA''' (Prof. Dr. Angelika Storrer, Universität Mannheim)</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD"> 10:05-10:30 </td><br />
<td> '''RapidMiner als Werkzeug für die textorientierten Geisteswissenschaften''' (Prof. Dr. Katharina Morik, TU Dortmund)</td><br />
</tr><br />
<tr><br />
<td>10:30-11:00</td><br />
<td bgcolor="#CDCDCD">Kaffeepause</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">11:00-11:30</td><br />
<td>'''Routineaufgaben bei der Nutzung von Korpora: Disambiguieren, Klassifizieren, Annotieren mit KobRA-Verfahren'''<br/>(Thomas Bartz/Christian Pölitz, TU Dortmund</td><br />
</tr><br />
<tr><br />
<td>11:30-12:00</td><br />
<td bgcolor="#CDCDCD">'''Extraktion guter Belege aus Textkorpora durch Kombination eines regelbasierten Verfahrens mit maschinellem Lernen'''<br/>(Dr. Alexander Geyken/Dr. Lothar Lemnitzer, BBAW)</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">12:00-12:30</td<br />
<td>'''Korpusbasierte Analyse internetbasierter Kommunikation: Herausforderungen und Perspektiven'''<br/>(PD Dr. Michael Beißwenger, TU Dortmund/Dr. Harald Lüngen, IDS/Christian Pölitz, TU Dortmund)</td><br />
</tr><br />
<tr><br />
<td>12:30-14:00</td><br />
<td bgcolor="#CDCDCD">Mittagspause</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">14:00-14:25</td><br />
<td>'''Neue Entwicklungen und Wege bei der Erstellung, Erweiterung und Nutzung von Korpora am Zentrum Sprache'''<br/>(Dr. Alexander Geyken/Bryan Jurish/Kay Michael Würzner, BBAW)</td><br />
</tr><br />
<tr><br />
<td>14:25-14:50</td><br />
<td bgcolor="#CDCDCD">'''Schnittstellen zur Nutzung der Korpusanalyseplattform KorAP''' (Nils Diewald/Dr. Marc Kupietz, IDS) </td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">14:50-15:15</td><br />
<td>'''Integration von KobRA Services in die CLARIN Forschungsinfrastruktur''' (Prof. Dr. Erhard Hinrichs/Marie Hinrichs, SfS Universität Tübingen)</td><br />
</tr><br />
<tr><br />
<td>15:15-16:00</td><br />
<td bgcolor="#CDCDCD">Kaffeepause, z.T. parallel zur Postersession</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">15:30-16:50</td><br />
<td>'''Postersession und Systemdemonstrationen''' (Stand 22.10.):<br />
*Thomas Bartz/Christian Pölitz/Angelika Storrer:'' Korpus-basierte linguistische Recherche und Analyse mit Hilfe von Data-Mining („KobRA“). Erprobung innovativer Data-Mining-Verfahren für die empirische Arbeit mit strukturierten Sprachressourcen''<br />
*Michael Beißwenger/Thomas Bartz/Axel Herold/Marc Kupietz/Lothar Lemnitzer/Harald Lüngen/Angelika Storrer: ''Aufbau von Social-Media-Korpora für die Digital Humanities: Standards und Perspektiven''<br /><br />
*Michael Beißwenger/Christian Pölitz/Lena Meyer: ''KobRA @ Classroom: Ein interdisziplinäres Projektseminar zum Einsatz von Data-Mining bei der korpusgestützten Analyse internetbasierter Kommunikation''<br /><br />
*Tassja Weber/Laura Herzberg: ''Studienarbeiten zur internetbasierten Kommunikation mit KobRA-Verfahren an der Universität Mannheim''<br />
*Jörg Didakowski/Nadja Radtke: ''Korpusbasierte Analyse von deutschen Stützverbgefügen''<br /><br />
*Sebastian Buschjäger/Lukas Pfahler: ''Discovering Subtle Word Relations in Large German Corpora''<br /> <br />
*Maria Ermakova: ''Baby vs. Säugling: Wer gewinnt im XX. Jahrhundert? Eine korpusbasierte Studie zur Semantik und Pragmatik des Fremdwortgebrauchs''<br />
*Erik-Lân Do Dinh/Richard Eckart de Castilho/Iryna Gurevych: ''In-Tool Learning for Selective Manual Annotation in Large Corpora'' (Poster und Systemdemonstration)<br />
*Nils Diewald/Marc Kupietz: ''Korpusanalyseplattform (KorAP)'' (Poster + Systemdemonstration) <br /><br />
*Erhard Hinrichs/Marie Hinrichs: ''WebLicht'' (Systemdemonstration)<br /><br />
*Bryan Jurish: ''Deutsches Textarchiv'' (DTA) (Poster und Systemdemonstration)<br /><br />
*Christian Pölitz: ''RapidMiner als Werkzeug für die korpusbasierte Sprachanalyse'' (Systemdemonstration)<br /><br />
</td><br />
</tr><br />
<tr><br />
<td>17:00-19:00</td><br />
<td bgcolor="#CDCDCD">'''Podiumsdiskussion: ''Digitale Textkorpora in den Geisteswissenschaften: Standortbestimmung und Perspektiven''''' <br />
'''Moderation''': Prof. Dr. Angelika Storrer<br />
<br />
'''Podiumsgäste''': Prof. Dr. Thomas Gloning (Gießen), Prof. Dr. Erhardt Hinrichs (Tübingen), Prof. Dr. Katharina Morik (Dortmund), Prof. Dr. Caroline Sporleder (Göttingen) und Prof. Dr. Holger Wormer (Dortmund).<br />
</td><br />
</tr><br />
</table></div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Tools123&diff=926Tools1232015-10-27T08:12:46Z<p>Storrer: </p>
<hr />
<div>__TOC__<br />
<br />
==Searching==<br />
* [http://vs.aka-online.de/globalwpsearch/ Global Wikipedia Article Search] searches across projects and shows missing interlanguage links. This site allows for searching all major Wikipedia sites for articles with the given name, which is useful for building links between these Wikipedias.<br />
<br />
<br />
==Categories==<br />
* [https://tools.wmflabs.org/meta/catanalysis/ Category Analysis] analyzes edits to pages in the category tree rooted at the specified category (or pages rooted at a prefix).<br />
* [http://tools.wmflabs.org/catnap/ CatNap] lists Wikipedia articles in a category grouped by their other categories. <br />
* [http://tools.wmflabs.org/catscan2/catscan2.php?interface_language=de&project=wikipedia&language=de CatScan V3.0] is a tool that searches an article category (and its subcategories) according to specified criteria to find articles, stubs, images, and categories. It can also be used for finding all articles that belong to two specified categories (the intersection). <br />
* [http://tools.wmflabs.org/bene/itemsbycat/ Items by cat] is a tool to find existing or missing items by defining a wiki, a category and the format (e.g. HTML, wiki markup, plain text). Users can also define the offset, limit and recursion level. The tool is available in 11 different languages. <br />
* [http://tools.wmflabs.org/quick-intersection/index.php?interface_language=de&project=wikipedia&language=de Quick Intersection] is a tool that utilizes the WMF Labs databases to generate very fast category trees and tree intersections. <br />
* [http://tools.wmflabs.org/catscan2/reverse_tree.php Reverse category tree] – Get the categories a page or file is in, all the way down to the roots.<br />
* [http://tools.wmflabs.org/glamtools/treeviews/ TreeViews] - Monthly view statistics for category trees.<br />
<br />
<br />
==History==<br />
* [http://tools.wmflabs.org/inkowik/contributors.php Contributors] creates a list of contributors to a given article on a given project in wikitext. <br />
* [http://tools.wmflabs.org/magnustools/get_distinct_authors.php GetDistinctAuthors] gives the distinct (non-IP) list of editors on a set of articles. <br />
* [http://tools.wmflabs.org/magnustools/herding_sheep.php Herding Sheep] shows the (last) edits of all users in a user category. <br />
* [https://tools.wmflabs.org/xtools-articleinfoindex.php?&uselang=en Page history] - Get various statistics about the history of a page. <br />
* [http://vs.aka-online.de/rchiststat/ Recent Changes Statistics] displays a statistical overview of the recent changes of the selected Wikipedia. Display can be restricted to a specific user or page.<br />
* [http://wikipedia.ramselehof.de/wikiblame.php WikiBlame] searches revisions of a page for a text string in either the HTML or wikitext. It then displays the revision dates where the string exists or does not by a green circle and red X. <br />
* [http://sergionunes.com/p/wikichanges/ WikiChanges] is a web-based tool that exposes the revision history of Wikipedia articles using an interactive graphical timeline. <br />
* [http://tools.wmflabs.org/pltools/rech/ Wikidata Recent Changes] is a tool to patrol and rollback edits made on Wikidata. <br />
* [http://tools.wmflabs.org/wikihistory/ WikiHistory] is a program that loads the version histories and displays information about them. Additionally, searches are possible for occurrences of texts in the full text of all versions and a computationally intensive author allocation throughout the text. It displays statistics on articles, including percentages of authorship (small edits, anonymous edits, different users, anonymous users) as well as the time course and a list per user names regarding text content and additional statistical evaluations. <br />
* [http://vs.aka-online.de/cgi-bin/wppagehiststat.pl Wikipedia Page History Statistics] builds an edit history overview page for the article with the given name.<br />
* [http://tools.wmflabs.org/xtools-articleinfo/index.php?&uselang=en X!'s Page History] - Page statistics and visualization, provides sortable and exportable list of all contributors with number of edits and amount of added text. Provides also results of syntax and grammar checks and latest assessment history.<br />
<br />
<br />
==Statistics==<br />
<br />
===General===<br />
* [http://tools.wmflabs.org/wikidata-todo/stats.php Wikidata Stats] - Statistics based on bi-weekly Wikimedia snapshots.<br />
* [http://stats.wikimedia.org/ Wikimedia Statistics] shows detailed trends for each project. Tables and charts cover the entire history.<br />
* [http://stats.wikimedia.org/EN/Sitemap.htm Wikipedia Statistics] - Statistics for all projects and all languages. Updated monthly.<br />
* [http://s23.org/wikistats/ WikiStats] is an informal but widely recognized name for a set of reports, which provide monthly trend information for all Wikimedia projects and wikis. <br />
* [http://tools.wmflabs.org/xtools/adminstats/?uselang=en X!'s AdminStats] shows statistics of admin actions, broken down into individual actions, arbitrary period selectable. <br />
<br />
<br />
===Edit counters===<br />
* [https://tools.wmflabs.org/guc/index.php Global User Contributions] searches for contributions of users on the Wikimedia wikis. Additional features like blocklog, sul-info or translation will follow in the future.<br />
* [http://listen.hatnote.com/ Listen to Wikipedia] is a visual and audio illustration of live editing activity on Wikipedia.<br />
* [http://tools.wmflabs.org/xtools/sc/?project=de.wikipedia.org&uselang=en Quick, Dirty, Simple Edit Counter] - Quick user contribution analysis.<br />
* [http://tools.wmflabs.org/magnustools/quick_counter.php Quick edit counter] – Simple user edit count breakdown. <br />
* [http://cosmiclattes.github.io/wikireplay/player.html Replay Edits] shows the user how the edits in a page evolved visually. The current revision compare page has only one dimension, the line number.<br />
* [http://tools.wmflabs.org/supercount/ User Analysis Tool] works on editors with over 750,000 edits and replicates the months graph of Interiot's tool.<br />
* [http://wikiwash.metronews.ca/ Wikiwash] tracks Wikipedia edits in real time. <br />
* [http://tools.wmflabs.org/xtools-ec/?uselang=en X!'s Edit Counter] renewed with edit summary evaluation, SUL edit counts, timecard, latest global edits.<br />
* [https://tools.wmflabs.org/erwin85/xcontribs.php xContribs] gives an overview of a user's xWikiness, i.e., the spread of their contributions over the various projects. <br />
<br />
<br />
===Page views===<br />
* [http://www.wikipediatrends.com/ English Wikipedia Articles Trends] - English Wikipedia articles traffic statistics. Trend lines for several articles can be shown in one chart. Linear, logarithmic and normalised vertical scales are possible.<br />
* [http://tools.wmflabs.org/hay/langviews/ Multilingual page views] - Page views for an article in all available languages using the data from stats.grok.se. This shows you the last 30 days. <br />
* [http://dumps.wikimedia.org/other/pagecounts-raw/ Page View Statistics] is a tool, which allows to see how many people have seen an article. <br />
* [https://stats.wikimedia.org/EN/TablesPageViewsMonthly.htm Page Views for Wikipedia, Non-mobile, Normalized] is a tool to show monthly page views. <br />
* [http://tools.wmflabs.org/glamtools/treeviews/ TreeViews] is a tool to show monthly page views for Wikipedia category trees. <br />
* [http://stats.grok.se/de.n/201404/ Wikinews Article Traffic Statistics] a tool for charting how many hits any given article gets, great for comparing different kinds of articles at different times, published in the same week, or the continued popularity of an article. <br />
* [http://stats.grok.se/ Wikipedia Article Traffic Statistics] graphs the number of views per day for a Wikipedia page. The tool aggregates a list of the "most viewed pages", although this is often several months behind. <br />
* [http://tools.wmflabs.org/wikitrends/english-uptrends-this-week.html Wikitrends] is a tool to explore trending searches in Wikipedia. It helps you find the most popular topics in Wikipedia for each day, week and month. <br />
<br />
<br />
==Others==<br />
* [http://tools.wmflabs.org/autolist/ AutoList 2] can create a live list of items based on a Wikidata Query. <br />
* [https://tools.digitalmethods.net/beta/wikipedia2geo/Wikipedia Edits Scraper and IP Localizer] scrapes Wikipedia history and does IP to Geo for anonymous edits. <br />
* [https://tools.wmflabs.org/meta/gusersearch/ Global User Search] provides searching and filtering of global users on Wikimedia wikis.<br />
* [http://www.histropedia.com/ Histropedia] is an interactive tool to display historical events and described as a combination of maps, timelines, and trends. It is currently running in beta. It works by pulling data from Wikidata and Wikipedia and plotting events on a timeline which is navigated with simple left and right buttons and a zoom function. When an event is plotted on the timeline, relatable information – such as YouTube videos, Twitter mentions, and Amazon books of similar subjects – become available to view in a pop-up box. At present is only available for English language Wikipedia articles but will be extended across all of Wikipedia’s 267 languages.<br />
* [http://en.inforapid.org/ InfoRapid Wissensportal] Representation of weighted relationships among articles as mindmap.<br />
* [http://community.languagetool.org/wikiCheck/?lang=en Language Tool WikiCheck] - Style and grammar checking of existing Wikipedia pages and recent changes.<br />
* [http://www.manypedia.com/ Manypedia] is a web tool in which you can compare Linguistic Points Of View (LPOV) of different language Wikipedias.<br />
* [http://tools.wmflabs.org/missingtopics/ Missing topics] finds redlinks in the pages of a category, or of a single page, and sorts them according to number of occurrences. <br />
* [http://tools.wmflabs.org/most-wanted/ Most wanted] – Topics, measured by redlinkcount, for several languages.<br />
* [http://tools.wmflabs.org/not-in-the-other-language/ Not in the other language] looks for Wikidata items that have a page in one language but not in the other. <br />
* [http://tools.wmflabs.org/wikidata-todo/related_properties.php Related properties] can analyze the results from a WikiData Query, and show the properties used in all items matching a query. <br />
* [https://tools.wmflabs.org/meta/stalktoy/ Stalktoy] shows global details about a user across all Wikimedia wikis. You can provide a username, an IPv4/IPv6 address, or a CIDR block. <br />
* [http://tools.wmflabs.org/wikidata-terminator/ Terminator] generates a list of items with (and without) descriptions. Enter your language code, then enter your desired tern and click "Do it". You can also find a list of the top items missing description, labels or articles. The list is available in several different languages. This tool is particularly useful for disambiguation. <br />
* [http://simia.net/wikidatabrowse/ Wikidata Browse] browses through items and shows photos, facts, and translations of the items in several languages. Useful for translation. A good tool for learning foreign languages.<br />
* [http://tools.wmflabs.org/hay/wdtranslate/ Wikidata Translate] is a tool used for translating a term from one language to another. Choose the language in which you want the term to be translated by clicking on "Change your preferred languages? “ Click the drop-down menu of "Translate from" to select the language of the term. A list of Wikipedia pages, in your preferred languages, titled with that translated term, will appear. <br />
* [http://reportcard.wmflabs.org/ Wikimedia Report Card] - Numbers and graphs for several core metrics (including unique visitors and page views for the entirety of Wikimedia projects), updated monthly.<br />
* [http://www.wikimindmap.org/ Wikimindmap] Darstellung von Artikelinhalten als Mindmap. <br />
* [https://tools.digitalmethods.net/beta/wikipediaCrosslingualImageAnalysis/ Wikipedia Cross-Lingual Image Analysis] makes the images of all language versions of a Wikipedia article comparable. <br />
* [https://tools.digitalmethods.net/beta/wikitoc/ Wikipedia TOC Scraper] scrapes Table of Contents for revisions of a Wikipedia page and explore the results by moving a slider to browse across chronologically ordered TOCs.</div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Fachtagung_30.10.2015&diff=890Fachtagung 30.10.20152015-10-18T16:11:30Z<p>Storrer: </p>
<hr />
<div><table width="1000" border="0" cellpadding="7" cellspacing ="2"><br />
<tr><br />
<td bgcolor="#FEEAAB"><big>'''Fachtagung ''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'''''</big></td><br />
</tr><br />
<tr><br />
<td>'''Ort:''' [http://www.bbaw.de/veranstaltungen/2015/oktober/datamining Berlin-Brandenburgische Akademie der Wissenschaften (BBAW)] Einsteinsaal.<br />
'''Termin:''' 30. Oktober 2015 9:30 - 19:00 Uhr<br />
<br />
Auf dieser Fachtagung stellt das BMBF-Verbundprojekt KobRA (Korpus-basierte linguistische Recherche und Analyse mit Hilfe von Data-Mining) seine Ergebnisse vor und diskutiert weiterführende Perspektiven mit Anwendern und der interessierten Öffentlichkeit. <br />
<br />
Die Teilnahme ist kostenlos. Anmeldung (verbindlich) bis zum '''25.10.15'''. Bitte nutzen Sie hierfür das [http://www2.bbaw.de/nutzung-von-korpora Anmeldeformular].<br />
<br />
</td><br />
</tr><br />
</table><br />
<br />
'''Tagungsprogramm''' <br />
<table width="1000" border="0" bgcolor="#FEEAAB" cellpadding="7" cellspacing ="2"><br />
<tr><br />
<td bgcolor="#CDCDCD"> 9:30-9:40 </td><br />
<td> '''Begrüßung und Eröffnung'''</td><br />
</tr><br />
<tr><br />
<td> 9:40-10:05 </td><br />
<td bgcolor="#CDCDCD"> '''Korpusbasierte Recherche und Analyse mit Hilfe von Data-Mining: Das BMBF-Projekt KobRA''' (Prof. Dr. Angelika Storrer, Universität Mannheim)</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD"> 10:05-10:30 </td><br />
<td> '''RapidMiner als Werkzeug für die textorientierten Geisteswissenschaften''' (Prof. Dr. Katharina Morik, TU Dortmund)</td><br />
</tr><br />
<tr><br />
<td>10:30-11:00</td><br />
<td bgcolor="#CDCDCD">Kaffeepause</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">11:00-11:30</td><br />
<td>'''Routineaufgaben bei der Nutzung von Korpora: Disambiguieren, Klassifizieren, Annotieren mit KobRA-Verfahren'''<br/>(Thomas Bartz/Christian Pölitz, TU Dortmund</td><br />
</tr><br />
<tr><br />
<td>11:30-12:00</td><br />
<td bgcolor="#CDCDCD">'''Extraktion guter Belege aus Textkorpora durch Kombination eines regelbasierten Verfahrens mit maschinellem Lernen'''<br/>(Dr. Alexander Geyken/Dr. Lothar Lemnitzer, BBAW)</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">12:00-12:30</td<br />
<td>'''Korpusbasierte Analyse internetbasierter Kommunikation: Herausforderungen und Perspektiven'''<br/>(PD Dr. Michael Beißwenger, TU Dortmund/Dr. Harald Lüngen, IDS/Christian Pölitz, TU Dortmund)</td><br />
</tr><br />
<tr><br />
<td>12:30-14:00</td><br />
<td bgcolor="#CDCDCD">Mittagspause</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">14:00-14:25</td><br />
<td>'''Neue Entwicklungen und Wege bei der Erstellung, Erweiterung und Nutzung von Korpora am Zentrum Sprache'''<br/>(Dr. Alexander Geyken/Bryan Jurish/Kay Michael Würzner, BBAW)</td><br />
</tr><br />
<tr><br />
<td>14:25-14:50</td><br />
<td bgcolor="#CDCDCD">'''Schnittstellen zur Nutzung der Korpusanalyseplattform KorAP''' (Nils Diewald/Dr. Marc Kupietz, IDS) </td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">14:50-15:15</td><br />
<td>'''WebLicht-Integration''' (Prof. Dr. Erhard Hinrichs/Marie Hinrichs, SfS Universität Tübingen)</td><br />
</tr><br />
<tr><br />
<td>15:15-15:30</td><br />
<td bgcolor="#CDCDCD">Kaffeepause</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">15:30-16:50</td><br />
<td>'''Postersession und Systemdemonstrationen''' (Stand 06.10.):<br />
*Michael Beißwenger/Thomas Bartz/Axel Herold/Marc Kupietz/Lothar Lemnitzer/Harald Lüngen/Angelika Storrer: ''Aufbau von Social-Media-Korpora für die Digital Humanities: Standards und Perspektiven''<br /><br />
*Michael Beißwenger/Christian Pölitz/Lena Meyer: ''KobRA @ Classroom: Ein interdisziplinäres Projektseminar zum Einsatz von Data-Mining bei der korpusgestützten Analyse internetbasierter Kommunikation''<br /><br />
*Tassja Weber/Laura Herzberg: ''Studienarbeiten zur internetbasierter Kommunikation mit KobRA-Verfahren an der Universität Mannheim''<br />
*Jörg Didakowski/Nadja Radtke: ''Korpusbasierte Analyse von deutschen Stützverbgefügen''<br /><br />
*Sebastian Buschjäger/Lukas Pfahler: ''Discovering Subtle Word Relations in Large German Corpora''<br /> <br />
*Nils Diewald/Marc Kupietz: ''Korpusanalyseplattform (KorAP)'' (Poster + Systemdemonstration) <br /><br />
*Erhard Hinrichs/Marie Hinrichs: ''WebLicht'' (Systemdemonstration)<br /><br />
*Bryan Jurish: ''Deutsches Textarchiv'' (DTA) (Poster und Systemdemonstration)<br /><br />
*Christian Pölitz: ''RapidMiner als Werkzeug für die korpusbasierte Sprachanalyse'' (Systemdemonstration)<br /><br />
</td><br />
</tr><br />
<tr><br />
<td>17:00-19:00</td><br />
<td bgcolor="#CDCDCD">'''Podiumsdiskussion: ''Digitale Textkorpora in den Geisteswissenschaften: Standortbestimmung und Perspektiven''''' <br />
'''Moderation''': Prof. Dr. Angelika Storrer.<br />
<br />
'''Podiumsgäste''': Prof. Dr. Thomas Gloning (Gießen), Prof. Dr. Erhardt Hinrichs (Tübingen), Prof. Dr. Katharina Morik (Dortmund), Prof. Dr. Caroline Sporleder (Göttingen) und Prof. Dr. Holger Wormer (Dortmund).<br />
</td><br />
</tr><br />
</table></div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Fachtagung_30.10.2015&diff=889Fachtagung 30.10.20152015-10-18T16:11:03Z<p>Storrer: </p>
<hr />
<div><table width="1000" border="0" cellpadding="7" cellspacing ="2"><br />
<tr><br />
<td bgcolor="#FEEAAB"><big>'''Fachtagung ''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'''''</big></td><br />
</tr><br />
<tr><br />
<td>'''Ort:''' [http://www.bbaw.de/veranstaltungen/2015/oktober/datamining Berlin-Brandenburgische Akademie der Wissenschaften (BBAW)] Einsteinsaal.<br />
'''Termin:''' 30. Oktober 2015 9:30 - 19:00 Uhr<br />
<br />
Auf dieser Fachtagung stellt das BMBF-Verbundprojekt KobRA (Korpus-basierte linguistische Recherche und Analyse mit Hilfe von Data-Mining) seine Ergebnisse vor und diskutiert weiterführende Perspektiven mit Anwendern und der interessierten Öffentlichkeit. <br />
<br />
Die Teilnahme ist kostenlos. Anmeldung (verbindlich) bis zum '''25.10.15'''. Bitte nutzen Sie hierfür das [http://www2.bbaw.de/nutzung-von-korpora Anmeldeformular].<br />
<br />
</td><br />
</tr><br />
</table><br />
<br />
'''Tagungsprogramm''' <br />
<table width="1000" border="0" bgcolor="#FEEAAB" cellpadding="7" cellspacing ="2"><br />
<tr><br />
<td bgcolor="#CDCDCD"> 9:30-9:40 </td><br />
<td> '''Begrüßung und Eröffnung'''</td><br />
</tr><br />
<tr><br />
<td> 9:40-10:05 </td><br />
<td bgcolor="#CDCDCD"> '''Korpusbasierte Recherche und Analyse mit Hilfe von Data-Mining: Das BMBF-Projekt KobRA''' (Prof. Dr. Angelika Storrer, Universität Mannheim)</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD"> 10:05-10:30 </td><br />
<td> '''RapidMiner als Werkzeug für die textorientierten Geisteswissenschaften''' (Prof. Dr. Katharina Morik, TU Dortmund)</td><br />
</tr><br />
<tr><br />
<td>10:30-11:00</td><br />
<td bgcolor="#CDCDCD">Kaffeepause</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">11:00-11:30</td><br />
<td>'''Routineaufgaben bei der Nutzung von Korpora: Disambiguieren, Klassifizieren, Annotieren mit KobRA-Verfahren'''<br/>(Thomas Bartz/Christian Pölitz, TU Dortmund</td><br />
</tr><br />
<tr><br />
<td>11:30-12:00</td><br />
<td bgcolor="#CDCDCD">'''Extraktion guter Belege aus Textkorpora durch Kombination eines regelbasierten Verfahrens mit maschinellem Lernen'''<br/>(Dr. Alexander Geyken/Dr. Lothar Lemnitzer, BBAW)</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">12:00-12:30</td<br />
<td>'''Korpusbasierte Analyse internetbasierter Kommunikation: Herausforderungen und Perspektiven'''<br/>(PD Dr. Michael Beißwenger, TU Dortmund/Dr. Harald Lüngen, IDS/Christian Pölitz, TU Dortmund)</td><br />
</tr><br />
<tr><br />
<td>12:30-14:00</td><br />
<td bgcolor="#CDCDCD">Mittagspause</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">14:00-14:25</td><br />
<td>'''Neue Entwicklungen und Wege bei der Erstellung, Erweiterung und Nutzung von Korpora am Zentrum Sprache'''<br/>(Dr. Alexander Geyken/Bryan Jurish/Kay Michael Würzner, BBAW)</td><br />
</tr><br />
<tr><br />
<td>14:25-14:50</td><br />
<td bgcolor="#CDCDCD">'''Schnittstellen zur Nutzung der Korpusanalyseplattform KorAP''' (Nils Diewald/Dr. Marc Kupietz, IDS) </td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">14:50-15:15</td><br />
<td>'''WebLicht-Integration''' (Prof. Dr. Erhard Hinrichs/Marie Hinrichs, SfS Universität Tübingen)</td><br />
</tr><br />
<tr><br />
<td>15:15-15:30</td><br />
<td bgcolor="#CDCDCD">Kaffeepause</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">15:30-16:50</td><br />
<td>'''Postersession und Systemdemonstrationen''' (Stand 06.10.):<br />
*Michael Beißwenger/Thomas Bartz/Axel Herold/Marc Kupietz/Lothar Lemnitzer/Harald Lüngen/Angelika Storrer: ''Aufbau von Social-Media-Korpora für die Digital Humanities: Standards und Perspektiven''<br /><br />
*Michael Beißwenger/Christian Pölitz/Lena Meyer: ''KobRA @ Classroom: Ein interdisziplinäres Projektseminar zum Einsatz von Data-Mining bei der korpusgestützten Analyse internetbasierter Kommunikation''<br /><br />
*Tassja Weber/Laura Herzberg: ''Studienarbeiten zur internetbasierter Kommunikation mit KobRA-Verfahren an der Universität Mannheim''<br />
*Jörg Didakowski/Nadja Radtke: ''Korpusbasierte Analyse von deutschen Stützverbgefügen''<br /><br />
*Sebastian Buschjäger/Lukas Pfahler: ''Discovering Subtle Word Relations in Large German Corpora''<br /> <br />
*Nils Diewald/Marc Kupietz: ''Korpusanalyseplattform (KorAP)'' (Poster + Systemdemonstration) <br /><br />
*Erhard Hinrichs/Marie Hinrichs: ''WebLicht'' (Systemdemonstration)<br /><br />
*Bryan Jurish: ''Deutsches Textarchiv'' (DTA) (Poster und Systemdemonstration)<br /><br />
*Christian Pölitz: ''RapidMiner als Werkzeug für die korpusbasierte Sprachanalyse'' (Systemdemonstration)<br /><br />
</td><br />
</tr><br />
<tr><br />
<td>17:00-19:00</td><br />
<td bgcolor="#CDCDCD">'''Podiumsdiskussion: ''Digitale Textkorpora in den Geisteswissenschaften: Standortbestimmung und Perspektiven''''' <br />
'''Moderation''': Angelika Storrer.<br />
<br />
'''Podiumsgäste''': Prof. Dr. Thomas Gloning (Gießen), Prof. Dr. Erhardt Hinrichs (Tübingen), Prof. Dr. Katharina Morik (Dortmund), Prof. Dr. Caroline Sporleder (Göttingen) und Prof. Dr. Holger Wormer (Dortmund).<br />
</td><br />
</tr><br />
</table></div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Fachtagung_30.10.2015&diff=888Fachtagung 30.10.20152015-10-18T16:10:42Z<p>Storrer: </p>
<hr />
<div><table width="1000" border="0" cellpadding="7" cellspacing ="2"><br />
<tr><br />
<td bgcolor="#FEEAAB"><big>'''Fachtagung ''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'''''</big></td><br />
</tr><br />
<tr><br />
<td>'''Ort:''' [http://www.bbaw.de/veranstaltungen/2015/oktober/datamining Berlin-Brandenburgische Akademie der Wissenschaften (BBAW)] Einsteinsaal.<br />
'''Termin:''' 30. Oktober 2015 9:30 - 19:00 Uhr<br />
<br />
Auf dieser Fachtagung stellt das BMBF-Verbundprojekt KobRA (Korpus-basierte linguistische Recherche und Analyse mit Hilfe von Data-Mining) seine Ergebnisse vor und diskutiert weiterführende Perspektiven mit Anwendern und der interessierten Öffentlichkeit. <br />
<br />
Die Teilnahme ist kostenlos. Anmeldung (verbindlich) bis zum '''25.10.15'''. Bitte nutzen Sie hierfür das [http://www2.bbaw.de/nutzung-von-korpora Anmeldeformular].<br />
<br />
</td><br />
</tr><br />
</table><br />
<br />
'''Tagungsprogramm''' <br />
<table width="1000" border="0" bgcolor="#FEEAAB" cellpadding="7" cellspacing ="2"><br />
<tr><br />
<td bgcolor="#CDCDCD"> 9:30-9:40 </td><br />
<td> '''Begrüßung und Eröffnung'''</td><br />
</tr><br />
<tr><br />
<td> 9:40-10:05 </td><br />
<td bgcolor="#CDCDCD"> '''Korpusbasierte Recherche und Analyse mit Hilfe von Data-Mining: Das BMBF-Projekt KobRA''' (Prof. Dr. Angelika Storrer, Universität Mannheim)</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD"> 10:05-10:30 </td><br />
<td> '''RapidMiner als Werkzeug für die textorientierten Geisteswissenschaften''' (Prof. Dr. Katharina Morik, TU Dortmund)</td><br />
</tr><br />
<tr><br />
<td>10:30-11:00</td><br />
<td bgcolor="#CDCDCD">Kaffeepause</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">11:00-11:30</td><br />
<td>'''Routineaufgaben bei der Nutzung von Korpora: Disambiguieren, Klassifizieren, Annotieren mit KobRA-Verfahren'''<br/>(Thomas Bartz/Christian Pölitz, TU Dortmund</td><br />
</tr><br />
<tr><br />
<td>11:30-12:00</td><br />
<td bgcolor="#CDCDCD">'''Extraktion guter Belege aus Textkorpora durch Kombination eines regelbasierten Verfahrens mit maschinellem Lernen'''<br/>(Dr. Alexander Geyken/Dr. Lothar Lemnitzer, BBAW)</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">12:00-12:30</td<br />
<td>'''Korpusbasierte Analyse internetbasierter Kommunikation: Herausforderungen und Perspektiven'''<br/>(PD Dr. Michael Beißwenger, TU Dortmund/Dr. Harald Lüngen, IDS/Christian Pölitz, TU Dortmund)</td><br />
</tr><br />
<tr><br />
<td>12:30-14:00</td><br />
<td bgcolor="#CDCDCD">Mittagspause</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">14:00-14:25</td><br />
<td>'''Neue Entwicklungen und Wege bei der Erstellung, Erweiterung und Nutzung von Korpora am Zentrum Sprache'''<br/>(Dr. Alexander Geyken/Bryan Jurish/Kay Michael Würzner, BBAW)</td><br />
</tr><br />
<tr><br />
<td>14:25-14:50</td><br />
<td bgcolor="#CDCDCD">'''Schnittstellen zur Nutzung der Korpusanalyseplattform KorAP''' (Nils Diewald/Dr. Marc Kupietz, IDS) </td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">14:50-15:15</td><br />
<td>'''WebLicht-Integration''' (Prof. Dr. Erhard Hinrichs/Marie Hinrichs, SfS Universität Tübingen)</td><br />
</tr><br />
<tr><br />
<td>15:15-15:30</td><br />
<td bgcolor="#CDCDCD">Kaffeepause</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">15:30-16:50</td><br />
<td>'''Postersession und Systemdemonstrationen''' (Stand 06.10.):<br />
*Michael Beißwenger/Thomas Bartz/Axel Herold/Marc Kupietz/Lothar Lemnitzer/Harald Lüngen/Angelika Storrer: ''Aufbau von Social-Media-Korpora für die Digital Humanities: Standards und Perspektiven''<br /><br />
*Michael Beißwenger/Christian Pölitz/Lena Meyer: ''KobRA @ Classroom: Ein interdisziplinäres Projektseminar zum Einsatz von Data-Mining bei der korpusgestützten Analyse internetbasierter Kommunikation''<br /><br />
*Tassja Weber/Laura Herzberg: ''Studienarbeiten zur internetbasierter Kommunikation mit KobRA-Verfahren an der Universität Mannheim''<br />
*Jörg Didakowski/Nadja Radtke: ''Korpusbasierte Analyse von deutschen Stützverbgefügen''<br /><br />
*Sebastian Buschjäger/Lukas Pfahler: ''Discovering Subtle Word Relations in Large German Corpora''<br /> <br />
*Nils Diewald/Marc Kupietz: ''Korpusanalyseplattform (KorAP)'' (Poster + Systemdemonstration) <br /><br />
*Erhard Hinrichs/Marie Hinrichs: ''WebLicht'' (Systemdemonstration)<br /><br />
*Bryan Jurish: ''Deutsches Textarchiv'' (DTA) (Poster und Systemdemonstration)<br /><br />
*Christian Pölitz: ''RapidMiner als Werkzeug für die korpusbasierte Sprachanalyse'' (Systemdemonstration)<br /><br />
</td><br />
</tr><br />
<tr><br />
<td>17:00-19:00</td><br />
<td bgcolor="#CDCDCD">'''Podiumsdiskussion: ''Digitale Textkorpora in den Geisteswissenschaften: Standortbestimmung und Perspektiven''''' <br />
'''Moderation''': Angelika Storrer.<br />
'''Podiumsgäste''': Prof. Dr. Thomas Gloning (Gießen), Prof. Dr. Erhardt Hinrichs (Tübingen), Prof. Dr. Katharina Morik (Dortmund), Prof. Dr. Caroline Sporleder (Göttingen) und Prof. Dr. Holger Wormer (Dortmund).<br />
</td><br />
</tr><br />
</table></div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Fachtagung_30.10.2015&diff=882Fachtagung 30.10.20152015-10-14T11:25:01Z<p>Storrer: </p>
<hr />
<div><table width="1000" border="0" cellpadding="7" cellspacing ="2"><br />
<tr><br />
<td bgcolor="#FEEAAB"><big>'''Fachtagung ''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'''''</big></td><br />
</tr><br />
<tr><br />
<td>'''Ort:''' [http://www.bbaw.de/veranstaltungen/2015/oktober/datamining Berlin-Brandenburgische Akademie der Wissenschaften (BBAW)] Einsteinsaal.<br />
'''Termin:''' 30. Oktober 2015 9:30 - 19:00 Uhr<br />
<br />
Auf dieser Fachtagung stellt das BMBF-Verbundprojekt KobRA (Korpus-basierte linguistische Recherche und Analyse mit Hilfe von Data-Mining) seine Ergebnisse vor und diskutiert weiterführende Perspektiven mit Anwendern und der interessierten Öffentlichkeit. <br />
<br />
Die Teilnahme ist kostenlos. Anmeldung (verbindlich) bis zum '''25.10.15'''. Bitte nutzen Sie hierfür das [http://www2.bbaw.de/nutzung-von-korpora Anmeldeformular].<br />
<br />
</td><br />
</tr><br />
</table><br />
<br />
'''Tagungsprogramm''' (für eine Druckversion des aktuellen Tagungsprogramms klicken Sie bitte [[Media: Fachtagung Data Mining Programm Stand 13.10.pdf|hier]]).<br />
<table width="1000" border="0" bgcolor="#FEEAAB" cellpadding="7" cellspacing ="2"><br />
<tr><br />
<td bgcolor="#CDCDCD"> 9:30-9:40 </td><br />
<td> '''Begrüßung und Eröffnung'''</td><br />
</tr><br />
<tr><br />
<td> 9:40-10:05 </td><br />
<td bgcolor="#CDCDCD"> '''Korpusbasierte Recherche und Analyse mit Hilfe von Data-Mining: Das BMBF-Projekt KobRA''' (Prof. Dr. Angelika Storrer, Universität Mannheim)</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD"> 10:05-10:30 </td><br />
<td> '''RapidMiner als Werkzeug für die textorientierten Geisteswissenschaften''' (Prof. Dr. Katharina Morik, TU Dortmund)</td><br />
</tr><br />
<tr><br />
<td>10:30-11:00</td><br />
<td bgcolor="#CDCDCD">Kaffeepause</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">11:00-11:30</td><br />
<td>'''Routineaufgaben bei der Nutzung von Korpora: Disambiguieren, Klassifizieren, Annotieren mit KobRA-Verfahren''' (Thomas Bartz/Christian Pölitz, TU Dortmund</td><br />
</tr><br />
<tr><br />
<td>11:30-12:00</td><br />
<td bgcolor="#CDCDCD">'''Extraktion guter Belege aus Textkorpora durch Kombination eines regelbasierten Verfahrens mit maschinellem Lernen''' (Dr. Alexander Geyken/Dr. Lothar Lemnitzer, BBAW)</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">12:00-12:30</td><br />
<td>'''Korpusbasierte Analyse internetbasierter Kommunikation: Herausforderungen und Perspektiven''' (PD Dr. Michael Beißwenger, TU Dortmund/Dr. Harald Lüngen, IDS)</td><br />
</tr><br />
<tr><br />
<td>12:30-14:00</td><br />
<td bgcolor="#CDCDCD">Mittagspause</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">14:00-14:25</td><br />
<td>'''Neue Entwicklungen und Wege bei der Erstellung, Erweiterung und Nutzung von Korpora am Zentrum Sprache''' (Dr. Alexander Geyken/Bryan Jurish/Kay Michael Würzner, BBAW)</td><br />
</tr><br />
<tr><br />
<td>14:25-14:50</td><br />
<td bgcolor="#CDCDCD">'''Schnittstellen zur Nutzung der Korpusanalyseplattform KorAP''' (Nils Diewald/Dr. Marc Kupietz, IDS) </td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">14:50-15:15</td><br />
<td>'''WebLicht-Integration''' (Prof. Dr. Erhard Hinrichs/Marie Hinrichs, SfS Universität Tübingen)</td><br />
</tr><br />
<tr><br />
<td>15:15-15:30</td><br />
<td bgcolor="#CDCDCD">Kaffeepause</td><br />
</tr><br />
<tr><br />
<td bgcolor="#CDCDCD">15:30-16:50</td><br />
<td>'''Postersession und Systemdemonstrationen''' (Stand 06.10.):<br />
*Michael Beißwenger/Thomas Bartz/Axel Herold/Marc Kupietz/Lothar Lemnitzer/Harald Lüngen/Angelika Storrer: ''Aufbau von Social-Media-Korpora für die Digital Humanities: Standards und Perspektiven''<br /><br />
*Michael Beißwenger/Christian Pölitz/Lena Meyer: ''KobRA @ Classroom: Ein interdisziplinäres Projektseminar zum Einsatz von Data-Mining bei der korpusgestützten Analyse internetbasierter Kommunikation''<br /><br />
*Tassja Weber/Laura Herzberg: ''Studienarbeiten zur internetbasierter Kommunikation mit KobRA-Verfahren an der Universität Mannheim''<br />
*Jörg Didakowski/Nadja Radtke: ''Korpusbasierte Analyse von deutschen Stützverbgefügen''<br /><br />
*Sebastian Buschjäger/Lukas Pfahler: ''Discovering Subtle Word Relations in Large German Corpora''<br /> <br />
*Nils Diewald/Marc Kupietz: ''Korpusanalyseplattform (KorAP)'' (Poster + Systemdemonstration) <br /><br />
*Erhard Hinrichs/Marie Hinrichs: ''WebLicht'' (Systemdemonstration)<br /><br />
*Bryan Jurish: ''Deutsches Textarchiv'' (DTA) (Poster und Systemdemonstration)<br /><br />
*Christian Pölitz: ''RapidMiner als Werkzeug für die korpusbasierte Sprachanalyse'' (Systemdemonstration)<br /><br />
</td><br />
</tr><br />
<tr><br />
<td>17:00-19:00</td><br />
<td bgcolor="#CDCDCD">'''Podiumsdiskussion: ''Digitale Textkorpora in den Geisteswissenschaften: Standortbestimmung und Perspektiven''''' <br />
'''Moderation''': Angelika Storrer.<br />
'''Podiumsgäste''': Prof. Dr. Thomas Gloning (Gießen), Prof. Dr. Erhardt Hinrichs (Tübingen), Prof. Dr. Katharina Morik (Dortmund) und Prof. Dr. Caroline Sporleder (Göttingen).<br />
</td><br />
</tr><br />
</table></div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Tools123&diff=847Tools1232015-10-08T15:47:41Z<p>Storrer: </p>
<hr />
<div>__TOC__<br />
<br />
==Searching==<br />
* [http://vs.aka-online.de/globalwpsearch/ Global Wikipedia Article Search] searches across projects and shows missing interlanguage links. This site allows for searching all major Wikipedia sites for articles with the given name, which is useful for building links between these Wikipedias.<br />
<br />
<br />
==Categories==<br />
* [https://tools.wmflabs.org/meta/catanalysis/ Category Analysis] analyzes edits to pages in the category tree rooted at the specified category (or pages rooted at a prefix).<br />
* [http://tools.wmflabs.org/catnap/ CatNap] lists Wikipedia articles in a category grouped by their other categories. <br />
* [http://tools.wmflabs.org/catscan2/catscan2.php?interface_language=de&project=wikipedia&language=de CatScan V3.0] is a tool that searches an article category (and its subcategories) according to specified criteria to find articles, stubs, images, and categories. It can also be used for finding all articles that belong to two specified categories (the intersection). <br />
* [http://tools.wmflabs.org/bene/itemsbycat/ Items by cat] is a tool to find existing or missing items by defining a wiki, a category and the format (e.g. HTML, wiki markup, plain text). Users can also define the offset, limit and recursion level. The tool is available in 11 different languages. <br />
* [http://tools.wmflabs.org/quick-intersection/index.php?interface_language=de&project=wikipedia&language=de Quick Intersection] is a tool that utilizes the WMF Labs databases to generate very fast category trees and tree intersections. <br />
* [http://tools.wmflabs.org/catscan2/reverse_tree.php Reverse category tree] – Get the categories a page or file is in, all the way down to the roots.<br />
* [http://tools.wmflabs.org/glamtools/treeviews/ TreeViews] - Monthly view statistics for category trees.<br />
<br />
<br />
==History==<br />
* [http://tools.wmflabs.org/inkowik/contributors.php Contributors] creates a list of contributors to a given article on a given project in wikitext. <br />
* [http://tools.wmflabs.org/magnustools/get_distinct_authors.php GetDistinctAuthors] gives the distinct (non-IP) list of editors on a set of articles. <br />
* [http://tools.wmflabs.org/magnustools/herding_sheep.php Herding Sheep] shows the (last) edits of all users in a user category. <br />
* [https://tools.wmflabs.org/xtools-articleinfoindex.php?&uselang=en Page history] - Get various statistics about the history of a page. <br />
* [http://vs.aka-online.de/rchiststat/ Recent Changes Statistics] displays a statistical overview of the recent changes of the selected Wikipedia. Display can be restricted to a specific user or page.<br />
* [http://wikipedia.ramselehof.de/wikiblame.php WikiBlame] searches revisions of a page for a text string in either the HTML or wikitext. It then displays the revision dates where the string exists or does not by a green circle and red X. <br />
* [http://sergionunes.com/p/wikichanges/ WikiChanges] is a web-based tool that exposes the revision history of Wikipedia articles using an interactive graphical timeline. <br />
* [http://tools.wmflabs.org/pltools/rech/ Wikidata Recent Changes] is a tool to patrol and rollback edits made on Wikidata. <br />
* [http://tools.wmflabs.org/wikihistory/ WikiHistory] is a program that loads the version histories and displays information about them. Additionally, searches are possible for occurrences of texts in the full text of all versions and a computationally intensive author allocation throughout the text. It displays statistics on articles, including percentages of authorship (small edits, anonymous edits, different users, anonymous users) as well as the time course and a list per user names regarding text content and additional statistical evaluations. <br />
* [http://vs.aka-online.de/cgi-bin/wppagehiststat.pl Wikipedia Page History Statistics] builds an edit history overview page for the article with the given name.<br />
* [http://tools.wmflabs.org/xtools-articleinfo/index.php?&uselang=en X!'s Page History] - Page statistics and visualization, provides sortable and exportable list of all contributors with number of edits and amount of added text. Provides also results of syntax and grammar checks and latest assessment history.<br />
<br />
<br />
==Statistics==<br />
<br />
===General===<br />
* [http://tools.wmflabs.org/wikidata-todo/stats.php Wikidata Stats] - Statistics based on bi-weekly Wikimedia snapshots.<br />
* [http://stats.wikimedia.org/ Wikimedia Statistics] shows detailed trends for each project. Tables and charts cover the entire history.<br />
* [http://stats.wikimedia.org/EN/Sitemap.htm Wikipedia Statistics] - Statistics for all projects and all languages. Updated monthly.<br />
* [http://s23.org/wikistats/ WikiStats] is an informal but widely recognized name for a set of reports, which provide monthly trend information for all Wikimedia projects and wikis. <br />
* [http://tools.wmflabs.org/xtools/adminstats/?uselang=en X!'s AdminStats] shows statistics of admin actions, broken down into individual actions, arbitrary period selectable. <br />
<br />
<br />
===Edit counters===<br />
* [https://tools.wmflabs.org/guc/index.php Global User Contributions] searches for contributions of users on the Wikimedia wikis. Additional features like blocklog, sul-info or translation will follow in the future.<br />
* [http://listen.hatnote.com/ Listen to Wikipedia] is a visual and audio illustration of live editing activity on Wikipedia.<br />
* [http://tools.wmflabs.org/xtools/sc/?project=de.wikipedia.org&uselang=en Quick, Dirty, Simple Edit Counter] - Quick user contribution analysis.<br />
* [http://tools.wmflabs.org/magnustools/quick_counter.php Quick edit counter] – Simple user edit count breakdown. <br />
* [http://cosmiclattes.github.io/wikireplay/player.html Replay Edits] shows the user how the edits in a page evolved visually. The current revision compare page has only one dimension, the line number.<br />
* [http://tools.wmflabs.org/supercount/ User Analysis Tool] works on editors with over 750,000 edits and replicates the months graph of Interiot's tool.<br />
* [http://wikiwash.metronews.ca/ Wikiwash] tracks Wikipedia edits in real time. <br />
* [http://tools.wmflabs.org/xtools-ec/?uselang=en X!'s Edit Counter] renewed with edit summary evaluation, SUL edit counts, timecard, latest global edits.<br />
* [https://tools.wmflabs.org/erwin85/xcontribs.php xContribs] gives an overview of a user's xWikiness, i.e., the spread of their contributions over the various projects. <br />
<br />
<br />
===Page views===<br />
* [http://www.wikipediatrends.com/ English Wikipedia Articles Trends] - English Wikipedia articles traffic statistics. Trend lines for several articles can be shown in one chart. Linear, logarithmic and normalised vertical scales are possible.<br />
* [http://tools.wmflabs.org/hay/langviews/ Multilingual page views] - Page views for an article in all available languages using the data from stats.grok.se. This shows you the last 30 days. <br />
* [http://dumps.wikimedia.org/other/pagecounts-raw/ Page View Statistics] is a tool, which allows to see how many people have seen an article. <br />
* [https://stats.wikimedia.org/EN/TablesPageViewsMonthly.htm Page Views for Wikipedia, Non-mobile, Normalized] is a tool to show monthly page views. <br />
* [http://tools.wmflabs.org/glamtools/treeviews/ TreeViews] is a tool to show monthly page views for Wikipedia category trees. <br />
* [http://stats.grok.se/de.n/201404/ Wikinews Article Traffic Statistics] a tool for charting how many hits any given article gets, great for comparing different kinds of articles at different times, published in the same week, or the continued popularity of an article. <br />
* [http://stats.grok.se/ Wikipedia Article Traffic Statistics] graphs the number of views per day for a Wikipedia page. The tool aggregates a list of the "most viewed pages", although this is often several months behind. <br />
* [http://tools.wmflabs.org/wikitrends/english-uptrends-this-week.html Wikitrends] is a tool to explore trending searches in Wikipedia. It helps you find the most popular topics in Wikipedia for each day, week and month. <br />
<br />
<br />
==Others==<br />
* [http://tools.wmflabs.org/autolist/ AutoList 2] can create a live list of items based on a Wikidata Query. <br />
* [https://tools.digitalmethods.net/beta/wikipedia2geo/Wikipedia Edits Scraper and IP Localizer] scrapes Wikipedia history and does IP to Geo for anonymous edits. <br />
* [https://tools.wmflabs.org/meta/gusersearch/ Global User Search] provides searching and filtering of global users on Wikimedia wikis.<br />
* [http://www.histropedia.com/ Histropedia] is an interactive tool to display historical events and described as a combination of maps, timelines, and trends. It is currently running in beta. It works by pulling data from Wikidata and Wikipedia and plotting events on a timeline which is navigated with simple left and right buttons and a zoom function. When an event is plotted on the timeline, relatable information – such as YouTube videos, Twitter mentions, and Amazon books of similar subjects – become available to view in a pop-up box. At present is only available for English language Wikipedia articles but will be extended across all of Wikipedia’s 267 languages.<br />
* [http://en.inforapid.org/ InfoRapid Wissensportal] Representation of weighted relationships among articles as mindmap.<br />
* [http://community.languagetool.org/wikiCheck/?lang=en Language Tool WikiCheck] - Style and grammar checking of existing Wikipedia pages and recent changes.<br />
* [http://www.manypedia.com/ Manypedia] is a web tool in which you can compare Linguistic Points Of View (LPOV) of different language Wikipedias.<br />
* [http://tools.wmflabs.org/missingtopics/ Missing topics] finds redlinks in the pages of a category, or of a single page, and sorts them according to number of occurrences. <br />
* [http://tools.wmflabs.org/most-wanted/ Most wanted] – Topics, measured by redlinkcount, for several languages.<br />
* [http://tools.wmflabs.org/not-in-the-other-language/ Not in the other language] looks for Wikidata items that have a page in one language but not in the other. <br />
* [http://tools.wmflabs.org/wikidata-todo/related_properties.php Related properties] can analyze the results from a WikiData Query, and show the properties used in all items matching a query. <br />
* [https://tools.wmflabs.org/meta/stalktoy/ Stalktoy] shows global details about a user across all Wikimedia wikis. You can provide a username, an IPv4/IPv6 address, or a CIDR block. <br />
* [http://tools.wmflabs.org/wikidata-terminator/ Terminator] generates a list of items with (and without) descriptions. Enter your language code, then enter your desired tern and click "Do it". You can also find a list of the top items missing description, labels or articles. The list is available in several different languages. This tool is particularly useful for disambiguation. <br />
* [http://simia.net/wikidatabrowse/ Wikidata Browse] browses through items and shows photos, facts, and translations of the items in several languages. Useful for translation. A good tool for learning foreign languages.<br />
* [http://tools.wmflabs.org/hay/wdtranslate/ Wikidata Translate] is a tool used for translating a term from one language to another. Choose the language in which you want the term to be translated by clicking on "Change your preferred languages? “ Click the drop-down menu of "Translate from" to select the language of the term. A list of Wikipedia pages, in your preferred languages, titled with that translated term, will appear. <br />
* [http://reportcard.wmflabs.org/ Wikimedia Report Card] - Numbers and graphs for several core metrics (including unique visitors and page views for the entirety of Wikimedia projects), updated monthly.<br />
* [http://www.wikimindmap.org/ Wikimindmap] Darstellung von Artikelinhalten als Mindmap. <br />
* [https://tools.digitalmethods.net/beta/wikipediaCrosslingualImageAnalysis/ Wikipedia Cross-Lingual Image Analysis] makes the images of all language versions of a Wikipedia article comparable. <br />
* [https://tools.digitalmethods.net/beta/wikitoc/ Wikipedia TOC Scraper] scrapes Table of Contents for revisions of a Wikipedia page and explore the results by moving a slider to browse across chronologically ordered TOCs.<br />
<br />
== Wikipedia as a corpus==</div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Tools123&diff=846Tools1232015-10-08T15:47:25Z<p>Storrer: </p>
<hr />
<div>__TOC__<br />
<br />
==Searching==<br />
* [http://vs.aka-online.de/globalwpsearch/ Global Wikipedia Article Search] searches across projects and shows missing interlanguage links. This site allows for searching all major Wikipedia sites for articles with the given name, which is useful for building links between these Wikipedias.<br />
<br />
<br />
==Categories==<br />
* [https://tools.wmflabs.org/meta/catanalysis/ Category Analysis] analyzes edits to pages in the category tree rooted at the specified category (or pages rooted at a prefix).<br />
* [http://tools.wmflabs.org/catnap/ CatNap] lists Wikipedia articles in a category grouped by their other categories. <br />
* [http://tools.wmflabs.org/catscan2/catscan2.php?interface_language=de&project=wikipedia&language=de CatScan V3.0] is a tool that searches an article category (and its subcategories) according to specified criteria to find articles, stubs, images, and categories. It can also be used for finding all articles that belong to two specified categories (the intersection). <br />
* [http://tools.wmflabs.org/bene/itemsbycat/ Items by cat] is a tool to find existing or missing items by defining a wiki, a category and the format (e.g. HTML, wiki markup, plain text). Users can also define the offset, limit and recursion level. The tool is available in 11 different languages. <br />
* [http://tools.wmflabs.org/quick-intersection/index.php?interface_language=de&project=wikipedia&language=de Quick Intersection] is a tool that utilizes the WMF Labs databases to generate very fast category trees and tree intersections. <br />
* [http://tools.wmflabs.org/catscan2/reverse_tree.php Reverse category tree] – Get the categories a page or file is in, all the way down to the roots.<br />
* [http://tools.wmflabs.org/glamtools/treeviews/ TreeViews] - Monthly view statistics for category trees.<br />
<br />
<br />
==History==<br />
* [http://tools.wmflabs.org/inkowik/contributors.php Contributors] creates a list of contributors to a given article on a given project in wikitext. <br />
* [http://tools.wmflabs.org/magnustools/get_distinct_authors.php GetDistinctAuthors] gives the distinct (non-IP) list of editors on a set of articles. <br />
* [http://tools.wmflabs.org/magnustools/herding_sheep.php Herding Sheep] shows the (last) edits of all users in a user category. <br />
* [https://tools.wmflabs.org/xtools-articleinfoindex.php?&uselang=en Page history] - Get various statistics about the history of a page. <br />
* [http://vs.aka-online.de/rchiststat/ Recent Changes Statistics] displays a statistical overview of the recent changes of the selected Wikipedia. Display can be restricted to a specific user or page.<br />
* [http://wikipedia.ramselehof.de/wikiblame.php WikiBlame] searches revisions of a page for a text string in either the HTML or wikitext. It then displays the revision dates where the string exists or does not by a green circle and red X. <br />
* [http://sergionunes.com/p/wikichanges/ WikiChanges] is a web-based tool that exposes the revision history of Wikipedia articles using an interactive graphical timeline. <br />
* [http://tools.wmflabs.org/pltools/rech/ Wikidata Recent Changes] is a tool to patrol and rollback edits made on Wikidata. <br />
* [http://tools.wmflabs.org/wikihistory/ WikiHistory] is a program that loads the version histories and displays information about them. Additionally, searches are possible for occurrences of texts in the full text of all versions and a computationally intensive author allocation throughout the text. It displays statistics on articles, including percentages of authorship (small edits, anonymous edits, different users, anonymous users) as well as the time course and a list per user names regarding text content and additional statistical evaluations. <br />
* [http://vs.aka-online.de/cgi-bin/wppagehiststat.pl Wikipedia Page History Statistics] builds an edit history overview page for the article with the given name.<br />
* [http://tools.wmflabs.org/xtools-articleinfo/index.php?&uselang=en X!'s Page History] - Page statistics and visualization, provides sortable and exportable list of all contributors with number of edits and amount of added text. Provides also results of syntax and grammar checks and latest assessment history.<br />
<br />
<br />
==Statistics==<br />
<br />
===General===<br />
* [http://tools.wmflabs.org/wikidata-todo/stats.php Wikidata Stats] - Statistics based on bi-weekly Wikimedia snapshots.<br />
* [http://stats.wikimedia.org/ Wikimedia Statistics] shows detailed trends for each project. Tables and charts cover the entire history.<br />
* [http://stats.wikimedia.org/EN/Sitemap.htm Wikipedia Statistics] - Statistics for all projects and all languages. Updated monthly.<br />
* [http://s23.org/wikistats/ WikiStats] is an informal but widely recognized name for a set of reports, which provide monthly trend information for all Wikimedia projects and wikis. <br />
* [http://tools.wmflabs.org/xtools/adminstats/?uselang=en X!'s AdminStats] shows statistics of admin actions, broken down into individual actions, arbitrary period selectable. <br />
<br />
<br />
===Edit counters===<br />
* [https://tools.wmflabs.org/guc/index.php Global User Contributions] searches for contributions of users on the Wikimedia wikis. Additional features like blocklog, sul-info or translation will follow in the future.<br />
* [http://listen.hatnote.com/ Listen to Wikipedia] is a visual and audio illustration of live editing activity on Wikipedia.<br />
* [http://tools.wmflabs.org/xtools/sc/?project=de.wikipedia.org&uselang=en Quick, Dirty, Simple Edit Counter] - Quick user contribution analysis.<br />
* [http://tools.wmflabs.org/magnustools/quick_counter.php Quick edit counter] – Simple user edit count breakdown. <br />
* [http://cosmiclattes.github.io/wikireplay/player.html Replay Edits] shows the user how the edits in a page evolved visually. The current revision compare page has only one dimension, the line number.<br />
* [http://tools.wmflabs.org/supercount/ User Analysis Tool] works on editors with over 750,000 edits and replicates the months graph of Interiot's tool.<br />
* [http://wikiwash.metronews.ca/ Wikiwash] tracks Wikipedia edits in real time. <br />
* [http://tools.wmflabs.org/xtools-ec/?uselang=en X!'s Edit Counter] renewed with edit summary evaluation, SUL edit counts, timecard, latest global edits.<br />
* [https://tools.wmflabs.org/erwin85/xcontribs.php xContribs] gives an overview of a user's xWikiness, i.e., the spread of their contributions over the various projects. <br />
<br />
<br />
===Page views===<br />
* [http://www.wikipediatrends.com/ English Wikipedia Articles Trends] - English Wikipedia articles traffic statistics. Trend lines for several articles can be shown in one chart. Linear, logarithmic and normalised vertical scales are possible.<br />
* [http://tools.wmflabs.org/hay/langviews/ Multilingual page views] - Page views for an article in all available languages using the data from stats.grok.se. This shows you the last 30 days. <br />
* [http://dumps.wikimedia.org/other/pagecounts-raw/ Page View Statistics] is a tool, which allows to see how many people have seen an article. <br />
* [https://stats.wikimedia.org/EN/TablesPageViewsMonthly.htm Page Views for Wikipedia, Non-mobile, Normalized] is a tool to show monthly page views. <br />
* [http://tools.wmflabs.org/glamtools/treeviews/ TreeViews] is a tool to show monthly page views for Wikipedia category trees. <br />
* [http://stats.grok.se/de.n/201404/ Wikinews Article Traffic Statistics] a tool for charting how many hits any given article gets, great for comparing different kinds of articles at different times, published in the same week, or the continued popularity of an article. <br />
* [http://stats.grok.se/ Wikipedia Article Traffic Statistics] graphs the number of views per day for a Wikipedia page. The tool aggregates a list of the "most viewed pages", although this is often several months behind. <br />
* [http://tools.wmflabs.org/wikitrends/english-uptrends-this-week.html Wikitrends] is a tool to explore trending searches in Wikipedia. It helps you find the most popular topics in Wikipedia for each day, week and month. <br />
<br />
<br />
==Others==<br />
* [http://tools.wmflabs.org/autolist/ AutoList 2] can create a live list of items based on a Wikidata Query. <br />
* [https://tools.digitalmethods.net/beta/wikipedia2geo/Wikipedia Edits Scraper and IP Localizer] scrapes Wikipedia history and does IP to Geo for anonymous edits. <br />
* [https://tools.wmflabs.org/meta/gusersearch/ Global User Search] provides searching and filtering of global users on Wikimedia wikis.<br />
* [http://www.histropedia.com/ Histropedia] is an interactive tool to display historical events and described as a combination of maps, timelines, and trends. It is currently running in beta. It works by pulling data from Wikidata and Wikipedia and plotting events on a timeline which is navigated with simple left and right buttons and a zoom function. When an event is plotted on the timeline, relatable information – such as YouTube videos, Twitter mentions, and Amazon books of similar subjects – become available to view in a pop-up box. At present is only available for English language Wikipedia articles but will be extended across all of Wikipedia’s 267 languages.<br />
* [http://en.inforapid.org/ InfoRapid Wissensportal] Representation of weighted relationships among articles as mindmap.<br />
* [http://community.languagetool.org/wikiCheck/?lang=en Language Tool WikiCheck] - Style and grammar checking of existing Wikipedia pages and recent changes.<br />
* [http://www.manypedia.com/ Manypedia] is a web tool in which you can compare Linguistic Points Of View (LPOV) of different language Wikipedias.<br />
* [http://tools.wmflabs.org/missingtopics/ Missing topics] finds redlinks in the pages of a category, or of a single page, and sorts them according to number of occurrences. <br />
* [http://tools.wmflabs.org/most-wanted/ Most wanted] – Topics, measured by redlinkcount, for several languages.<br />
* [http://tools.wmflabs.org/not-in-the-other-language/ Not in the other language] looks for Wikidata items that have a page in one language but not in the other. <br />
* [http://tools.wmflabs.org/wikidata-todo/related_properties.php Related properties] can analyze the results from a WikiData Query, and show the properties used in all items matching a query. <br />
* [https://tools.wmflabs.org/meta/stalktoy/ Stalktoy] shows global details about a user across all Wikimedia wikis. You can provide a username, an IPv4/IPv6 address, or a CIDR block. <br />
* [http://tools.wmflabs.org/wikidata-terminator/ Terminator] generates a list of items with (and without) descriptions. Enter your language code, then enter your desired tern and click "Do it". You can also find a list of the top items missing description, labels or articles. The list is available in several different languages. This tool is particularly useful for disambiguation. <br />
* [http://simia.net/wikidatabrowse/ Wikidata Browse] browses through items and shows photos, facts, and translations of the items in several languages. Useful for translation. A good tool for learning foreign languages.<br />
* [http://tools.wmflabs.org/hay/wdtranslate/ Wikidata Translate] is a tool used for translating a term from one language to another. Choose the language in which you want the term to be translated by clicking on "Change your preferred languages? “ Click the drop-down menu of "Translate from" to select the language of the term. A list of Wikipedia pages, in your preferred languages, titled with that translated term, will appear. <br />
* [http://reportcard.wmflabs.org/ Wikimedia Report Card] - Numbers and graphs for several core metrics (including unique visitors and page views for the entirety of Wikimedia projects), updated monthly.<br />
* [http://www.wikimindmap.org/ Wikimindmap] Darstellung von Artikelinhalten als Mindmap. <br />
* [https://tools.digitalmethods.net/beta/wikipediaCrosslingualImageAnalysis/ Wikipedia Cross-Lingual Image Analysis] makes the images of all language versions of a Wikipedia article comparable. <br />
* [https://tools.digitalmethods.net/beta/wikitoc/ Wikipedia TOC Scraper] scrapes Table of Contents for revisions of a Wikipedia page and explore the results by moving a slider to browse across chronologically ordered TOCs.<br />
<br />
=== Wikipedia as a corpus===</div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Hauptseite&diff=840Hauptseite2015-10-08T12:30:41Z<p>Storrer: </p>
<hr />
<div>{| class="wikitable" width="99%"<br />
|-<br />
! <big> Herzlich willkommen </big><br />
|- <br />
| style="background:#ffffff; padding:1em" | <br />
[[Datei:Kwic-kobra-2geo.png|links]] [[Datei:KobRA-RM.png|rechts]] '''KobRA&nbsp;(Korpus-basierte Recherche und Analyse mit Hilfe von Data-Mining)''' ist ein Verbundprojekt, das seit September 2012 vom [http://www.bmbf.de Bundesministerium für Bildung und Forschung (BMBF)] im Rahmen des '''[http://www.bmbf.de/foerderungen/16466.php Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities]''' gefördert wird (Förderkennzeichen: 01UG1245A).<br />
<br />
Im Projekt arbeiten Partner aus Informatik, Linguistik und Sprachtechnologie gemeinsam daran, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern. Koordinatorin des Projekts ist [http://germanistik.uni-mannheim.de/abteilungen/germanistische_linguistik/prof_dr_angelika_storrer/index.html Prof. Dr. Angelika Storrer (Universität Mannheim)]. <br />
<br />
<span style= "color:#FF0000;">'''AKTUELL:'''</span><br />
Auf der [[Fachtagung 30.10.2015|Fachtagung ''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'']] am '''30.10.2015 an der Berlin Brandenburgischen Akademie der Wissenschaften (BBAW)''' in Berlin informieren wir über die Ergebnisse unseres Projekts. <br />
<br />
'''Anmeldung bis zum 25.10.2015''' unter kobra@dwds.de. Die Teilnahme ist kostenfrei, alle Interessierten sind herzlich eingeladen.<br />
<br />
<div style="clear: left"></div> Auf diesen Seiten bieten wir einen Überblick und detailliertere Informationen über:<br />
* '''[[Projektbeschreibung|die Ziele, Fragestellungen und Methoden des Projekts]]'''<br />
* '''[[Team|die beteiligten Personen und Forschungseinrichtungen]]'''<br />
* '''[[Fallstudien|die Fallstudien des Projekts]]'''<br />
* '''sowie über Aktivitäten und aktuelle Veröffentlichungen (s.u.).'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left; margin-right:1em"<br />
|-<br />
! <big>Aktivitäten</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
*[[Fachtagung 30.10.2015|Fachtagung ''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'']] am 30.10.2015 an der BBAW. Die Teilnahme ist kostenfrei, Anmeldung bis zum '''25.10.2015''' unter kobra@dwds.de.<br />
<br />
* Vortrag ''A Data Mining Environment for Linguistic Research Based on CLARIN-D Language Resources'' (Katharina Morik, Thomas Bartz, Christian Pölitz, Angelika Storrer) auf der [http://dch2015.net/abstracts_submission.shtml ''DCH2015 - Interdisciplinary Conference on Digital Cultural Heritage''] am 28.-30. Oktober 2015 in Berlin.<br />
<br />
* Panel: Am 29.10.15 wird ein von von Michael Beißwenger & Thierry Chanier organisiertes Panel [http://tei2015.huma-num.fr/en/panelsround-tables/#acc-3 TEI across corpora, languages and genres: Towards a standard for the representation of social media and computer-mediated communication]" im Rahmen der [http://tei2015.huma-num.fr/en/ Jahreskonferenz der Text encoding Initiative] stattfinden. Am Panel sind verschiedene KobRA-Akteure beteiligt.<br />
<br />
* Vortrag: "Wikipedia as a corpus resource for linguistic research" (Angelika Storrer) auf der [http://ird-cmc-rennes.sciencesconf.org/ internationalen ''ird-cmc''-Konferenz in Rennes/Frankreich] am 23.10.2015.<br />
<br />
* Panel: "Towards an encoding standard for social media and CMC: Experiences from German and French corpus projects using TEI" (organisiert von Michael Beißwenger & Thierry Chanier mit Beiträgen u.a. aus verschiedenen Korpusprojekten im KobRA-Kontext) auf der [http://ird-cmc-rennes.sciencesconf.org/ internationalen ''ird-cmc''-Konferenz in Rennes/Frankreich] am 23.10.2015.<br />
<br />
* Paper auf der Internationalen Fachtagung [http://www.kiv.zcu.cz/tsd2015/ ''Text, Speech and Dialogue'']: Pölitz, Christian; Bartz, Thomas; Morik, Katharina; Storrer, Angelika (2015): ''Investigation of Word Senses over Time using Linguistic Corpora'' In: Matousek, Vaclav et al. (Hrsg.): Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer.<br />
<br />
* Paper auf der Internationalen Fachtagung [https://elex.link/elex2015/ ''eLexicography 2015'']: Lemnitzer, Lothar; Pölitz, Christian; Didakowski, Jörg; Geyken, Alexander (2015): ''A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries''In: Kosem, Iztok et al. (Hrsg.):'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.<br />
<br />
* Paper auf der Internationalen Fachtagung [https://elex.link/elex2015/ ''eLexicography 2015'']: Geyken, Alexander; Pölitz, Christian; Bartz, Thomas (2015): ''A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries'' In: Kosem, Tztok et al. (Hrsg): 'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.<br />
<br />
* Vortrag [http://clarin2015.informatik.uni-leipzig.de/program#Kobra Korpusbasierte Sprachanalyse mit CLARIN-D-Ressourcen: Anwendungsszenarien und Erfahrungen aus dem Projekt KobRA] auf dem CLARIN-D Workshop ''Fächerübergreifende Perspektiven durch digitale Forschungsinfrastrukturen'' am 30.6/1.7. in Leipzig.<br />
<br />
*Posterpräsentation ''Erprobung innovativer Data-Mining-Verfahren für die empirische Arbeit mit strukturierten Sprachressourcen''. (Thomas Bartz, Christian Pölitz, Angelika Storrer). [https://de.dariah.eu/dhsummit2015 auf dem Digital Humanities Summit], Berlin, 3./4. März 2015<br />
<br />
----<br />
<br />
Überblick über weitere Konferenzbeiträge und Projekt-Workshops: '''[[Aktivitäten]]'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left"<br />
|-<br />
! <big>Veröffentlichungen</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
*Bartz,Thomas; Pölitz, Christian; Morik, Katharina; Storrer, Angelika (2015): '''Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research'''. In: Jan Odijk (Ed): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=116;article=001 Selected Papers from the CLARIN 2014 Conference], October 24-25, 2014, Soesterberg, The Netherlands, 1-13.<br />
<br />
*Bingel, Joachim; Diewald, Nils (2015): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=111;article=001 '''KoralQuery – a General Corpus Query Protocol''']. In: Proceedings of the Workshop on Innovative Corpus Query and Visualization Tools at NODALIDA 2015, Vilnius, Lithuania, May 11-13, 2015. <br />
<br />
*Diewald,Nild; Bingel, Joachim (2015): [http://KorAP.github.io/Koral '''KoralQuery 0.3. Technical Report, Working draft''']. IDS, Mannheim, Germany. <br />
<br />
*Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): '''Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods.''' In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. [http://www.uni-hildesheim.de/konvens2014/data/konvens2014-workshop-proceedings.pdf Proceedings-Band als PDF]<br />
<br />
*Thomas Bartz, Michael Beißwenger, Christian Pölitz, Nadja Radtke & Angelika Storrer (2014): '''Neue Möglichkeiten der Arbeit mit strukturierten Sprachressourcen in den Digital Humanities mithilfe von Data-Mining.''' [http://dharchive.org/paper/DH2014/Poster-894.xml Online Proceedings of the Digital Humanities 2014 annual international conference of the Alliance of Digital Humanities Organizations], Universität Lausanne, 10. Juli 2014<br />
<br />
*Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael (2014): '''Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014.''' Technischer Bericht, Technische Universität Dortmund. [[Media: KobRA-MS2_Verfahren.pdf|Online-Veröffentlichung (PDF)]]<br />
<br />
*Didakowski, Jörg; Radtke, Nadja (2014): '''Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. ''' In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. [http://euralex2014.eurac.edu/en/callforpapers/Documents/EURALEX%202014_gesamt.pdf Online-Veröffentlichung (PDF)]<br />
<br />
----<br />
<br />
Überblick über weitere Veröffentlichungen mit Projektbezug: '''[[Publikationen]]'''<br />
|}</div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Hauptseite&diff=839Hauptseite2015-10-08T12:29:55Z<p>Storrer: </p>
<hr />
<div>{| class="wikitable" width="99%"<br />
|-<br />
! <big> Herzlich willkommen </big><br />
|- <br />
| style="background:#ffffff; padding:1em" | <br />
[[Datei:Kwic-kobra-2geo.png|links]] [[Datei:KobRA-RM.png|rechts]] '''KobRA&nbsp;(Korpus-basierte Recherche und Analyse mit Hilfe von Data-Mining)''' ist ein Verbundprojekt, das seit September 2012 vom [http://www.bmbf.de Bundesministerium für Bildung und Forschung (BMBF)] im Rahmen des '''[http://www.bmbf.de/foerderungen/16466.php Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities]''' gefördert wird (Förderkennzeichen: 01UG1245A).<br />
<br />
Im Projekt arbeiten Partner aus Informatik, Linguistik und Sprachtechnologie gemeinsam daran, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern. Koordinatorin des Projekts ist [http://germanistik.uni-mannheim.de/abteilungen/germanistische_linguistik/prof_dr_angelika_storrer/index.html Prof. Dr. Angelika Storrer (Universität Mannheim)]. <br />
<br />
<span style= "color:#FF0000;">'''AKTUELL:'''</span><br />
Auf der [[Fachtagung 30.10.2015|Fachtagung ''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'']] am '''30.10.2015 an der Berlin Brandenburgischen Akademie der Wissenschaften (BBAW)''' in Berlin informieren wir über die Ergebnisse unseres Projekts. <br />
<br />
'''Anmeldung bis zum 25.10.2015''' unter kobra@dwds.de. Die Teilnahme ist kostenfrei, alle Interessierten sind herzlich eingeladen.<br />
<br />
<div style="clear: left"></div> Auf diesen Seiten bieten wir einen Überblick und detailliertere Informationen über:<br />
* '''[[Projektbeschreibung|die Ziele, Fragestellungen und Methoden des Projekts]]'''<br />
* '''[[Team|die beteiligten Personen und Forschungseinrichtungen]]'''<br />
* '''[[Fallstudien|die Fallstudien des Projekts]]'''<br />
* '''sowie über Aktivitäten und aktuelle Veröffentlichungen (s.u.).'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left; margin-right:1em"<br />
|-<br />
! <big>Aktivitäten</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
*[[Fachtagung 30.10.2015|Fachtagung ''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'']] am 30.10.2015 an der BBAW. Die Teilnahme ist kostenfrei, Anmeldung bis zum '''25.10.2015''' unter kobra@dwds.de.<br />
<br />
* Vortrag ''A Data Mining Environment for Linguistic Research Based on CLARIN-D Language Resources'' (Katharina Morik, Thomas Bartz, Christian Pölitz, Angelika Storrer) auf der [http://dch2015.net/abstracts_submission.shtml ''DCH2015 - Interdisciplinary Conference on Digital Cultural Heritage''] am 28.-30. Oktober 2015 in Berlin.<br />
<br />
* Panel: Am 29.10.15 wird ein von von Michael Beißwenger & Thierry Changier organisiertes Panel [http://tei2015.huma-num.fr/en/panelsround-tables/#acc-3 TEI across corpora, languages and genres: Towards a standard for the representation of social media and computer-mediated communication]" im Rahmen der [http://tei2015.huma-num.fr/en/ Jahreskonferenz der Text encoding Initiative] stattfinden. Am Panel sind verschiedene KobRA-Akteure beteiligt.<br />
<br />
* Vortrag: "Wikipedia as a corpus resource for linguistic research" (Angelika Storrer) auf der [http://ird-cmc-rennes.sciencesconf.org/ internationalen ''ird-cmc''-Konferenz in Rennes/Frankreich] am 23.10.2015.<br />
<br />
* Panel: "Towards an encoding standard for social media and CMC: Experiences from German and French corpus projects using TEI" (organisiert von Michael Beißwenger & Thierry Chanier mit Beiträgen u.a. aus verschiedenen Korpusprojekten im KobRA-Kontext) auf der [http://ird-cmc-rennes.sciencesconf.org/ internationalen ''ird-cmc''-Konferenz in Rennes/Frankreich] am 23.10.2015.<br />
<br />
* Paper auf der Internationalen Fachtagung [http://www.kiv.zcu.cz/tsd2015/ ''Text, Speech and Dialogue'']: Pölitz, Christian; Bartz, Thomas; Morik, Katharina; Storrer, Angelika (2015): ''Investigation of Word Senses over Time using Linguistic Corpora'' In: Matousek, Vaclav et al. (Hrsg.): Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer.<br />
<br />
* Paper auf der Internationalen Fachtagung [https://elex.link/elex2015/ ''eLexicography 2015'']: Lemnitzer, Lothar; Pölitz, Christian; Didakowski, Jörg; Geyken, Alexander (2015): ''A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries''In: Kosem, Iztok et al. (Hrsg.):'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.<br />
<br />
* Paper auf der Internationalen Fachtagung [https://elex.link/elex2015/ ''eLexicography 2015'']: Geyken, Alexander; Pölitz, Christian; Bartz, Thomas (2015): ''A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries'' In: Kosem, Tztok et al. (Hrsg): 'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.<br />
<br />
* Vortrag [http://clarin2015.informatik.uni-leipzig.de/program#Kobra Korpusbasierte Sprachanalyse mit CLARIN-D-Ressourcen: Anwendungsszenarien und Erfahrungen aus dem Projekt KobRA] auf dem CLARIN-D Workshop ''Fächerübergreifende Perspektiven durch digitale Forschungsinfrastrukturen'' am 30.6/1.7. in Leipzig.<br />
<br />
*Posterpräsentation ''Erprobung innovativer Data-Mining-Verfahren für die empirische Arbeit mit strukturierten Sprachressourcen''. (Thomas Bartz, Christian Pölitz, Angelika Storrer). [https://de.dariah.eu/dhsummit2015 auf dem Digital Humanities Summit], Berlin, 3./4. März 2015<br />
<br />
----<br />
<br />
Überblick über weitere Konferenzbeiträge und Projekt-Workshops: '''[[Aktivitäten]]'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left"<br />
|-<br />
! <big>Veröffentlichungen</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
*Bartz,Thomas; Pölitz, Christian; Morik, Katharina; Storrer, Angelika (2015): '''Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research'''. In: Jan Odijk (Ed): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=116;article=001 Selected Papers from the CLARIN 2014 Conference], October 24-25, 2014, Soesterberg, The Netherlands, 1-13.<br />
<br />
*Bingel, Joachim; Diewald, Nils (2015): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=111;article=001 '''KoralQuery – a General Corpus Query Protocol''']. In: Proceedings of the Workshop on Innovative Corpus Query and Visualization Tools at NODALIDA 2015, Vilnius, Lithuania, May 11-13, 2015. <br />
<br />
*Diewald,Nild; Bingel, Joachim (2015): [http://KorAP.github.io/Koral '''KoralQuery 0.3. Technical Report, Working draft''']. IDS, Mannheim, Germany. <br />
<br />
*Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): '''Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods.''' In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. [http://www.uni-hildesheim.de/konvens2014/data/konvens2014-workshop-proceedings.pdf Proceedings-Band als PDF]<br />
<br />
*Thomas Bartz, Michael Beißwenger, Christian Pölitz, Nadja Radtke & Angelika Storrer (2014): '''Neue Möglichkeiten der Arbeit mit strukturierten Sprachressourcen in den Digital Humanities mithilfe von Data-Mining.''' [http://dharchive.org/paper/DH2014/Poster-894.xml Online Proceedings of the Digital Humanities 2014 annual international conference of the Alliance of Digital Humanities Organizations], Universität Lausanne, 10. Juli 2014<br />
<br />
*Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael (2014): '''Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014.''' Technischer Bericht, Technische Universität Dortmund. [[Media: KobRA-MS2_Verfahren.pdf|Online-Veröffentlichung (PDF)]]<br />
<br />
*Didakowski, Jörg; Radtke, Nadja (2014): '''Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. ''' In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. [http://euralex2014.eurac.edu/en/callforpapers/Documents/EURALEX%202014_gesamt.pdf Online-Veröffentlichung (PDF)]<br />
<br />
----<br />
<br />
Überblick über weitere Veröffentlichungen mit Projektbezug: '''[[Publikationen]]'''<br />
|}</div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Hauptseite&diff=838Hauptseite2015-10-08T12:25:40Z<p>Storrer: </p>
<hr />
<div>{| class="wikitable" width="99%"<br />
|-<br />
! <big> Herzlich willkommen </big><br />
|- <br />
| style="background:#ffffff; padding:1em" | <br />
[[Datei:Kwic-kobra-2geo.png|links]] [[Datei:KobRA-RM.png|rechts]] '''KobRA&nbsp;(Korpus-basierte Recherche und Analyse mit Hilfe von Data-Mining)''' ist ein Verbundprojekt, das seit September 2012 vom [http://www.bmbf.de Bundesministerium für Bildung und Forschung (BMBF)] im Rahmen des '''[http://www.bmbf.de/foerderungen/16466.php Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities]''' gefördert wird (Förderkennzeichen: 01UG1245A).<br />
<br />
Im Projekt arbeiten Partner aus Informatik, Linguistik und Sprachtechnologie gemeinsam daran, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern. Koordinatorin des Projekts ist [http://germanistik.uni-mannheim.de/abteilungen/germanistische_linguistik/prof_dr_angelika_storrer/index.html Prof. Dr. Angelika Storrer (Universität Mannheim)]. <br />
<br />
<span style= "color:#FF0000;">'''AKTUELL:'''</span><br />
Auf der [[Fachtagung 30.10.2015|Fachtagung ''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'']] am '''30.10.2015 an der Berlin Brandenburgischen Akademie der Wissenschaften (BBAW)''' in Berlin informieren wir über die Ergebnisse unseres Projekts. <br />
<br />
'''Anmeldung bis zum 25.10.2015''' unter kobra@dwds.de. Die Teilnahme ist kostenfrei, alle Interessierten sind herzlich eingeladen.<br />
<br />
<div style="clear: left"></div> Auf diesen Seiten bieten wir einen Überblick und detailliertere Informationen über:<br />
* '''[[Projektbeschreibung|die Ziele, Fragestellungen und Methoden des Projekts]]'''<br />
* '''[[Team|die beteiligten Personen und Forschungseinrichtungen]]'''<br />
* '''[[Fallstudien|die Fallstudien des Projekts]]'''<br />
* '''sowie über Aktivitäten und aktuelle Veröffentlichungen (s.u.).'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left; margin-right:1em"<br />
|-<br />
! <big>Aktivitäten</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
*[[Fachtagung 30.10.2015|Fachtagung ''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'']] am 30.10.2015 an der BBAW. Die Teilnahme ist kostenfrei, Anmeldung bis zum '''25.10.2015''' unter kobra@dwds.de.<br />
<br />
* Vortrag ''A Data Mining Environment for Linguistic Research Based on CLARIN-D Language Resources'' (Katharina Morik, Thomas Bartz, Christian Pölitz, Angelika Storrer) auf der [http://dch2015.net/abstracts_submission.shtml ''DCH2015 - Interdisciplinary Conference on Digital Cultural Heritage''] am 28.-30. Oktober 2015 in Berlin.<br />
<br />
* Im Rahmen der [http://tei2015.huma-num.fr/en/ Jahreskonferenz der Text encoding Initiative] beteiligen sich verschiedene KobRA-Akteure am Panel "[http://tei2015.huma-num.fr/en/panelsround-tables/#acc-3 TEI across corpora, languages and genres: Towards a standard for the representation of social media and computer-mediated communication]" (organisert von Michael Beißwenger & Thierry Chanier unter Beteiligung u.a. von Alexander Geyken, Axel Herold, Marc Kupietz, Lothar Lemnitzer, Harald Lüngen, Angelika Storrer und Andreas Witt).<br />
<br />
* Vortrag: "Wikipedia as a corpus resource for linguistic research" (Angelika Storrer) auf der [http://ird-cmc-rennes.sciencesconf.org/ internationalen ''ird-cmc''-Konferenz in Rennes/Frankreich] am 23.10.2015.<br />
<br />
* Panel: "Towards an encoding standard for social media and CMC: Experiences from German and French corpus projects using TEI" (organisiert von Michael Beißwenger & Thierry Chanier mit Beiträgen u.a. aus verschiedenen Korpusprojekten im KobRA-Kontext) auf der [http://ird-cmc-rennes.sciencesconf.org/ internationalen ''ird-cmc''-Konferenz in Rennes/Frankreich] am 23.10.2015.<br />
<br />
* Paper auf der Internationalen Fachtagung [http://www.kiv.zcu.cz/tsd2015/ ''Text, Speech and Dialogue'']: Pölitz, Christian; Bartz, Thomas; Morik, Katharina; Storrer, Angelika (2015): ''Investigation of Word Senses over Time using Linguistic Corpora'' In: Matousek, Vaclav et al. (Hrsg.): Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer.<br />
<br />
* Paper auf der Internationalen Fachtagung [https://elex.link/elex2015/ ''eLexicography 2015'']: Lemnitzer, Lothar; Pölitz, Christian; Didakowski, Jörg; Geyken, Alexander (2015): ''A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries''In: Kosem, Iztok et al. (Hrsg.):'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.<br />
<br />
* Paper auf der Internationalen Fachtagung [https://elex.link/elex2015/ ''eLexicography 2015'']: Geyken, Alexander; Pölitz, Christian; Bartz, Thomas (2015): ''A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries'' In: Kosem, Tztok et al. (Hrsg): 'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.<br />
<br />
* Vortrag [http://clarin2015.informatik.uni-leipzig.de/program#Kobra Korpusbasierte Sprachanalyse mit CLARIN-D-Ressourcen: Anwendungsszenarien und Erfahrungen aus dem Projekt KobRA] auf dem CLARIN-D Workshop ''Fächerübergreifende Perspektiven durch digitale Forschungsinfrastrukturen'' am 30.6/1.7. in Leipzig.<br />
<br />
*Posterpräsentation ''Erprobung innovativer Data-Mining-Verfahren für die empirische Arbeit mit strukturierten Sprachressourcen''. (Thomas Bartz, Christian Pölitz, Angelika Storrer). [https://de.dariah.eu/dhsummit2015 auf dem Digital Humanities Summit], Berlin, 3./4. März 2015<br />
<br />
----<br />
<br />
Überblick über weitere Konferenzbeiträge und Projekt-Workshops: '''[[Aktivitäten]]'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left"<br />
|-<br />
! <big>Veröffentlichungen</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
*Bartz,Thomas; Pölitz, Christian; Morik, Katharina; Storrer, Angelika (2015): '''Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research'''. In: Jan Odijk (Ed): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=116;article=001 Selected Papers from the CLARIN 2014 Conference], October 24-25, 2014, Soesterberg, The Netherlands, 1-13.<br />
<br />
*Bingel, Joachim; Diewald, Nils (2015): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=111;article=001 '''KoralQuery – a General Corpus Query Protocol''']. In: Proceedings of the Workshop on Innovative Corpus Query and Visualization Tools at NODALIDA 2015, Vilnius, Lithuania, May 11-13, 2015. <br />
<br />
*Diewald,Nild; Bingel, Joachim (2015): [http://KorAP.github.io/Koral '''KoralQuery 0.3. Technical Report, Working draft''']. IDS, Mannheim, Germany. <br />
<br />
*Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): '''Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods.''' In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. [http://www.uni-hildesheim.de/konvens2014/data/konvens2014-workshop-proceedings.pdf Proceedings-Band als PDF]<br />
<br />
*Thomas Bartz, Michael Beißwenger, Christian Pölitz, Nadja Radtke & Angelika Storrer (2014): '''Neue Möglichkeiten der Arbeit mit strukturierten Sprachressourcen in den Digital Humanities mithilfe von Data-Mining.''' [http://dharchive.org/paper/DH2014/Poster-894.xml Online Proceedings of the Digital Humanities 2014 annual international conference of the Alliance of Digital Humanities Organizations], Universität Lausanne, 10. Juli 2014<br />
<br />
*Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael (2014): '''Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014.''' Technischer Bericht, Technische Universität Dortmund. [[Media: KobRA-MS2_Verfahren.pdf|Online-Veröffentlichung (PDF)]]<br />
<br />
*Didakowski, Jörg; Radtke, Nadja (2014): '''Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. ''' In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. [http://euralex2014.eurac.edu/en/callforpapers/Documents/EURALEX%202014_gesamt.pdf Online-Veröffentlichung (PDF)]<br />
<br />
----<br />
<br />
Überblick über weitere Veröffentlichungen mit Projektbezug: '''[[Publikationen]]'''<br />
|}</div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Hauptseite&diff=824Hauptseite2015-10-02T07:23:54Z<p>Storrer: </p>
<hr />
<div>{| class="wikitable" width="99%"<br />
|-<br />
! <big> Herzlich willkommen </big><br />
|- <br />
| style="background:#ffffff; padding:1em" | <br />
[[Datei:Kwic-kobra-2geo.png|links]] [[Datei:KobRA-RM.png|rechts]] '''KobRA&nbsp;(Korpus-basierte Recherche und Analyse mit Hilfe von Data-Mining)''' ist ein Verbundprojekt, das seit September 2012 vom [http://www.bmbf.de Bundesministerium für Bildung und Forschung (BMBF)] im Rahmen des '''[http://www.bmbf.de/foerderungen/16466.php Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities]''' gefördert wird (Förderkennzeichen: 01UG1245A).<br />
<br />
Im Projekt arbeiten Partner aus Informatik, Linguistik und Sprachtechnologie gemeinsam daran, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern. Koordinatorin des Projekts ist [http://germanistik.uni-mannheim.de/abteilungen/germanistische_linguistik/prof_dr_angelika_storrer/index.html Prof. Dr. Angelika Storrer (Universität Mannheim)]. <br />
<br />
<span style= "color:#FF0000;">'''AKTUELL:'''</span><br />
Auf der [[Fachtagung 30.10.2015|Fachtagung ''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'']] am '''30.10.2015 an der Berlin Brandenburgischen Akademie der Wissenschaften (BBAW)''' in Berlin informieren wir über die Ergebnisse unseres Projekts. <br />
<br />
'''Anmeldung bis zum 25.10.2015''' unter kobra@dwds.de. Die Teilnahme ist kostenfrei, alle Interessierten sind herzlich eingeladen.<br />
<br />
<div style="clear: left"></div> Auf diesen Seiten bieten wir einen Überblick und detailliertere Informationen über:<br />
* '''[[Projektbeschreibung|die Ziele, Fragestellungen und Methoden des Projekts]]'''<br />
* '''[[Team|die beteiligten Personen und Forschungseinrichtungen]]'''<br />
* '''[[Fallstudien|die Fallstudien des Projekts]]'''<br />
* '''sowie über Aktivitäten und aktuelle Veröffentlichungen (s.u.).'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left; margin-right:1em"<br />
|-<br />
! <big>Aktivitäten</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
*[[Fachtagung 30.10.2015|Fachtagung ''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'']] am 30.10.2015 an der BBAW. Die Teilnahme ist kostenfrei, Anmeldung bis zum '''25.10.2015''' unter kobra@dwds.de.<br />
<br />
* Vortrag ''A Data Mining Environment for Linguistic Research Based on CLARIN-D Language Resources'' (Katharina Morik, Thomas Bartz, Christian Pölitz, Angelika Storrer) auf der [http://dch2015.net/abstracts_submission.shtml ''DCH2015 - Interdisciplinary Conference on Digital Cultural Heritage''] am 28.-30. Oktober 2015 in Berlin.<br />
<br />
* Paper auf der Internationalen Fachtagung [http://www.kiv.zcu.cz/tsd2015/ ''Text, Speech and Dialogue'']: Pölitz, Christian; Bartz, Thomas; Morik, Katharina; Storrer, Angelika (2015): ''Investigation of Word Senses over Time using Linguistic Corpora'' In: Matousek, Vaclav et al. (Hrsg.): Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer.<br />
<br />
* Paper auf der Internationalen Fachtagung [https://elex.link/elex2015/ ''eLexicography 2015'']: Lemnitzer, Lothar; Pölitz, Christian; Didakowski, Jörg; Geyken, Alexander (2015): ''A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries''In: Kosem, Iztok et al. (Hrsg.):'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.<br />
<br />
* Paper auf der Internationalen Fachtagung [https://elex.link/elex2015/ ''eLexicography 2015'']: Geyken, Alexander; Pölitz, Christian; Bartz, Thomas (2015): ''A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries'' In: Kosem, Tztok et al. (Hrsg): 'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.<br />
<br />
* Vortrag [http://clarin2015.informatik.uni-leipzig.de/program#Kobra Korpusbasierte Sprachanalyse mit CLARIN-D-Ressourcen: Anwendungsszenarien und Erfahrungen aus dem Projekt KobRA] auf dem CLARIN-D Workshop ''Fächerübergreifende Perspektiven durch digitale Forschungsinfrastrukturen'' am 30.6/1.7. in Leipzig.<br />
<br />
*Posterpräsentation ''Erprobung innovativer Data-Mining-Verfahren für die empirische Arbeit mit strukturierten Sprachressourcen''. (Thomas Bartz, Christian Pölitz, Angelika Storrer). [https://de.dariah.eu/dhsummit2015 auf dem Digital Humanities Summit], Berlin, 3./4. März 2015<br />
<br />
----<br />
<br />
Überblick über weitere Konferenzbeiträge und Projekt-Workshops: '''[[Aktivitäten]]'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left"<br />
|-<br />
! <big>Veröffentlichungen</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
*Bartz,Thomas; Pölitz, Christian; Morik, Katharina; Storrer, Angelika (2015): '''Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research'''. In: Jan Odijk (Ed): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=116;article=001 Selected Papers from the CLARIN 2014 Conference], October 24-25, 2014, Soesterberg, The Netherlands, 1-13.<br />
<br />
*Bingel, Joachim; Diewald, Nils (2015): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=111;article=001 '''KoralQuery – a General Corpus Query Protocol''']. In: Proceedings of the Workshop on Innovative Corpus Query and Visualization Tools at NODALIDA 2015, Vilnius, Lithuania, May 11-13, 2015. <br />
<br />
*Diewald,Nild; Bingel, Joachim (2015): [http://KorAP.github.io/Koral '''KoralQuery 0.3. Technical Report, Working draft''']. IDS, Mannheim, Germany. <br />
<br />
*Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): '''Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods.''' In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. [http://www.uni-hildesheim.de/konvens2014/data/konvens2014-workshop-proceedings.pdf Proceedings-Band als PDF]<br />
<br />
*Thomas Bartz, Michael Beißwenger, Christian Pölitz, Nadja Radtke & Angelika Storrer (2014): '''Neue Möglichkeiten der Arbeit mit strukturierten Sprachressourcen in den Digital Humanities mithilfe von Data-Mining.''' [http://dharchive.org/paper/DH2014/Poster-894.xml Online Proceedings of the Digital Humanities 2014 annual international conference of the Alliance of Digital Humanities Organizations], Universität Lausanne, 10. Juli 2014<br />
<br />
*Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael (2014): '''Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014.''' Technischer Bericht, Technische Universität Dortmund. [[Media: KobRA-MS2_Verfahren.pdf|Online-Veröffentlichung (PDF)]]<br />
<br />
*Didakowski, Jörg; Radtke, Nadja (2014): '''Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. ''' In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. [http://euralex2014.eurac.edu/en/callforpapers/Documents/EURALEX%202014_gesamt.pdf Online-Veröffentlichung (PDF)]<br />
<br />
----<br />
<br />
Überblick über weitere Veröffentlichungen mit Projektbezug: '''[[Publikationen]]'''<br />
|}</div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Aktivit%C3%A4ten&diff=823Aktivitäten2015-10-02T07:17:40Z<p>Storrer: </p>
<hr />
<div>Auf dieser Seite finden Sie Meldungen zu Aktivitäten des KobRA-Projekts (absteigend chronologisch sortiert). Für einen schnellen Überblick bieten wir auch eine Auflistung aller projektrelevanten wissenschaftlichen Vorträge an: '''[[Präsentationen]]'''. Für die Workshops und Fallstudien des Projekts gibt es ebenfalls je eigenständige Rubriken: '''[[:Kategorie:Projektworkshops|Projektworkshops]]''', '''[[:Kategorie:Fallstudien|Fallstudien]]'''.<br />
<br />
__FORCETOC__<br />
==KobRA-Fachtagung, 30. Oktober 2015, BBAW (Berlin)==<br />
Auf der Fachtagung [http://www.bbaw.de/veranstaltungen/2015/oktober/datamining ''Neue Wege in der Nutzung von Korpora - Data-Mining für die textorientierten Geisteswissenschaften''] werden die Ergebnisse des KobRA-Projekts vorgestellt. <br />
<br />
Die Teilnahme ist kostenfrei, alle Interessierten sind herzlich eingeladen. Anmeldung zur Tagung bis '''25.10.2015''' über kobra@dwds.de.<br />
==DCH2015, 28. bis 30. Oktober 2015 (Berlin)==<br />
Vortrag ''A Data Mining Environment for Linguistic Research Based on CLARIN-D Language Resources'' (Katharina Morik, Thomas Bartz, Christian Pölitz & Angelika Storrer) auf der [http://dch2015.net/abstracts_submission.shtml ''DCH2015 - Interdisciplinary Conference on Digital Cultural Heritage''] am 28. Oktober 2015 in Berlin.<br />
<br />
==CLARIN-D Fach-AG Workshop, 30. Juni/1. Juli 2015 (Leipzig)==<br />
<br />
Beim dritten Workshop der CLARIN-D Fach-AGs [http://clarin2015.informatik.uni-leipzig.de/ "Fächerübergreifende Perspektiven durch digitale Forschungsinfrastrukturen"] stehen digitale Forschungsressourcen, deren Pflege und Anwendungs- und Distributionspotential im Mittelpunkt. Der Workshop bietet die Möglichkeit, das KobRA-Projekt im Rahmen eines interdisziplinären Austausches vorzustellen und sowohl vielfältige Anwendungsmöglichkeiten der entwickelten Analyseverfahren aufzuzeigen als auch Forschungsdesiderate zu formulieren.<br />
<br />
*Beitrag: "Korpusbasierte Sprachanalyse mit CLARIN-D-Ressourcen: Anwendungsszenarien und Erfahrungen aus dem Projekt KobRA". Vortrag im Rahmen des [http://clarin2015.informatik.uni-leipzig.de/ "CLARIN-D Fach-AGs" "CLARIN-D Workshops "Fächerübergreifende Perspektiven durch digitale Forschungsinfrastrukturen" in Leipzig] (Angelika Storrer)<br />
<br />
==Digital Humanities Summit, 3./4. März 2015 (Berlin)==<br />
<br />
Der [https://de.dariah.eu/dhsummit2015 "DARIAH-D Digital Humanities Summit"] beschäftigte sich mit der zukünftigen Entwicklung digitaler Forschungsinfrastrukturen im Bereich der Kultur- und Geisteswissenschaften. Die Entwicklung von neuen, korpusbasierten Analysemethoden und Werkzeugen trägt zur Strärkung interdiziplinärer Zusammenarbeit bei und fördert die Vernetzung von Forschungsinfrastrukturen. <br />
<br />
*Beitrag: "Erprobung innovativer Data-Mining-Verfahren für die empirische Arbeit mit strukturierten Sprachressourcen". [https://de.dariah.eu/documents/10180/472725/1_Bartz_DH-Summit_300dpi.pdf/376e6d94-c0e9-4cfc-86b0-39a2269cafae "Posterpräsentation auf dem Digital Humanities Summit in Berlin"] (Thomas Bartz, Christian Pölitz, Angelika Storrer)<br />
<br />
==Herrenhäuser Symposium Visuelle Linguistik, 19.-21. November 2014 (Hannover)==<br />
<br />
Ziel des [http://www.visual-linguistics.net/symposium/ ''Symposiums Visuelle Linguistik''] im Schloss Herrenhausen (Hannover) war es, den aktuellen Stand zu Theorie und Anwendung von Visualisierungen in der Sprachwissenschaft zu erörten. Visualisierung hat als Mittel zur Veranschaulichung in der Linguistik eine lange Tradition, mit dem Aufkommen großer Korpora und der damit einhergehenden Etablierung statistischer, korpuslinguistischer Methoden hat das Thema in den letzten Jahren eine neue Relevanz bekommen und stellt heute eine große Entwicklungschance und Herausforderung zugleich dar.<br />
<br />
*Beitrag: "Visualisierung von Frequenzverteilungen im Anwendungsbereich Lexikographie." Posterpräsentation im Rahmen des [http://www.visual-linguistics.net/symposium/index.html ''Herrenhäuser Symposiums: Visuelle Linguistik. Theorie und Anwendung von Visualisierungen in der Sprachwissenschaft'' im Schloss Herrenhausen, Hannover] (Thomas Bartz, Angelika Storrer)<br />
<br />
==CAC 2014, 23.-25. Oktober 2014 (Soesterberg)==<br />
<br />
Die [https://www.clarin.eu/event/2014/clarin-annual-conference-2014-soesterberg-netherlands ''CLARIN-Jahreskonferenz 2014''] in Soesterberg (Niederlande) war eine gute Gelegenheit, bislang noch nicht präsentierte Ergebnisse der Projektarbeiten aus dem [[Projektbeschreibung#Wissenschaftliche Anwendungsfelder ("use cases")|Anwendungsfeld Lexikographie]] und erstmals auch die im Projekt entwickelte bzw. angepasste [[Projektbeschreibung#Entstehende_Ressourcen|Data-Mining-Umgebung für die korpus-basierte linguistische Recherche und Analyse]] als Ganze vorzustellen. Die Projektarbeiten bauen unmittelbar auf die [https://www.clarin.eu/guest-portal CLARIN-Infrastruktur] auf und erweitern die Möglichkeiten der Recherche und Analyse.<br />
<br />
*Beitrag: "Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research." Vortrag im Rahmen der [https://www.clarin.eu/event/2014/clarin-annual-conference-2014-soesterberg-netherlands ''CLARIN Annual Conference (CAC 2014)'' in Soesterberg] (Thomas Bartz, Christian Pölitz)<br />
<br />
==KONVENS 2014, 7. Oktober 2014 (Hildesheim)==<br />
<br />
Im Rahmen des Workshops [https://sites.google.com/site/nlp4cmc/ NLP4CMC: Natural Language Processing for Computer-Mediated Communication / Social Media] bei [http://www.uni-hildesheim.de/konvens2014/ Konferenz zur Verarbeitung natürlicher Sprachen (KONVENS 2014)] an der Universität Hildesheim haben wir mit unseren Kooperationspartnern vom IDS Mannheim laufende Arbeiten aus dem Projekt zur automatischen Identifikation und Klassifikation sprachlicher Besonderheiten in der internetbasierten Kommunikation vorgestellt. Die Datengrundlage für die Entwicklung und Evaluation der Verfahren bildete das Wikipedia-Korpus in DeReKo.<br />
<br />
*Beitrag: "Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning." Posterpräsentation im Rahmen des Workshops "NLP4CMC: Natural Language Processing for Computer-Mediated Communication / Social Media" bei der KONVENS 2014 (Michael Beißwenger, Harald Lüngen, Eliza Margaretha & Christian Pölitz)<br />
<br />
==Dritter Projekt-Workshop am 25./26. September 2014 (Mannheim)==<br />
<br />
Am 25./26.09.2014 fand an der Universität Mannheim das dritte Arbeitstreffen des Projekts statt. Im Vordergrund stand der Austausch über die bereits erreichten Projektziele der Entwicklungs- und Evaluationsphase sowie über die geplanten Arbeiten in der bevorstehenden Integrationsphase. Am ersten Workshoptag stellten Beteiligte aus allen Teilprojekten des Projektverbunds in öffentlichen Vorträgen bislang erzielte Ergebnisse und laufende Arbeiten vor. Der zweite Workshoptag diente der konkreteren internen Planung der nächsten Projektphase sowie der Abschlusstagung am 29./30. Oktober 2015 an der [http://www.bbaw.de/|Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW)].<br />
<br />
*[[Dokumentation: 3. Projektworkshop (September 2014)]]<br />
<br />
==4th General DARIAH VCC meeting, 17.-19. September 2014 (Rom)==<br />
<br />
Beim DARIAH-Meeting in Rom waren wir in Kooperation mit Kolleginnen und Kollegen aus der [http://www.tei-c.org/Activities/SIG/CMC/ TEI-SIG "Computer-Mediated Comunication"] an der Ausrichtung einer Community Session zum Thema [http://dariah.eu/activities/general-vcc-meetings/4th-general-vcc-meeting/programme/community-sessions.html "Models and tools for structuring & annotating corpora of social media / computer-mediated communication"] beteiligt. Im Rahmen dieser Veranstaltung haben wir erste Ergebnisse aus den Fallstudien im Bereich "Varietätenlinguistik / Internetbasierte Kommunikation" vorgestellt und mit Blick auf die Entwicklung von Standards für den Aufbau von Korpora internetbasierter Kommunikation diskutiert.<br />
<br />
*Beitrag: "Analyzing CMC corpora using machine learning methods: Report from the KobRA project." [http://www.dariah.eu/activities/general-vcc-meetings/4th-general-vcc-meeting.html 4th General Virtual Competency Centre (VCC) meeting of DARIAH-EU] (Michael Beißwenger & Christian Pölitz)<br />
<br />
==EURALEX 2014, 15.-19. Juli 2014 (Bozen)==<br />
<br />
In ihrem Vortrag zur Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen im Rahmen des [http://euralex2014.eurac.edu/de/Pages/default.aspx ''XVI. internationalen EURALEX-Kongresses'', ausgerichtet an der Europäischen Akademie in Bozen (EURAC)], gaben Jörg Didakowski und Nadja Radtke einen guten Einblick in die Fragestellungen und korpus-/technologie-basierten Ansätze im [[Projektbeschreibung#Wissenschaftliche Anwendungsfelder ("use cases")|Anwendungsfeld diachronische Sprachforschung/Stützverbgefüge]].<br />
<br />
*Beitrag: "Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen." Vortrag im Rahmen des [http://euralex2014.eurac.edu/en/Pages/default.aspx ''XVI EURALEX International Congress (EURALEX 2014)'' an der European Academy of Bolzano/Bozen (EURAC)] (Jörg Didakowski, Nadja Radtke)<br />
<br />
==DH 2014, 7.-12. Juni 2014 (Lausanne)==<br />
<br />
Nach einem erfolgreich eingereichten Paper zu Ergebnissen aus dem [[Projektbeschreibung#Wissenschaftliche Anwendungsfelder ("use cases")|Anwendungsfeld Lexikographie]] war das KobRA-Projekt auch auf der internationalen Jahreskonferenz der ''Alliance of Digital Humanities Organizations'', [http://dh2014.org/ ''Digital Humanities''], in Lausanne präsent. Im Rahmen einer Posterpräsentation konnten wir in einen erkenntnisreichen Austausch mit Vertretern verwandter Projekte treten und interessante neue Kontakte knüpfen.<br />
<br />
*Beitrag: "Neue Möglichkeiten der Arbeit mit strukturierten Sprachressourcen in den Digital Humanities mithilfe von Data-Mining." Posterpräsentation im Rahmen der [http://dh2014.org/ ''Digital Humanities 2014'' in Lausanne] (Thomas Bartz, Michael Beißwenger, Christian Pölitz, Nadja Radtke, Angelika Storrer)<br />
<br />
==LaTeCH 2014, 26. April 2014 (Göteborg)==<br />
<br />
Die im Rahmen der Fallstudien im [[Projektbeschreibung#Wissenschaftliche Anwendungsfelder ("use cases")|Anwendungsfeld Lexikographie]] bislang angewandten Verfahren wurden in einem Vortrag beim [http://sighum.science.ru.nl/latech2014/index.html 8. Workshop ''Language Technology for Cultural Heritage, Social Sciences, and Humanities (LaTeCH 2014)''] vorgestellt. Der Workshop fand in Verbindung mit der [http://eacl2014.org/ 14. Jahrestagung des ''European Chapter of the Association for Computational Linguistics (EACL 2014)''] statt.<br />
<br />
* Beitrag: "Enhancing the possibilities of corpus-based investigations: Word sense disambiguation on query results of large text corpora." Vortrag beim [http://sighum.science.ru.nl/latech2014/index.html 8. Workshop ''Language Technology for Cultural Heritage, Social Sciences, and Humanities (LaTeCH 2014)''] im Rahmen der [http://eacl2014.org/ 14. Jahrestagung des ''European Chapter of the Association for Computational Linguistics (EACL 2014)''] (Christian Pölitz, Thomas Bartz)<br />
<br />
==DHd 2014, 25.-28. März 2014 (Passau)==<br />
<br />
Das KobRA-Projekt war mit einer Posterpräsentation und einem Kurzvortrag im Rahmen des Poster-Slams bei der [http://www.dhd2014.uni-passau.de/ ersten Jahrestagung des Verbands ''Digital Humanities im deutschsprachigen Raum (DHd)'' in Passau] vertreten. Vorgestellt wurden Projektergebnisse aus dem [[Projektbeschreibung#Wissenschaftliche Anwendungsfelder ("use cases")|Anwendungsfeld Lexikographie]], die in Zusammenarbeit mit dem Projektpartner an der Berlin-Brandenburgischen Akademie der Wissenschaften erzielt wurden.<br />
<br />
* Beitrag: "Disambiguierung in Suchtrefferlisten aus großen Textkorpora: Anwendungsfelder und Perspektiven." Kurzvortrag und Posterpräsentation im Rahmen der [http://www.dhd2014.uni-passau.de/ ersten Jahrestagung des Verbands ''Digital Humanities im deutschsprachigen Raum (DHd)'' in Passau] (Thomas Bartz, Alexander Geyken, Christian Pölitz, Achim Saupe, Angelika Storrer)<br />
<br />
=="Social Media Corpora for the eHumanities", Februar 2014 (Dortmund)==<br />
<br />
Im Februar 2014 fand an der TU Dortmund die Abschlusstagung des DFG-Netzwerks ''[http://www.empirikom.net Empirische Erforschung internetbasierter Kommunikation (Empirikom)]'' statt. In die Tagung integriert war das zweite offizielle Arbeitstreffen der [http://www.tei-c.org/Activities/SIG/CMC/ Special Interest Group "Computer-Mediated Communication"] der ''[http://www.tei-c.org/ Text Encoding Initiative (TEI)]'', an dem mit Michael Beißwenger, Lothar Lemnitzer, Angelika Storrer und Andreas Witt KobRA-Vertreter aus Dortmund, Berlin und Mannheim mit Beiträgen beteiligt waren. Vorgestellt und diskutiert wurde u.a. der Entwurf zu einem Basisschema für die TEI-Repräsentation von Korpora internetbasierter Kommunikation (IBK), das geeignet ist, nicht nur Korpora zu rein schriftbasierten IBK-Genres, sondern auch Korpora mit Sprachdaten aus multimodalen Kommunikationsumgebungen zu repräsentieren.<br />
<br />
Darüber hinaus stellten Thomas Bartz, Michael Beißwenger und Angelika Storrer in Verbindung mit Swantje Westpfahl (IDS Mannheim) Erweiterungen zum "Stuttgart-Tübingen-Tagset" für das POS-Tagging deutscher Sprachdaten vor, die auf die Behandlung von Phänomenen in Sprachdaten internetbasierter Kommunikation abgestimmt sind und die auch in den Arbeiten in KobRA Verwendung finden werden. Ein Beitrag von Angelika Storrer zur Modellierung von Phänomenen "nichtstandardisierter" Schriftlichkeit bei der Sprachverwendung in sozialen Medien lieferte dazu einen theoretischen Beschreibungsrahmen.<br />
<br />
Die Tagungsbeiträge mit KobRA-Bezug im Einzelnen:<br />
* "A Basic Schema for Modeling Computer-Mediated Communication in TEI" (Michael Beißwenger, Maria Ermakova, Thierry Chanier, Kun Jin, Lothar Lemnitzer und Angelika Storrer)<br />
* "General Requirements and Issues in Defining a TEI Schema for the Representation of Computer-Mediated Communication" (Michael Beißwenger)<br />
* "Relations and Options for Cooperation between the SIG 'TEI for Linguists' and the SIG 'Computer-Mediated Communication'" (Andreas Witt)<br />
* "Ein erweitertes STTS-Tagset für die POS-Annotation von Korpora gesprochener Sprache und von Korpora internetbasierter Kommunikation" (Thomas Bartz, Michael Beißwenger, Angelika Storrer und Swantje Westpfahl)<br />
* "Was ist eigentlich der Standard? Varietätenlinguistische Überlegungen zur Einordnung von interaktionsorientierter Schriftlichkeit als 'non-standard', 'standardfern' etc. (Angelika Storrer)<br />
* "Vorbereitung einer Shared Task zur automatischen linguistischen Annotation von Sprachdaten aus Genres internetbasierter Kommunikation: Werkstattbericht" (Michael Beißwenger, Sabine Bartsch, Stefan Evert und Kay-Michael Würzner)<br />
<br />
==TEI 2013, 2.-5. Oktober 2013 (Rom)==<br />
<br />
Mit der Ausrichtung eines Panels sowie eines Arbeitstreffens der neu gegründeten Special Interest Group (SIG) "Computer-Mediated Communication" war KobRA (vertreten durch Thomas Bartz, Michael Beißwenger und Angelika Storrer) an der diesjährigen [http://digilab2.let.uniroma1.it/teiconf2013/ Konferenz der ''Text Encoding Inidiative'' (TEI) in Rom] beteiligt.<br />
<br />
Gemeinsam mit Kooperationspartnern aus Deutschland, Frankreich, Italien und den Niederlanden wurden aktuelle Arbeiten zur Standardisierung von Schemata für die linguistische Annotation von Sprachdaten aus Genres internetbasierter Kommunikation präsentiert. Im Rahmen des von Michael Beißwenger & Lothar Lemnitzer organisierten Panels wurde anhand von Daten aus Korpus- und Forschungsprojekten zu verschiedenen europäischen Sprachen (für das Deutsche: Daten aus DeRiK und KobRA) ein Umriss sprachlicher und struktureller Besonderheiten internetbasierter Kommunikation präsentiert und wurden Herausforderungen und Möglichkeiten der automatischen und standardisierten Annotation solcher Phänomene in Korpora diskutiert.<br />
<br />
Im Rahmen der von Michael Beißwenger koordinierten SIG wurden Schnittstellen zwischen laufenden Arbeiten in KobRA und DeRiK und vergleichbaren Arbeiten in Projekten zu anderen Sprachen identifiziert und Kooperationen in Hinblick auf die Erarbeitung von Lösungen für die automatische Annotation relevanter Phänomene vereinbart. Die Ergebnisse des Panels, der SIG und der vereinbarten Kooperationen fließen in die weitere Projektarbeit im [[Projektbeschreibung#Wissenschaftliche Anwendungsfelder ("use cases")|Anwendungsfeld Varietätenlinguistik/Internetbasierte Kommunikation]] ein.<br />
<br />
Die Konferenzbeiträge mit KobRA-Bezug im Einzelnen:<br />
<br />
*Three-Paper Panel: [http://wiki.tei-c.org/images/8/85/Teicmcpanel2013expose.pdf Computer-Mediated Communication in TEI: What Lies Ahead] (organisiert von Michael Beißwenger & Lothar Lemnitzer mit Beiträgen von Michael Beißwenger, Thierry Chanier, Isabella Chiari, Maria Ermakova, Maarten van Gompel, Iris Hendrickx, Axel Herold, Henk van den Heuvel und Angelika Storrer)<br />
*Arbeitstreffen der [http://www.tei-c.org/Activities/SIG/CMC/ SIG "Computer-Mediated Communication"] (organisiert von Michael Beißwenger mit Beiträgen von Thomas Bartz, Angelika Storrer, Thierry Chanier, Isabella Chiari, Maria Ermakova und Iris Hendrickx)<br />
<br />
==GSCL 2013, 23.-27. September 2013 (Darmstadt)==<br />
<br />
Mit mehreren Einzelbeiträgen sowie der Ausrichtung eines Workshops haben VertreterInnen des KobRA-Projekts auf der [http://gscl2013.ukp.informatik.tu-darmstadt.de/ International Conference of the German Society for Computational Linguistics and Language Technology (GSCL) 2013] laufende Arbeiten zur automatischen Analyse von Sprachdaten aus Genres internetbasierter Kommunikation und zur Nutzung von Informatikmethoden für die korpusgestützte Sprachanalyse präsentiert. Die Ergebnisse der Diskussionen im Rahmen des Workshops, der Postersession und des Kurzpaper-Format "GSCL-Kaleidoskop" fließen in die weitere Projektarbeit im [[Projektbeschreibung#Wissenschaftliche Anwendungsfelder ("use cases")|Anwendungsfeld Varietätenlinguistik/Internetbasierte Kommunikation]] ein.<br />
<br />
Die Konferenzbeiträge mit KobRA-Bezug im Einzelnen:<br />
*Workshop: [http://empirikom.net/bin/view/Aktivitaeten/GsclWorkshop Verarbeitung und Annotation von Sprachdaten aus Genres internetbasierter Kommunikation] (organisiert von Michael Beißwenger und Angelika Storrer in Verbindung mit Anke Lüdeling (Berlin) und dem [http://www.empirikom.net DFG-Netzwerk Empirikom])<br />
*"Vorbereitung einer Shared Task zur Verarbeitung von Sprachdaten aus Genres internetbasierter Kommunikation / Preparing a Shared Task on Linguistic Annotation of Computer-Mediated Communication." Vortrag und Posterpräsentation im Rahmen des ''GSCL-Kaleidoskop'' (Michael Beißwenger in Kooperation mit Stefan Evert, Kay-Michael Würzner und Sabine Bartsch)<br />
* "Domain Adaptation in Corpus Linguistics." Vortrag im Rahmen des ''GSCL-Kaleidoskop'' (Christian Pölitz)<br />
* "Modifikation und Erweiterung von STTS für die Annotation von Gesprächskorpora und von Korpora zu Genres internetbasierter Kommunikation." Vortrag im Rahmen des ''GSCL-Kaleidoskop'' (Thomas Bartz, Michael Beißwenger und Angelika Storrer in Verbindung mit Ines Rehbein, Thomas Schmidt und Swantje Westpfahl)<br />
<br />
==GAL 2013, 19./20. September 2013 (Aachen)==<br />
<br />
Auf der [http://www.gal2013.ifaar.rwth-aachen.de 2. Sektionentagung der Gesellschaft für Angewandte Linguistik e.V. (GAL 2013)] haben die Dortmunder Projektmitarbeiter Thomas Bartz, Nadja Radtke und Christian Pölitz erste Ergebnisse der KobRA-Projektarbeiten zu den Aufgabenbereichen Klassifikation und Disambiguierung von Treffern bzw. Trefferlisten vorgestellt. Ausgangspunkt für den gemeinsamen Vortrag sind die Arbeiten im [[Projektbeschreibung#Wissenschaftliche Anwendungsfelder ("use cases")|Anwendungsfeld Lexikographie]], in die auch Ergebnisse und Anregungen aus der Sektionsarbeit unmittelbar einfließen.<br />
<br />
Angaben zum Vortrag:<br />
* "Bereinigen, Disambiguieren, Visualisieren: Möglichkeiten der Unterstützung der korpusbasierten Lexikographie durch Data-Mining-Verfahren." Sektion "Lexikographie" der [http://www.gal2013.ifaar.rwth-aachen.de 2. Sektionentagung der Gesellschaft für Angewandte Linguistik e.V. (GAL 2013)] (Thomas Bartz, Nadja Radtke & Christian Pölitz)<br />
<br />
==IDT 2013, 29. Juli bis 3. August 2013 (Bozen)==<br />
<br />
Mit zwei Einzelvorträgen und einem Posterstand haben Nadja Radtke und Thomas Bartz KobRA auf der [http://www.idt-2013.it XV. Internationalen Tagung der Deutschlehrerinnen und Deutschlehrer (IDT 2013)] in Bozen vertreten und potenzielle Anwender aus den Bereichen Schule und Lehrerbildung als Multiplikatoren für die Aufgaben und Lösungen des Projekts gewinnen können.<br />
<br />
In ihrem Vortrag in der Sektion "Wortschatz und Phraseologie" zeigte Nadja Radtke typische Bereinigungs- und Klassifikationsaufgaben, die sich beim korpus-basierten Aufbau einer Wiki-Ressource zu deutschen Stützverbgefügen im Rahmen ihres Dissertationsprojektes gestellt haben, und für die KobRA-Lösungen entwickelt werden.<br />
<br />
Thomas Bartz stellte in seinem Vortrag in der Sektion "Korpora im Sprachunterricht" Möglichkeiten und Grenzen des Einsatzes aktuell existierender digitaler Sprachressourcen im Deutschunterricht sowie zu erwartende Verbesserungen durch KobRA-Lösungen vor.<br />
<br />
Nadja Radtke und Thomas Bartz präsentierten im Rahmen einer sektionsübergreifenden Posterpräsentation Möglichkeiten der Nutzung deutschsprachiger Onlinekorpora im Unterricht und neue Potenziale für diesen Anwendungsbereich, die sich durch die KobRA-Projektarbeiten ergeben.<br />
<br />
Der direkte Kontakt zu Nutzern von Korpora und Sprachressourcen in Lehr-/Lernkontexten brachte wichtige Anregungen insbesondere für die [[Projektbeschreibung#Wissenschaftliche Anwendungsfelder ("use cases")|Anwendungsfelder Lexikographie und Diachronische Sprachforschung]].<br />
<br />
Die Konferenzbeiträge mit KobRA-Bezug im Einzelnen:<br />
*"Konzeption und korpusbasierter Aufbau einer Wiki-Ressource zu deutschen Stützverbgefügen." Vortrag im Rahmen der Sektion "Wortschatz und Phraseologie" (Nadja Radtke)<br />
* "Digitale Sprachressourcen im Deutschunterricht: Korpus-basierte Recherche und Analyse in der "Wörterbuchwerkstatt"." Vortrag im Rahmen der Sektion "Korpora im Sprachunterricht" (Thomas Bartz)<br />
* "Nutzung deutschsprachiger Onlinekorpora im Unterricht." Ausgewählter Beitrag der Sektion "Korpora im Sprachunterricht" für die sektionsübergreifende Posterpräsentation "Agorá" (Thomas Bartz & Nadja Radtke)<br />
<br />
==Zweiter Projekt-Workshop am 18./19. April 2013 (Dortmund)==<br />
<br />
Am 18./19.04.2013 fand an der TU Dortmund das zweite Arbeitstreffen des Projekts statt. Neben einer Einführung in RapidMiner, die von [http://www-ai.cs.uni-dortmund.de/PERSONAL/morik.html Prof. Dr. Katharina Morik] angeboten wurde, standen dabei auch die Werkstattberichte der Projektpartner sowie die Dortmunder Werkstattberichte auf dem Programm. Das Ziel des zweiten Arbeitstreffens war u.a. das Verabschieden der Aufgabenliste sowie das Festlegen des Meilensteins 1.<br />
<br />
*[[Dokumentation: 2. Projektworkshop (April 2013)]]<br />
<br />
==Kick-off-Treffen der BMBF-Projektverbünde, 8./9. April 2013 (Leipzig)==<br />
<br />
Am 8./9. April 2013 fand an der Universität Leipzig das Kick-off-Treffen der 24 Projektverbünde statt, die im Rahmen des [http://www.bmbf.de/foerderungen/16466.php Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities] vom BMBF gefördert werden. Bei diesem Treffen wurde KobRA - wie auch die anderen 24 Projekte - im Rahmen einer Posterpräsentation vorgestellt.<br />
<br />
*[[Media:Kobra-poster-leipzig-final-2.pdf|KobRA-Poster (PDF)]]<br />
*[[Media:Projektbeschreibung-KobRA-final.pdf|Projektbeschreibung als Teil der Tagungsunterlagen (PDF)]]<br />
<br />
==Kick-off-Meeting der KobRA-Partner am 15./16. November 2012 (Dortmund)==<br />
<br />
Am 15./16.11.2012 fand im Erich-Brost-Haus der TU Dortmund das erste Arbeitstreffen des Projekts statt. Neben einem Überblick über Ziele und Fragestellungen sowie einer Vorstellung von Ressourcen und Verfahren in KobRA standen dabei auch Vorträge eingeladener Gastwissenschaftler auf dem Programm.<br />
<br />
*[[Dokumentation: Kick-off-Meeting (November 2012)]]</div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Aktivit%C3%A4ten&diff=822Aktivitäten2015-10-02T07:17:00Z<p>Storrer: </p>
<hr />
<div>Auf dieser Seite finden Sie Meldungen zu Aktivitäten des KobRA-Projekts (absteigend chronologisch sortiert). Für einen schnellen Überblick bieten wir auch eine Auflistung aller projektrelevanten wissenschaftlichen Vorträge an: '''[[Präsentationen]]'''. Für die Workshops und Fallstudien des Projekts gibt es ebenfalls je eigenständige Rubriken: '''[[:Kategorie:Projektworkshops|Projektworkshops]]''', '''[[:Kategorie:Fallstudien|Fallstudien]]'''.<br />
<br />
__FORCETOC__<br />
==KobRA-Fachtagung, 30. Oktober 2015, BBAW (Berlin)==<br />
Auf der Fachtagung [http://www.bbaw.de/veranstaltungen/2015/oktober/datamining ''Neue Wege in der Nutzung von Korpora - Data-Mining für die textorientierten Geisteswissenschaften''] werden die Ergebnisse des KobRA-Projekts vorgestellt. Die Teilnahme ist kostenfrei, alle Interessierten sind herzlich eingeladen. Anmeldung zur Tagung bis '''25.10.2015''' über kobra@dwds.de.<br />
<br />
<br />
==DCH2015, 28. bis 30. Oktober 2015 (Berlin)==<br />
Vortrag ''A Data Mining Environment for Linguistic Research Based on CLARIN-D Language Resources'' (Katharina Morik, Thomas Bartz, Christian Pölitz & Angelika Storrer) auf der [http://dch2015.net/abstracts_submission.shtml ''DCH2015 - Interdisciplinary Conference on Digital Cultural Heritage''] am 28. Oktober 2015 in Berlin.<br />
<br />
==CLARIN-D Fach-AG Workshop, 30. Juni/1. Juli 2015 (Leipzig)==<br />
<br />
Beim dritten Workshop der CLARIN-D Fach-AGs [http://clarin2015.informatik.uni-leipzig.de/ "Fächerübergreifende Perspektiven durch digitale Forschungsinfrastrukturen"] stehen digitale Forschungsressourcen, deren Pflege und Anwendungs- und Distributionspotential im Mittelpunkt. Der Workshop bietet die Möglichkeit, das KobRA-Projekt im Rahmen eines interdisziplinären Austausches vorzustellen und sowohl vielfältige Anwendungsmöglichkeiten der entwickelten Analyseverfahren aufzuzeigen als auch Forschungsdesiderate zu formulieren.<br />
<br />
*Beitrag: "Korpusbasierte Sprachanalyse mit CLARIN-D-Ressourcen: Anwendungsszenarien und Erfahrungen aus dem Projekt KobRA". Vortrag im Rahmen des [http://clarin2015.informatik.uni-leipzig.de/ "CLARIN-D Fach-AGs" "CLARIN-D Workshops "Fächerübergreifende Perspektiven durch digitale Forschungsinfrastrukturen" in Leipzig] (Angelika Storrer)<br />
<br />
==Digital Humanities Summit, 3./4. März 2015 (Berlin)==<br />
<br />
Der [https://de.dariah.eu/dhsummit2015 "DARIAH-D Digital Humanities Summit"] beschäftigte sich mit der zukünftigen Entwicklung digitaler Forschungsinfrastrukturen im Bereich der Kultur- und Geisteswissenschaften. Die Entwicklung von neuen, korpusbasierten Analysemethoden und Werkzeugen trägt zur Strärkung interdiziplinärer Zusammenarbeit bei und fördert die Vernetzung von Forschungsinfrastrukturen. <br />
<br />
*Beitrag: "Erprobung innovativer Data-Mining-Verfahren für die empirische Arbeit mit strukturierten Sprachressourcen". [https://de.dariah.eu/documents/10180/472725/1_Bartz_DH-Summit_300dpi.pdf/376e6d94-c0e9-4cfc-86b0-39a2269cafae "Posterpräsentation auf dem Digital Humanities Summit in Berlin"] (Thomas Bartz, Christian Pölitz, Angelika Storrer)<br />
<br />
==Herrenhäuser Symposium Visuelle Linguistik, 19.-21. November 2014 (Hannover)==<br />
<br />
Ziel des [http://www.visual-linguistics.net/symposium/ ''Symposiums Visuelle Linguistik''] im Schloss Herrenhausen (Hannover) war es, den aktuellen Stand zu Theorie und Anwendung von Visualisierungen in der Sprachwissenschaft zu erörten. Visualisierung hat als Mittel zur Veranschaulichung in der Linguistik eine lange Tradition, mit dem Aufkommen großer Korpora und der damit einhergehenden Etablierung statistischer, korpuslinguistischer Methoden hat das Thema in den letzten Jahren eine neue Relevanz bekommen und stellt heute eine große Entwicklungschance und Herausforderung zugleich dar.<br />
<br />
*Beitrag: "Visualisierung von Frequenzverteilungen im Anwendungsbereich Lexikographie." Posterpräsentation im Rahmen des [http://www.visual-linguistics.net/symposium/index.html ''Herrenhäuser Symposiums: Visuelle Linguistik. Theorie und Anwendung von Visualisierungen in der Sprachwissenschaft'' im Schloss Herrenhausen, Hannover] (Thomas Bartz, Angelika Storrer)<br />
<br />
==CAC 2014, 23.-25. Oktober 2014 (Soesterberg)==<br />
<br />
Die [https://www.clarin.eu/event/2014/clarin-annual-conference-2014-soesterberg-netherlands ''CLARIN-Jahreskonferenz 2014''] in Soesterberg (Niederlande) war eine gute Gelegenheit, bislang noch nicht präsentierte Ergebnisse der Projektarbeiten aus dem [[Projektbeschreibung#Wissenschaftliche Anwendungsfelder ("use cases")|Anwendungsfeld Lexikographie]] und erstmals auch die im Projekt entwickelte bzw. angepasste [[Projektbeschreibung#Entstehende_Ressourcen|Data-Mining-Umgebung für die korpus-basierte linguistische Recherche und Analyse]] als Ganze vorzustellen. Die Projektarbeiten bauen unmittelbar auf die [https://www.clarin.eu/guest-portal CLARIN-Infrastruktur] auf und erweitern die Möglichkeiten der Recherche und Analyse.<br />
<br />
*Beitrag: "Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research." Vortrag im Rahmen der [https://www.clarin.eu/event/2014/clarin-annual-conference-2014-soesterberg-netherlands ''CLARIN Annual Conference (CAC 2014)'' in Soesterberg] (Thomas Bartz, Christian Pölitz)<br />
<br />
==KONVENS 2014, 7. Oktober 2014 (Hildesheim)==<br />
<br />
Im Rahmen des Workshops [https://sites.google.com/site/nlp4cmc/ NLP4CMC: Natural Language Processing for Computer-Mediated Communication / Social Media] bei [http://www.uni-hildesheim.de/konvens2014/ Konferenz zur Verarbeitung natürlicher Sprachen (KONVENS 2014)] an der Universität Hildesheim haben wir mit unseren Kooperationspartnern vom IDS Mannheim laufende Arbeiten aus dem Projekt zur automatischen Identifikation und Klassifikation sprachlicher Besonderheiten in der internetbasierten Kommunikation vorgestellt. Die Datengrundlage für die Entwicklung und Evaluation der Verfahren bildete das Wikipedia-Korpus in DeReKo.<br />
<br />
*Beitrag: "Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning." Posterpräsentation im Rahmen des Workshops "NLP4CMC: Natural Language Processing for Computer-Mediated Communication / Social Media" bei der KONVENS 2014 (Michael Beißwenger, Harald Lüngen, Eliza Margaretha & Christian Pölitz)<br />
<br />
==Dritter Projekt-Workshop am 25./26. September 2014 (Mannheim)==<br />
<br />
Am 25./26.09.2014 fand an der Universität Mannheim das dritte Arbeitstreffen des Projekts statt. Im Vordergrund stand der Austausch über die bereits erreichten Projektziele der Entwicklungs- und Evaluationsphase sowie über die geplanten Arbeiten in der bevorstehenden Integrationsphase. Am ersten Workshoptag stellten Beteiligte aus allen Teilprojekten des Projektverbunds in öffentlichen Vorträgen bislang erzielte Ergebnisse und laufende Arbeiten vor. Der zweite Workshoptag diente der konkreteren internen Planung der nächsten Projektphase sowie der Abschlusstagung am 29./30. Oktober 2015 an der [http://www.bbaw.de/|Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW)].<br />
<br />
*[[Dokumentation: 3. Projektworkshop (September 2014)]]<br />
<br />
==4th General DARIAH VCC meeting, 17.-19. September 2014 (Rom)==<br />
<br />
Beim DARIAH-Meeting in Rom waren wir in Kooperation mit Kolleginnen und Kollegen aus der [http://www.tei-c.org/Activities/SIG/CMC/ TEI-SIG "Computer-Mediated Comunication"] an der Ausrichtung einer Community Session zum Thema [http://dariah.eu/activities/general-vcc-meetings/4th-general-vcc-meeting/programme/community-sessions.html "Models and tools for structuring & annotating corpora of social media / computer-mediated communication"] beteiligt. Im Rahmen dieser Veranstaltung haben wir erste Ergebnisse aus den Fallstudien im Bereich "Varietätenlinguistik / Internetbasierte Kommunikation" vorgestellt und mit Blick auf die Entwicklung von Standards für den Aufbau von Korpora internetbasierter Kommunikation diskutiert.<br />
<br />
*Beitrag: "Analyzing CMC corpora using machine learning methods: Report from the KobRA project." [http://www.dariah.eu/activities/general-vcc-meetings/4th-general-vcc-meeting.html 4th General Virtual Competency Centre (VCC) meeting of DARIAH-EU] (Michael Beißwenger & Christian Pölitz)<br />
<br />
==EURALEX 2014, 15.-19. Juli 2014 (Bozen)==<br />
<br />
In ihrem Vortrag zur Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen im Rahmen des [http://euralex2014.eurac.edu/de/Pages/default.aspx ''XVI. internationalen EURALEX-Kongresses'', ausgerichtet an der Europäischen Akademie in Bozen (EURAC)], gaben Jörg Didakowski und Nadja Radtke einen guten Einblick in die Fragestellungen und korpus-/technologie-basierten Ansätze im [[Projektbeschreibung#Wissenschaftliche Anwendungsfelder ("use cases")|Anwendungsfeld diachronische Sprachforschung/Stützverbgefüge]].<br />
<br />
*Beitrag: "Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen." Vortrag im Rahmen des [http://euralex2014.eurac.edu/en/Pages/default.aspx ''XVI EURALEX International Congress (EURALEX 2014)'' an der European Academy of Bolzano/Bozen (EURAC)] (Jörg Didakowski, Nadja Radtke)<br />
<br />
==DH 2014, 7.-12. Juni 2014 (Lausanne)==<br />
<br />
Nach einem erfolgreich eingereichten Paper zu Ergebnissen aus dem [[Projektbeschreibung#Wissenschaftliche Anwendungsfelder ("use cases")|Anwendungsfeld Lexikographie]] war das KobRA-Projekt auch auf der internationalen Jahreskonferenz der ''Alliance of Digital Humanities Organizations'', [http://dh2014.org/ ''Digital Humanities''], in Lausanne präsent. Im Rahmen einer Posterpräsentation konnten wir in einen erkenntnisreichen Austausch mit Vertretern verwandter Projekte treten und interessante neue Kontakte knüpfen.<br />
<br />
*Beitrag: "Neue Möglichkeiten der Arbeit mit strukturierten Sprachressourcen in den Digital Humanities mithilfe von Data-Mining." Posterpräsentation im Rahmen der [http://dh2014.org/ ''Digital Humanities 2014'' in Lausanne] (Thomas Bartz, Michael Beißwenger, Christian Pölitz, Nadja Radtke, Angelika Storrer)<br />
<br />
==LaTeCH 2014, 26. April 2014 (Göteborg)==<br />
<br />
Die im Rahmen der Fallstudien im [[Projektbeschreibung#Wissenschaftliche Anwendungsfelder ("use cases")|Anwendungsfeld Lexikographie]] bislang angewandten Verfahren wurden in einem Vortrag beim [http://sighum.science.ru.nl/latech2014/index.html 8. Workshop ''Language Technology for Cultural Heritage, Social Sciences, and Humanities (LaTeCH 2014)''] vorgestellt. Der Workshop fand in Verbindung mit der [http://eacl2014.org/ 14. Jahrestagung des ''European Chapter of the Association for Computational Linguistics (EACL 2014)''] statt.<br />
<br />
* Beitrag: "Enhancing the possibilities of corpus-based investigations: Word sense disambiguation on query results of large text corpora." Vortrag beim [http://sighum.science.ru.nl/latech2014/index.html 8. Workshop ''Language Technology for Cultural Heritage, Social Sciences, and Humanities (LaTeCH 2014)''] im Rahmen der [http://eacl2014.org/ 14. Jahrestagung des ''European Chapter of the Association for Computational Linguistics (EACL 2014)''] (Christian Pölitz, Thomas Bartz)<br />
<br />
==DHd 2014, 25.-28. März 2014 (Passau)==<br />
<br />
Das KobRA-Projekt war mit einer Posterpräsentation und einem Kurzvortrag im Rahmen des Poster-Slams bei der [http://www.dhd2014.uni-passau.de/ ersten Jahrestagung des Verbands ''Digital Humanities im deutschsprachigen Raum (DHd)'' in Passau] vertreten. Vorgestellt wurden Projektergebnisse aus dem [[Projektbeschreibung#Wissenschaftliche Anwendungsfelder ("use cases")|Anwendungsfeld Lexikographie]], die in Zusammenarbeit mit dem Projektpartner an der Berlin-Brandenburgischen Akademie der Wissenschaften erzielt wurden.<br />
<br />
* Beitrag: "Disambiguierung in Suchtrefferlisten aus großen Textkorpora: Anwendungsfelder und Perspektiven." Kurzvortrag und Posterpräsentation im Rahmen der [http://www.dhd2014.uni-passau.de/ ersten Jahrestagung des Verbands ''Digital Humanities im deutschsprachigen Raum (DHd)'' in Passau] (Thomas Bartz, Alexander Geyken, Christian Pölitz, Achim Saupe, Angelika Storrer)<br />
<br />
=="Social Media Corpora for the eHumanities", Februar 2014 (Dortmund)==<br />
<br />
Im Februar 2014 fand an der TU Dortmund die Abschlusstagung des DFG-Netzwerks ''[http://www.empirikom.net Empirische Erforschung internetbasierter Kommunikation (Empirikom)]'' statt. In die Tagung integriert war das zweite offizielle Arbeitstreffen der [http://www.tei-c.org/Activities/SIG/CMC/ Special Interest Group "Computer-Mediated Communication"] der ''[http://www.tei-c.org/ Text Encoding Initiative (TEI)]'', an dem mit Michael Beißwenger, Lothar Lemnitzer, Angelika Storrer und Andreas Witt KobRA-Vertreter aus Dortmund, Berlin und Mannheim mit Beiträgen beteiligt waren. Vorgestellt und diskutiert wurde u.a. der Entwurf zu einem Basisschema für die TEI-Repräsentation von Korpora internetbasierter Kommunikation (IBK), das geeignet ist, nicht nur Korpora zu rein schriftbasierten IBK-Genres, sondern auch Korpora mit Sprachdaten aus multimodalen Kommunikationsumgebungen zu repräsentieren.<br />
<br />
Darüber hinaus stellten Thomas Bartz, Michael Beißwenger und Angelika Storrer in Verbindung mit Swantje Westpfahl (IDS Mannheim) Erweiterungen zum "Stuttgart-Tübingen-Tagset" für das POS-Tagging deutscher Sprachdaten vor, die auf die Behandlung von Phänomenen in Sprachdaten internetbasierter Kommunikation abgestimmt sind und die auch in den Arbeiten in KobRA Verwendung finden werden. Ein Beitrag von Angelika Storrer zur Modellierung von Phänomenen "nichtstandardisierter" Schriftlichkeit bei der Sprachverwendung in sozialen Medien lieferte dazu einen theoretischen Beschreibungsrahmen.<br />
<br />
Die Tagungsbeiträge mit KobRA-Bezug im Einzelnen:<br />
* "A Basic Schema for Modeling Computer-Mediated Communication in TEI" (Michael Beißwenger, Maria Ermakova, Thierry Chanier, Kun Jin, Lothar Lemnitzer und Angelika Storrer)<br />
* "General Requirements and Issues in Defining a TEI Schema for the Representation of Computer-Mediated Communication" (Michael Beißwenger)<br />
* "Relations and Options for Cooperation between the SIG 'TEI for Linguists' and the SIG 'Computer-Mediated Communication'" (Andreas Witt)<br />
* "Ein erweitertes STTS-Tagset für die POS-Annotation von Korpora gesprochener Sprache und von Korpora internetbasierter Kommunikation" (Thomas Bartz, Michael Beißwenger, Angelika Storrer und Swantje Westpfahl)<br />
* "Was ist eigentlich der Standard? Varietätenlinguistische Überlegungen zur Einordnung von interaktionsorientierter Schriftlichkeit als 'non-standard', 'standardfern' etc. (Angelika Storrer)<br />
* "Vorbereitung einer Shared Task zur automatischen linguistischen Annotation von Sprachdaten aus Genres internetbasierter Kommunikation: Werkstattbericht" (Michael Beißwenger, Sabine Bartsch, Stefan Evert und Kay-Michael Würzner)<br />
<br />
==TEI 2013, 2.-5. Oktober 2013 (Rom)==<br />
<br />
Mit der Ausrichtung eines Panels sowie eines Arbeitstreffens der neu gegründeten Special Interest Group (SIG) "Computer-Mediated Communication" war KobRA (vertreten durch Thomas Bartz, Michael Beißwenger und Angelika Storrer) an der diesjährigen [http://digilab2.let.uniroma1.it/teiconf2013/ Konferenz der ''Text Encoding Inidiative'' (TEI) in Rom] beteiligt.<br />
<br />
Gemeinsam mit Kooperationspartnern aus Deutschland, Frankreich, Italien und den Niederlanden wurden aktuelle Arbeiten zur Standardisierung von Schemata für die linguistische Annotation von Sprachdaten aus Genres internetbasierter Kommunikation präsentiert. Im Rahmen des von Michael Beißwenger & Lothar Lemnitzer organisierten Panels wurde anhand von Daten aus Korpus- und Forschungsprojekten zu verschiedenen europäischen Sprachen (für das Deutsche: Daten aus DeRiK und KobRA) ein Umriss sprachlicher und struktureller Besonderheiten internetbasierter Kommunikation präsentiert und wurden Herausforderungen und Möglichkeiten der automatischen und standardisierten Annotation solcher Phänomene in Korpora diskutiert.<br />
<br />
Im Rahmen der von Michael Beißwenger koordinierten SIG wurden Schnittstellen zwischen laufenden Arbeiten in KobRA und DeRiK und vergleichbaren Arbeiten in Projekten zu anderen Sprachen identifiziert und Kooperationen in Hinblick auf die Erarbeitung von Lösungen für die automatische Annotation relevanter Phänomene vereinbart. Die Ergebnisse des Panels, der SIG und der vereinbarten Kooperationen fließen in die weitere Projektarbeit im [[Projektbeschreibung#Wissenschaftliche Anwendungsfelder ("use cases")|Anwendungsfeld Varietätenlinguistik/Internetbasierte Kommunikation]] ein.<br />
<br />
Die Konferenzbeiträge mit KobRA-Bezug im Einzelnen:<br />
<br />
*Three-Paper Panel: [http://wiki.tei-c.org/images/8/85/Teicmcpanel2013expose.pdf Computer-Mediated Communication in TEI: What Lies Ahead] (organisiert von Michael Beißwenger & Lothar Lemnitzer mit Beiträgen von Michael Beißwenger, Thierry Chanier, Isabella Chiari, Maria Ermakova, Maarten van Gompel, Iris Hendrickx, Axel Herold, Henk van den Heuvel und Angelika Storrer)<br />
*Arbeitstreffen der [http://www.tei-c.org/Activities/SIG/CMC/ SIG "Computer-Mediated Communication"] (organisiert von Michael Beißwenger mit Beiträgen von Thomas Bartz, Angelika Storrer, Thierry Chanier, Isabella Chiari, Maria Ermakova und Iris Hendrickx)<br />
<br />
==GSCL 2013, 23.-27. September 2013 (Darmstadt)==<br />
<br />
Mit mehreren Einzelbeiträgen sowie der Ausrichtung eines Workshops haben VertreterInnen des KobRA-Projekts auf der [http://gscl2013.ukp.informatik.tu-darmstadt.de/ International Conference of the German Society for Computational Linguistics and Language Technology (GSCL) 2013] laufende Arbeiten zur automatischen Analyse von Sprachdaten aus Genres internetbasierter Kommunikation und zur Nutzung von Informatikmethoden für die korpusgestützte Sprachanalyse präsentiert. Die Ergebnisse der Diskussionen im Rahmen des Workshops, der Postersession und des Kurzpaper-Format "GSCL-Kaleidoskop" fließen in die weitere Projektarbeit im [[Projektbeschreibung#Wissenschaftliche Anwendungsfelder ("use cases")|Anwendungsfeld Varietätenlinguistik/Internetbasierte Kommunikation]] ein.<br />
<br />
Die Konferenzbeiträge mit KobRA-Bezug im Einzelnen:<br />
*Workshop: [http://empirikom.net/bin/view/Aktivitaeten/GsclWorkshop Verarbeitung und Annotation von Sprachdaten aus Genres internetbasierter Kommunikation] (organisiert von Michael Beißwenger und Angelika Storrer in Verbindung mit Anke Lüdeling (Berlin) und dem [http://www.empirikom.net DFG-Netzwerk Empirikom])<br />
*"Vorbereitung einer Shared Task zur Verarbeitung von Sprachdaten aus Genres internetbasierter Kommunikation / Preparing a Shared Task on Linguistic Annotation of Computer-Mediated Communication." Vortrag und Posterpräsentation im Rahmen des ''GSCL-Kaleidoskop'' (Michael Beißwenger in Kooperation mit Stefan Evert, Kay-Michael Würzner und Sabine Bartsch)<br />
* "Domain Adaptation in Corpus Linguistics." Vortrag im Rahmen des ''GSCL-Kaleidoskop'' (Christian Pölitz)<br />
* "Modifikation und Erweiterung von STTS für die Annotation von Gesprächskorpora und von Korpora zu Genres internetbasierter Kommunikation." Vortrag im Rahmen des ''GSCL-Kaleidoskop'' (Thomas Bartz, Michael Beißwenger und Angelika Storrer in Verbindung mit Ines Rehbein, Thomas Schmidt und Swantje Westpfahl)<br />
<br />
==GAL 2013, 19./20. September 2013 (Aachen)==<br />
<br />
Auf der [http://www.gal2013.ifaar.rwth-aachen.de 2. Sektionentagung der Gesellschaft für Angewandte Linguistik e.V. (GAL 2013)] haben die Dortmunder Projektmitarbeiter Thomas Bartz, Nadja Radtke und Christian Pölitz erste Ergebnisse der KobRA-Projektarbeiten zu den Aufgabenbereichen Klassifikation und Disambiguierung von Treffern bzw. Trefferlisten vorgestellt. Ausgangspunkt für den gemeinsamen Vortrag sind die Arbeiten im [[Projektbeschreibung#Wissenschaftliche Anwendungsfelder ("use cases")|Anwendungsfeld Lexikographie]], in die auch Ergebnisse und Anregungen aus der Sektionsarbeit unmittelbar einfließen.<br />
<br />
Angaben zum Vortrag:<br />
* "Bereinigen, Disambiguieren, Visualisieren: Möglichkeiten der Unterstützung der korpusbasierten Lexikographie durch Data-Mining-Verfahren." Sektion "Lexikographie" der [http://www.gal2013.ifaar.rwth-aachen.de 2. Sektionentagung der Gesellschaft für Angewandte Linguistik e.V. (GAL 2013)] (Thomas Bartz, Nadja Radtke & Christian Pölitz)<br />
<br />
==IDT 2013, 29. Juli bis 3. August 2013 (Bozen)==<br />
<br />
Mit zwei Einzelvorträgen und einem Posterstand haben Nadja Radtke und Thomas Bartz KobRA auf der [http://www.idt-2013.it XV. Internationalen Tagung der Deutschlehrerinnen und Deutschlehrer (IDT 2013)] in Bozen vertreten und potenzielle Anwender aus den Bereichen Schule und Lehrerbildung als Multiplikatoren für die Aufgaben und Lösungen des Projekts gewinnen können.<br />
<br />
In ihrem Vortrag in der Sektion "Wortschatz und Phraseologie" zeigte Nadja Radtke typische Bereinigungs- und Klassifikationsaufgaben, die sich beim korpus-basierten Aufbau einer Wiki-Ressource zu deutschen Stützverbgefügen im Rahmen ihres Dissertationsprojektes gestellt haben, und für die KobRA-Lösungen entwickelt werden.<br />
<br />
Thomas Bartz stellte in seinem Vortrag in der Sektion "Korpora im Sprachunterricht" Möglichkeiten und Grenzen des Einsatzes aktuell existierender digitaler Sprachressourcen im Deutschunterricht sowie zu erwartende Verbesserungen durch KobRA-Lösungen vor.<br />
<br />
Nadja Radtke und Thomas Bartz präsentierten im Rahmen einer sektionsübergreifenden Posterpräsentation Möglichkeiten der Nutzung deutschsprachiger Onlinekorpora im Unterricht und neue Potenziale für diesen Anwendungsbereich, die sich durch die KobRA-Projektarbeiten ergeben.<br />
<br />
Der direkte Kontakt zu Nutzern von Korpora und Sprachressourcen in Lehr-/Lernkontexten brachte wichtige Anregungen insbesondere für die [[Projektbeschreibung#Wissenschaftliche Anwendungsfelder ("use cases")|Anwendungsfelder Lexikographie und Diachronische Sprachforschung]].<br />
<br />
Die Konferenzbeiträge mit KobRA-Bezug im Einzelnen:<br />
*"Konzeption und korpusbasierter Aufbau einer Wiki-Ressource zu deutschen Stützverbgefügen." Vortrag im Rahmen der Sektion "Wortschatz und Phraseologie" (Nadja Radtke)<br />
* "Digitale Sprachressourcen im Deutschunterricht: Korpus-basierte Recherche und Analyse in der "Wörterbuchwerkstatt"." Vortrag im Rahmen der Sektion "Korpora im Sprachunterricht" (Thomas Bartz)<br />
* "Nutzung deutschsprachiger Onlinekorpora im Unterricht." Ausgewählter Beitrag der Sektion "Korpora im Sprachunterricht" für die sektionsübergreifende Posterpräsentation "Agorá" (Thomas Bartz & Nadja Radtke)<br />
<br />
==Zweiter Projekt-Workshop am 18./19. April 2013 (Dortmund)==<br />
<br />
Am 18./19.04.2013 fand an der TU Dortmund das zweite Arbeitstreffen des Projekts statt. Neben einer Einführung in RapidMiner, die von [http://www-ai.cs.uni-dortmund.de/PERSONAL/morik.html Prof. Dr. Katharina Morik] angeboten wurde, standen dabei auch die Werkstattberichte der Projektpartner sowie die Dortmunder Werkstattberichte auf dem Programm. Das Ziel des zweiten Arbeitstreffens war u.a. das Verabschieden der Aufgabenliste sowie das Festlegen des Meilensteins 1.<br />
<br />
*[[Dokumentation: 2. Projektworkshop (April 2013)]]<br />
<br />
==Kick-off-Treffen der BMBF-Projektverbünde, 8./9. April 2013 (Leipzig)==<br />
<br />
Am 8./9. April 2013 fand an der Universität Leipzig das Kick-off-Treffen der 24 Projektverbünde statt, die im Rahmen des [http://www.bmbf.de/foerderungen/16466.php Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities] vom BMBF gefördert werden. Bei diesem Treffen wurde KobRA - wie auch die anderen 24 Projekte - im Rahmen einer Posterpräsentation vorgestellt.<br />
<br />
*[[Media:Kobra-poster-leipzig-final-2.pdf|KobRA-Poster (PDF)]]<br />
*[[Media:Projektbeschreibung-KobRA-final.pdf|Projektbeschreibung als Teil der Tagungsunterlagen (PDF)]]<br />
<br />
==Kick-off-Meeting der KobRA-Partner am 15./16. November 2012 (Dortmund)==<br />
<br />
Am 15./16.11.2012 fand im Erich-Brost-Haus der TU Dortmund das erste Arbeitstreffen des Projekts statt. Neben einem Überblick über Ziele und Fragestellungen sowie einer Vorstellung von Ressourcen und Verfahren in KobRA standen dabei auch Vorträge eingeladener Gastwissenschaftler auf dem Programm.<br />
<br />
*[[Dokumentation: Kick-off-Meeting (November 2012)]]</div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Hauptseite&diff=821Hauptseite2015-10-02T07:16:13Z<p>Storrer: </p>
<hr />
<div>{| class="wikitable" width="99%"<br />
|-<br />
! <big> Herzlich willkommen </big><br />
|- <br />
| style="background:#ffffff; padding:1em" | <br />
[[Datei:Kwic-kobra-2geo.png|links]] [[Datei:KobRA-RM.png|rechts]] '''KobRA&nbsp;(Korpus-basierte Recherche und Analyse mit Hilfe von Data-Mining)''' ist ein Verbundprojekt, das seit September 2012 vom [http://www.bmbf.de Bundesministerium für Bildung und Forschung (BMBF)] im Rahmen des '''[http://www.bmbf.de/foerderungen/16466.php Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities]''' gefördert wird (Förderkennzeichen: 01UG1245A).<br />
<br />
'''Ziel des Projektes ist es, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern.''' Strukturierte Sprachressourcen (annotierte Textkorpora, Baumbanken, Wortnetze) bieten neuartige und attraktive Möglichkeiten, linguistische Fragestellungen an authentischen Sprachverwendungsdaten zu untersuchen und quantitativ auszuwerten. <br />
<br />
Koordinatorin des Projekts ist [http://germanistik.uni-mannheim.de/abteilungen/germanistische_linguistik/prof_dr_angelika_storrer/index.html Prof. Dr. Angelika Storrer (Universität Mannheim)].<br />
<br />
<br />
<span style= "color:#FF0000;">'''AKTUELL:'''</span><br />
Auf der [[Fachtagung 30.10.2015|Fachtagung ''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'']] am '''30.10.2015 an der Berlin Brandenburgischen Akademie der Wissenschaften (BBAW)''' in Berlin informieren wir über die Ergebnisse unseres Projekts. <br />
<br />
'''Anmeldung bis zum 25.10.2015''' unter kobra@dwds.de. Die Teilnahme ist kostenfrei, alle Interessierten sind herzlich eingeladen.<br />
<br />
<br />
<div style="clear: left"></div> Auf diesen Seiten bieten wir einen Überblick und detailliertere Informationen über:<br />
* '''[[Projektbeschreibung|die Ziele, Fragestellungen und Methoden des Projekts]]'''<br />
* '''[[Team|die beteiligten Personen und Forschungseinrichtungen]]'''<br />
* '''[[Fallstudien|die Fallstudien des Projekts]]'''<br />
* '''sowie über Aktivitäten und aktuelle Veröffentlichungen (s.u.).'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left; margin-right:1em"<br />
|-<br />
! <big>Aktivitäten</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
*[[Fachtagung 30.10.2015|Fachtagung ''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'']] am 30.10.2015 an der BBAW. Die Teilnahme ist kostenfrei, Anmeldung bis zum '''25.10.2015''' unter kobra@dwds.de.<br />
<br />
* Vortrag ''A Data Mining Environment for Linguistic Research Based on CLARIN-D Language Resources'' (Katharina Morik, Thomas Bartz, Christian Pölitz, Angelika Storrer) auf der [http://dch2015.net/abstracts_submission.shtml ''DCH2015 - Interdisciplinary Conference on Digital Cultural Heritage''] am 28.-30. Oktober 2015 in Berlin.<br />
<br />
* Paper auf der Internationalen Fachtagung [http://www.kiv.zcu.cz/tsd2015/ ''Text, Speech and Dialogue'']: Pölitz, Christian; Bartz, Thomas; Morik, Katharina; Storrer, Angelika (2015): ''Investigation of Word Senses over Time using Linguistic Corpora'' In: Matousek, Vaclav et al. (Hrsg.): Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer.<br />
<br />
* Paper auf der Internationalen Fachtagung [https://elex.link/elex2015/ ''eLexicography 2015'']: Lemnitzer, Lothar; Pölitz, Christian; Didakowski, Jörg; Geyken, Alexander (2015): ''A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries''In: Kosem, Iztok et al. (Hrsg.):'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.<br />
<br />
* Paper auf der Internationalen Fachtagung [https://elex.link/elex2015/ ''eLexicography 2015'']: Geyken, Alexander; Pölitz, Christian; Bartz, Thomas (2015): ''A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries'' In: Kosem, Tztok et al. (Hrsg): 'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.<br />
<br />
* Vortrag [http://clarin2015.informatik.uni-leipzig.de/program#Kobra Korpusbasierte Sprachanalyse mit CLARIN-D-Ressourcen: Anwendungsszenarien und Erfahrungen aus dem Projekt KobRA] auf dem CLARIN-D Workshop ''Fächerübergreifende Perspektiven durch digitale Forschungsinfrastrukturen'' am 30.6/1.7. in Leipzig.<br />
<br />
*Posterpräsentation ''Erprobung innovativer Data-Mining-Verfahren für die empirische Arbeit mit strukturierten Sprachressourcen''. (Thomas Bartz, Christian Pölitz, Angelika Storrer). [https://de.dariah.eu/dhsummit2015 auf dem Digital Humanities Summit], Berlin, 3./4. März 2015<br />
<br />
----<br />
<br />
Überblick über weitere Konferenzbeiträge und Projekt-Workshops: '''[[Aktivitäten]]'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left"<br />
|-<br />
! <big>Veröffentlichungen</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
*Bartz,Thomas; Pölitz, Christian; Morik, Katharina; Storrer, Angelika (2015): '''Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research'''. In: Jan Odijk (Ed): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=116;article=001 Selected Papers from the CLARIN 2014 Conference], October 24-25, 2014, Soesterberg, The Netherlands, 1-13.<br />
<br />
*Bingel, Joachim; Diewald, Nils (2015): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=111;article=001 '''KoralQuery – a General Corpus Query Protocol''']. In: Proceedings of the Workshop on Innovative Corpus Query and Visualization Tools at NODALIDA 2015, Vilnius, Lithuania, May 11-13, 2015. <br />
<br />
*Diewald,Nild; Bingel, Joachim (2015): [http://KorAP.github.io/Koral '''KoralQuery 0.3. Technical Report, Working draft''']. IDS, Mannheim, Germany. <br />
<br />
*Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): '''Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods.''' In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. [http://www.uni-hildesheim.de/konvens2014/data/konvens2014-workshop-proceedings.pdf Proceedings-Band als PDF]<br />
<br />
*Thomas Bartz, Michael Beißwenger, Christian Pölitz, Nadja Radtke & Angelika Storrer (2014): '''Neue Möglichkeiten der Arbeit mit strukturierten Sprachressourcen in den Digital Humanities mithilfe von Data-Mining.''' [http://dharchive.org/paper/DH2014/Poster-894.xml Online Proceedings of the Digital Humanities 2014 annual international conference of the Alliance of Digital Humanities Organizations], Universität Lausanne, 10. Juli 2014<br />
<br />
*Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael (2014): '''Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014.''' Technischer Bericht, Technische Universität Dortmund. [[Media: KobRA-MS2_Verfahren.pdf|Online-Veröffentlichung (PDF)]]<br />
<br />
*Didakowski, Jörg; Radtke, Nadja (2014): '''Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. ''' In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. [http://euralex2014.eurac.edu/en/callforpapers/Documents/EURALEX%202014_gesamt.pdf Online-Veröffentlichung (PDF)]<br />
<br />
----<br />
<br />
Überblick über weitere Veröffentlichungen mit Projektbezug: '''[[Publikationen]]'''<br />
|}</div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Hauptseite&diff=820Hauptseite2015-10-02T07:14:25Z<p>Storrer: </p>
<hr />
<div>{| class="wikitable" width="99%"<br />
|-<br />
! <big> Herzlich willkommen </big><br />
|- <br />
| style="background:#ffffff; padding:1em" | <br />
[[Datei:Kwic-kobra-2geo.png|links]] [[Datei:KobRA-RM.png|rechts]] '''KobRA&nbsp;(Korpus-basierte Recherche und Analyse mit Hilfe von Data-Mining)''' ist ein Verbundprojekt, das seit September 2012 vom [http://www.bmbf.de Bundesministerium für Bildung und Forschung (BMBF)] im Rahmen des '''[http://www.bmbf.de/foerderungen/16466.php Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities]''' gefördert wird (Förderkennzeichen: 01UG1245A).<br />
<br />
'''Ziel des Projektes ist es, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern.''' Strukturierte Sprachressourcen (annotierte Textkorpora, Baumbanken, Wortnetze) bieten neuartige und attraktive Möglichkeiten, linguistische Fragestellungen an authentischen Sprachverwendungsdaten zu untersuchen und quantitativ auszuwerten. <br />
<br />
Koordinatorin des Projekts ist [http://germanistik.uni-mannheim.de/abteilungen/germanistische_linguistik/prof_dr_angelika_storrer/index.html Prof. Dr. Angelika Storrer (Universität Mannheim)].<br />
<br />
<br />
<span style= "color:#FF0000;">'''AKTUELL:'''</span><br />
Auf der '''Fachtagung ''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften''''' am '''30.10.2015''' an der Berlin Brandenburgischen Akademie der Wissenschaften (BBAW) in Berlin informieren wir über die Ergebnisse unseres Projekts. <br />
<br />
'''Anmeldung bis zum 25.10.2015''' unter kobra@dwds.de. Die Teilnahme ist kostenfrei, alle Interessierten sind herzlich eingeladen.<br />
<br />
<br />
<div style="clear: left"></div> Auf diesen Seiten bieten wir einen Überblick und detailliertere Informationen über:<br />
* '''[[Projektbeschreibung|die Ziele, Fragestellungen und Methoden des Projekts]]'''<br />
* '''[[Team|die beteiligten Personen und Forschungseinrichtungen]]'''<br />
* '''[[Fallstudien|die Fallstudien des Projekts]]'''<br />
* '''sowie über Aktivitäten und aktuelle Veröffentlichungen (s.u.).'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left; margin-right:1em"<br />
|-<br />
! <big>Aktivitäten</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
*[[Fachtagung 30.10.2015|Fachtagung ''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften'']] am 30.10.2015 an der BBAW. Die Teilnahme ist kostenfrei, Anmeldung bis zum '''25.10.2015''' unter kobra@dwds.de.<br />
<br />
* Vortrag ''A Data Mining Environment for Linguistic Research Based on CLARIN-D Language Resources'' (Katharina Morik, Thomas Bartz, Christian Pölitz, Angelika Storrer) auf der [http://dch2015.net/abstracts_submission.shtml ''DCH2015 - Interdisciplinary Conference on Digital Cultural Heritage''] am 28.-30. Oktober 2015 in Berlin.<br />
<br />
* Paper auf der Internationalen Fachtagung [http://www.kiv.zcu.cz/tsd2015/ ''Text, Speech and Dialogue'']: Pölitz, Christian; Bartz, Thomas; Morik, Katharina; Storrer, Angelika (2015): ''Investigation of Word Senses over Time using Linguistic Corpora'' In: Matousek, Vaclav et al. (Hrsg.): Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer.<br />
<br />
* Paper auf der Internationalen Fachtagung [https://elex.link/elex2015/ ''eLexicography 2015'']: Lemnitzer, Lothar; Pölitz, Christian; Didakowski, Jörg; Geyken, Alexander (2015): ''A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries''In: Kosem, Iztok et al. (Hrsg.):'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.<br />
<br />
* Paper auf der Internationalen Fachtagung [https://elex.link/elex2015/ ''eLexicography 2015'']: Geyken, Alexander; Pölitz, Christian; Bartz, Thomas (2015): ''A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries'' In: Kosem, Tztok et al. (Hrsg): 'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.<br />
<br />
* Vortrag [http://clarin2015.informatik.uni-leipzig.de/program#Kobra Korpusbasierte Sprachanalyse mit CLARIN-D-Ressourcen: Anwendungsszenarien und Erfahrungen aus dem Projekt KobRA] auf dem CLARIN-D Workshop ''Fächerübergreifende Perspektiven durch digitale Forschungsinfrastrukturen'' am 30.6/1.7. in Leipzig.<br />
<br />
*Posterpräsentation ''Erprobung innovativer Data-Mining-Verfahren für die empirische Arbeit mit strukturierten Sprachressourcen''. (Thomas Bartz, Christian Pölitz, Angelika Storrer). [https://de.dariah.eu/dhsummit2015 auf dem Digital Humanities Summit], Berlin, 3./4. März 2015<br />
<br />
----<br />
<br />
Überblick über weitere Konferenzbeiträge und Projekt-Workshops: '''[[Aktivitäten]]'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left"<br />
|-<br />
! <big>Veröffentlichungen</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
*Bartz,Thomas; Pölitz, Christian; Morik, Katharina; Storrer, Angelika (2015): '''Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research'''. In: Jan Odijk (Ed): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=116;article=001 Selected Papers from the CLARIN 2014 Conference], October 24-25, 2014, Soesterberg, The Netherlands, 1-13.<br />
<br />
*Bingel, Joachim; Diewald, Nils (2015): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=111;article=001 '''KoralQuery – a General Corpus Query Protocol''']. In: Proceedings of the Workshop on Innovative Corpus Query and Visualization Tools at NODALIDA 2015, Vilnius, Lithuania, May 11-13, 2015. <br />
<br />
*Diewald,Nild; Bingel, Joachim (2015): [http://KorAP.github.io/Koral '''KoralQuery 0.3. Technical Report, Working draft''']. IDS, Mannheim, Germany. <br />
<br />
*Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): '''Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods.''' In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. [http://www.uni-hildesheim.de/konvens2014/data/konvens2014-workshop-proceedings.pdf Proceedings-Band als PDF]<br />
<br />
*Thomas Bartz, Michael Beißwenger, Christian Pölitz, Nadja Radtke & Angelika Storrer (2014): '''Neue Möglichkeiten der Arbeit mit strukturierten Sprachressourcen in den Digital Humanities mithilfe von Data-Mining.''' [http://dharchive.org/paper/DH2014/Poster-894.xml Online Proceedings of the Digital Humanities 2014 annual international conference of the Alliance of Digital Humanities Organizations], Universität Lausanne, 10. Juli 2014<br />
<br />
*Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael (2014): '''Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014.''' Technischer Bericht, Technische Universität Dortmund. [[Media: KobRA-MS2_Verfahren.pdf|Online-Veröffentlichung (PDF)]]<br />
<br />
*Didakowski, Jörg; Radtke, Nadja (2014): '''Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. ''' In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. [http://euralex2014.eurac.edu/en/callforpapers/Documents/EURALEX%202014_gesamt.pdf Online-Veröffentlichung (PDF)]<br />
<br />
----<br />
<br />
Überblick über weitere Veröffentlichungen mit Projektbezug: '''[[Publikationen]]'''<br />
|}</div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Fachtagung_30.10.2015&diff=819Fachtagung 30.10.20152015-10-02T07:13:01Z<p>Storrer: </p>
<hr />
<div>Fachtagung ''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften''<br />
<br />
Ort: [http://www.bbaw.de/veranstaltungen/2015/oktober/datamining Berlin-Brandenburgische Akademie der Wissenschaften (BBAW)] Einsteinsaal.<br />
Termin: 30. Oktober 2015 9:30 - 19:00 Uhr<br />
<br />
Auf dieser Fachtagung stellt das BMBF-Verbundprojekt KobRA (Korpus-basierte Recherche und Analyse) ihre Ergebnisse vor und diskutiert weiterführende Perspektive mit Anwendern und der interessierten Öffentlichkeit. <br />
<br />
Die Teilnahme ist kostenlos. Anmeldung bis zum 25.10.15 unter: kobra@dwds.de.<br />
<br />
'''Tagungsprogramm'''<br />
<table border="1"><br />
<tr><br />
<td> 9:30-9:40 </td><br />
<td> ''Begrüßung und Eröffnung''</td><br />
</tr><br />
<tr><br />
<td> 9:40-10:05 </td><br />
<td> ''Korpusbasierte Recherche und Analyse mit Hilfe von Data-Mining: Das BMBF-Projekt KobRA'' (Angelika Storrer, Universität Mannheim)</td><br />
</tr><br />
<tr><br />
<td> 10:05-10:30 </td><br />
<td> ''RapidMiner als Werkzeug für die textorientierten Geisteswissenschaften'' (Katharina Morik, TU Dortmund)</td><br />
</tr><br />
<tr><br />
<td>10:30-11:00</td><br />
<td>Kaffeepause</td><br />
</tr><br />
<tr><br />
<td>11:00-11:30</td><br />
<td>''Routineaufgaben bei der Nutzung von Korpora: Disambiguieren, Klassifizieren, Annotieren mit KobRA-Verfahren'' (Thomas Bartz, TU Dortmund</td><br />
</tr><br />
<tr><br />
<td>11:30-12:00</td><br />
<td>''Extraktion guter Belege aus Textkorpora durch Kombination eines regelbasierten Verfahrens mit maschinellem Lernen'' (Alexander Geyken/ Lothar Lemnitzer, BBAW)</td><br />
</tr><br />
<tr><br />
<td>12:00-12:30</td><br />
<td>''Analyse von sozialen Medien und internetbasierter Kommunikation'' (Michael Beißwenger, TU Dortmund/Harald Lüngen, IDS)</td><br />
</tr><br />
<tr><br />
<td>12:30-14:00</td><br />
<td>Mittagspause</td><br />
</tr><br />
<tr><br />
<td>14:00-14:25</td><br />
<td>''Neue Entwicklungen und Wege bei der Erstellung, Erweiterung und Nutzung von Korpora am Zentrum Sprache'' (Alexander Geyken/Bryan Jurish/Kay Michael Würzner, BBAW)</td><br />
</tr><br />
<tr><br />
<td>14:25-14:50</td><br />
<td>''Schnittstellen zur Nutzung der Korpusanalyseplattform KorAP'' (Nils Diewald/Marc Kupietz, BBAW) </td><br />
</tr><br />
<tr><br />
<td>14:50-15:15</td><br />
<td>''WebLicht Integration'' (Erhard Hinrichs/Marie Hinrichs, SfS Universität Tübingen)</td><br />
</tr><br />
<tr><br />
<td>15:15-15:30</td><br />
<td>Kaffeepause</td><br />
</tr><br />
<tr><br />
<td>15:30-16:50</td><br />
<td>Postersession und Systemdemonstrationen (Stand 1.10.)<br />
*Thomas Bartz/Michael Beißwenger/Angelika Storrer et al.: ''Aufbau von Social-Media-Korpora für die Digital Humanities: Standards und Perspektiven''<br /><br />
*Michael Beißwenger/Christian Pölitz/Lena Meyer: ''KobRA @ Classroom: Ein interdisziplinäres Projektseminar zum Einsatz von Data-Mining bei der korpusgestützten Analyse internetbasierter Kommunikation''<br /><br />
*Sebastian Buschjäger/Lukas Pfahler: ''Discovering Subtle Word Relations in Large German Corpora''<br /> <br />
*Niels Diewald/Marc Kupietz: KorAP (Poster + Systemdemonstration) <br /><br />
*Erhard Hinrichs/Marie Hinrichs: Demo WebLicht (Systemdemonstration)<br /><br />
*Christian Pölitz ''RapidMiner als Werkzeug für die korpusbasierte Sprachanalyse'' (Systemdemonstration)<br /><br />
</td><br />
</tr><br />
<tr><br />
<td>17:00-18:30</td><br />
<td>Podiumsdiskussion: ''Digitale Textkorpora in den Geisteswissenschaften: Standortbestimmung und Perspektiven''. <br />
Moderation: Angelika Storrer<br />
</td><br />
</tr><br />
</table></div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Fachtagung_30.10.2015&diff=818Fachtagung 30.10.20152015-10-02T07:11:56Z<p>Storrer: </p>
<hr />
<div>Fachtagung ''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften''<br />
<br />
Ort: [http://www.bbaw.de/veranstaltungen/2015/oktober/datamining Berlin-Brandenburgische Akademie der Wissenschaften (BBAW)] Einsteinsaal.<br />
<br />
Auf dieser Fachtagung stellt das BMBF-Verbundprojekt KobRA (Korpus-basierte Recherche und Analyse) ihre Ergebnisse vor und diskutiert weiterführende Perspektive mit Anwendern und der interessierten Öffentlichkeit. <br />
<br />
Die Teilnahme ist kostenlos. Anmeldung bis zum 25.10.15 unter: kobra@dwds.de.<br />
<br />
'''Tagungsprogramm'''<br />
<table border="1"><br />
<tr><br />
<td> 9:30-9:40 </td><br />
<td> ''Begrüßung und Eröffnung''</td><br />
</tr><br />
<tr><br />
<td> 9:40-10:05 </td><br />
<td> ''Korpusbasierte Recherche und Analyse mit Hilfe von Data-Mining: Das BMBF-Projekt KobRA'' (Angelika Storrer, Universität Mannheim)</td><br />
</tr><br />
<tr><br />
<td> 10:05-10:30 </td><br />
<td> ''RapidMiner als Werkzeug für die textorientierten Geisteswissenschaften'' (Katharina Morik, TU Dortmund)</td><br />
</tr><br />
<tr><br />
<td>10:30-11:00</td><br />
<td>Kaffeepause</td><br />
</tr><br />
<tr><br />
<td>11:00-11:30</td><br />
<td>''Routineaufgaben bei der Nutzung von Korpora: Disambiguieren, Klassifizieren, Annotieren mit KobRA-Verfahren'' (Thomas Bartz, TU Dortmund</td><br />
</tr><br />
<tr><br />
<td>11:30-12:00</td><br />
<td>''Extraktion guter Belege aus Textkorpora durch Kombination eines regelbasierten Verfahrens mit maschinellem Lernen'' (Alexander Geyken/ Lothar Lemnitzer, BBAW)</td><br />
</tr><br />
<tr><br />
<td>12:00-12:30</td><br />
<td>''Analyse von sozialen Medien und internetbasierter Kommunikation'' (Michael Beißwenger, TU Dortmund/Harald Lüngen, IDS)</td><br />
</tr><br />
<tr><br />
<td>12:30-14:00</td><br />
<td>Mittagspause</td><br />
</tr><br />
<tr><br />
<td>14:00-14:25</td><br />
<td>''Neue Entwicklungen und Wege bei der Erstellung, Erweiterung und Nutzung von Korpora am Zentrum Sprache'' (Alexander Geyken/Bryan Jurish/Kay Michael Würzner, BBAW)</td><br />
</tr><br />
<tr><br />
<td>14:25-14:50</td><br />
<td>''Schnittstellen zur Nutzung der Korpusanalyseplattform KorAP'' (Nils Diewald/Marc Kupietz, BBAW) </td><br />
</tr><br />
<tr><br />
<td>14:50-15:15</td><br />
<td>''WebLicht Integration'' (Erhard Hinrichs/Marie Hinrichs, SfS Universität Tübingen)</td><br />
</tr><br />
<tr><br />
<td>15:15-15:30</td><br />
<td>Kaffeepause</td><br />
</tr><br />
<tr><br />
<td>15:30-16:50</td><br />
<td>Postersession und Systemdemonstrationen (Stand 1.10.)<br />
*Thomas Bartz/Michael Beißwenger/Angelika Storrer et al.: ''Aufbau von Social-Media-Korpora für die Digital Humanities: Standards und Perspektiven''<br /><br />
*Michael Beißwenger/Christian Pölitz/Lena Meyer: ''KobRA @ Classroom: Ein interdisziplinäres Projektseminar zum Einsatz von Data-Mining bei der korpusgestützten Analyse internetbasierter Kommunikation''<br /><br />
*Sebastian Buschjäger/Lukas Pfahler: ''Discovering Subtle Word Relations in Large German Corpora''<br /> <br />
*Niels Diewald/Marc Kupietz: KorAP (Poster + Systemdemonstration) <br /><br />
*Erhard Hinrichs/Marie Hinrichs: Demo WebLicht (Systemdemonstration)<br /><br />
*Christian Pölitz ''RapidMiner als Werkzeug für die korpusbasierte Sprachanalyse'' (Systemdemonstration)<br /><br />
</td><br />
</tr><br />
<tr><br />
<td>17:00-18:30</td><br />
<td>Podiumsdiskussion: ''Digitale Textkorpora in den Geisteswissenschaften: Standortbestimmung und Perspektiven''. <br />
Moderation: Angelika Storrer<br />
</td><br />
</tr><br />
</table></div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Fachtagung_30.10.2015&diff=817Fachtagung 30.10.20152015-10-02T07:06:22Z<p>Storrer: </p>
<hr />
<div>Fachtagung ''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften''<br />
<br />
Ort: Berlin-Brandenburgische Akademie der Wissenschaften (BBAW) Einsteinsaal.<br />
<br />
Auf dieser Fachtagung stellt das BMBF-Verbundprojekt KobRA (Korpus-basierte Recherche und Analyse) ihre Ergebnisse vor und diskutiert weiterführende Perspektive mit Anwendern und der interessierten Öffentlichkeit. <br />
<br />
Die Teilnahme ist kostenlos. Anmeldung bis zum 25.10.15 unter: kobra@dwds.de.<br />
<br />
'''Tagungsprogramm'''<br />
<table border="1"><br />
<tr><br />
<td> 9:30-9:40 </td><br />
<td> ''Begrüßung und Eröffnung''</td><br />
</tr><br />
<tr><br />
<td> 9:40-10:05 </td><br />
<td> ''Korpusbasierte Recherche und Analyse mit Hilfe von Data-Mining: Das BMBF-Projekt KobRA'' (Angelika Storrer, Universität Mannheim)</td><br />
</tr><br />
<tr><br />
<td> 10:05-10:30 </td><br />
<td> ''RapidMiner als Werkzeug für die textorientierten Geisteswissenschaften'' (Katharina Morik, TU Dortmund)</td><br />
</tr><br />
<tr><br />
<td>10:30-11:00</td><br />
<td>Kaffeepause</td><br />
</tr><br />
<tr><br />
<td>11:00-11:30</td><br />
<td>''Routineaufgaben bei der Nutzung von Korpora: Disambiguieren, Klassifizieren, Annotieren mit KobRA-Verfahren'' (Thomas Bartz, TU Dortmund</td><br />
</tr><br />
<tr><br />
<td>11:30-12:00</td><br />
<td>''Extraktion guter Belege aus Textkorpora durch Kombination eines regelbasierten Verfahrens mit maschinellem Lernen'' (Alexander Geyken/ Lothar Lemnitzer, BBAW)</td><br />
</tr><br />
<tr><br />
<td>12:00-12:30</td><br />
<td>''Analyse von sozialen Medien und internetbasierter Kommunikation'' (Michael Beißwenger, TU Dortmund/Harald Lüngen, IDS)</td><br />
</tr><br />
<tr><br />
<td>12:30-14:00</td><br />
<td>Mittagspause</td><br />
</tr><br />
<tr><br />
<td>14:00-14:25</td><br />
<td>''Neue Entwicklungen und Wege bei der Erstellung, Erweiterung und Nutzung von Korpora am Zentrum Sprache'' (Alexander Geyken/Bryan Jurish/Kay Michael Würzner, BBAW)</td><br />
</tr><br />
<tr><br />
<td>14:25-14:50</td><br />
<td>''Schnittstellen zur Nutzung der Korpusanalyseplattform KorAP'' (Nils Diewald/Marc Kupietz, BBAW) </td><br />
</tr><br />
<tr><br />
<td>14:50-15:15</td><br />
<td>''WebLicht Integration'' (Erhard Hinrichs/Marie Hinrichs, SfS Universität Tübingen)</td><br />
</tr><br />
<tr><br />
<td>15:15-15:30</td><br />
<td>Kaffeepause</td><br />
</tr><br />
<tr><br />
<td>15:30-16:50</td><br />
<td>Postersession und Systemdemonstrationen (Stand 1.10.)<br />
*Thomas Bartz/Michael Beißwenger/Angelika Storrer et al.: ''Aufbau von Social-Media-Korpora für die Digital Humanities: Standards und Perspektiven''<br /><br />
*Michael Beißwenger/Christian Pölitz/Lena Meyer: ''KobRA @ Classroom: Ein interdisziplinäres Projektseminar zum Einsatz von Data-Mining bei der korpusgestützten Analyse internetbasierter Kommunikation''<br /><br />
*Sebastian Buschjäger/Lukas Pfahler: ''Discovering Subtle Word Relations in Large German Corpora''<br /> <br />
*Niels Diewald/Marc Kupietz: KorAP (Poster + Systemdemonstration) <br /><br />
*Erhard Hinrichs/Marie Hinrichs: Demo WebLicht (Systemdemonstration)<br /><br />
*Christian Pölitz ''RapidMiner als Werkzeug für die korpusbasierte Sprachanalyse'' (Systemdemonstration)<br /><br />
</td><br />
</tr><br />
<tr><br />
<td>17:00-18:30</td><br />
<td>Podiumsdiskussion: ''Digitale Textkorpora in den Geisteswissenschaften: Standortbestimmung und Perspektiven''. <br />
Moderation: Angelika Storrer<br />
</td><br />
</tr><br />
</table></div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Fachtagung_30.10.2015&diff=816Fachtagung 30.10.20152015-10-02T07:05:17Z<p>Storrer: </p>
<hr />
<div>Fachtagung ''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften''<br />
<br />
Auf dieser Fachtagung stellt das BMBF-Verbundprojekt KobRA (Korpus-basierte Recherche und Analyse) ihre Ergebnisse vor und diskutiert weiterführende Perspektive mit Anwendern und der interessierten Öffentlichkeit. <br />
<br />
Die Teilnahme ist kostenlos. Anmeldung bis zum 25.10.15 unter: kobra@dwds.de.<br />
<br />
'''Tagungsprogramm'''<br />
<table border="1"><br />
<tr><br />
<td> 9:30-9:40 </td><br />
<td> ''Begrüßung und Eröffnung''</td><br />
</tr><br />
<tr><br />
<td> 9:40-10:05 </td><br />
<td> ''Korpusbasierte Recherche und Analyse mit Hilfe von Data-Mining: Das BMBF-Projekt KobRA'' (Angelika Storrer, Universität Mannheim)</td><br />
</tr><br />
<tr><br />
<td> 10:05-10:30 </td><br />
<td> ''RapidMiner als Werkzeug für die textorientierten Geisteswissenschaften'' (Katharina Morik, TU Dortmund)</td><br />
</tr><br />
<tr><br />
<td>10:30-11:00</td><br />
<td>Kaffeepause</td><br />
</tr><br />
<tr><br />
<td>11:00-11:30</td><br />
<td>''Routineaufgaben bei der Nutzung von Korpora: Disambiguieren, Klassifizieren, Annotieren mit KobRA-Verfahren'' (Thomas Bartz, TU Dortmund</td><br />
</tr><br />
<tr><br />
<td>11:30-12:00</td><br />
<td>''Extraktion guter Belege aus Textkorpora durch Kombination eines regelbasierten Verfahrens mit maschinellem Lernen'' (Alexander Geyken/ Lothar Lemnitzer, BBAW)</td><br />
</tr><br />
<tr><br />
<td>12:00-12:30</td><br />
<td>''Analyse von sozialen Medien und internetbasierter Kommunikation'' (Michael Beißwenger, TU Dortmund/Harald Lüngen, IDS)</td><br />
</tr><br />
<tr><br />
<td>12:30-14:00</td><br />
<td>Mittagspause</td><br />
</tr><br />
<tr><br />
<td>14:00-14:25</td><br />
<td>''Neue Entwicklungen und Wege bei der Erstellung, Erweiterung und Nutzung von Korpora am Zentrum Sprache'' (Alexander Geyken/Bryan Jurish/Kay Michael Würzner, BBAW)</td><br />
</tr><br />
<tr><br />
<td>14:25-14:50</td><br />
<td>''Schnittstellen zur Nutzung der Korpusanalyseplattform KorAP'' (Nils Diewald/Marc Kupietz, BBAW) </td><br />
</tr><br />
<tr><br />
<td>14:50-15:15</td><br />
<td>''WebLicht Integration'' (Erhard Hinrichs/Marie Hinrichs, SfS Universität Tübingen)</td><br />
</tr><br />
<tr><br />
<td>15:15-15:30</td><br />
<td>Kaffeepause</td><br />
</tr><br />
<tr><br />
<td>15:30-16:50</td><br />
<td>Postersession und Systemdemonstrationen (Stand 1.10.)<br />
*Thomas Bartz/Michael Beißwenger/Angelika Storrer et al.: ''Aufbau von Social-Media-Korpora für die Digital Humanities: Standards und Perspektiven''<br /><br />
*Michael Beißwenger/Christian Pölitz/Lena Meyer: ''KobRA @ Classroom: Ein interdisziplinäres Projektseminar zum Einsatz von Data-Mining bei der korpusgestützten Analyse internetbasierter Kommunikation''<br /><br />
*Sebastian Buschjäger/Lukas Pfahler: ''Discovering Subtle Word Relations in Large German Corpora''<br /> <br />
*Niels Diewald/Marc Kupietz: KorAP (Poster + Systemdemonstration) <br /><br />
*Erhard Hinrichs/Marie Hinrichs: Demo WebLicht (Systemdemonstration)<br /><br />
*Christian Pölitz ''RapidMiner als Werkzeug für die korpusbasierte Sprachanalyse'' (Systemdemonstration)<br /><br />
</td><br />
</tr><br />
<tr><br />
<td>17:00-18:30</td><br />
<td>Podiumsdiskussion: ''Digitale Textkorpora in den Geisteswissenschaften: Standortbestimmung und Perspektiven''. <br />
Moderation: Angelika Storrer<br />
</td><br />
</tr><br />
</table></div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Fachtagung_30.10.2015&diff=815Fachtagung 30.10.20152015-10-02T06:58:35Z<p>Storrer: </p>
<hr />
<div>Fachtagung ''Neue Wege in der Nutzung von Korpora: Data-Mining für die textorientierten Geisteswissenschaften''<br />
<br />
Auf dieser Fachtagung stellt das BMBF-Verbundprojekt KobRA (Korpus-basierte Recherche und Analyse) ihre Ergebnisse vor und diskutiert weiterführende Perspektive mit Anwendern und der interessierten Öffentlichkeit. <br />
<br />
Die Teilnahme ist kostenlos. Anmeldung bis zum 25.10.15 unter: kobra@dwds.de.<br />
<br />
'''Tagungsprogramm'''<br />
<table border="1"><br />
<tr><br />
<td> 9:30-9:40 </td><br />
<td> Begrüßung und Eröffnung</td><br />
</tr><br />
<tr><br />
<td> 9:40-10:05 </td><br />
<td> Korpusbasierte Recherche und Analyse mit Hilfe von Data-Mining: Das BMBF-Projekt KobRA (Angelika Storrer, Universität Mannheim)</td><br />
</tr><br />
<tr><br />
<td> 10:05-10:30 </td><br />
<td> RapidMiner als Werkzeug für die textorientierten Geisteswissenschaften (Katharina Morik, TU Dortmund)</td><br />
</tr><br />
<tr><br />
<td>10:30-11:00</td><br />
<td>Kaffeepause</td><br />
</tr><br />
<tr><br />
<td>11:00-11:30</td><br />
<td>''Routineaufgaben bei der Nutzung von Korpora: Disambiguieren, Klassifizieren, Annotieren mit KobRA-Verfahren'' (Thomas Bartz, TU Dortmund</td><br />
</tr><br />
<tr><br />
<td>11:30-12:00</td><br />
<td>''Extraktion guter Belege aus Textkorpora durch Kombination eines regelbasierten Verfahrens mit maschinellem Lernen'' (Alexander Geyken/ Lothar Lemnitzer, BBAW)</td><br />
</tr><br />
<tr><br />
<td>12:00-12:30</td><br />
<td>''Analyse von sozialen Medien und internetbasierter Kommunikation'' (Michael Beißwenger, TU Dortmund/Harald Lüngen, IDS)</td><br />
</tr><br />
<tr><br />
<td>12:30-14:00</td><br />
<td>Mittagspause</td><br />
</tr><br />
<tr><br />
<td>14:00-14:25</td><br />
<td>''Neue Entwicklungen und Wege bei der Erstellung, Erweiterung und Nutzung von Korpora am Zentrum Sprache'' (Alexander Geyken/Bryan Jurish/Kay Michael Würzner, BBAW)</td><br />
</tr><br />
<tr><br />
<td>14:25-14:50</td><br />
<td>''Schnittstellen zur Nutzung der Korpusanalyseplattform KorAP'' (Nils Diewald/Marc Kupietz, BBAW) </td><br />
</tr><br />
<tr><br />
<td>14:50-15:15</td><br />
<td>''WebLicht Integration'' (Erhard Hinrichs/Marie Hinrichs, SfS Universität Tübingen)</td><br />
</tr><br />
<tr><br />
<td>15:15-15:30</td><br />
<td>Kaffeepause</td><br />
</tr><br />
<tr><br />
<td>15:30-16:50</td><br />
<td>Postersession und Systemdemonstrationen (Stand: 22.09, wird laufend aktualisiert)<br />
#Christian Pölitz ''RapidMiner als Werkzeug für die korpusbasierte Sprachanalyse'' (Systemdemonstration)<br />
#Michael Beißwenger/Christian Pölitz/Lena Meyer: ''KobRA @ Classroom: Ein interdisziplinäres Projektseminar zum Einsatz von Data-Mining bei der korpusgestützten #Analyse internetbasierter Kommunikation'' (TU Dortmund, Germanistik)<br /><br />
Thomas Bartz/Michael Beißwenger/Angelika Storrer + IDS und BBAW: ''Aufbau von Social-Media-Korpora für die Digital Humanities: Standards und Perspektiven'' (TU Dortmund, Germanistik)<br /><br />
#Sebastian Buschjäger/Lukas Pfahler: ''Discovering Subtle Word Relations in Large German Corpora'' (TU Dortmund, Fachbereich Informatik)<br /> <br />
#Erhard Hinrichs/Marie Hinrichs: Demo WebLicht (SfS Tübingen)<br /><br />
#Niels Diewald/Marc Kupietz: KorAP (Poster + Systemdemonstration) (IDS Mannheim)<br /></td><br />
</tr><br />
<tr><br />
<td>17:00-18:30</td><br />
<td>Podiumsdiskussion: ''Digitale Textkorpora in den Geisteswissenschaften: Standortbestimmung und Perspektiven''. <br />
Moderation: Angelika Storrer<br />
</td><br />
</tr><br />
</table></div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Fachtagung_30.10.2015&diff=814Fachtagung 30.10.20152015-10-02T06:47:13Z<p>Storrer: Die Seite wurde neu angelegt: „ '''Tagungsprogramm''' <table border="1"> <tr> <td>9:30-9:40</td> <td>Begrüßung und Eröffnung</td> </tr> <tr> <td>9:40-10:05</td> <td>''Korpusbasierte Rech…“</p>
<hr />
<div><br />
<br />
'''Tagungsprogramm'''<br />
<table border="1"><br />
<tr><br />
<td>9:30-9:40</td><br />
<td>Begrüßung und Eröffnung</td><br />
</tr><br />
<tr><br />
<td>9:40-10:05</td><br />
<td>''Korpusbasierte Recherche und Analyse mit Hilfe von Data-Mining: Das BMBF-Projekt KobRA'' (Angelika Storrer, Universität Mannheim)</td><br />
</tr><br />
<tr><br />
<td>10:05-10:30</td><br />
<td>''RapidMiner als Werkzeug für die textorientierten Geisteswissenschaften'' (Katharina Morik, TU Dortmund)</td><br />
</tr><br />
<tr><br />
<td>10:30-11:00</td><br />
<td>Kaffeepause</td><br />
</tr><br />
<tr><br />
<td>11:00-11:30</td><br />
<td>''Routineaufgaben bei der Nutzung von Korpora: Disambiguieren, Klassifizieren, Annotieren mit KobRA-Verfahren'' (Thomas Bartz, TU Dortmund</td><br />
</tr><br />
<tr><br />
<td>11:30-12:00</td><br />
<td>''Extraktion guter Belege aus Textkorpora durch Kombination eines regelbasierten Verfahrens mit maschinellem Lernen'' (Alexander Geyken/ Lothar Lemnitzer, BBAW)</td><br />
</tr><br />
<tr><br />
<td>12:00-12:30</td><br />
<td>''Analyse von sozialen Medien und internetbasierter Kommunikation'' (Michael Beißwenger, TU Dortmund/Harald Lüngen, IDS)</td><br />
</tr><br />
<tr><br />
<td>12:30-14:00</td><br />
<td>Mittagspause</td><br />
</tr><br />
<tr><br />
<td>14:00-14:25</td><br />
<td>''Neue Entwicklungen und Wege bei der Erstellung, Erweiterung und Nutzung von Korpora am Zentrum Sprache'' (Alexander Geyken/Bryan Jurish/Kay Michael Würzner, BBAW)</td><br />
</tr><br />
<tr><br />
<td>14:25-14:50</td><br />
<td>''Schnittstellen zur Nutzung der Korpusanalyseplattform KorAP'' (Nils Diewald/Marc Kupietz, BBAW) </td><br />
</tr><br />
<tr><br />
<td>14:50-15:15</td><br />
<td>''WebLicht Integration'' (Erhard Hinrichs/Marie Hinrichs, SfS Universität Tübingen)</td><br />
</tr><br />
<tr><br />
<td>15:15-15:30</td><br />
<td>Kaffeepause</td><br />
</tr><br />
<tr><br />
<td>15:30-16:50</td><br />
<td>Postersession und Systemdemonstrationen (Stand: 22.09, wird laufend aktualisiert)<br />
1) Sebastian Buschjäger/Lukas Pfahler: ''Discovering Subtle Word Relations in Large German Corpora'' (TU Dortmund, Fachbereich Informatik)<br /> <br />
2) Michael Beißwenger/Christian Pölitz/Lena Meyer: ''KobRA @ Classroom: Ein interdisziplinäres Projektseminar zum Einsatz von Data-Mining bei der korpusgestützten Analyse internetbasierter Kommunikation'' (TU Dortmund, Germanistik)<br /><br />
3) Thomas Bartz/Michael Beißwenger/Angelika Storrer + IDS und BBAW: ''Aufbau von Social-Media-Korpora für die Digital Humanities: Standards und Perspektiven'' (TU Dortmund, Germanistik)<br /><br />
4) Erhard Hinrichs/Marie Hinrichs: Demo WebLicht (SfS Tübingen)<br /><br />
5) Niels Diewald/Marc Kupietz: KorAP (Poster + Systemdemonstration) (IDS Mannheim)<br /></td><br />
</tr><br />
<tr><br />
<td>17:00-18:30</td><br />
<td>Podiumsdiskussion: ''Digitale Textkorpora in den Geisteswissenschaften: Standortbestimmung und Perspektiven''. <br />
Moderation: Angelika Storrer<br />
</td><br />
</tr><br />
</table></div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Pr%C3%A4sentationen&diff=779Präsentationen2015-09-12T19:37:01Z<p>Storrer: </p>
<hr />
<div>__FORCETOC__<br />
<br />
===2015===<br />
<br />
*Angelika Storrer: [http://clarin2015.informatik.uni-leipzig.de/program#Kobra Korpusbasierte Sprachanalyse mit CLARIN-D-Ressourcen: Anwendungsszenarien und Erfahrungen aus dem Projekt KobRA]. CLARIN-D Workshop ''Fächerübergreifende Perspektiven durch digitale Forschungsinfrastrukturen'' am 30.6/1.7. in Leipzig.<br />
<br />
*Michael Beißwenger: '''Praktiken in der internetbasierten Kommunikation: Linguistische Modellierung und korpuslinguistische Perspektiven'''. [http://www.ids-mannheim.de/org/tagungen/tagung2015.html 51. Jahrestagung des Instituts für Deutsche Sprache], Congress Center Rosengarten Mannheim, 12. März 2015.<br />
<br />
*Thomas Bartz, Christian Poelitz & Angelika Storrer: '''Erprobung innovativer Data-Mining-Verfahren für die empirische Arbeit mit strukturierten Sprachressourcen'''. [https://de.dariah.eu/dhsummit2015 Posterpräsentation auf dem Digital Humanities Summit], Berlin, 3./4. März 2015<br />
<br />
===2014===<br />
<br />
*Michael Beißwenger: '''Repräsentation und linguistische Annotation von Korpora internetbasierter Kommunikation: Herausforderungen und Perspektiven'''. Goethe Universität Frankfurt, Fakultät für Informatik und Mathematik/[https://www.hucompute.org/calendar/7-talk/27 Text Technology Lab], 26. November 2014.<br />
<br />
*Thomas Bartz & Angelika Storrer: '''Visualisierung von Frequenzverteilungen im Anwendungsbereich Lexikographie.''' [http://www.visual-linguistics.net/symposium/index.html Herrenhäuser Symposium: Visuelle Linguistik. Theorie und Anwendung von Visualisierungen in der Sprachwissenschaft], Schloss Herrenhausen, Hannover, 20. November 2014<br />
<br />
*Lothar Lemnitzer & Michael Beißwenger: '''Deutsches Referenzkorpus zur internetbasierten Kommunikation: Fragen der Standardisierung und Datenerhebung'''. [http://www.deutschestextarchiv.de/veranstaltungen/DTAClarinDConf2014 2. DTA- und CLARIN-D-Konferenz: Textkorpora in Infrastrukturen für die Geistes- und Sozialwissenschaften], Berlin-Brandenburgische Akademie der Wissenschaften, 10. November 2014.<br />
<br />
*Thomas Bartz & Christian Pölitz: '''Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research.''' [https://www.clarin.eu/event/2014/clarin-annual-conference-2014-soesterberg-netherlands CLARIN Annual Conference 2014], Soesterberg, 25. Oktober 2014<br />
<br />
*Angelika Storrer: '''Was macht ein Wörterbuch zu einem guten Wörterbuch?''' [http://www.goethe.de/lhr/prj/d30/ver/dok/de13536332.htm Warum Wörterbücher für die Sprache wichtig sind.] Vortragsabend an der Berlin-Brandenburgischen Akademie der Wissenschaften im Rahmen der Initiative Deutsch 3.0, 15. Oktober 2014.<br />
<br />
*Michael Beißwenger, Harald Lüngen, Eliza Margaretha & Christian Pölitz: '''Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning'''. [https://sites.google.com/site/nlp4cmc/ Workshop "NLP4CMC: Natural Language Processing for Computer-Mediated Communication / Social Media"] @ [http://www.uni-hildesheim.de/konvens2014/ KONVENS - Konferenz zur Verarbeitung natürlicher Sprachen 2014], Stiftung Universität Hildesheim, 7. Oktober 2014.<br />
<br />
*Michael Beißwenger & Christian Pölitz: '''Analyzing CMC corpora using machine learning methods: Report from the KobRA project'''. [http://www.dariah.eu/activities/general-vcc-meetings/4th-general-vcc-meeting.html 4th General Virtual Competency Centre (VCC) meeting of DARIAH-EU], Rom, Università La Sapienza, 19. September 2014.<br />
<br />
*Michael Beißwenger, Thierry Chanier & Isabella Chiari: '''"Lightning Talk": Models and tools for structuring & annotating corpora of social media / computer-mediated communication'''. [http://www.dariah.eu/activities/general-vcc-meetings/4th-general-vcc-meeting.html 4th General Virtual Competency Centre (VCC) meeting of DARIAH-EU], Rom, Università La Sapienza, 18. September 2014.<br />
<br />
*Jörg Didakowski & Nadja Radtke: '''Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen.''' [http://euralex2014.eurac.edu/en/Pages/default.aspx XVI EURALEX International Congress (EURALEX 2014)], European Academy of Bolzano/Bozen (EURAC), 18. Juli 2014<br />
<br />
*Angelika Storrer: '''Qualität von Internet-Wörterbüchern: Themenfelder und Thesen zur Diskussion'''. [http://www1.ids-mannheim.de/fileadmin/lexik/elexiko/Workshop_Internetwoerterbuecher_EURALEX_2014.pdf Pre-Conference Workshop im Rahmen des EURALEX International Congress (EURALEX 2014)], European Academy of Bolzano/Bozen (EURAC), 14. Juli 2014.<br />
<br />
*Thomas Bartz, Michael Beißwenger, Christian Pölitz, Nadja Radtke & Angelika Storrer: '''Neue Möglichkeiten der Arbeit mit strukturierten Sprachressourcen in den Digital Humanities mithilfe von Data-Mining.''' [http://dharchive.org/paper/DH2014/Poster-894.xml Digital Humanities 2014 annual international conference of the Alliance of Digital Humanities Organizations], Universität Lausanne, 10. Juli 2014<br />
<br />
*Michael Beißwenger: '''Aufbau von Korpora internetbasierter Kommunikation: Herausforderungen, Projekte, Perspektiven.''' Technische Universität Berlin, Forschungskolloquium Allgemeine Linguistik, 8. Juli 2014.<br />
<br />
*Angelika Storrer: '''Digitale Wörterbücher und Schreibassistenzsysteme'''. [http://www.fif.tu-darmstadt.de/fif_formats_structure/fif_workshops_structure/fif_workshops_2014_structure/fif_workshop_text_as_a_workpiece_structure/index.de.jsp Text als Werkstück – Wege zu einer computergestützten Überarbeitung von deutschen Texten], Workshop im Rahmen der Initiative Deutsch 3.0., UKP Lab DIPF Frankfurt, 7. Juli 2014.<br />
<br />
*Christian Pölitz & Thomas Bartz: '''Enhancing the possibilities of corpus-based investigations: Word sense disambiguation on query results of large text corpora.''' [http://sighum.science.ru.nl/latech2014/ EACL 2014 Workshop zu: Language Technology for Cultural Heritage, Social Sciences, and Humanities], Chalmers University of Technology, Göteborg, 26. April 2014<br />
<br />
*Thomas Bartz, Alexander Geyken, Christian Pölitz, Achim Saupe & Angelika Storrer: '''Disambiguierung in Suchtrefferlisten aus großen Textkorpora: Anwendungsfelder und Perspektiven.''' [http://www.dhd2014.uni-passau.de/ Digital Humanities im deutschsprachigen Raum, Jahrestagung 2014], Universität Passau, 26. März 2014<br />
<br />
*Michael Beißwenger: '''Korpora zur internetbasierten Kommunikation.''' Ringvorlesung "Digitale Sprachressourcen in der Linguistik", Universität Mannheim, 12. März 2014<br />
<br />
*Michael Beißwenger: '''General Requirements and Issues in Defining a TEI Schema for the Representation of Computer-Mediated Communication'''. [http://www.empirikom.net/bin/view/Aktivitaeten/WebHome#A_42_34Social_Media_Corpora_for_the_eHumanities:_Standards_44_Challenges_44_and_Perspectives_34_40Siebte_Arbeitstagung_44_20._4521._Februar_2014_44_TU_Dortmund_41_42 7. Arbeitstagung des DFG-Netzwerks ''Empirikom'': Social Media Corpora for the eHumanities: Standards, Challenges, and Perspectives], TU Dortmund, 20. Februar 2014<br />
<br />
*Angelika Storrer: '''Was ist eigentlich der Standard? Varietätenlinguistische Überlegungen zur Einordnung von interaktionsorientierter Schriftlichkeit als 'non-standard', 'standardfern' etc.'''. [http://www.empirikom.net/bin/view/Aktivitaeten/WebHome#A_42_34Social_Media_Corpora_for_the_eHumanities:_Standards_44_Challenges_44_and_Perspectives_34_40Siebte_Arbeitstagung_44_20._4521._Februar_2014_44_TU_Dortmund_41_42 7. Arbeitstagung des DFG-Netzwerks ''Empirikom'': Social Media Corpora for the eHumanities: Standards, Challenges, and Perspectives], TU Dortmund, 21. Februar 2014<br />
<br />
*Thomas Bartz, Michael Beißwenger, Angelika Storrer & Swantje Westpfahl: '''Ein erweitertes STTS-Tagset für die POS-Annotation von Korpora gesprochener Sprache und von Korpora internetbasierter Kommunikation'''. [http://www.empirikom.net/bin/view/Aktivitaeten/WebHome#A_42_34Social_Media_Corpora_for_the_eHumanities:_Standards_44_Challenges_44_and_Perspectives_34_40Siebte_Arbeitstagung_44_20._4521._Februar_2014_44_TU_Dortmund_41_42 7. Arbeitstagung des DFG-Netzwerks ''Empirikom'': Social Media Corpora for the eHumanities: Standards, Challenges, and Perspectives], TU Dortmund, 21. Februar 2014<br />
<br />
*Michael Beißwenger, Sabine Bartsch, Stefan Evert & Kay-Michael Würzner: '''Vorbereitung einer Shared Task zur automatischen linguistischen Annotation von Sprachdaten aus Genres internetbasierter Kommunikation: Werkstattbericht'''. [http://www.empirikom.net/bin/view/Aktivitaeten/WebHome#A_42_34Social_Media_Corpora_for_the_eHumanities:_Standards_44_Challenges_44_and_Perspectives_34_40Siebte_Arbeitstagung_44_20._4521._Februar_2014_44_TU_Dortmund_41_42 7. Arbeitstagung des DFG-Netzwerks ''Empirikom'': Social Media Corpora for the eHumanities: Standards, Challenges, and Perspectives], TU Dortmund, 21. Februar 2014<br />
<br />
===2013===<br />
<br />
*Michael Beißwenger: '''Raum in der schriftlichen internetbasierten Kommunikation: Lokaldeixis in Chats und Wikipedia-Diskussionen.''' Vortrag beim [http://www.spur.uzh.ch/veranstaltungen/archive/workshops-dez2013.html Workshop des UFSP ''Sprache und Raum'': "Interaktion im virtuellen Raum - Raum in der virtuellen Interaktion]", Universität Zürich, 17. Dezember 2013<br />
<br />
*Thomas Bartz, Michael Beißwenger, Angelika Storrer & Swantje Westpfahl: '''Selbstständige interaktive Einheiten in Korpora gesprochener Sprache und in Korpora zu Genres internetbasierter Kommunikation'''. Vortrag auf dem [http://smokehead.linguistics.rub.de/stts/index.php/Programm_Hildesheim 3. Arbeitstreffen zum Stuttgart-Tübingen-Tagset (STTS)], Universität Hildesheim, 9. Dezember 2013, 9. Dezember 2013<br />
<br />
*Michael Beißwenger, Thierry Chanier, Isabella Chiari, Maria Ermakova, Maarten van Gompel, Iris Hendrickx, Axel Herold, Henk van den Heuvel & Angelika Storrer: '''Computer-mediated communication in TEI: What lies ahead.''' Panel and talk, [http://digilab2.let.uniroma1.it/teiconf2013/ The Linked TEI: Text Encoding in the Web. TEI Conference and Members Meeting 2013], Rom/Italien, 4. Oktober 2013<br />
<br />
*Michael Beißwenger: '''Modeling genres of computer-mediated communication in TEI: requirements and perspectives.''' 1st meeting of the TEI Special Interest Group (SIG) ''Computer-Mediated Communication''. [http://digilab2.let.uniroma1.it/teiconf2013/ The Linked TEI: Text Encoding in the Web. TEI Conference and Members Meeting 2013], Rom/Italien, 3. Oktober 2013<br />
<br />
*Christian Pölitz: '''Domain Adaptation in Corpus Linguistics'''. Vortrag im Rahmen des ''GSCL-Kaleidoskops'', [http://gscl2013.ukp.informatik.tu-darmstadt.de/ Internationale Konferenz der Gesellschaft für Sprachtechnologie und Computerlinguistik], TU Darmstadt, 27. September 2013<br />
<br />
*Thomas Bartz, Michael Beißwenger, Ines Rehbein, Thomas Schmidt, Angelika Storrer & Swantje Westpfahl: '''Modifikation und Erweiterung von STTS für die Annotation von Gesprächskorpora und von Korpora zu Genres internetbasierter Kommunikation'''. Vortrag im Rahmen des ''GSCL-Kaleidoskops'', [http://gscl2013.ukp.informatik.tu-darmstadt.de/ Internationale Konferenz der Gesellschaft für Sprachtechnologie und Computerlinguistik], TU Darmstadt, 27. September 2013<br />
<br />
*Sabine Bartsch, Michael Beißwenger, Stefan Evert & Kay-Michael Würzner: '''Vorbereitung einer Shared Task zur Verarbeitung von Sprachdaten aus Genres internetbasierter Kommunikation. Ein Arbeitsbericht aus dem DFG-Netzwerk Empirikom / Preparing a Shared Task on Linguistic Annotation of Computer-Mediated Communication'''. Vortrag und Posterpräsentation im Rahmen des ''GSCL-Kaleidoskops'', [http://gscl2013.ukp.informatik.tu-darmstadt.de/ Internationale Konferenz der Gesellschaft für Sprachtechnologie und Computerlinguistik], TU Darmstadt, 27. September 2013<br />
<br />
*Michael Beißwenger, Anke Lüdeling & Angelika Storrer: '''Verarbeitung und Annotation von Sprachdaten aus Genres internetbasierter Kommunikation: Herausforderungen & Perspektiven'''. Vortrag beim Workshop "[http://www.empirikom.net/bin/view/Aktivitaeten/GsclWorkshop Verarbeitung und Annotation von Sprachdaten aus Genres internetbasierter Kommunikation]" im Rahmen der [http://gscl2013.ukp.informatik.tu-darmstadt.de/ Internationalen Konferenz der Gesellschaft für Sprachtechnologie und Computerlinguistik], TU Darmstadt, 23. September 2013<br />
<br />
*Thomas Bartz, Nadja Radtke & Christian Pölitz: '''Bereinigen, Disambiguieren, Visualisieren: Möglichkeiten der Unterstützung der korpusbasierten Lexikographie durch Data-Mining-Verfahren.''' Sektion ''Lexikographie'' der [http://www.gal2013.ifaar.rwth-aachen.de 2. Sektionentagung der Gesellschaft für Angewandte Linguistik e.V.], RWTH Aachen, 20. September 2013<br />
<br />
*Thomas Bartz & Nadja Radtke: '''Nutzung deutschsprachiger Onlinekorpora im Unterricht.''' Ausgewählter Beitrag der Sektion ''Korpora im Sprachunterricht'' für die sektionsübergreifende Posterpräsentation "Agorá" im Rahmen der [http://www.idt-2013.it IDT 2013 - XV. Internationale Tagung der Deutschlehrerinnen und Deutschlehrer], Bozen/Italien, 30. Juli bis 3. August 2013<br />
<br />
*Thomas Bartz: '''Digitale Sprachressourcen im Deutschunterricht: Korpus-basierte Recherche und Analyse in der "Wörterbuchwerkstatt".''' Sektion ''Korpora im Sprachunterricht'' der [http://www.idt-2013.it IDT 2013 - XV. Internationale Tagung der Deutschlehrerinnen und Deutschlehrer], Bozen/Italien, 30. Juli 2013<br />
<br />
*Nadja Radtke: '''Konzeption und korpusbasierter Aufbau einer Wiki-Ressource zu deutschen Stützverbgefügen.''' Sektion ''Wortschatz und Phraseologie'' der [http://www.idt-2013.it IDT 2013 - XV. Internationale Tagung der Deutschlehrerinnen und Deutschlehrer], Bozen/Italien, 29. Juli 2013<br />
<br />
*Thomas Bartz, Michael Beißwenger & Angelika Storrer: '''STTS und internetbasierte Kommunikation: Herausforderungen und Lösungsvorschläge.''' CLARIN-D-Workshop "[http://www.sfs.uni-tuebingen.de/aktuelles/detail/stts-workshop.html Das STTS-Tagset für Wortartentagging: Stand und Perspektiven (Zweiter Workshop)]", Universität Tübingen, Seminar für Sprachwissenschaft, 6. Mai 2013<br />
<br />
*Thomas Bartz, Michael Beißwenger, Christian Pölitz, Nadja Radtke & Angelika Storrer: '''KobRA - Korpus-basierte linguistische Recherche und Analyse mit Hilfe von Data Mining.''' Posterpräsentation im Rahmen des Kickoff-Treffens der 24 BMBF-Projektverbünde im Bereich "eHumanities", Universität Leipzig, ([[Media:Kobra-poster-leipzig-final-2.pdf|PDF-Version]]) 8./9. April 2013<br />
<br />
*Michael Beißwenger, Stefanie Dipper, Stefan Evert & Bianka Trevisan: '''Introduction: Modelling Non-Standardized Writing / Modellierung nichtstandardisierter Schriftlichkeit.''' [http://www.sfb632.uni-potsdam.de/dgfs-2013/AG_10.html AG "Modellierung nicht-standardisierter Schriftlichkeit"] auf der Jahrestagung der Deutschen Gesellschaft für Sprachwissenschaft (DGfS), Universität Potsdam, 13. März 2013<br />
<br />
*Angelika Storrer: '''Sprachverfall durch internetbasierte Kommunikation? Linguistische Erklärungsansätze - empirische Befunde.''' [http://www.ids-mannheim.de/org/tagungen/tagung2013.html Jahrestagung 2013 des Instituts für deutsche Sprache IDS] zum Thema ''Sprachverfall? Dynamik – Wandel – Variation'', Mannheim, 13. März 2013<br />
<br />
*Michael Beißwenger, Maria Ermakova, Alexander Geyken, Lothar Lemnitzer & Angelika Storrer: '''DeRiK - Deutsches Referenzkorpus zur internetbasierten Kommunikation.'''<br/>Posterpräsentation, Projektmesse "Korpora geschriebener Sprache" im Rahmen der 49. Jahrestagung des Insituts für deutsche Sprache, Mannheim, 13. März 2013<br />
<br />
*Thomas Bartz & Angelika Storrer: '''Korpusbasierte Analyse internetbasierter Kommunikation: Phänomene und Herausforderungen.''' [http://www.sfb632.uni-potsdam.de/dgfs-2013/AG_10.html AG "Modellierung nicht-standardisierter Schriftlichkeit"] auf der Jahrestagung der Deutschen Gesellschaft für Sprachwissenschaft (DGfS), Universität Potsdam, 15. März 2013<br />
<br />
*Thomas Bartz, Michael Beißwenger & Angelika Storrer: '''Experiments with Tokenization and Part-of-speech Tagging for German CMC Discourse.''' International Workshop "[http://wiki.itmc.tu-dortmund.de/cmc/ Building Corpora of Computer-Mediated Communication: Issues, Challenges, and Perspectives]", TU Dortmund, 15. Februar 2013<br />
<br />
*Michael Beißwenger, Maria Ermakova, Alexander Geyken, Lothar Lemnitzer & Angelika Storrer: '''A TEI Schema for the Annotation of CMC Genres.''' International Workshop "[http://wiki.itmc.tu-dortmund.de/cmc/ Building Corpora of Computer-Mediated Communication: Issues, Challenges, and Perspectives]", TU Dortmund, 14. Februar 2013<br />
<br />
*Michael Beißwenger, Maria Ermakova, Alexander Geyken, Lothar Lemnitzer & Angelika Storrer: '''Building a Reference Corpus of German Computer-Mediated Communication: Introducing the DeRiK project.''' International Workshop "[http://wiki.itmc.tu-dortmund.de/cmc/ Building Corpora of Computer-Mediated Communication: Issues, Challenges, and Perspectives]", TU Dortmund, 14. Februar 2013<br />
<br />
===2012===<br />
<br />
*Michael Beißwenger & Angelika Storrer: '''Categories of Analysis for Computer-Mediated Discourse: The Case of ''Interaction Signs.''''' 4. Arbeitstagung des DFG-Netzwerks "Empirische Erforschung internetbasierter Kommunikation (Empirikom), RWTH Aachen, 8. November 2012<br />
<br />
*Angelika Storrer: '''Internet-Lexikographie: Produkte – Prozesse – Perspektiven.''' Vortrag im Rahmen des 7. Kolloquiums zur Lexikographie und Wörterbuchforschung "Print- und E-Wörterbücher im Vergleich: Konvergenzen, Divergenzen, Probleme, Perspektiven", Sofia, [http://www.studiger.tu-dortmund.de/images/Storrer-lexikographie-sofia.pdf Foliensatz zum Vortrag (PDF)] 22. Oktober 2012<br />
<br />
*Michael Beißwenger, Stefan Evert & Torsten Zesch: '''Gewinnung, Aufbereitung und Analyse von Korpora zu Genres internetbasierter Kommunikation: Herausforderungen und Perspektiven.''' GSCL-Workshop "Webkorpora in Computerlinguistik und Sprachforschung", Institut für deutsche Sprache, Mannheim, 28. September 2012<br />
<br />
*Michael Beißwenger & Lothar Lemnitzer: '''Aufbau und Annotation eines Referenzkorpus zur deutschsprachigen internetbasierten Kommunikation.''' GSCL-Workshop "Webkorpora in Computerlinguistik und Sprachforschung", Institut für deutsche Sprache, Mannheim, 28. September 2012<br />
<br />
*Thomas Bartz, Michael Beißwenger & Angelika Storrer: '''Überlegungen zur Modifikation und Erweiterung von STTS für das Tagging von Korpora zur internetbasierten Kommunikation.''' CLARIN-D-Workshop: [http://www.ims.uni-stuttgart.de/veranstaltungen/stts-workshop/ Das STTS-Tagset für Wortartentagging: Stand und Perspektiven], Universität Stuttgart, Institut für Maschinelle Sprachverarbeitung (IMS), 24. September 2012<br />
<br />
*Michael Beißwenger & Lothar Lemnitzer: '''Processing and Representing Computer-Mediated Discourse: An Open Issue in Corpus Linguistics.''' Workshop on Automatic Processing of Non-Standard Data Sources in Corpus-Based Research (NOSDAC), Universität zu Köln, 31. August 2012</div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Pr%C3%A4sentationen&diff=778Präsentationen2015-09-12T19:35:02Z<p>Storrer: </p>
<hr />
<div>__FORCETOC__<br />
<br />
===2015===<br />
<br />
*Angelika Storrer: '''Korpusbasierte Sprachanalyse mit CLARIN-D-Ressourcen: Anwendungsszenarien und Erfahrungen aus dem Projekt KobRA'''. CLARIN-D Workshop ''Fächerübergreifende Perspektiven durch digitale Forschungsinfrastrukturen'' am 30.6/1.7. in Leipzig.<br />
<br />
*Michael Beißwenger: '''Praktiken in der internetbasierten Kommunikation: Linguistische Modellierung und korpuslinguistische Perspektiven'''. [http://www.ids-mannheim.de/org/tagungen/tagung2015.html 51. Jahrestagung des Instituts für Deutsche Sprache], Congress Center Rosengarten Mannheim, 12. März 2015.<br />
<br />
*Thomas Bartz, Christian Poelitz & Angelika Storrer: '''Erprobung innovativer Data-Mining-Verfahren für die empirische Arbeit mit strukturierten Sprachressourcen'''. [https://de.dariah.eu/dhsummit2015 Posterpräsentation auf dem Digital Humanities Summit], Berlin, 3./4. März 2015<br />
<br />
===2014===<br />
<br />
*Michael Beißwenger: '''Repräsentation und linguistische Annotation von Korpora internetbasierter Kommunikation: Herausforderungen und Perspektiven'''. Goethe Universität Frankfurt, Fakultät für Informatik und Mathematik/[https://www.hucompute.org/calendar/7-talk/27 Text Technology Lab], 26. November 2014.<br />
<br />
*Thomas Bartz & Angelika Storrer: '''Visualisierung von Frequenzverteilungen im Anwendungsbereich Lexikographie.''' [http://www.visual-linguistics.net/symposium/index.html Herrenhäuser Symposium: Visuelle Linguistik. Theorie und Anwendung von Visualisierungen in der Sprachwissenschaft], Schloss Herrenhausen, Hannover, 20. November 2014<br />
<br />
*Lothar Lemnitzer & Michael Beißwenger: '''Deutsches Referenzkorpus zur internetbasierten Kommunikation: Fragen der Standardisierung und Datenerhebung'''. [http://www.deutschestextarchiv.de/veranstaltungen/DTAClarinDConf2014 2. DTA- und CLARIN-D-Konferenz: Textkorpora in Infrastrukturen für die Geistes- und Sozialwissenschaften], Berlin-Brandenburgische Akademie der Wissenschaften, 10. November 2014.<br />
<br />
*Thomas Bartz & Christian Pölitz: '''Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research.''' [https://www.clarin.eu/event/2014/clarin-annual-conference-2014-soesterberg-netherlands CLARIN Annual Conference 2014], Soesterberg, 25. Oktober 2014<br />
<br />
*Angelika Storrer: '''Was macht ein Wörterbuch zu einem guten Wörterbuch?''' [http://www.goethe.de/lhr/prj/d30/ver/dok/de13536332.htm Warum Wörterbücher für die Sprache wichtig sind.] Vortragsabend an der Berlin-Brandenburgischen Akademie der Wissenschaften im Rahmen der Initiative Deutsch 3.0, 15. Oktober 2014.<br />
<br />
*Michael Beißwenger, Harald Lüngen, Eliza Margaretha & Christian Pölitz: '''Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning'''. [https://sites.google.com/site/nlp4cmc/ Workshop "NLP4CMC: Natural Language Processing for Computer-Mediated Communication / Social Media"] @ [http://www.uni-hildesheim.de/konvens2014/ KONVENS - Konferenz zur Verarbeitung natürlicher Sprachen 2014], Stiftung Universität Hildesheim, 7. Oktober 2014.<br />
<br />
*Michael Beißwenger & Christian Pölitz: '''Analyzing CMC corpora using machine learning methods: Report from the KobRA project'''. [http://www.dariah.eu/activities/general-vcc-meetings/4th-general-vcc-meeting.html 4th General Virtual Competency Centre (VCC) meeting of DARIAH-EU], Rom, Università La Sapienza, 19. September 2014.<br />
<br />
*Michael Beißwenger, Thierry Chanier & Isabella Chiari: '''"Lightning Talk": Models and tools for structuring & annotating corpora of social media / computer-mediated communication'''. [http://www.dariah.eu/activities/general-vcc-meetings/4th-general-vcc-meeting.html 4th General Virtual Competency Centre (VCC) meeting of DARIAH-EU], Rom, Università La Sapienza, 18. September 2014.<br />
<br />
*Jörg Didakowski & Nadja Radtke: '''Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen.''' [http://euralex2014.eurac.edu/en/Pages/default.aspx XVI EURALEX International Congress (EURALEX 2014)], European Academy of Bolzano/Bozen (EURAC), 18. Juli 2014<br />
<br />
*Angelika Storrer: '''Qualität von Internet-Wörterbüchern: Themenfelder und Thesen zur Diskussion'''. [http://www1.ids-mannheim.de/fileadmin/lexik/elexiko/Workshop_Internetwoerterbuecher_EURALEX_2014.pdf Pre-Conference Workshop im Rahmen des EURALEX International Congress (EURALEX 2014)], European Academy of Bolzano/Bozen (EURAC), 14. Juli 2014.<br />
<br />
*Thomas Bartz, Michael Beißwenger, Christian Pölitz, Nadja Radtke & Angelika Storrer: '''Neue Möglichkeiten der Arbeit mit strukturierten Sprachressourcen in den Digital Humanities mithilfe von Data-Mining.''' [http://dharchive.org/paper/DH2014/Poster-894.xml Digital Humanities 2014 annual international conference of the Alliance of Digital Humanities Organizations], Universität Lausanne, 10. Juli 2014<br />
<br />
*Michael Beißwenger: '''Aufbau von Korpora internetbasierter Kommunikation: Herausforderungen, Projekte, Perspektiven.''' Technische Universität Berlin, Forschungskolloquium Allgemeine Linguistik, 8. Juli 2014.<br />
<br />
*Angelika Storrer: '''Digitale Wörterbücher und Schreibassistenzsysteme'''. [http://www.fif.tu-darmstadt.de/fif_formats_structure/fif_workshops_structure/fif_workshops_2014_structure/fif_workshop_text_as_a_workpiece_structure/index.de.jsp Text als Werkstück – Wege zu einer computergestützten Überarbeitung von deutschen Texten], Workshop im Rahmen der Initiative Deutsch 3.0., UKP Lab DIPF Frankfurt, 7. Juli 2014.<br />
<br />
*Christian Pölitz & Thomas Bartz: '''Enhancing the possibilities of corpus-based investigations: Word sense disambiguation on query results of large text corpora.''' [http://sighum.science.ru.nl/latech2014/ EACL 2014 Workshop zu: Language Technology for Cultural Heritage, Social Sciences, and Humanities], Chalmers University of Technology, Göteborg, 26. April 2014<br />
<br />
*Thomas Bartz, Alexander Geyken, Christian Pölitz, Achim Saupe & Angelika Storrer: '''Disambiguierung in Suchtrefferlisten aus großen Textkorpora: Anwendungsfelder und Perspektiven.''' [http://www.dhd2014.uni-passau.de/ Digital Humanities im deutschsprachigen Raum, Jahrestagung 2014], Universität Passau, 26. März 2014<br />
<br />
*Michael Beißwenger: '''Korpora zur internetbasierten Kommunikation.''' Ringvorlesung "Digitale Sprachressourcen in der Linguistik", Universität Mannheim, 12. März 2014<br />
<br />
*Michael Beißwenger: '''General Requirements and Issues in Defining a TEI Schema for the Representation of Computer-Mediated Communication'''. [http://www.empirikom.net/bin/view/Aktivitaeten/WebHome#A_42_34Social_Media_Corpora_for_the_eHumanities:_Standards_44_Challenges_44_and_Perspectives_34_40Siebte_Arbeitstagung_44_20._4521._Februar_2014_44_TU_Dortmund_41_42 7. Arbeitstagung des DFG-Netzwerks ''Empirikom'': Social Media Corpora for the eHumanities: Standards, Challenges, and Perspectives], TU Dortmund, 20. Februar 2014<br />
<br />
*Angelika Storrer: '''Was ist eigentlich der Standard? Varietätenlinguistische Überlegungen zur Einordnung von interaktionsorientierter Schriftlichkeit als 'non-standard', 'standardfern' etc.'''. [http://www.empirikom.net/bin/view/Aktivitaeten/WebHome#A_42_34Social_Media_Corpora_for_the_eHumanities:_Standards_44_Challenges_44_and_Perspectives_34_40Siebte_Arbeitstagung_44_20._4521._Februar_2014_44_TU_Dortmund_41_42 7. Arbeitstagung des DFG-Netzwerks ''Empirikom'': Social Media Corpora for the eHumanities: Standards, Challenges, and Perspectives], TU Dortmund, 21. Februar 2014<br />
<br />
*Thomas Bartz, Michael Beißwenger, Angelika Storrer & Swantje Westpfahl: '''Ein erweitertes STTS-Tagset für die POS-Annotation von Korpora gesprochener Sprache und von Korpora internetbasierter Kommunikation'''. [http://www.empirikom.net/bin/view/Aktivitaeten/WebHome#A_42_34Social_Media_Corpora_for_the_eHumanities:_Standards_44_Challenges_44_and_Perspectives_34_40Siebte_Arbeitstagung_44_20._4521._Februar_2014_44_TU_Dortmund_41_42 7. Arbeitstagung des DFG-Netzwerks ''Empirikom'': Social Media Corpora for the eHumanities: Standards, Challenges, and Perspectives], TU Dortmund, 21. Februar 2014<br />
<br />
*Michael Beißwenger, Sabine Bartsch, Stefan Evert & Kay-Michael Würzner: '''Vorbereitung einer Shared Task zur automatischen linguistischen Annotation von Sprachdaten aus Genres internetbasierter Kommunikation: Werkstattbericht'''. [http://www.empirikom.net/bin/view/Aktivitaeten/WebHome#A_42_34Social_Media_Corpora_for_the_eHumanities:_Standards_44_Challenges_44_and_Perspectives_34_40Siebte_Arbeitstagung_44_20._4521._Februar_2014_44_TU_Dortmund_41_42 7. Arbeitstagung des DFG-Netzwerks ''Empirikom'': Social Media Corpora for the eHumanities: Standards, Challenges, and Perspectives], TU Dortmund, 21. Februar 2014<br />
<br />
===2013===<br />
<br />
*Michael Beißwenger: '''Raum in der schriftlichen internetbasierten Kommunikation: Lokaldeixis in Chats und Wikipedia-Diskussionen.''' Vortrag beim [http://www.spur.uzh.ch/veranstaltungen/archive/workshops-dez2013.html Workshop des UFSP ''Sprache und Raum'': "Interaktion im virtuellen Raum - Raum in der virtuellen Interaktion]", Universität Zürich, 17. Dezember 2013<br />
<br />
*Thomas Bartz, Michael Beißwenger, Angelika Storrer & Swantje Westpfahl: '''Selbstständige interaktive Einheiten in Korpora gesprochener Sprache und in Korpora zu Genres internetbasierter Kommunikation'''. Vortrag auf dem [http://smokehead.linguistics.rub.de/stts/index.php/Programm_Hildesheim 3. Arbeitstreffen zum Stuttgart-Tübingen-Tagset (STTS)], Universität Hildesheim, 9. Dezember 2013, 9. Dezember 2013<br />
<br />
*Michael Beißwenger, Thierry Chanier, Isabella Chiari, Maria Ermakova, Maarten van Gompel, Iris Hendrickx, Axel Herold, Henk van den Heuvel & Angelika Storrer: '''Computer-mediated communication in TEI: What lies ahead.''' Panel and talk, [http://digilab2.let.uniroma1.it/teiconf2013/ The Linked TEI: Text Encoding in the Web. TEI Conference and Members Meeting 2013], Rom/Italien, 4. Oktober 2013<br />
<br />
*Michael Beißwenger: '''Modeling genres of computer-mediated communication in TEI: requirements and perspectives.''' 1st meeting of the TEI Special Interest Group (SIG) ''Computer-Mediated Communication''. [http://digilab2.let.uniroma1.it/teiconf2013/ The Linked TEI: Text Encoding in the Web. TEI Conference and Members Meeting 2013], Rom/Italien, 3. Oktober 2013<br />
<br />
*Christian Pölitz: '''Domain Adaptation in Corpus Linguistics'''. Vortrag im Rahmen des ''GSCL-Kaleidoskops'', [http://gscl2013.ukp.informatik.tu-darmstadt.de/ Internationale Konferenz der Gesellschaft für Sprachtechnologie und Computerlinguistik], TU Darmstadt, 27. September 2013<br />
<br />
*Thomas Bartz, Michael Beißwenger, Ines Rehbein, Thomas Schmidt, Angelika Storrer & Swantje Westpfahl: '''Modifikation und Erweiterung von STTS für die Annotation von Gesprächskorpora und von Korpora zu Genres internetbasierter Kommunikation'''. Vortrag im Rahmen des ''GSCL-Kaleidoskops'', [http://gscl2013.ukp.informatik.tu-darmstadt.de/ Internationale Konferenz der Gesellschaft für Sprachtechnologie und Computerlinguistik], TU Darmstadt, 27. September 2013<br />
<br />
*Sabine Bartsch, Michael Beißwenger, Stefan Evert & Kay-Michael Würzner: '''Vorbereitung einer Shared Task zur Verarbeitung von Sprachdaten aus Genres internetbasierter Kommunikation. Ein Arbeitsbericht aus dem DFG-Netzwerk Empirikom / Preparing a Shared Task on Linguistic Annotation of Computer-Mediated Communication'''. Vortrag und Posterpräsentation im Rahmen des ''GSCL-Kaleidoskops'', [http://gscl2013.ukp.informatik.tu-darmstadt.de/ Internationale Konferenz der Gesellschaft für Sprachtechnologie und Computerlinguistik], TU Darmstadt, 27. September 2013<br />
<br />
*Michael Beißwenger, Anke Lüdeling & Angelika Storrer: '''Verarbeitung und Annotation von Sprachdaten aus Genres internetbasierter Kommunikation: Herausforderungen & Perspektiven'''. Vortrag beim Workshop "[http://www.empirikom.net/bin/view/Aktivitaeten/GsclWorkshop Verarbeitung und Annotation von Sprachdaten aus Genres internetbasierter Kommunikation]" im Rahmen der [http://gscl2013.ukp.informatik.tu-darmstadt.de/ Internationalen Konferenz der Gesellschaft für Sprachtechnologie und Computerlinguistik], TU Darmstadt, 23. September 2013<br />
<br />
*Thomas Bartz, Nadja Radtke & Christian Pölitz: '''Bereinigen, Disambiguieren, Visualisieren: Möglichkeiten der Unterstützung der korpusbasierten Lexikographie durch Data-Mining-Verfahren.''' Sektion ''Lexikographie'' der [http://www.gal2013.ifaar.rwth-aachen.de 2. Sektionentagung der Gesellschaft für Angewandte Linguistik e.V.], RWTH Aachen, 20. September 2013<br />
<br />
*Thomas Bartz & Nadja Radtke: '''Nutzung deutschsprachiger Onlinekorpora im Unterricht.''' Ausgewählter Beitrag der Sektion ''Korpora im Sprachunterricht'' für die sektionsübergreifende Posterpräsentation "Agorá" im Rahmen der [http://www.idt-2013.it IDT 2013 - XV. Internationale Tagung der Deutschlehrerinnen und Deutschlehrer], Bozen/Italien, 30. Juli bis 3. August 2013<br />
<br />
*Thomas Bartz: '''Digitale Sprachressourcen im Deutschunterricht: Korpus-basierte Recherche und Analyse in der "Wörterbuchwerkstatt".''' Sektion ''Korpora im Sprachunterricht'' der [http://www.idt-2013.it IDT 2013 - XV. Internationale Tagung der Deutschlehrerinnen und Deutschlehrer], Bozen/Italien, 30. Juli 2013<br />
<br />
*Nadja Radtke: '''Konzeption und korpusbasierter Aufbau einer Wiki-Ressource zu deutschen Stützverbgefügen.''' Sektion ''Wortschatz und Phraseologie'' der [http://www.idt-2013.it IDT 2013 - XV. Internationale Tagung der Deutschlehrerinnen und Deutschlehrer], Bozen/Italien, 29. Juli 2013<br />
<br />
*Thomas Bartz, Michael Beißwenger & Angelika Storrer: '''STTS und internetbasierte Kommunikation: Herausforderungen und Lösungsvorschläge.''' CLARIN-D-Workshop "[http://www.sfs.uni-tuebingen.de/aktuelles/detail/stts-workshop.html Das STTS-Tagset für Wortartentagging: Stand und Perspektiven (Zweiter Workshop)]", Universität Tübingen, Seminar für Sprachwissenschaft, 6. Mai 2013<br />
<br />
*Thomas Bartz, Michael Beißwenger, Christian Pölitz, Nadja Radtke & Angelika Storrer: '''KobRA - Korpus-basierte linguistische Recherche und Analyse mit Hilfe von Data Mining.''' Posterpräsentation im Rahmen des Kickoff-Treffens der 24 BMBF-Projektverbünde im Bereich "eHumanities", Universität Leipzig, ([[Media:Kobra-poster-leipzig-final-2.pdf|PDF-Version]]) 8./9. April 2013<br />
<br />
*Michael Beißwenger, Stefanie Dipper, Stefan Evert & Bianka Trevisan: '''Introduction: Modelling Non-Standardized Writing / Modellierung nichtstandardisierter Schriftlichkeit.''' [http://www.sfb632.uni-potsdam.de/dgfs-2013/AG_10.html AG "Modellierung nicht-standardisierter Schriftlichkeit"] auf der Jahrestagung der Deutschen Gesellschaft für Sprachwissenschaft (DGfS), Universität Potsdam, 13. März 2013<br />
<br />
*Angelika Storrer: '''Sprachverfall durch internetbasierte Kommunikation? Linguistische Erklärungsansätze - empirische Befunde.''' [http://www.ids-mannheim.de/org/tagungen/tagung2013.html Jahrestagung 2013 des Instituts für deutsche Sprache IDS] zum Thema ''Sprachverfall? Dynamik – Wandel – Variation'', Mannheim, 13. März 2013<br />
<br />
*Michael Beißwenger, Maria Ermakova, Alexander Geyken, Lothar Lemnitzer & Angelika Storrer: '''DeRiK - Deutsches Referenzkorpus zur internetbasierten Kommunikation.'''<br/>Posterpräsentation, Projektmesse "Korpora geschriebener Sprache" im Rahmen der 49. Jahrestagung des Insituts für deutsche Sprache, Mannheim, 13. März 2013<br />
<br />
*Thomas Bartz & Angelika Storrer: '''Korpusbasierte Analyse internetbasierter Kommunikation: Phänomene und Herausforderungen.''' [http://www.sfb632.uni-potsdam.de/dgfs-2013/AG_10.html AG "Modellierung nicht-standardisierter Schriftlichkeit"] auf der Jahrestagung der Deutschen Gesellschaft für Sprachwissenschaft (DGfS), Universität Potsdam, 15. März 2013<br />
<br />
*Thomas Bartz, Michael Beißwenger & Angelika Storrer: '''Experiments with Tokenization and Part-of-speech Tagging for German CMC Discourse.''' International Workshop "[http://wiki.itmc.tu-dortmund.de/cmc/ Building Corpora of Computer-Mediated Communication: Issues, Challenges, and Perspectives]", TU Dortmund, 15. Februar 2013<br />
<br />
*Michael Beißwenger, Maria Ermakova, Alexander Geyken, Lothar Lemnitzer & Angelika Storrer: '''A TEI Schema for the Annotation of CMC Genres.''' International Workshop "[http://wiki.itmc.tu-dortmund.de/cmc/ Building Corpora of Computer-Mediated Communication: Issues, Challenges, and Perspectives]", TU Dortmund, 14. Februar 2013<br />
<br />
*Michael Beißwenger, Maria Ermakova, Alexander Geyken, Lothar Lemnitzer & Angelika Storrer: '''Building a Reference Corpus of German Computer-Mediated Communication: Introducing the DeRiK project.''' International Workshop "[http://wiki.itmc.tu-dortmund.de/cmc/ Building Corpora of Computer-Mediated Communication: Issues, Challenges, and Perspectives]", TU Dortmund, 14. Februar 2013<br />
<br />
===2012===<br />
<br />
*Michael Beißwenger & Angelika Storrer: '''Categories of Analysis for Computer-Mediated Discourse: The Case of ''Interaction Signs.''''' 4. Arbeitstagung des DFG-Netzwerks "Empirische Erforschung internetbasierter Kommunikation (Empirikom), RWTH Aachen, 8. November 2012<br />
<br />
*Angelika Storrer: '''Internet-Lexikographie: Produkte – Prozesse – Perspektiven.''' Vortrag im Rahmen des 7. Kolloquiums zur Lexikographie und Wörterbuchforschung "Print- und E-Wörterbücher im Vergleich: Konvergenzen, Divergenzen, Probleme, Perspektiven", Sofia, [http://www.studiger.tu-dortmund.de/images/Storrer-lexikographie-sofia.pdf Foliensatz zum Vortrag (PDF)] 22. Oktober 2012<br />
<br />
*Michael Beißwenger, Stefan Evert & Torsten Zesch: '''Gewinnung, Aufbereitung und Analyse von Korpora zu Genres internetbasierter Kommunikation: Herausforderungen und Perspektiven.''' GSCL-Workshop "Webkorpora in Computerlinguistik und Sprachforschung", Institut für deutsche Sprache, Mannheim, 28. September 2012<br />
<br />
*Michael Beißwenger & Lothar Lemnitzer: '''Aufbau und Annotation eines Referenzkorpus zur deutschsprachigen internetbasierten Kommunikation.''' GSCL-Workshop "Webkorpora in Computerlinguistik und Sprachforschung", Institut für deutsche Sprache, Mannheim, 28. September 2012<br />
<br />
*Thomas Bartz, Michael Beißwenger & Angelika Storrer: '''Überlegungen zur Modifikation und Erweiterung von STTS für das Tagging von Korpora zur internetbasierten Kommunikation.''' CLARIN-D-Workshop: [http://www.ims.uni-stuttgart.de/veranstaltungen/stts-workshop/ Das STTS-Tagset für Wortartentagging: Stand und Perspektiven], Universität Stuttgart, Institut für Maschinelle Sprachverarbeitung (IMS), 24. September 2012<br />
<br />
*Michael Beißwenger & Lothar Lemnitzer: '''Processing and Representing Computer-Mediated Discourse: An Open Issue in Corpus Linguistics.''' Workshop on Automatic Processing of Non-Standard Data Sources in Corpus-Based Research (NOSDAC), Universität zu Köln, 31. August 2012</div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Publikationen&diff=777Publikationen2015-09-12T19:32:40Z<p>Storrer: </p>
<hr />
<div>=Projektergebnisse und -grundlagen=<br />
<br />
===2015===<br />
*Bartz, Thomas; Pölitz, Christian; Morik, Katharina; Storrer, Angelika (2015): '''Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research'''. In: Jan Odijk (Ed): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=116;article=001 Selected Papers from the CLARIN 2014 Conference], October 24-25, 2014, Soesterberg, The Netherlands, 1-13.<br />
<br />
*Bingel, Joachim; Diewald, Nils (2015): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=111;article=001 '''KoralQuery – a General Corpus Query Protocol''']. In: Proceedings of the Workshop on Innovative Corpus Query and Visualization Tools at NODALIDA 2015, Vilnius, Lithuania, May 11-13, 2015. <br />
<br />
*Diewald,Nild; Bingel, Joachim (2015): [http://KorAP.github.io/Koral '''KoralQuery 0.3. Technical Report, Working draft''']. IDS, Mannheim, Germany.<br />
<br />
*Pölitz, Christian; Bartz, Thomas; Morik, Katharina; Storrer, Angelika (2015): '''Investigation of Word Senses over Time using Linguistic Corpora''' In: Matousek, Václav et al.(Hrsg.): Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer. <br />
<br />
*Lemnitzer, Lothar; Pölitz, Christian; Didakowski, Jörg; Geyken, Alexander (2015): '''A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries''' In: Kosem, Iztok et al. (Hrsg.): Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.<br />
<br />
*Geyken, Alexander; Pölitz, Christian; Bartz, Thomas (2015): '''A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries''' In: Kosem, Iztok et al.(Hrsg.):'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015. <br />
<br />
===2014===<br />
*Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): '''Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods.''' In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. [http://www.uni-hildesheim.de/konvens2014/data/konvens2014-workshop-proceedings.pdf Proceedings-Band als PDF]<br />
<br />
*Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael (2014): '''Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014.''' Technischer Bericht, Technische Universität Dortmund. [[Media: KobRA-MS2_Verfahren.pdf|Online-Veröffentlichung (PDF)]]<br />
<br />
*Didakowski, Jörg; Radtke, Nadja (2014): '''Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. ''' In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. [http://euralex2014.eurac.edu/en/callforpapers/Documents/EURALEX%202014_gesamt.pdf Online-Veröffentlichung (PDF)]<br />
<br />
*Bartz, Thomas; Beißwenger, Michael; Pölitz, Christian; Radtke, Nadja; Storrer, Angelika (2014): '''Neue Möglichkeiten der Arbeit mit strukturierten Sprachressourcen in den Digital Humanities mithilfe von Data-Mining.''' Online Proceedings of the Digital Humanities 2014 annual international conference of the Alliance of Digital Humanities Organizations, Universität Lausanne, 10. Juli 2014. [http://dharchive.org/paper/DH2014/Poster-894.xml Online-Veröffentlichung]<br />
<br />
*Beißwenger, Michael; Oostdijk, Nelleke; Storrer, Angelika; van den Heuvel, Henk (2014) (Hrsg.): '''Building and Annotating Corpora of Computer-Mediated Communication: Issues and Challenges at the Interface of Corpus and Computational Linguistics.''' [http://www.jlcl.org/2014_Heft2/Heft2-2014.pdf JLCL, Heft 2/2014].<br />
<br />
*Bartz, Thomas; Radtke, Nadja (2014): '''Digitale Korpora in der Internet-Lexikographie. Bericht zur Sektion „Lexikographie“ der 2. Sektionentagung der Gesellschaft für Angewandte Linguistik (GAL e.V.) am 20. September 2013 an der RWTH Aachen.''' In: Lexicographica 30/1, 605–610.<br />
<br />
*Bartz, Thomas; Radtke, Nadja (2014): '''Digitale Korpora im Deutschunterricht: Didaktisches Potenzial.''' In: Zeitschrift für germanistische Linguistik 42/1, 130–143.<br />
<br />
*Bartz, Thomas; Beißwenger, Michael; Storrer, Angelika (2014): '''Optimierung des Stuttgart-Tübingen-Tagset für die linguistische Annotation von Korpora zur internetbasierten Kommunikation: Phänomene, Herausforderungen, Erweiterungsvorschläge.''' In: Journal for Language Technology and Computational Linguistics (Themenheft "Das STTS-Tagset für Wortartentagging - Stand und Perspektiven"). [http://www.jlcl.org/2013_Heft1/7Bartz.pdf PDF-Version]<br />
<br />
*Angelika Storrer (2014): '''Sprachverfall durch internetbasierte Kommunikation? Linguistische Erklärungsansätze – empirische Befunde.''' In: Sprachverfall? Dynamik – Wandel – Variation. Jahrbuch des Instituts für Deutsche Sprache 2013. [http://www.studiger.tu-dortmund.de/images/Storrer-ids2013.pdf PDF-Preprint]<br />
<br />
===2013===<br />
*Bartz, Thomas; Pölitz, Christian (2013): '''Disambiguierung in Suchtrefferlisten aus großen Textkorpora.''' Technischer Bericht, Technische Universität Dortmund. [[Media: KobRA-MS1b_Disambiguierung.pdf|Online-Veröffentlichung (PDF)]]<br />
<br />
*Bartz, Thomas; Pölitz, Christian; Radtke, Nadja (2013): '''Automatische Klassifikation von Stützverbgefügen mithilfe von Data-Mining.''' Technischer Bericht, Technische Universität Dortmund. [[Media: KobRA-MS1a_Belegklassifikation.pdf|Online-Veröffentlichung (PDF)]]<br />
<br />
*Beißwenger, Michael (2013): '''Space in computer-mediated communication: Corpus-based investigations on the use of local deictics in chats.''' In: Peter Auer, Martin Hilpert, Anja Stukenbrock & Benedikt Szmrecsanyi (Eds.): Space in Language and Linguistics: Geographical, Interactional, and Cognitive Perspectives. Berlin. Boston: de Gruyter (linguae & litterae 24), 494-528.<br />
<br />
*Beißwenger, Michael (2013): '''Das Dortmunder Chat-Korpus.''' In: Zeitschrift für germanistische Linguistik 41/1, 161-164. (Erweiterte Fassung [http://www.linse.uni-due.de/tl_files/PDFs/Publikationen-Rezensionen/Chatkorpus_Beisswenger_2013.pdf online als PDF-Dokument])<br />
<br />
*Beißwenger, Michael (2013): '''Raumorientierung in der Netzkommunikation. Korpusgestützte Untersuchungen zur lokalen Deixis in Chats.''' In: Barbara Frank-Job, Alexander Mehler & Tilmann Sutter (Hrsg.): Die Dynamik sozialer und sprachlicher Netzwerke. Konzepte, Methoden und empirische Untersuchungen an Beispielen des WWW. Wiesbaden: VS Verlag für Sozialwissenschaften, 207-258. [http://michael-beisswenger.de/pub/beisswenger-deixis-zif_preprint.pdf PDF-Preprint]<br />
<br />
*Beißwenger, Michael; Ermakova, Maria; Geyken, Alexander; Lemnitzer, Lothar; Storrer, Angelika (2013):<br>'''DeRiK: A German Reference Corpus of Computer-Mediated Communication.''' In: LLC: The Journal of Digital Scholarship in the Humanities. [http://llc.oxfordjournals.org/cgi/reprint/fqt038?ijkey=GXFixqNNy0uW7cO&keytype=ref PDF version at ''Oxford Journals'']<br />
<br />
*Beißwenger, Michael; Lemnitzer, Lothar (2013): '''Aufbau eines Referenzkorpus zur deutschsprachigen internetbasierten Kommunikation als Zusatzkomponente für die Korpora im Projekt "Digitales Wörterbuch der deutschen Sprache" (DWDS).''' In: Journal for Language Technology and Computational Linguistics 26 (2) (Themenheft "Webkorpora in Computerlinguistik und Sprachforschung", hrsg. v. Alexander Mehler, Roman Schneider & Angelika Storrer), 1-22. [http://www.jlcl.org/2013_Heft2/1BeiLem.pdf Online-Veröffentlichung (PDF)]<br />
<br />
*Storrer, Angelika (2013): '''Variation im deutschen Wortschatz am Beispiel der Streckverbgefüge.''' In: Deutsche Akademie für Sprache und Dichtung; Union der deutschen Akademien der Wissenschaften (Hrsg.): Reichtum und Armut der deutschen Sprache. Erster Bericht zur Lage der deutschen Sprache. Berlin/New York: de Gruyter, 171-209. <br />
<br />
*Storrer, Angelika (2013): '''Sprachstil und Sprachvariation in sozialen Netzwerken.''' In: Barbara Frank-Job, Alexander Mehler & Tilmann Sutter (Hrsg.): Die Dynamik sozialer und sprachlicher Netzwerke. Konzepte, Methoden und empirische Untersuchungen an Beispielen des WWW. Wiesbaden: VS Verlag für Sozialwissenschaften, 329-364 - Download: [http://www.studiger.tu-dortmund.de/images/Storrer-sprachstil-preprint-2012.pdf PDF-Preprint]<br />
<br />
===2012===<br />
*Beißwenger, Michael (2012): '''Digitale Korpora und Kommunikationstechnologien in Sprachanalyse und Sprachdidaktik.''' Habilitationsschrift, Fakultät Kulturwissenschaften der TU Dortmund.<br />
<br />
*Beißwenger, Michael; Ermakova, Maria; Geyken, Alexander; Lemnitzer, Lothar; Storrer, Angelika (2012): '''A TEI Schema for the Representation of Computer-mediated Communication.''' In: Journal of the Text Encoding Initiative (jTEI), Issue 3 | November 2012 (DOI: 10.4000/jtei.476). ([http://jtei.revues.org/476 Online article (PDF)])<br />
<br />
*Beißwenger, Michael; Ermakova, Maria; Geyken, Alexander; Lemnitzer, Lothar; Storrer, Angelika (2012): '''DeRiK: A German Reference Corpus of Computer-Mediated Communication.''' In: Proceedings of Digital Humanities 2012.<br />
<br />
*Beißwenger, Michael; Storrer, Angelika (2012): '''Interaktionsorientiertes Schreiben und interaktive Lesespiele in der Chat-Kommunikation.''' In: Zeitschrift für Literaturwissenschaft und Linguistik 168, S. 92-124. - Download: [http://www.studiger.tu-dortmund.de/images/Lili-preprint.pdf PDF-Preprint]<br />
<br />
*Storrer, Angelika (2012): '''Neue Text- und Schreibformen im Internet: Das Beispiel Wikipedia.''' In: Juliane Köster & Helmuth Feilke (Hrsg.): Textkompetenzen für die Sekundarstufe II. Freiburg: Fillibach, S. 277-304. - Download: [http://www.studiger.tu-dortmund.de/images/Storrer-textkompetenzen-preprint.pdf PDF-Preprint].<br />
<br />
=Weitere (chronologisch)=<br />
<br />
*Angelika Storrer (2014): '''Sprachverfall durch internetbasierte Kommunikation? Linguistische Erklärungsansätze – empirische Befunde'''. In: Sprachverfall? Dynamik – Wandel – Variation. Jahrbuch des Instituts für Deutsche Sprache 2013. [http://www.studiger.tu-dortmund.de/images/Storrer-ids2013.pdf PDF-Preprint]<br />
<br />
*Beißwenger, Michael; Ermakova, Maria; Geyken, Alexander; Lemnitzer, Lothar; Storrer, Angelika (2013): '''DeRiK: A German Reference Corpus of Computer-Mediated Communication'''. In: Literary and Linguistic Computing 2013 (doi: 10.1093/llc/fqt038). [http://llc.oxfordjournals.org/cgi/reprint/fqt038?ijkey=GXFixqNNy0uW7cO&keytype=ref PDF at ''Oxford Journals'']<br />
<br />
*Beißwenger, Michael; Storrer, Angelika (2012): '''Interaktionsorientiertes Schreiben und interaktive Lesespiele in der Chat-Kommunikation'''. In: Zeitschrift für Literaturwissenschaft und Linguistik 168 (Themenschwerpunkt "Dinge und Maschinen in der Kommunikation"), 92-124. [http://www.michael-beisswenger.de/pub/lili-preprint.pdf PDF-Preprint]<br />
<br />
*Beißwenger, Michael (2012): '''Kompetenzen für das Schreiben mit webbasierten Schreibtechnologien'''. In: Helmuth Feilke, Juliane Köster & Michael Steinmetz (Hrsg.): Textkompetenzen in der Sekundarstufe II. Freiburg: Fillibach, 233-267. [http://www.michael-beisswenger.de/pub/beisswenger-schreibkompetenzen-preprint.pdf PDF-Preprint]<br />
<br />
*Beißwenger, Michael; Storrer, Angelika (2011): '''Digitale Sprachressourcen in Lehramtsstudiengängen: Kompetenzen - Erfahrungen - Desiderate'''. In: Journal for Language Technology and Computational Linguistics (Themenheft "Language Resources and Technologies in E-Learning and Teaching", ed. Frank Binder, Henning Lobin & Harald Lüngen), 119-139. [http://www.jlcl.org/2011_Heft1/9.pdf PDF]<br />
<br />
*Beißwenger, Michael (2010): '''Chattern unter die Finger geschaut: Formulieren und Revidieren bei der schriftlichen Verbalisierung in synchroner internetbasierter Kommunikation'''. In: Vilmos Ágel & Mathilde Hennig (Hrsg.): Nähe und Distanz im Kontext variationslinguistischer Forschung. Berlin. New York: de Gruyter (Linguistik - Impulse & Tendenzen 35), 247-294. [http://www.michael-beisswenger.de/pub/preprint-beisswenger2010a.pdf PDF-Preprint]<br />
<br />
*Storrer, Angelika (2009): '''Rhetorisch-stilistische Eigenschaften der Sprache des Internets'''. In: Fix, Ulla; Gardt, Andreas; Knape, Joachim (Hgg.): Rhetorik und Stilistik – Rhetorics and Stilistics. Ein internationales Handbuch historischer und systematischer Forschung. Berlin/New York: de Gruyter (Handbooks of Linguistics and Communication Science HSK), S. 2211-2226. [http://www.studiger.tu-dortmund.de/images/Storrer_2007_Rhetorisch_stilistische_eigenschaften_der_sprache_des_internets.pdf PDF-Preprint]<br />
<br />
*Beißwenger, Michael; Storrer, Angelika (2008): '''Corpora of Computer-Mediated Communication'''. In: Anke Lüdeling & Merja Kytö (Eds): Corpus Linguistics. An International Handbook. Volume 1. Berlin. New York (Series: Handbücher zur Sprache und Kommunikationswissenschaft / Handbooks of Linguistics and Communication Science 29.1), 292-308. [http://www.michael-beisswenger.de/pub/hsk-corpora.pdf PDF-Preprint]<br />
<br />
*Storrer, Angelika (2008): '''Hypertextlinguistik'''. In: Janich, Nina (Hrsg.): Textlinguistik. 15 Einführungen. Tübingen (narr Studienbücher), S. 211-227. [http://www.studiger.tu-dortmund.de/images/Hypertextlinguistik-Preprint.pdf PDF-Preprint]<br />
<br />
*Beißwenger, Michael (2007): '''Sprachhandlungskoordination in der Chat-Kommunikation'''. Berlin. New York: de Gruyter (Reihe Linguistik - Impulse & Tendenzen 26). [http://www.michael-beisswenger.de/sprachhandlungskoordination/beisswenger_shkchat-abstract.pdf Kurzzusammenfassung]<br />
<br />
*Storrer, Angelika (2007): '''Chat-Kommunikation in Beruf und Weiterbildung'''. In: Der Deutschunterricht, 1/2007, S. 49-61. [http://www.studiger.tu-dortmund.de/images/Storrer_2007_Chat-kommunikation_in_beruf_und_weiterbildung.pdf PDF-Preprint]<br />
<br />
*Beißwenger, Michael; Storrer, Angelika (Hrsg.; 2005): '''Chat-Kommunikation in Beruf, Bildung und Medien: Konzepte - Werkzeuge - Anwendungsfelder'''. Stuttgart.<br />
<br />
*Storrer, Angelika (2004): '''Text und Hypertext. Mit einem Exkurs zu XLink und XPointer von Eva Anna Lenz'''. In: Lemnitzer, Lothar; Lobin, Hennig (Hgg.): Texttechnologie. Tübingen: Stauffenburg, S. 13-50.<br />
<br />
*Storrer, Angelika (2004): '''Text-Bild-Bezüge und Nutzermetaphern im World Wide Web'''. In: Holly, Werner; Hoppe, Almut; Schmitz. Ulrich (Hgg.). Sprache und Bild I. Mitteilungen des Germanistenverbands 51.1, S. 40-57. [http://www.studiger.tu-dortmund.de/images/Storrer_2005_Text-bild-bezuege_und_nutzermetaphern_im_World_Wide_Web.pdf PDF-Preprint]<br />
<br />
*Beißwenger, Michael (2003): '''Sprachhandlungskoordination im Chat'''. In: Zeitschrift für germanistische Linguistik 31 (2), 198-231. [http://www.michael-beisswenger.de/pub/zgl-preprint.pdf PDF-Preprint]<br />
<br />
*Beißwenger, Michael (2002): '''Getippte "Gespräche" und ihre trägermediale Bedingtheit. Zum Einfluß technischer und prozeduraler Faktoren auf die kommunikative Grundhaltung beim Chatten'''. In: Schröder, Ingo W.; Voell, Stéphane (Hrsg.): Moderne Oralität. Marburg 2002 (Reihe Curupira, Bd. 13), 265-299. [http://www.michael-beisswenger.de/pub/curupira.pdf PDF-Preprint]<br />
<br />
*Beißwenger, Michael (2001): '''Das interaktive Lesespiel. Chat-Kommunikation als mediale Inszenierung'''. In: Chat-Kommunikation. Sprache, Interaktion, Sozialität & Identität in synchroner computervermittelter Kommunikation. Perspektiven auf ein interdisziplinäres Forschungsfeld. Stuttgart, 79-138. [http://www.michael-beisswenger.de/pub/lesespiel.pdf PDF-Preprint]<br />
<br />
*Storrer, Angelika (2001): '''Sprachliche Besonderheiten getippter Gespräche: Sprecherwechsel und sprachliches Zeigen in der Chat-Kommunikation'''. In: Beißwenger, Michael (Hrsg.): Chat-Kommunikation. Sprache, Interaktion, Sozialität und Identität in synchroner computervermittelter Kommunikation. Stuttgart: ibidem, S.3-24. [http://www.studiger.tu-dortmund.de/images/Storrer_2001_sprachliche_besonderheiten_getippter_gespraeche.pdf PDF-Preprint]<br />
<br />
*Beißwenger, Michael (Hrsg., 2001): '''Chat-Kommunikation. Sprache, Interaktion, Sozialität & Identität in synchroner computervermittelter Kommunikation'''. Perspektiven auf ein interdisziplinäres Forschungsfeld. Stuttgart.<br />
<br />
*Storrer, Angelika (2001): '''Getippte Gespräche oder dialogische Texte? Zur kommunikationstheoretischen Einordnung der Chat-Kommunikation'''. In: Lehr, Andrea; Kammerer, Matthias et al. (Hgg.): Sprache im Alltag. Beiträge zu neuen Perspektiven in der Linguistik. Berlin u.a.: de Gruyter, S.439-465. [http://www.studiger.tu-dortmund.de/images/Storrer_2001_getippte_gespraeche_oder_dialogische_texte.pdf PDF-Preprint]<br />
<br />
*Beißwenger, Michael (2000): '''Kommunikation in virtuellen Welten: Sprache, Text und Wirklichkeit'''. Stuttgart.<br />
<br />
*Storrer, Angelika (2000): '''Schriftverkehr auf der Datenautobahn. Besonderheiten der schriftlichen Kommunikation im Internet'''. In: Voß, G. Günter; Holly, Werner; Boehnke, Klaus (Hgg.): Neue Medien im Alltag: Begriffsbestimmungen eines interdisziplinären Forschungsfeldes. Opladen: Leske + Budrich, S. 153-177. [http://www.studiger.tu-dortmund.de/images/Storrer_2000_Schriftverkehr_auf_der_Datenautobahn.pdf PDF-Preprint]</div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Hauptseite&diff=776Hauptseite2015-09-12T19:30:41Z<p>Storrer: </p>
<hr />
<div>{| class="wikitable" width="99%"<br />
|-<br />
! <big> Herzlich willkommen </big><br />
|- <br />
| style="background:#ffffff; padding:1em" | <br />
[[Datei:Kwic-kobra-2geo.png|links]] [[Datei:KobRA-RM.png|rechts]] '''KobRA&nbsp;(Korpus-basierte Recherche und Analyse mit Hilfe von Data-Mining)''' ist ein Verbundprojekt, das seit September 2012 vom [http://www.bmbf.de Bundesministerium für Bildung und Forschung (BMBF)] im Rahmen des '''[http://www.bmbf.de/foerderungen/16466.php Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities]''' gefördert wird (Förderkennzeichen: 01UG1245A).<br />
<br />
'''Ziel des Projektes ist es, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern.''' Strukturierte Sprachressourcen (annotierte Textkorpora, Baumbanken, Wortnetze) bieten neuartige und attraktive Möglichkeiten, linguistische Fragestellungen an authentischen Sprachverwendungsdaten zu untersuchen und quantitativ auszuwerten. <br />
<br />
Koordinatorin des Projekts ist [http://germanistik.uni-mannheim.de/abteilungen/germanistische_linguistik/prof_dr_angelika_storrer/index.html Prof. Dr. Angelika Storrer (Universität Mannheim)].<br />
<br />
<div style="clear: left"></div> Auf diesen Seiten bieten wir einen Überblick und detailliertere Informationen über:<br />
* '''[[Projektbeschreibung|die Ziele, Fragestellungen und Methoden des Projekts]]'''<br />
* '''[[Team|die beteiligten Personen und Forschungseinrichtungen]]'''<br />
* '''[[Fallstudien|die Fallstudien des Projekts]]'''<br />
* '''sowie über Aktivitäten und aktuelle Veröffentlichungen (s.u.).'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left; margin-right:1em"<br />
|-<br />
! <big>Aktivitäten</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
* Paper auf der Internationalen Fachtagung [http://www.kiv.zcu.cz/tsd2015/ ''Text, Speech and Dialogue'']: Pölitz, Christian; Bartz, Thomas; Morik, Katharina; Storrer, Angelika (2015): ''Investigation of Word Senses over Time using Linguistic Corpora'' In: Matousek, Vaclav et al. (Hrsg.): Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer.<br />
<br />
* Paper auf der Internationalen Fachtagung [https://elex.link/elex2015/ ''eLexicography 2015'']: Lemnitzer, Lothar; Pölitz, Christian; Didakowski, Jörg; Geyken, Alexander (2015): ''A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries''In: Kosem, Iztok et al. (Hrsg.):'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.<br />
<br />
* Paper auf der Internationalen Fachtagung [https://elex.link/elex2015/ ''eLexicography 2015'']: Geyken, Alexander; Pölitz, Christian; Bartz, Thomas (2015): ''A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries'' In: Kosem, Tztok et al. (Hrsg): 'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.<br />
<br />
* Vortrag [http://clarin2015.informatik.uni-leipzig.de/program#Kobra Korpusbasierte Sprachanalyse mit CLARIN-D-Ressourcen: Anwendungsszenarien und Erfahrungen aus dem Projekt KobRA] auf dem CLARIN-D Workshop ''Fächerübergreifende Perspektiven durch digitale Forschungsinfrastrukturen'' am 30.6/1.7. in Leipzig.<br />
<br />
*Posterpräsentation ''Erprobung innovativer Data-Mining-Verfahren für die empirische Arbeit mit strukturierten Sprachressourcen''. (Thomas Bartz, Christian Pölitz, Angelika Storrer). [https://de.dariah.eu/dhsummit2015 auf dem Digital Humanities Summit], Berlin, 3./4. März 2015<br />
<br />
----<br />
<br />
Überblick über weitere Konferenzbeiträge und Projekt-Workshops: '''[[Aktivitäten]]'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left"<br />
|-<br />
! <big>Veröffentlichungen</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
*Bartz,Thomas; Pölitz, Christian; Morik, Katharina; Storrer, Angelika (2015): '''Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research'''. In: Jan Odijk (Ed): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=116;article=001 Selected Papers from the CLARIN 2014 Conference], October 24-25, 2014, Soesterberg, The Netherlands, 1-13.<br />
<br />
*Bingel, Joachim; Diewald, Nils (2015): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=111;article=001 '''KoralQuery – a General Corpus Query Protocol''']. In: Proceedings of the Workshop on Innovative Corpus Query and Visualization Tools at NODALIDA 2015, Vilnius, Lithuania, May 11-13, 2015. <br />
<br />
*Diewald,Nild; Bingel, Joachim (2015): [http://KorAP.github.io/Koral '''KoralQuery 0.3. Technical Report, Working draft''']. IDS, Mannheim, Germany. <br />
<br />
*Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): '''Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods.''' In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. [http://www.uni-hildesheim.de/konvens2014/data/konvens2014-workshop-proceedings.pdf Proceedings-Band als PDF]<br />
<br />
*Thomas Bartz, Michael Beißwenger, Christian Pölitz, Nadja Radtke & Angelika Storrer (2014): '''Neue Möglichkeiten der Arbeit mit strukturierten Sprachressourcen in den Digital Humanities mithilfe von Data-Mining.''' [http://dharchive.org/paper/DH2014/Poster-894.xml Online Proceedings of the Digital Humanities 2014 annual international conference of the Alliance of Digital Humanities Organizations], Universität Lausanne, 10. Juli 2014<br />
<br />
*Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael (2014): '''Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014.''' Technischer Bericht, Technische Universität Dortmund. [[Media: KobRA-MS2_Verfahren.pdf|Online-Veröffentlichung (PDF)]]<br />
<br />
*Didakowski, Jörg; Radtke, Nadja (2014): '''Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. ''' In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. [http://euralex2014.eurac.edu/en/callforpapers/Documents/EURALEX%202014_gesamt.pdf Online-Veröffentlichung (PDF)]<br />
<br />
----<br />
<br />
Überblick über weitere Veröffentlichungen mit Projektbezug: '''[[Publikationen]]'''<br />
|}</div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Hauptseite&diff=775Hauptseite2015-09-12T19:28:46Z<p>Storrer: </p>
<hr />
<div>{| class="wikitable" width="99%"<br />
|-<br />
! <big> Herzlich willkommen </big><br />
|- <br />
| style="background:#ffffff; padding:1em" | <br />
[[Datei:Kwic-kobra-2geo.png|links]] [[Datei:KobRA-RM.png|rechts]] '''KobRA&nbsp;(Korpus-basierte Recherche und Analyse mit Hilfe von Data-Mining)''' ist ein Verbundprojekt, das seit September 2012 vom [http://www.bmbf.de Bundesministerium für Bildung und Forschung (BMBF)] im Rahmen des '''[http://www.bmbf.de/foerderungen/16466.php Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities]''' gefördert wird (Förderkennzeichen: 01UG1245A).<br />
<br />
'''Ziel des Projektes ist es, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern.''' Strukturierte Sprachressourcen (annotierte Textkorpora, Baumbanken, Wortnetze) bieten neuartige und attraktive Möglichkeiten, linguistische Fragestellungen an authentischen Sprachverwendungsdaten zu untersuchen und quantitativ auszuwerten. <br />
<br />
Koordinatorin des Projekts ist [http://germanistik.uni-mannheim.de/abteilungen/germanistische_linguistik/prof_dr_angelika_storrer/index.html Prof. Dr. Angelika Storrer (Universität Mannheim)].<br />
<br />
<div style="clear: left"></div> Auf diesen Seiten bieten wir einen Überblick und detailliertere Informationen über:<br />
* '''[[Projektbeschreibung|die Ziele, Fragestellungen und Methoden des Projekts]]'''<br />
* '''[[Team|die beteiligten Personen und Forschungseinrichtungen]]'''<br />
* '''[[Fallstudien|die Fallstudien des Projekts]]'''<br />
* '''sowie über Aktivitäten und aktuelle Veröffentlichungen (s.u.).'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left; margin-right:1em"<br />
|-<br />
! <big>Aktivitäten</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
* Paper auf der Internationalen Fachtagung [http://www.kiv.zcu.cz/tsd2015/ ''Text, Speech and Dialogue'']: Pölitz, Christian; Bartz, Thomas; Morik, Katharina; Storrer, Angelika (2015): ''Investigation of Word Senses over Time using Linguistic Corpora'' In: Matousek, Vaclav et al. (Hrsg.): Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer.<br />
<br />
* Paper auf der Internationalen Fachtagung [https://elex.link/elex2015/ ''eLexicography 2015'']: Lemnitzer, Lothar; Pölitz, Christian; Didakowski, Jörg; Geyken, Alexander (2015): ''A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries''In: Kosem, Iztok et al. (Hrsg.):'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.<br />
<br />
* Paper auf der Internationalen Fachtagung [https://elex.link/elex2015/ ''eLexicography 2015'']: Geyken, Alexander; Pölitz, Christian; Bartz, Thomas (2015): ''A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries'' In: Kosem, Tztok et al. (Hrsg): 'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.<br />
<br />
* Vortrag [http://clarin2015.informatik.uni-leipzig.de/program#Kobra Korpusbasierte Sprachanalyse mit CLARIN-D-Ressourcen: Anwendungsszenarien und Erfahrungen aus dem Projekt KobRA] auf dem CLARIN-D Workshop ''Fächerübergreifende Perspektiven durch digitale Forschungsinfrastrukturen'' am 30.6/1.7. in Leipzig.<br />
<br />
*Posterpräsentation ''Erprobung innovativer Data-Mining-Verfahren für die empirische Arbeit mit strukturierten Sprachressourcen''. (Thomas Bartz, Christian Pölitz, Angelika Storrer). [https://de.dariah.eu/dhsummit2015 auf dem Digital Humanities Summit], Berlin, 3./4. März 2015<br />
<br />
----<br />
<br />
Überblick über weitere Konferenzbeiträge und Projekt-Workshops: '''[[Aktivitäten]]'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left"<br />
|-<br />
! <big>Veröffentlichungen</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
*Bingel, Joachim; Diewald, Nils (2015): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=111;article=001 '''KoralQuery – a General Corpus Query Protocol''']. In: Proceedings of the Workshop on Innovative Corpus Query and Visualization Tools at NODALIDA 2015, Vilnius, Lithuania, May 11-13, 2015. <br />
<br />
*Diewald,Nild; Bingel, Joachim (2015): [http://KorAP.github.io/Koral '''KoralQuery 0.3. Technical Report, Working draft''']. IDS, Mannheim, Germany. <br />
<br />
*Bartz,Thomas; Pölitz, Christian; Morik, Katharina; Storrer, Angelika (2015): '''Using Data Mining and the CLARIN Infrastructure to Extend Corpus-based Linguistic Research'''. In: Jan Odijk (Ed): [http://www.ep.liu.se/ecp_article/index.en.aspx?issue=116;article=001 Selected Papers from the CLARIN 2014 Conference], October 24-25, 2014, Soesterberg, The Netherlands, 1-13.<br />
<br />
*Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): '''Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods.''' In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. [http://www.uni-hildesheim.de/konvens2014/data/konvens2014-workshop-proceedings.pdf Proceedings-Band als PDF]<br />
<br />
*Thomas Bartz, Michael Beißwenger, Christian Pölitz, Nadja Radtke & Angelika Storrer (2014): '''Neue Möglichkeiten der Arbeit mit strukturierten Sprachressourcen in den Digital Humanities mithilfe von Data-Mining.''' [http://dharchive.org/paper/DH2014/Poster-894.xml Online Proceedings of the Digital Humanities 2014 annual international conference of the Alliance of Digital Humanities Organizations], Universität Lausanne, 10. Juli 2014<br />
<br />
*Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael (2014): '''Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014.''' Technischer Bericht, Technische Universität Dortmund. [[Media: KobRA-MS2_Verfahren.pdf|Online-Veröffentlichung (PDF)]]<br />
<br />
*Didakowski, Jörg; Radtke, Nadja (2014): '''Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. ''' In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. [http://euralex2014.eurac.edu/en/callforpapers/Documents/EURALEX%202014_gesamt.pdf Online-Veröffentlichung (PDF)]<br />
<br />
----<br />
<br />
Überblick über weitere Veröffentlichungen mit Projektbezug: '''[[Publikationen]]'''<br />
|}</div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Hauptseite&diff=690Hauptseite2015-06-11T08:42:32Z<p>Storrer: </p>
<hr />
<div>{| class="wikitable" width="99%"<br />
|-<br />
! <big> Herzlich willkommen </big><br />
|- <br />
| style="background:#ffffff; padding:1em" | <br />
[[Datei:Kwic-kobra-2geo.png|links]] [[Datei:KobRA-RM.png|rechts]] '''KobRA&nbsp;(Korpus-basierte Recherche und Analyse mit Hilfe von Data-Mining)''' ist ein Verbundprojekt, das seit September 2012 vom [http://www.bmbf.de Bundesministerium für Bildung und Forschung (BMBF)] im Rahmen des '''[http://www.bmbf.de/foerderungen/16466.php Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities]''' gefördert wird (Förderkennzeichen: 01UG1245A).<br />
<br />
'''Ziel des Projektes ist es, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern.''' Strukturierte Sprachressourcen (annotierte Textkorpora, Baumbanken, Wortnetze) bieten neuartige und attraktive Möglichkeiten, linguistische Fragestellungen an authentischen Sprachverwendungsdaten zu untersuchen und quantitativ auszuwerten. <br />
<br />
Koordinatorin des Projekts ist [http://germanistik.uni-mannheim.de/abteilungen/germanistische_linguistik/prof_dr_angelika_storrer/index.html Prof. Dr. Angelika Storrer (Universität Mannheim)].<br />
<br />
<div style="clear: left"></div> Auf diesen Seiten bieten wir einen Überblick und detailliertere Informationen über:<br />
* '''[[Projektbeschreibung|die Ziele, Fragestellungen und Methoden des Projekts]]'''<br />
* '''[[Team|die beteiligten Personen und Forschungseinrichtungen]]'''<br />
* '''[[Fallstudien|die Fallstudien des Projekts]]'''<br />
* '''sowie über Aktivitäten und aktuelle Veröffentlichungen (s.u.).'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left; margin-right:1em"<br />
|-<br />
! <big>Aktivitäten</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
* Vortrag [http://clarin2015.informatik.uni-leipzig.de/program#Kobra Korpusbasierte Sprachanalyse mit CLARIN-D-Ressourcen: Anwendungsszenarien und Erfahrungen aus dem Projekt KobRA] auf dem CLARIN-D Workshop "Fächerübergreifende Perspektiven durch digitale Forschungsinfrastrukturen" am 30.6/1.7. in Leipzig.<br />
<br />
* Paper angenommen für die Internationalen Fachtagung ''Text, Speech and Dialogue'': Poelitz, C.; Bartz, T.; Morik, K.; Storrer, A. (2015), ''Investigation of Word Senses over Time using Linguistic Corpora'', in Vaclav Matousek et al., ed. (2015), Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer.<br />
<br />
* Paper angenommen für die Internationale Fachtagung ''eLexicography 2015'': Lemnitzer, L.; Poelitz, C.; Didakowski, J.; Geyken, A. (2015), ''A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries''., in I Kosem et al., ed., 'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.<br />
<br />
* Paper angenommen für die Internationale Fachtagung ''eLexicography 2015'': Geyken, A.; Poelitz, C.; Bartz, T. (2015), ''A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries''., in I Kosem et al., ed., 'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.<br />
<br />
*''Erprobung innovativer Data-Mining-Verfahren für die empirische Arbeit mit strukturierten Sprachressourcen''. (Thomas Bartz, Christian Pölitz, Angelika Storrer). [https://de.dariah.eu/dhsummit2015 Posterpräsentation auf dem Digital Humanities Summit], Berlin, 3./4. März 2015<br />
<br />
* [[Aktivitäten#Herrenhäuser Symposium Visuelle Linguistik, 19.-21. November 2014 (Hannover)|Posterpräsentation zu neuen Möglichkeiten frequenzbasierter Visualisierungen disambiguierter lexikalischer Einheiten mithilfe von KobRA-Verfahren im Rahmen des Symposiums ''Visuelle Linguistik'', Schloss Herrenhausen, Hannover]]<br />
<br />
* [[Aktivitäten#CAC 2014, 23.-25. Oktober 2014 (Soesterberg)|Vortrag und Austausch zu neuen Ergebnissen und zur Gesamtarchitektur des KobRA-Projekts im Rahmen der ''CLARIN-Jahrestagung (CAC 2014)'' in Soesterberg (Niederlande)]]<br />
<br />
----<br />
<br />
Überblick über weitere Konferenzbeiträge und Projekt-Workshops: '''[[Aktivitäten]]'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left"<br />
|-<br />
! <big>Veröffentlichungen</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
*Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): '''Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods.''' In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. [http://www.uni-hildesheim.de/konvens2014/data/konvens2014-workshop-proceedings.pdf Proceedings-Band als PDF]<br />
<br />
*Thomas Bartz, Michael Beißwenger, Christian Pölitz, Nadja Radtke & Angelika Storrer (2014): '''Neue Möglichkeiten der Arbeit mit strukturierten Sprachressourcen in den Digital Humanities mithilfe von Data-Mining.''' [http://dharchive.org/paper/DH2014/Poster-894.xml Online Proceedings of the Digital Humanities 2014 annual international conference of the Alliance of Digital Humanities Organizations], Universität Lausanne, 10. Juli 2014<br />
<br />
*Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael (2014): '''Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014.''' Technischer Bericht, Technische Universität Dortmund. [[Media: KobRA-MS2_Verfahren.pdf|Online-Veröffentlichung (PDF)]]<br />
<br />
*Didakowski, Jörg; Radtke, Nadja (2014): '''Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. ''' In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. [http://euralex2014.eurac.edu/en/callforpapers/Documents/EURALEX%202014_gesamt.pdf Online-Veröffentlichung (PDF)]<br />
<br />
----<br />
<br />
Überblick über weitere Veröffentlichungen mit Projektbezug: '''[[Publikationen]]'''<br />
|}</div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Hauptseite&diff=689Hauptseite2015-06-11T08:37:47Z<p>Storrer: </p>
<hr />
<div>{| class="wikitable" width="99%"<br />
|-<br />
! <big> Herzlich willkommen </big><br />
|- <br />
| style="background:#ffffff; padding:1em" | <br />
[[Datei:Kwic-kobra-2geo.png|links]] [[Datei:KobRA-RM.png|rechts]] '''KobRA&nbsp;(Korpus-basierte Recherche und Analyse mit Hilfe von Data-Mining)''' ist ein Verbundprojekt, das seit September 2012 vom [http://www.bmbf.de Bundesministerium für Bildung und Forschung (BMBF)] im Rahmen des '''[http://www.bmbf.de/foerderungen/16466.php Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities]''' gefördert wird (Förderkennzeichen: 01UG1245A).<br />
<br />
'''Ziel des Projektes ist es, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern.''' Strukturierte Sprachressourcen (annotierte Textkorpora, Baumbanken, Wortnetze) bieten neuartige und attraktive Möglichkeiten, linguistische Fragestellungen an authentischen Sprachverwendungsdaten zu untersuchen und quantitativ auszuwerten. <br />
<br />
Koordinatorin des Projekts ist [http://germanistik.uni-mannheim.de/abteilungen/germanistische_linguistik/prof_dr_angelika_storrer/index.html Prof. Dr. Angelika Storrer (Universität Mannheim)].<br />
<br />
<div style="clear: left"></div> Auf diesen Seiten bieten wir einen Überblick und detailliertere Informationen über:<br />
* '''[[Projektbeschreibung|die Ziele, Fragestellungen und Methoden des Projekts]]'''<br />
* '''[[Team|die beteiligten Personen und Forschungseinrichtungen]]'''<br />
* '''[[Fallstudien|die Fallstudien des Projekts]]'''<br />
* '''sowie über Aktivitäten und aktuelle Veröffentlichungen (s.u.).'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left; margin-right:1em"<br />
|-<br />
! <big>Aktivitäten</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
* Vortrag [http://clarin2015.informatik.uni-leipzig.de/program#Kobra Korpusbasierte Sprachanalyse mit CLARIN-D-Ressourcen: Anwendungsszenarien und Erfahrungen aus dem Projekt KobRA] auf dem CLARIN-D Workshop "Fächerübergreifende Perspektiven durch digitale Forschungsinfrastrukturen" am 30.6/1.7. in Leipzig.<br />
<br />
* Paper angenommen für die Internationalen Fachtagung ''Text, Speech and Dialogue'': Poelitz, C.; Bartz, T.; Morik, K.; Storrer, A. (2015), Investigation of Word Senses over Time using Linguistic Corpora, in Vaclav Matousek et al., ed. (2015), Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer.<br />
<br />
* Paper angenommen für die Internationale Fachtagung ''eLexicography 2015'': Lemnitzer, L.; Poelitz, C.; Didakowski, J.; Geyken, A. (2015), A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries., in I Kosem et al., ed., 'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.<br />
<br />
* Paper angenommen für die Internationale Fachtagung ''eLexicography 2015'': Geyken, A.; Poelitz, C.; Bartz, T. (2015), A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries., in I Kosem et al., ed., 'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.<br />
<br />
* [[Aktivitäten#Herrenhäuser Symposium Visuelle Linguistik, 19.-21. November 2014 (Hannover)|Posterpräsentation zu neuen Möglichkeiten frequenzbasierter Visualisierungen disambiguierter lexikalischer Einheiten mithilfe von KobRA-Verfahren im Rahmen des Symposiums ''Visuelle Linguistik'', Schloss Herrenhausen, Hannover]]<br />
<br />
* [[Aktivitäten#CAC 2014, 23.-25. Oktober 2014 (Soesterberg)|Vortrag und Austausch zu neuen Ergebnissen und zur Gesamtarchitektur des KobRA-Projekts im Rahmen der ''CLARIN-Jahrestagung (CAC 2014)'' in Soesterberg (Niederlande)]]<br />
<br />
----<br />
<br />
Überblick über weitere Konferenzbeiträge und Projekt-Workshops: '''[[Aktivitäten]]'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left"<br />
|-<br />
! <big>Veröffentlichungen</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
*Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): '''Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods.''' In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. [http://www.uni-hildesheim.de/konvens2014/data/konvens2014-workshop-proceedings.pdf Proceedings-Band als PDF]<br />
<br />
*Thomas Bartz, Michael Beißwenger, Christian Pölitz, Nadja Radtke & Angelika Storrer (2014): '''Neue Möglichkeiten der Arbeit mit strukturierten Sprachressourcen in den Digital Humanities mithilfe von Data-Mining.''' [http://dharchive.org/paper/DH2014/Poster-894.xml Online Proceedings of the Digital Humanities 2014 annual international conference of the Alliance of Digital Humanities Organizations], Universität Lausanne, 10. Juli 2014<br />
<br />
*Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael (2014): '''Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014.''' Technischer Bericht, Technische Universität Dortmund. [[Media: KobRA-MS2_Verfahren.pdf|Online-Veröffentlichung (PDF)]]<br />
<br />
*Didakowski, Jörg; Radtke, Nadja (2014): '''Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. ''' In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. [http://euralex2014.eurac.edu/en/callforpapers/Documents/EURALEX%202014_gesamt.pdf Online-Veröffentlichung (PDF)]<br />
<br />
----<br />
<br />
Überblick über weitere Veröffentlichungen mit Projektbezug: '''[[Publikationen]]'''<br />
|}</div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Hauptseite&diff=688Hauptseite2015-06-11T08:33:10Z<p>Storrer: </p>
<hr />
<div>{| class="wikitable" width="99%"<br />
|-<br />
! <big> Herzlich willkommen </big><br />
|- <br />
| style="background:#ffffff; padding:1em" | <br />
[[Datei:Kwic-kobra-2geo.png|links]] [[Datei:KobRA-RM.png|rechts]] '''KobRA&nbsp;(Korpus-basierte Recherche und Analyse mit Hilfe von Data-Mining)''' ist ein Verbundprojekt, das seit September 2012 vom [http://www.bmbf.de Bundesministerium für Bildung und Forschung (BMBF)] im Rahmen des '''[http://www.bmbf.de/foerderungen/16466.php Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities]''' gefördert wird (Förderkennzeichen: 01UG1245A).<br />
<br />
'''Ziel des Projektes ist es, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern.''' Strukturierte Sprachressourcen (annotierte Textkorpora, Baumbanken, Wortnetze) bieten neuartige und attraktive Möglichkeiten, linguistische Fragestellungen an authentischen Sprachverwendungsdaten zu untersuchen und quantitativ auszuwerten. <br />
<br />
Koordinatorin des Projekts ist [http://germanistik.uni-mannheim.de/abteilungen/germanistische_linguistik/prof_dr_angelika_storrer/index.html Prof. Dr. Angelika Storrer (Universität Mannheim)].<br />
<br />
<div style="clear: left"></div> Auf diesen Seiten bieten wir einen Überblick und detailliertere Informationen über:<br />
* '''[[Projektbeschreibung|die Ziele, Fragestellungen und Methoden des Projekts]]'''<br />
* '''[[Team|die beteiligten Personen und Forschungseinrichtungen]]'''<br />
* '''[[Fallstudien|die Fallstudien des Projekts]]'''<br />
* '''sowie über Aktivitäten und aktuelle Veröffentlichungen (s.u.).'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left; margin-right:1em"<br />
|-<br />
! <big>Aktivitäten</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
* Vortrag [http://clarin2015.informatik.uni-leipzig.de/program#Kobra Korpusbasierte Sprachanalyse mit CLARIN-D-Ressourcen: Anwendungsszenarien und Erfahrungen aus dem Projekt KobRA] auf dem CLARIN-D Workshop "Fächerübergreifende Perspektiven durch digitale Forschungsinfrastrukturen" am 30.6/1.7. in Leipzig.<br />
<br />
* Paper angenommen für die Internationalen Fachtagung ''Text, Speech and Dialogue'': Poelitz, C.; Bartz, T.; Morik, K.; Storrer, A. (2015), Investigation of Word Senses over Time using Linguistic Corpora, in Vaclav Matousek et al., ed. (2015), Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer.<br />
<br />
* Paper angenommen für die Internationale Fachtagung ''eLexicography 2015'': Lemnitzer, L.; Poelitz, C.; Didakowski, J.; Geyken, A. (2015), A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries., in I Kosem et al., ed., 'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.<br />
<br />
* Paper angenommen für die Internationale Fachtagung ''eLexicography 2015'': Geyken, A.; Poelitz, C.; Bartz, T. (2015), A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries., in I Kosem et al., ed., 'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.<br />
<br />
* [[Aktivitäten#Herrenhäuser Symposium Visuelle Linguistik, 19.-21. November 2014 (Hannover)|Posterpräsentation zu neuen Möglichkeiten frequenzbasierter Visualisierungen disambiguierter lexikalischer Einheiten mithilfe von KobRA-Verfahren im Rahmen des Symposiums ''Visuelle Linguistik'', Schloss Herrenhausen, Hannover]]<br />
<br />
* [[Aktivitäten#CAC 2014, 23.-25. Oktober 2014 (Soesterberg)|Vortrag und Austausch zu neuen Ergebnissen und zur Gesamtarchitektur des KobRA-Projekts im Rahmen der ''CLARIN-Jahrestagung (CAC 2014)'' in Soesterberg (Niederlande)]]<br />
<br />
----<br />
<br />
Überblick über weitere Konferenzbeiträge und Projekt-Workshops: '''[[Aktivitäten]]'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left"<br />
|-<br />
! <big>Veröffentlichungen</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
*Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): '''Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods.''' In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. [http://www.uni-hildesheim.de/konvens2014/data/konvens2014-workshop-proceedings.pdf Proceedings-Band als PDF]<br />
<br />
*Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael (2014): '''Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014.''' Technischer Bericht, Technische Universität Dortmund. [[Media: KobRA-MS2_Verfahren.pdf|Online-Veröffentlichung (PDF)]]<br />
<br />
*Didakowski, Jörg; Radtke, Nadja (2014): '''Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. ''' In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. [http://euralex2014.eurac.edu/en/callforpapers/Documents/EURALEX%202014_gesamt.pdf Online-Veröffentlichung (PDF)]<br />
<br />
----<br />
<br />
Überblick über weitere Veröffentlichungen mit Projektbezug: '''[[Publikationen]]'''<br />
|}</div>Storrerhttp://kobra.tu-dortmund.de/mediawiki/index.php?title=Hauptseite&diff=687Hauptseite2015-06-11T08:25:41Z<p>Storrer: </p>
<hr />
<div>{| class="wikitable" width="99%"<br />
|-<br />
! <big> Herzlich willkommen </big><br />
|- <br />
| style="background:#ffffff; padding:1em" | <br />
[[Datei:Kwic-kobra-2geo.png|links]] [[Datei:KobRA-RM.png|rechts]] '''KobRA&nbsp;(Korpus-basierte Recherche und Analyse mit Hilfe von Data-Mining)''' ist ein Verbundprojekt, das seit September 2012 vom [http://www.bmbf.de Bundesministerium für Bildung und Forschung (BMBF)] im Rahmen des '''[http://www.bmbf.de/foerderungen/16466.php Programms zur Förderung von Forschungs- und Entwicklungsvorhaben aus dem Bereich der eHumanities]''' gefördert wird (Förderkennzeichen: 01UG1245A).<br />
<br />
'''Ziel des Projektes ist es, die Möglichkeiten der empirischen linguistischen Arbeit mit strukturierten Sprachressourcen durch den Einsatz innovativer Data-Mining-Verfahren (insbesondere Verfahren des maschinellen Lernens) zu verbessern.''' Strukturierte Sprachressourcen (annotierte Textkorpora, Baumbanken, Wortnetze) bieten neuartige und attraktive Möglichkeiten, linguistische Fragestellungen an authentischen Sprachverwendungsdaten zu untersuchen und quantitativ auszuwerten. <br />
<br />
Koordinatorin des Projekts ist [http://germanistik.uni-mannheim.de/abteilungen/germanistische_linguistik/prof_dr_angelika_storrer/index.html Prof. Dr. Angelika Storrer (Universität Mannheim)].<br />
<br />
<div style="clear: left"></div> Auf diesen Seiten bieten wir einen Überblick und detailliertere Informationen über:<br />
* '''[[Projektbeschreibung|die Ziele, Fragestellungen und Methoden des Projekts]]'''<br />
* '''[[Team|die beteiligten Personen und Forschungseinrichtungen]]'''<br />
* '''[[Fallstudien|die Fallstudien des Projekts]]'''<br />
* '''sowie über Aktivitäten und aktuelle Veröffentlichungen (s.u.).'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left; margin-right:1em"<br />
|-<br />
! <big>Aktivitäten</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
<br />
* Angenommener Vortrag auf der Internationalen Fachtagung ''Text, Speech and Dialogue'': Poelitz, C.; Bartz, T.; Morik, K.; Storrer, A. (2015), Investigation of Word Senses over Time using Linguistic Corpora, in Vaclav Matousek et al., ed. (2015), Text, Speech and Dialogue - 18th International Conference, TSD 2015, Plzen, Czech Republic, September 8-12, 2014. Proceedings, Springer.<br />
<br />
* Angenommener Vortrag für die Internationale Fachtagung ''eLexicography 2015'': Lemnitzer, L.; Poelitz, C.; Didakowski, J.; Geyken, A. (2015), A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries., in I Kosem et al., ed., 'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.<br />
<br />
* Angenommener Vortrag für die Internationale Fachtagung ''eLexicography 2015'': Geyken, A.; Poelitz, C.; Bartz, T. (2015), A machine learning method based on word profiles for semi-automatic update of polysemous dictionary entries in legacy dictionaries., in I Kosem et al., ed., 'Electronic Lexicography in the 21st Century. Linking lexical data in the digital age. eLex 2015.<br />
<br />
* [[Aktivitäten#Herrenhäuser Symposium Visuelle Linguistik, 19.-21. November 2014 (Hannover)|Posterpräsentation zu neuen Möglichkeiten frequenzbasierter Visualisierungen disambiguierter lexikalischer Einheiten mithilfe von KobRA-Verfahren im Rahmen des Symposiums ''Visuelle Linguistik'', Schloss Herrenhausen, Hannover]]<br />
<br />
* [[Aktivitäten#CAC 2014, 23.-25. Oktober 2014 (Soesterberg)|Vortrag und Austausch zu neuen Ergebnissen und zur Gesamtarchitektur des KobRA-Projekts im Rahmen der ''CLARIN-Jahrestagung (CAC 2014)'' in Soesterberg (Niederlande)]]<br />
<br />
----<br />
<br />
Überblick über weitere Konferenzbeiträge und Projekt-Workshops: '''[[Aktivitäten]]'''<br />
|}<br />
<br />
{| class="wikitable" width="49%" style="float:left"<br />
|-<br />
! <big>Veröffentlichungen</big><br />
|-<br />
| style="background:#ffffff; padding:1em" |<br />
*Beißwenger, Michael; Lüngen, Harald; Margaretha, Eliza; Pölitz, Christian (2014): '''Mining corpora of computer-mediated communication: Analysis of linguistic features in Wikipedia talk pages using machine learning methods.''' In: Faaß, Gertrud; Ruppenhofer, Josef (Hrsg.): Workshop Proceedings of the 12th Edition of the Konvens Conference. Hildesheim, Germany, October 8-10, 2014. Hildesheim: Universitätsverlag, 42-47. [http://www.uni-hildesheim.de/konvens2014/data/konvens2014-workshop-proceedings.pdf Proceedings-Band als PDF]<br />
<br />
*Pölitz, Christian; Bartz, Thomas; Beißwenger, Michael (2014): '''Überwachte und unüberwachte Disambiguierung von KwiC-Snippets bei der Suche in großen Textkorpora. Data-Mining-Verfahren des KobRA-Projekts, Stand 08/2014.''' Technischer Bericht, Technische Universität Dortmund. [[Media: KobRA-MS2_Verfahren.pdf|Online-Veröffentlichung (PDF)]]<br />
<br />
*Didakowski, Jörg; Radtke, Nadja (2014): '''Nutzung des DWDS-Wortprofils beim Aufbau eines lexikalischen Informationssystems zu deutschen Stützverbgefügen. ''' In: Abel, Andrea; Vettori, Chiara; Ralli, Natascia (Hrsg.): Proceedings of the XVI EURALEX International Congress: The User in Focus. 15-19 July 2014, Bolzano/Bozen: EURAC research, 345-353. [http://euralex2014.eurac.edu/en/callforpapers/Documents/EURALEX%202014_gesamt.pdf Online-Veröffentlichung (PDF)]<br />
<br />
----<br />
<br />
Überblick über weitere Veröffentlichungen mit Projektbezug: '''[[Publikationen]]'''<br />
|}</div>Storrer