Visualisierung von diachronen Kollokationen

Aus Kobra
Version vom 19. Februar 2016, 14:25 Uhr von Weber (Diskussion | Beiträge)

(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)
Wechseln zu: Navigation, Suche

KobRA-Werkzeuge in RapidMiner ermöglichen eine einfache Generierung Word-Cloud-artiger Visualisierungen diachroner Kollokationen. Damit lässt sich beispielsweise auf einfache Weise anschaulich machen, in welchen inhaltlichen Zusammenhängen ein Wort im Laufe der Zeit genutzt wurde. Die folgenden Word-Clouds zeigen die Entwicklung der Verwendungskontexte für die Wörter „Frau” und „Mann” vom 15. bis ins 20. Jh. hinein. Die Belege stammen aus dem diachronen Korpus „Deutsches Textarchiv” (abrufbar unter: http://www.deutschestextarchiv.de/).

  • „Frau” 1460
  • „Frau” 1600
  • „Frau” 1890
  • „Frau” 1920
  • „Mann” 1600
  • „Mann” 1890
  • „Mann” 1920

Für das im Folgenden beschriebene Verfahren benötigen Sie RapidMiner. Informationen zum Download finden Sie unter https://rapidminer.com/ oder im KobRA-Software-Handbuch (PDF). Sie benötigen außerdem das KobRA-RapidMiner-Plug-in. Das Verfahren können Sie über folgenden Link herunterladen: RMProzessMannFrau.zip. Bitte entpacken Sie die Dateien vor dem Import in RapidMiner.

Kurzanleitung: Visualisierung diachroner Kollokationen mithilfe von KobRA-Werkzeugen und RapidMiner

In wenigen Schritten gelangen Sie zu den gewünschten Visualisierungen:

  1. RapidMiner starten
  2. Heruntergeladenes Verfahren (RapidMiner-Prozess) importieren über Menü „File” → „Import Process...”
  3. Dateipfade auf den eigenen Rechner anpassen:
    1. Für die Operatoren „Write CSV (2)” und „Write CSV (3)” (s. Abbildung 1) einen Ordner auswählen, in den die Belege für die Suchwörter „Frau” und „Mann” geschrieben werden (es muss für beide Operatoren derselbe Dateipfad und Dateiname angegeben werden)
    2. Diesen Dateipfad und Dateinamen auch für den Operator „Read CSV” angeben
    3. Nacheinander durch Doppelcklick auf die Operatoren „Loop Values” (s. Abbildung 2) und „Loop Values (2)” in die Schleife hinabsteigen und für den dort befindlichen Operator „Write CSV” wiederum einen Dateipfad und Dateinamen zum Speichern angeben. Empfehlung für den Dateinamen: Jahr%{loop_value}%{loop_value_inner}.txt.csv
  4. Aufruf eines Word-Cloud-Tools (z.B. „Tag Cloud Maker”, s. Abbildung 3) unter Verwendung der in Schritt 3.3 ausgegebenen Daten
  5. Durch Ändern der Daten, die man einliest, oder der Gruppierung kann man beliebig viele einfache Visualisierungen diachroner Kollokationen erzeugen
  • Abbildung 1: Illustration zur Dateipfad-Angabe für den RapidMiner-Operator „Write CSV”
  • Abbildung 2: RapidMiner-Operator „Loop Values”
  • Abbildung 3: Word-Cloud-Tool „Tag Cloud Maker”