Text Mining

Definition:

Text Mining bezeichnet alle Techniken zur automatischen Extraktion von hochwertigen Informationen aus einem Korpus von Textdaten und erlaubt so eine effiziente Nutzung verfügbarer Textarchive.

Anwendung:

Auf einer grundlegenden Ebene ermöglichen diese Werkzeuge den Überblick über einen Text oder aus diesem die Schlüsselwörter zu entnehmen. Um eine Idee der Möglichkeiten des Text Mining zu gewinnen, siehe das Beispiel Shakespeare Searched.

Hinweis für Anwender:
Obwohl sich die Text Mining-Tools in den letzten Jahren vervielfacht haben, verlangen die meisten einige Investitionen, um angewandt werden zu können. Es gibt allerdings einige einfache Tools, die direkt online zugänglich sind und auf denen erste Erfahrungen gemacht werden können. Siehe auch die Kategorie Word cloud.

ANNIS
ANNIS (ANNotation of Information Structure) ist ein Webbrowser basiertes Open Source-Tool für die Suche und Visualisierung von komplexen linguistischen Multilevel-Korpora mit verschiedenen Annotations-Typen.

Google Ngram Viewer
Semantisches Tool, das eine graphische Visualisierung der erscheinenden Wörter im Google-Books-Korpus ermöglicht.

Textalyser
Analyse nach Häufigkeit der auftretenden Wörter oder Wortgruppen eines Textes. Verfügt über eine Stoppliste in Englisch und Französisch.

Voyant
Analyse nach Häufigkeit der auftretenden Wörter eines Textes. Verfügt über eine Stoppliste in verschiedenen Sprachen. Es wird ein Word cloud des Texts erstellt.

Textable
Das Tool ermöglicht die visuelle Analyse von Textdaten.

Weiterführende Links:
Spezialisierte Toolliste zum Text Mining.