• search hit 2 of 1
Back to Result List

Inhaltsanalytische Untersuchung zum Thema Nachhaltigkeit mit RapidMiner

Content analytical survey on the subject of sustainability with RapidMiner

  • Auf Grund der stetig wachsenden Menge an Daten gewinnt die automatische Datenanalyse durch Algorithmen zunehmend an Bedeutung. Im Speziellen trägt die Analyse von Texten ohne manuelles Zutun zu einer erhebliche Erleichterung der Extraktion von relevanten Informationen bei. Sprachliche Informationen können neben der Zuordnung zu Kategorien auf Regeln und Muster untersucht werden. Diese Art der Untersuchung fällt in den Bereich des Text Minings und in der vorliegenden Arbeit geht es darum, eine qualitative Inhaltsanalyse zum Thema Nachhaltigkeit nachzuempfinden. Es soll geprüft werden, in wie weit automatisierte Verfahren in der Lage sind, Ergebnisse einer bereits bestehenden Untersuchung zu erzielen. In der Durchführung werden mit der OpenSource Software RapidMiner vier Prozesse erstellt, die darauf abzielen, Zeitungsartikel auf ihren Inhalt zu analysieren. Unter anderem werden eine Assoziationsanalyse und eine Klassifikation realisiert, deren Ziel es ist, den Kontext und die Verwendung des Begriffes der Nachhaltigkeit in den Medien zu untersuchen. Die vorliegende Studie will prüfen, ob automatisierten Methoden im Vergleich zu manuellen Verfahren hinreichende Ergebnisse liefern können, sodass die hiesigen Resultate an denen der zu Grunde gelegten Studie von Fischer und Haucke gemessen werden sollen. Die Ergebnisse zeigen, dass die Realisierung einer Inhaltsanalyse mit RapidMiner möglich ist und zu erheblichen Zeiteinsparungen gegenüber konventionellen Verfahren führt. Sie zeigen jedoch auch, dass sich die Minderung des Aufwandes in der Ergebnisqualität widerspiegelt und somit der alleinige Einsatz von Text Mining Verfahren zur Analyse von spezifischen Kontexten noch nicht ausreichend ist.
  • Due to the continuously growing amount of data, data analysis becomes more and more important. Especially the analysis of text documents without manual support helps significally to extract the relevant information. Besides different possibilities to determine text documents, rules and patterns can be detected or categories can be assigned to language information. This kind of investigations is part of text mining and the present study is about to recreate a qualitative content analysis on the subject of sustainability. The aim is to prove how close automatic procedures can reach the results of a consisting research. The implementation contains four different processes, made with the open source software RapidMiner, that analyse the content of newspaper articles. An association analysis as well as a classification can be done to explore the context and use of the term of sustainability in public media. The present study finds out whether automatic methods or manual techniques can provide sufficient outcomes by comparing these results with those on the basis of a study by Fischer and Haucke. The findings show that it is possible to realize a content analysis with RapidMiner and to reduce the amount of time needed with conventional methods - but they also show that the results decline with the effort being diminished. Therefore text mining methods cannot be used on themselves to analyse specific contexts so far.

Download full text files

Export metadata

Additional Services

Share in Twitter Search Google Scholar
Metadaten
Author:Theresa Schöbel
URN:urn:nbn:de:gbv:luen4-opus-143906
URL: https://pub-data.leuphana.de/frontdoor/index/index/docId/755
Document Type:Bachelor Thesis
Language:German
Year of Completion:2016
Date of Publication (online):2016/02/18
Publishing Institution:Leuphana Universität Lüneburg
Release Date:2016/02/18
Tag:Data Analysis; Data Mining; RapidMiner; Sustainability
GND Keyword:RapidMiner; Datenanalyse; Nachhaltigkeit; Data Mining
Institutes:Fak 3 - Umwelt und Technik (alt) / Nachhaltigkeitsmgmt./-ökologie
Dewey Decimal Classification:0 Informatik, Informationswissenschaft, allgemeine Werke / 00 Informatik, Wissen, Systeme / 004 Datenverarbeitung; Informatik