• search hit 3 of 1022
Back to Result List

Robustness of centrality measures

Robustheit von Zentralitätsmaßen

  • Network analysis methods have long been used in the social sciences. About 25 years ago, these methods gained popularity in various other domains and many real-world phenomena have been modeled using networks. Well-known examples include (online) social networks, economic networks, web graphs, metabolic networks, infrastructure networks, and many more. Technological development made it possible to store and process data on a scale not imaginable decades ago — a development that also includes network data. A particular characteristic of network data is that, unlike standard data, the objects of interest, called nodes, have relationships to (possibly all) other objects in the network. Collecting empirical data is often complicated and cumbersome, hence, the observed data are typically incomplete and might also contain other types of errors. Because of the interdependent structure of network data, these errors have a severe impact on network analysis methods. This cumulative dissertation is about the impact of erroneous network data on centrality measures, which are methods to assess the position of an object, for example a person, with respect to all other objects in a network. Existing studies have shown that even small errors can substantially alter these positions. The impact of errors on centrality measures is typically quantified using a concept called robustness. The articles included in this dissertation contribute to a better understanding of the robustness of centrality measures in several aspects. It is argued why the robustness needs to be estimated and a new method is proposed. This method allows researchers to estimate the robustness of a centrality measure in a specific network and can be used as a basis for decision making. The relationship between network properties and the robustness of centrality measures is analyzed. Experimental and analytical approaches show that centrality measures are often more robust in networks with a larger average degree. The study of the impact of non-random errors on the robustness suggests that centrality measures are often more robust if missing nodes are more likely to belong to the same community compared to missingness completely at random. For the development of imputation procedures based on machine learning techniques, a process for the evaluation of node embedding methods is proposed.
  • Methoden der Netzwerkanalyse werden in den Sozialwissenschaften seit Langem eingesetzt. Vor etwa 25 Jahren gewannen diese Methoden in anderen Bereichen an Popularität und viele Phänomene der echten Welt wurden mithilfe von Netzwerken modelliert. Bekannte Beispiele sind Social-Media-Platformen, wirtschaftliche Netzwerke, Web-Graphen, metabolische Netzwerke, Infrastrukturnetzwerke und viele andere. Die technologische Entwicklung machte es möglich, Daten in einem Umfang zu speichern und zu verarbeiten, der vor Jahrzehnten noch unvorstellbar war — eine Entwicklung, die auch Netzwerkdaten einschließt. Ein besonderes Merkmal von Netzwerkdaten, im Gegensatz zu Standarddaten ist, dass die Objekte in einem Netzwerk, Konten genannt, Beziehungen zu (möglicherweise allen) anderen Objekten im Netzwerk haben. Das Sammeln empirischer Daten ist oft kompliziert und umständlich, daher sind die erhobenen Daten in der Regel unvollständig und können auch andere Arten von Fehlern enthalten. Aufgrund der verflochtenen Struktur der Netzwerkdaten haben diese Fehler schwerwiegende Auswirkungen auf Netzwerkanalysemethoden. In dieser kumulativen Dissertation geht es um den Einfluss fehlerhafter Netzwerkdaten auf Zentralitätsmaße. Letzteres sind Methoden zur Bestimmung der Position eines Objekts, z. B. einer Person, im Hinblick auf alle anderen Objekte in einem Netzwerk. Bestehende Studien haben gezeigt, dass selbst kleine Fehler diese Positionen wesentlich verändern können. Der Einfluss von Fehlern auf Zentralitätsmaße wird üblicherweise mit einem Konzept namens Robustheit quantifiziert. Die in dieser Dissertation enthaltenen Artikel tragen in mehreren Aspekten zu einem besseren Verständnis der Robustheit von Zentralitätsmaßen bei. Es wird argumentiert, warum die Robustheit geschätzt werden muss. Hierzu wird eine neue Methode vorgeschlagen, welche es Forschern ermöglicht, die Robustheit eines Zentralitätsmaßes in einem bestimmten Netzwerk abzuschätzen und welche als Grundlage für die Entscheidungsfindung verwendet werden kann. Die Beziehung zwischen Netzwerkeigenschaften und der Robustheit von Zentralitätsmaßen wird analysiert. Experimentelle und analytische Ansätze zeigen, dass Zentralitätsmaße in Netzwerken mit einem höheren Durchschnittsgrad oft robuster sind. Die Untersuchung des Einflusses von nicht-zufälligen Fehlern auf die Robustheit legt nahe, dass Zentralitätsmaße oft robuster sind, wenn fehlende Knoten mit zur selben Community gehören. Für die Entwicklung von Imputationsverfahren, die auf Techniken des maschinellen Lernens basieren, wird ein Verfahren zur Evaluierung von Node-Embedding-Verfahren vorgeschlagen.

Download full text files

Export metadata

Additional Services

Share in Twitter Search Google Scholar
Metadaten
Author:Christoph Martin
URN:urn:nbn:de:gbv:luen4-opus4-10401
URL: https://pub-data.leuphana.de/frontdoor/index/index/docId/1040
Advisor:Peter Niemeyer (Prof. Dr.)
Referee:Burkhardt Funk (Prof. Dr.)ORCiDGND, Frank Takes (Prof. Dr.)ORCiD
Document Type:Doctoral Thesis
Language:English
Year of Completion:2020
Date of Publication (online):2020/06/23
Date of first Publication:2020/06/23
Publishing Institution:Leuphana Universität Lüneburg, Universitätsbibliothek der Leuphana Universität Lüneburg
Granting Institution:Leuphana Universität Lüneburg
Date of final exam:2020/06/03
Release Date:2020/06/23
Tag:Graphen; Netzwerkanalyse; Netzwerke; Robustheit; Zentralitätsmaßen; Zuverlässigkeit
centrality measures; graphs; networks; reliability; robustness
Note:
Das Rahmenpapier der kumulativen Dissertation enthält vier Beiträge
Institutes:Fakultät Wirtschaftswissenschaften
Fakultät Wirtschaftswissenschaften / Institut für Wirtschaftsinformatik (IIS)
Dewey Decimal Classification:3 Sozialwissenschaften / 33 Wirtschaft / 330 Wirtschaft
Licence (German):License LogoDeutsches Urheberrecht