Zur Kurzanzeige

dc.date.accessioned2019-08-15T13:26:56Z
dc.date.available2019-08-15T13:26:56Z
dc.date.issued2019
dc.identifierdoi:10.17170/kobra-20190815628
dc.identifier.urihttp://hdl.handle.net/123456789/11287
dc.language.isoengeng
dc.rightsNamensnennung - Weitergabe unter gleichen Bedingungen 3.0 Deutschland*
dc.rights.urihttp://creativecommons.org/licenses/by-sa/3.0/de/*
dc.subjectSocial Network Analysiseng
dc.subjectSocial Phenomenaeng
dc.subjectFace-to-Face Interactioneng
dc.subjectMachine Learningeng
dc.subject.ddc004
dc.titleSocial Network Mining for Analysis of Social Phenomenaeng
dc.typeDissertation
dcterms.abstractIn den letzten zehn Jahren wurde eine große Menge an Daten über menschliche Interaktionen verfügbar, die entweder aus sozialen Online-Netzwerken stammen oder von tragbaren Geräten erfasst wurden. Die klassischen Sozialwissenschaften bieten keine Instrumente für die Durchführung datengetriebener Forschung mit solchen Daten. Die computerorientierte Sozialwissenschaft (Computational Social Science) versucht, diese Lücke zu schließen, indem sie Methoden für Data-Mining und maschinelles Lernen zur Nutzung der Daten aus sozialen Netzwerken entwickelt. In diesem Kontext erforschen wir in dieser Dissertation verschiedene Verfahren zur Untersuchung sozialer Phänomene, indem wir Data-Mining-Techniken auf Daten aus sozialen Netzwerken anwenden. Wir nutzen dabei zwei verschiedene Arten von Daten: Zum einen handelt es sich um Daten aus Netzwerken der Face-to-Face-Interaktion, die mithilfe der RFID-Technologie gesammelt wurden. Diese Netzwerke ermöglichen es Forschenden, menschliche Interaktionen und soziale Phänomene wie die Community-Bildung auf Mikroebene zu erforschen. Zum anderen stammen die Daten aus sozialen Online-Netzwerken und Medien. Anhand dieser Daten lassen sich soziale Phänomene in größerem Umfang erforschen, beispielsweise Änderungen in der Mobilität der Bevölkerung bei Naturkatastrophen. Es ist wichtig, beide Datentypen zu berücksichtigen, um ein vollständiges Bild des Data-Minings in sozialen Netzwerken für die Analyse sozialer Phänomene erstellen zu können. Wir strukturieren die Arbeit in Anlehnung an den Cross-Industry Standard Process for Data Mining (CRISP-DM). Zuerst analysieren wir während der Datenverständnisphase von CRISP-DM Netzwerke der Face-to-Face-Interaktion und dabei insbesondere den Prozess der Community-Bildung. Zudem validieren wir, ob soziale Online-Netzwerke als Proxy für Offline-Aktivitäten dienen können. Die nachfolgenden Phasen der Datenvorbereitung, Modellierung und Evaluierung von CRISP-DM werden in drei Studien unterschiedlicher Art vorgestellt. Auf diese Weise demonstrieren wir den Umfang dessen, was mit der Analyse von sozialen Netzwerken möglich ist, um soziale Phänomene und Aktivitäten zu verstehen. Die erste Studie, die in Zusammenarbeit mit SozialwissenschaftlerInnen entstanden ist, stellt dar, wie die Analyse von Netzwerken der Face-to-Face-Interaktion soziologische Untersuchungen weiterentwickeln kann. In der zweiten Studie, die zusammen mit dem Pulse Lab der Vereinten Nationen in Jakarta durchgeführt wurde, zeigen wir, wie Waldbrände in sozialen Medien diskutiert werden und wie Veränderungen in der Mobilität der Bevölkerung mithilfe der Daten aus sozialen Medien beobachtet werden können. Im Rahmen der dritten Studie präsentieren wir eine Verbesserung des k-Nearest-Neighbor-Algorithmus für die Daten, die geografisch nicht gleich verteilt sind (ein Merkmal, das häufig bei Daten aus sozialen Netzwerken vorkommt). Die drei Studien zeigen unterschiedliche Möglichkeiten für die Untersuchung sozialer Netzwerke und die Entwicklung von Anwendungen, die auf deren Daten basieren. Zum Schluss stellen wir bei der Diskussion der Bereitstellungsphase von CRISP-DM die Ubicon-Plattform vor, die wir genutzt haben, um Daten zu sammeln und einige der Ergebnisse aufzubereiten. Insgesamt zeigt die Dissertation verschiedene Ansätze zur Untersuchung sozialer Phänomene mithilfe von Data-Mining und Techniken maschinellen Lernens, die auf Daten sozialer Netzwerke angewendet werden. Die präsentierten Ansätze können auf diverse Weise eingesetzt werden, von praktischen Anwendungen bis hin zu der theoretischen soziologischen Arbeit. Die Erkenntnisse aus dieser Arbeit sind relevant für Forschende aus unterschiedlichen Disziplinen (vor allem aus Informatik und Soziologie), die sich für Methoden zum Umgang mit Daten aus sozialen Netzwerken interessieren.ger
dcterms.abstractIn the last decade, a large amount of human interaction data has become available that either comes from online social networks or was captured using wearable devices. Traditional social science does not provide tools for conducting data-driven research using such data. Computational social science aims to close this gap by developing data mining and machine learning approaches for utilizing this data. Toward this end, in this thesis we explore different ways of studying social phenomena by applying data mining techniques to social network data. We use two different types of data: The first type is face-to-face interaction networks data obtained using novel wearable radio-frequency identification (RFID) technology, which represents high-resolution social networks. These networks allow researchers to study human interaction and social phenomena, such as community formation, on a micro level. The second type of data is the data available from online social networks and media. These data enable the study of social phenomena on a large scale, such as the study of changes in human mobility during disasters. It is important to consider both data types, as only in this way may we present a complete picture of the process of mining social network for analysis of social phenomena. We structure this work following the cross-industry standard process for data mining (CRISP-DM) framework. First, in CRISP-DM's data understanding phase, we aim to analyze face-to-face interaction networks and especially the process of community formation in those networks. We also validate whether online social networks can be used as a proxy for offline activities. The CRISP-DM framework's subsequent data preparation, modeling and evaluation phases are presented in three different types of studies. In this manner, we demonstrate the scope of what is possible in using social network mining to help us understand social phenomena and activities. The first study, conducted in collaboration with sociologists, shows how analysis of face-to-face interactions may enhance sociological studies. In the second study, which was carried out together with the United Nations Pulse Lab Jakarta, we show how forest fires are discussed in social media and how changes in the mobility of populations can be observed using online social media data. In the third study, we propose an improvement to the k-nearest neighbors classification algorithm for data with non-uniform geospatial distribution, a characteristic often observed in data from online social networks. These three studies show different possibilities when studying social phenomena and developing applications based on social network data. Finally, when discussing the deployment phase of the CRISP-DM framework, we present the Ubicon platform, which we used to collect data and to deploy some of our results. Altogether, this thesis shows different approaches for exploring social phenomena using data mining and machine learning techniques applied to social network data. The presented approaches have different potential use cases, from practical applications to more theoretical sociological work. The insights presented in this thesis are relevant for researchers from different disciplines, including computer science and sociology, interested in studying and developing methods to work with social network data.eng
dcterms.accessRightsopen access
dcterms.creatorKibanov, Mark
dcterms.dateAccepted2019-06-06
dcterms.extentxxii, 209 Seiten
dc.contributor.corporatenameKassel, Universität Kassel, Fachbereich Elektrotechnik / Informatikger
dc.contributor.refereeStumme, Gerd (Prof. Dr.)
dc.contributor.refereeNejdl, Wolfgang (Prof. Dr.)
dc.contributor.refereeDraude, Claude (Prof. Dr.)
dc.contributor.refereeZündorf, Albert (Prof. Dr.)
dc.subject.swdData Miningger
dc.subject.swdMaschinelles Lernenger
dc.subject.swdSocial Mediager
dc.subject.swdInterpersonale Kommunikationger
dc.subject.swdNetzwerkanalyse <Soziologie>ger
dc.type.versionpublishedVersion


Dateien zu dieser Ressource

Thumbnail
Thumbnail

Das Dokument erscheint in:

Zur Kurzanzeige

Namensnennung - Weitergabe unter gleichen Bedingungen 3.0 Deutschland
Solange nicht anders angezeigt, wird die Lizenz wie folgt beschrieben: Namensnennung - Weitergabe unter gleichen Bedingungen 3.0 Deutschland