Informatik
https://kobra.uni-kassel.de:443/handle/123456789/2006051211619
2024-03-19T03:16:12ZPatterns of Practice - Interdisciplinary Negotiation of Cultural Complexity through Practice-Based Methods in Informatics
https://kobra.uni-kassel.de:443/handle/123456789/15565
Following the principle of knowing through making, this thesis discusses development and application of a practice-based methodology for construction of digital artefacts within
cultural contexts. It addresses the epistemological diversity and complexity inhering within interdisciplinary projects, suggesting methodological devices able to navigate the variegated disciplinary landscape present within respective development projects. The conceptual pair complexity/complication acts as theoretical point of reference in order to frame mediations between the formal material of computer code and physically embodied practice in exhibition spaces. Inquiries conducted unfold poietically, in the mode of concrete construction of interactive artefacts. Interactive biographies, tangible tabletops, and collage generators are among the devices developed and deployed. Digital materiality emerges as a key category during the research process, pointing towards productive ambivalences at play within joint practices of digital making.
2022-01-01T00:00:00ZHeidt, Michael B.Following the principle of knowing through making, this thesis discusses development and application of a practice-based methodology for construction of digital artefacts within
cultural contexts. It addresses the epistemological diversity and complexity inhering within interdisciplinary projects, suggesting methodological devices able to navigate the variegated disciplinary landscape present within respective development projects. The conceptual pair complexity/complication acts as theoretical point of reference in order to frame mediations between the formal material of computer code and physically embodied practice in exhibition spaces. Inquiries conducted unfold poietically, in the mode of concrete construction of interactive artefacts. Interactive biographies, tangible tabletops, and collage generators are among the devices developed and deployed. Digital materiality emerges as a key category during the research process, pointing towards productive ambivalences at play within joint practices of digital making.Effektive Integration von heterogenen Produktkatalogen im schnelllebigen Umfeld des E-Commerce
https://kobra.uni-kassel.de:443/handle/123456789/15343
Online-Marktplätze generieren von Jahr zu Jahr einen größeren Anteil des Einzelhandelsumsatzes. Ein wichtiger Faktor für den Erfolg von Online-Marktplätzen ist die korrekte Darstellung der Produktdaten für ihre Kunden. Diese Daten werden häufig von Zulieferern in Form von Produktkatalogen zur Verfügung gestellt, die in den Online-Marktplatz integriert werden müssen. Um dies zu erreichen, sind insbesondere kleine und mittelständische Unternehmen häufig auf aufwändige manuelle Arbeitsschritte bei der Datenintegration angewiesen. Ein solcher Schritt bei der Datenintegration ist die Ermittlung von Zuordnungen zwischen den Benennungsschemata der Produktattribute der Zulieferer und dem Benennungsschema des Marktplatzes. Der Schritt ist aufwändig, da Zulieferer individuelle und häufig wechselnde Benennungsstrategien verwenden. Jede manuelle Katalogintegration erzeugt Paare von Produktkatalogen vor und nach dem Integrationsprozess. Bisher wurden diese Daten nicht genutzt, obwohl sie das Potenzial besitzen, die Schemazuordnung zu vereinfachen. Diese Arbeit widmet sich daher der Frage, inwieweit die im Rahmen eines Integrationsprozesses anfallenden Daten genutzt werden können, um das Bestimmen der Zuordnungen zu automatisieren oder zumindest die manuelle Zuordnung durch ein Empfehlungssystem zu unterstützen.
Zwei grundlegende Ansätze wurden verfolgt. Zunächst wurden ausschließlich die Attributnamen der Schemata für die Schemazuordnung verwendet. Dazu wurden mehrere Verfahren des maschinellen Lernens (ML) in Kombination mit verschiedenen Vektorisierungsstrategien für Attributnamen mit Verfahren verglichen, die ohne ML auskommen. Aufbauend auf den dabei gewonnenen Erkenntnissen wurde dann mit Attribut Label Ranking (ALR) ein neues Verfahren entwickelt, das neben Attributnamen auch Attributinstanzen zum Lernen von Zuordnungen verwendet. Die Evaluation der Verfahren erfolgte jeweils anhand von Produktdaten aus Integrationsprozessen eines Online-Marktplatzes für Antikörper. Die Ergebnisse zeigen das Potenzial der ML-Verfahren. Anhand von üblichen Vergleichsmetriken konnte die Erkennungsrate von Zuordnungen textbasierter Attribute im Vergleich zu ähnlichen Verfahren aus anderen Anwendungsbereichen um bis zu 0.5 verbessert werden. Erreichte Werte für Empfehlungsmetriken zeigen, dass die Verfahren als Empfehlungssystem zur Unterstützung der manuellen Arbeit eingesetzt werden können. Darüber hinaus ermöglicht ALR unter bestimmten Voraussetzungen eine vollautomatische Erkennung der Zuordnungen.; Online marketplaces generate a larger share of retail sales every year. An important factor for the success of online marketplaces is the correct presentation of product data to their customers. Suppliers often provide this data through product catalogs that the online marketplace needs to integrate into their web shop. In order to achieve this, small and medium-sized enterprises, in particular, often have to rely on time-consuming manual steps in data integration. One such step in data integration is the determination of mappings between the supplier naming schemes for product attributes and the marketplace naming scheme. This step is time-consuming because suppliers use individual naming strategies that can also change frequently. Every manual catalog integration creates pairs of product catalogs before and after the integration process. So far, this data has not yet been used, although it has the potential to simplify schema mapping. This work is dedicated to the question of how the data generated during an integration process can be used to automate the determination of schema mappings or, at least, to support the manual mapping process through a recommendation system.
This work employed two main approaches. First, only the attribute names of the schemas were used for schema mapping. For this purpose, several machine learning (ML) methods in combination with different vectorization strategies for attribute names were compared with methods that do not rely on ML. Second, by building upon the insights gained, a new method was developed with Attribute Label Ranking (ALR) using attribute instances and names to learn mappings. Both methods were evaluated using actual product data from integration processes of an online marketplace for antibodies.
The results show the potential of the ML methods. The recognition rate of mappings of text-based attributes improves by up to 0.5 in precision, recall and F-score compared to similar methods from different application areas. Achieved values for recommendation metrics show that the methods can be used as a recommendation system to support manual work. Furthermore, ALR enables fully automatic schema mappings under specific conditions.
2023-01-01T00:00:00ZSchmidts, Oliver MichaelOnline-Marktplätze generieren von Jahr zu Jahr einen größeren Anteil des Einzelhandelsumsatzes. Ein wichtiger Faktor für den Erfolg von Online-Marktplätzen ist die korrekte Darstellung der Produktdaten für ihre Kunden. Diese Daten werden häufig von Zulieferern in Form von Produktkatalogen zur Verfügung gestellt, die in den Online-Marktplatz integriert werden müssen. Um dies zu erreichen, sind insbesondere kleine und mittelständische Unternehmen häufig auf aufwändige manuelle Arbeitsschritte bei der Datenintegration angewiesen. Ein solcher Schritt bei der Datenintegration ist die Ermittlung von Zuordnungen zwischen den Benennungsschemata der Produktattribute der Zulieferer und dem Benennungsschema des Marktplatzes. Der Schritt ist aufwändig, da Zulieferer individuelle und häufig wechselnde Benennungsstrategien verwenden. Jede manuelle Katalogintegration erzeugt Paare von Produktkatalogen vor und nach dem Integrationsprozess. Bisher wurden diese Daten nicht genutzt, obwohl sie das Potenzial besitzen, die Schemazuordnung zu vereinfachen. Diese Arbeit widmet sich daher der Frage, inwieweit die im Rahmen eines Integrationsprozesses anfallenden Daten genutzt werden können, um das Bestimmen der Zuordnungen zu automatisieren oder zumindest die manuelle Zuordnung durch ein Empfehlungssystem zu unterstützen.
Zwei grundlegende Ansätze wurden verfolgt. Zunächst wurden ausschließlich die Attributnamen der Schemata für die Schemazuordnung verwendet. Dazu wurden mehrere Verfahren des maschinellen Lernens (ML) in Kombination mit verschiedenen Vektorisierungsstrategien für Attributnamen mit Verfahren verglichen, die ohne ML auskommen. Aufbauend auf den dabei gewonnenen Erkenntnissen wurde dann mit Attribut Label Ranking (ALR) ein neues Verfahren entwickelt, das neben Attributnamen auch Attributinstanzen zum Lernen von Zuordnungen verwendet. Die Evaluation der Verfahren erfolgte jeweils anhand von Produktdaten aus Integrationsprozessen eines Online-Marktplatzes für Antikörper. Die Ergebnisse zeigen das Potenzial der ML-Verfahren. Anhand von üblichen Vergleichsmetriken konnte die Erkennungsrate von Zuordnungen textbasierter Attribute im Vergleich zu ähnlichen Verfahren aus anderen Anwendungsbereichen um bis zu 0.5 verbessert werden. Erreichte Werte für Empfehlungsmetriken zeigen, dass die Verfahren als Empfehlungssystem zur Unterstützung der manuellen Arbeit eingesetzt werden können. Darüber hinaus ermöglicht ALR unter bestimmten Voraussetzungen eine vollautomatische Erkennung der Zuordnungen.
Online marketplaces generate a larger share of retail sales every year. An important factor for the success of online marketplaces is the correct presentation of product data to their customers. Suppliers often provide this data through product catalogs that the online marketplace needs to integrate into their web shop. In order to achieve this, small and medium-sized enterprises, in particular, often have to rely on time-consuming manual steps in data integration. One such step in data integration is the determination of mappings between the supplier naming schemes for product attributes and the marketplace naming scheme. This step is time-consuming because suppliers use individual naming strategies that can also change frequently. Every manual catalog integration creates pairs of product catalogs before and after the integration process. So far, this data has not yet been used, although it has the potential to simplify schema mapping. This work is dedicated to the question of how the data generated during an integration process can be used to automate the determination of schema mappings or, at least, to support the manual mapping process through a recommendation system.
This work employed two main approaches. First, only the attribute names of the schemas were used for schema mapping. For this purpose, several machine learning (ML) methods in combination with different vectorization strategies for attribute names were compared with methods that do not rely on ML. Second, by building upon the insights gained, a new method was developed with Attribute Label Ranking (ALR) using attribute instances and names to learn mappings. Both methods were evaluated using actual product data from integration processes of an online marketplace for antibodies.
The results show the potential of the ML methods. The recognition rate of mappings of text-based attributes improves by up to 0.5 in precision, recall and F-score compared to similar methods from different application areas. Achieved values for recommendation metrics show that the methods can be used as a recommendation system to support manual work. Furthermore, ALR enables fully automatic schema mappings under specific conditions.Orometry, Intrinsic Dimensionality and Learning: Novel Insights into Network Data
https://kobra.uni-kassel.de:443/handle/123456789/15182
Today, networks are an integral part of our world. Let it be real-life friendship networks or social connections that are based on social media. In this thesis, we contribute to the understanding of networks by studying networks from three different perspectives. First, we adapt notions and concepts from orometry to metric data and networks to gain novel insights from a local perspective. Specifically, we study measures of local outstandingness and propose concepts to derive small hierarchies from larger networks. These hierarchies are originally designed for the sake of defining dominance relationships between mountain peaks. Our adaption allows to identify outstanding entities on a local level and small hierarchies between them. Second, we evaluate networks from a global perspective by computing the intrinsic dimensionality of whole networks. Here, a low intrinsic dimensionality stands for data with highly distinguishable data points, which is crucial for learning. To accomplish this, we develop practical algorithms and speed-up techniques to transfer an axiomatically grounded framework to large-scale graph data. Furthermore, as an application, we present a feature selection method based on the developed method for computing intrinsic dimensions. Third, we propose two novel deep learning methods for representation learning on networks, leading to condensed perspectives on them. The first method learns embeddings with the help of techniques from formal concept analysis. This approach leads to a novel paradigm for embedding learning for bipartite graphs as it does not incorporate simple neighborhood information but the concept lattice structure of the corresponding formal context. The second method is a combination of a graph neural network and a language model and is tailored for a special network structure and the special task of author verification. This task deals with the verification of links between authors and publications. Our method is designed such that it can process raw texts and also incorporates past co-authorship edges. In conclusion, this thesis contributes to the understanding and investigation of networks from a local, global, and condensed perspective. This is done by proposing novel measures and structures for them based on orometric concepts and intrinsic dimensionality and by providing novel learning methods for bipartite networks in general and author-publication networks in specific.; Netzwerke sind integraler Bestandteil unseres Lebens, seien es echte Freundschaftsnetzwerke oder Verbindungen, welche auf sozialen Medien beruhen. In dieser Arbeit tragen wir dazu bei, solche Netzwerke besser zu verstehen. Dafür studieren wir Netzwerke aus drei Perspektiven: Erstens, adaptieren wir orometrische Konzepte auf metrische Daten und Netzwerke um diese Daten aus einer globalen Perspektive zu betrachten. Genauer gesagt untersuchen wir Maße für lokale Herausragendheit und stellen Konzepte vor, welche es ermöglichen Hierarchien von kleinen Teilmengen aus größeren Netzwerken abzuleiten. Diese Hierarchien sind ursprünglich dafür gedacht um Dominanzbeziehungen zwischen Berggipfeln darzustellen. Unsere Adaption auf Netzwerke führt zu überschaubaren Hierarchien zwischen herausragenden Akteuren und ist somit ein neuartiges Werkzeug im Rahmen der Netzwerkanalyse. Zweitens evaluieren wir die intrinsische Dimensionalität eines gesamten Netzwerkes um neue Einblicke aus einer globalen Perspektive zu erhalten. Dafür entwickeln wir Algorithmen und Effizienztechniken um ein axiomatisch fundiertes Framework für große Echtweltgraphen anwendbar zu machen. Zusätzlich erläutern wir eine abgeleitete Methode zur Featureselektion, welche sich als kompetitiv zu repräsentativen Baselines erweist. Drittens stellen wir zwei neuartige Deep-Learning Methoden für das Repräsentationslernen auf Netzwerken vor, was zu kondensierten Perspektiven führt. Die erste Methode lernt Einbettung mit der Hilfe des Begriffsverbandes eines formalen Kontextes. Dieses Vorgehen begründet ein neuartiges Paradigma zum Lernen von Einbettungen auf bipartiten Graphen, welches nicht auf Nachbarschaften, sondern auf Verbandsstrukturen beruht. Die zweite Methode kombiniert ein Graph Neuronales Netz mit einem Sprachmodell. Diese Methode wurde für die Verifikation von Autorenschaften entwickelt. Sie erlaubt, Textdaten und vergangene Ko-Autorenschaften in den Klassifikationsprozess einzubringen. Zusammenfassend leistet diese Arbeit einen Beitrag zur Untersuchung und Verarbeitung von Netzwerken durch die Einführung neuer Maße und Strukturen basierend auf orometrischen Konzepten und der intrinsischen Dimensionalität. Außerdem stellen wir neuartige Lernmethoden für spezielle Klassen von Netzwerken vor.
2023-11-01T00:00:00ZStubbemann, MaximilianToday, networks are an integral part of our world. Let it be real-life friendship networks or social connections that are based on social media. In this thesis, we contribute to the understanding of networks by studying networks from three different perspectives. First, we adapt notions and concepts from orometry to metric data and networks to gain novel insights from a local perspective. Specifically, we study measures of local outstandingness and propose concepts to derive small hierarchies from larger networks. These hierarchies are originally designed for the sake of defining dominance relationships between mountain peaks. Our adaption allows to identify outstanding entities on a local level and small hierarchies between them. Second, we evaluate networks from a global perspective by computing the intrinsic dimensionality of whole networks. Here, a low intrinsic dimensionality stands for data with highly distinguishable data points, which is crucial for learning. To accomplish this, we develop practical algorithms and speed-up techniques to transfer an axiomatically grounded framework to large-scale graph data. Furthermore, as an application, we present a feature selection method based on the developed method for computing intrinsic dimensions. Third, we propose two novel deep learning methods for representation learning on networks, leading to condensed perspectives on them. The first method learns embeddings with the help of techniques from formal concept analysis. This approach leads to a novel paradigm for embedding learning for bipartite graphs as it does not incorporate simple neighborhood information but the concept lattice structure of the corresponding formal context. The second method is a combination of a graph neural network and a language model and is tailored for a special network structure and the special task of author verification. This task deals with the verification of links between authors and publications. Our method is designed such that it can process raw texts and also incorporates past co-authorship edges. In conclusion, this thesis contributes to the understanding and investigation of networks from a local, global, and condensed perspective. This is done by proposing novel measures and structures for them based on orometric concepts and intrinsic dimensionality and by providing novel learning methods for bipartite networks in general and author-publication networks in specific.
Netzwerke sind integraler Bestandteil unseres Lebens, seien es echte Freundschaftsnetzwerke oder Verbindungen, welche auf sozialen Medien beruhen. In dieser Arbeit tragen wir dazu bei, solche Netzwerke besser zu verstehen. Dafür studieren wir Netzwerke aus drei Perspektiven: Erstens, adaptieren wir orometrische Konzepte auf metrische Daten und Netzwerke um diese Daten aus einer globalen Perspektive zu betrachten. Genauer gesagt untersuchen wir Maße für lokale Herausragendheit und stellen Konzepte vor, welche es ermöglichen Hierarchien von kleinen Teilmengen aus größeren Netzwerken abzuleiten. Diese Hierarchien sind ursprünglich dafür gedacht um Dominanzbeziehungen zwischen Berggipfeln darzustellen. Unsere Adaption auf Netzwerke führt zu überschaubaren Hierarchien zwischen herausragenden Akteuren und ist somit ein neuartiges Werkzeug im Rahmen der Netzwerkanalyse. Zweitens evaluieren wir die intrinsische Dimensionalität eines gesamten Netzwerkes um neue Einblicke aus einer globalen Perspektive zu erhalten. Dafür entwickeln wir Algorithmen und Effizienztechniken um ein axiomatisch fundiertes Framework für große Echtweltgraphen anwendbar zu machen. Zusätzlich erläutern wir eine abgeleitete Methode zur Featureselektion, welche sich als kompetitiv zu repräsentativen Baselines erweist. Drittens stellen wir zwei neuartige Deep-Learning Methoden für das Repräsentationslernen auf Netzwerken vor, was zu kondensierten Perspektiven führt. Die erste Methode lernt Einbettung mit der Hilfe des Begriffsverbandes eines formalen Kontextes. Dieses Vorgehen begründet ein neuartiges Paradigma zum Lernen von Einbettungen auf bipartiten Graphen, welches nicht auf Nachbarschaften, sondern auf Verbandsstrukturen beruht. Die zweite Methode kombiniert ein Graph Neuronales Netz mit einem Sprachmodell. Diese Methode wurde für die Verifikation von Autorenschaften entwickelt. Sie erlaubt, Textdaten und vergangene Ko-Autorenschaften in den Klassifikationsprozess einzubringen. Zusammenfassend leistet diese Arbeit einen Beitrag zur Untersuchung und Verarbeitung von Netzwerken durch die Einführung neuer Maße und Strukturen basierend auf orometrischen Konzepten und der intrinsischen Dimensionalität. Außerdem stellen wir neuartige Lernmethoden für spezielle Klassen von Netzwerken vor.Trajectory Mapping in Physical and Topical Spaces
https://kobra.uni-kassel.de:443/handle/123456789/15117
In this dissertation, two different types of trajectories are investigated. In the engfirst part of this work, we investigate methods for the analysis of physical trajectories. We focus on scenarios, in which signal strengths ofWiFi access points are recorded. In detail, they are recorded through smartphone devices by people moving through a building. By means of theWiFi signal strengths, (physical) trajectories of humans are reconstructed, which reflect the locations visited over time. Accurate localization based onWiFi signal strenghts is difficult due to different disturbances and differences in sensor hardware. Hence, our aim is not to create an accurate floor plan, but locations and trajectories in this work are reflected by an automatically constructed topological map, which represents locations and some relation between them (e.g., being visited one after another).
In the second part of this thesis, we investigate scientific trajectories in topical spaces. Similar to any person leaving trajectories in physical spaces, scientists leave trajectories in topical spaces by means of the publications they write. The research of scientific authors is often focussed on one or several specific (research) topics. Over the years, these focussed topics may change, resulting in what we - in this work call - topic space trajectories. Next to authors, trajectories in topic space can also be created by scientific venues, i.e., conferences or journals. This may reflect characteristics of the venues. On a larger scale, trajectories may also give an overview over the overall changing interest in scientific topics. We investigate, in this work, methods for mapping trajectories of both, scientific authors and venues, reaching for methods such as dimension reduction and topic models. Based on these approaches, we also investigate how topical expertise is passed between scientists as topic flows through co-author networks. Finally, we investigate a practical scenario in which the topics of scientific venues are used to create an explainable, scientific venue recommendation system.
The different aspects of our work are connected through a case study on the different approaches. In the physical trajectory setting, our case study is comprised of, first, an office scenario in which people follow their normal day behavior and, second, an exhibition scenario in which different booths distributed within a multifloor building are visited during a congress. For topical trajectories, we conduct the case study on top machine learning conferences and journals as well as important authors from this field. Finally, for topic flows, the case study is continued on large publication data sets from mathematics and computer science, comprised of about 20 Mio. publications spanning over 60 years of research. The case study demonstrates the benefits of our approaches.; In dieser Dissertationwerden zwei verschiedene Arten von Trajektorien untersucht. Im ersten Teil dieser Arbeit untersuchen wir Methoden zur Analyse von physischen Trajektorien. Wir fokussieren uns auf Szenarien, in denen Personen durch ihre Smartphones die Signalstärken von WiFi Access Points in Gebäuden aufzeichnen. Anhand derWiFi-Signalstärken werden (physische) Trajektorien rekonstruiert, die die im Laufe der Zeit besuchten Orte widerspiegeln. Eine genaue Lokalisierung auf der Grundlage von WiFi-Signalstärken ist aufgrund verschiedener Störungen und unterschiedlicher Sensorhardware schwierig. Das Ziel dieser Arbeit ist daher, im Gegensatz zu einem genauen Grundriss, die automatische Repräsentation von Standorten und Trajektorien durch eine topologische Karte, die Orte und Relationen zwischen ihnen darstellt (z.B. dass sie nacheinander besucht werden).
Im zweiten Teil dieser Arbeit untersuchen wir wissenschaftliche Trajektorien in thematischen Räumen. Ähnlich wie jeder Mensch Trajektorien in physischen Räumen hinterlässt, hinterlassenWissenschaftler Trajektorien in thematischen Räumen durch die Publikationen, die sie verfassen. Die Forschung wissenschaftlicher Autoren ist in der Regel auf ein oder mehrere spezifische (Forschungs-)Themen fokussiert. Im Laufe der Jahre können sich diese fokussierten Themen ändern, was wir - in dieser Arbeit - als Topic Space Trajectories bezeichnen. Neben den Autoren können Trajektorien im Themenraum auch von wissenschaftlichen Konferenzen oder Zeitschriften erzeugt werden. In einem größeren Maßstab können Trajektorien auch einen Überblick über das sich insgesamt verändernde Interesse an wissenschaftlichen Themen geben. In dieser Arbeit untersuchen wir Methoden zur Abbildung thematischer wissenschaftlicher Trajektorien und greifen dabei auf Methoden wie Dimensionsreduktion und Topic Models zurück. Auf dieser Grundlage untersuchen wirweiterhin, wie thematisches Fachwissen zwischen Wissenschaftlern in Form von Topic Flows durch Koautorennetzwerke weitergegeben wird. Schließlich untersuchen wir ein praktisches Szenario, in dem die Themen wissenschaftlicher Veranstaltungsorte verwendet werden, um ein erklärbares Empfehlungssystem für wissenschaftliche Veranstaltungsorte zu entwickeln.
Die verschiedenen Aspekte und Ansätze unserer Arbeit werden durch eine Fallstudie verknüpft. Im Bereich der physischen Trajektorien besteht unsere Fallstudie aus einem Büroszenario und einem Kongressszenario. Für thematische Trajektorien untersuchen wir Publikationen der wichtigsten Autoren, Konferenzen und Zeitschriften für maschinelles Lernen. Für Topic Flows schließlich wird die Fallstudie mit großen Publikationsdatensätzen aus Mathematik und Informatik fortgesetzt, die etwa 20 Mio. Publikationen aus über 60 Jahren Forschung umfassen.
Die Fallstudie veranschaulicht die Vorteile unserer Ansätze.
2023-01-01T00:00:00ZSchäfermeier, BastianIn this dissertation, two different types of trajectories are investigated. In the engfirst part of this work, we investigate methods for the analysis of physical trajectories. We focus on scenarios, in which signal strengths ofWiFi access points are recorded. In detail, they are recorded through smartphone devices by people moving through a building. By means of theWiFi signal strengths, (physical) trajectories of humans are reconstructed, which reflect the locations visited over time. Accurate localization based onWiFi signal strenghts is difficult due to different disturbances and differences in sensor hardware. Hence, our aim is not to create an accurate floor plan, but locations and trajectories in this work are reflected by an automatically constructed topological map, which represents locations and some relation between them (e.g., being visited one after another).
In the second part of this thesis, we investigate scientific trajectories in topical spaces. Similar to any person leaving trajectories in physical spaces, scientists leave trajectories in topical spaces by means of the publications they write. The research of scientific authors is often focussed on one or several specific (research) topics. Over the years, these focussed topics may change, resulting in what we - in this work call - topic space trajectories. Next to authors, trajectories in topic space can also be created by scientific venues, i.e., conferences or journals. This may reflect characteristics of the venues. On a larger scale, trajectories may also give an overview over the overall changing interest in scientific topics. We investigate, in this work, methods for mapping trajectories of both, scientific authors and venues, reaching for methods such as dimension reduction and topic models. Based on these approaches, we also investigate how topical expertise is passed between scientists as topic flows through co-author networks. Finally, we investigate a practical scenario in which the topics of scientific venues are used to create an explainable, scientific venue recommendation system.
The different aspects of our work are connected through a case study on the different approaches. In the physical trajectory setting, our case study is comprised of, first, an office scenario in which people follow their normal day behavior and, second, an exhibition scenario in which different booths distributed within a multifloor building are visited during a congress. For topical trajectories, we conduct the case study on top machine learning conferences and journals as well as important authors from this field. Finally, for topic flows, the case study is continued on large publication data sets from mathematics and computer science, comprised of about 20 Mio. publications spanning over 60 years of research. The case study demonstrates the benefits of our approaches.
In dieser Dissertationwerden zwei verschiedene Arten von Trajektorien untersucht. Im ersten Teil dieser Arbeit untersuchen wir Methoden zur Analyse von physischen Trajektorien. Wir fokussieren uns auf Szenarien, in denen Personen durch ihre Smartphones die Signalstärken von WiFi Access Points in Gebäuden aufzeichnen. Anhand derWiFi-Signalstärken werden (physische) Trajektorien rekonstruiert, die die im Laufe der Zeit besuchten Orte widerspiegeln. Eine genaue Lokalisierung auf der Grundlage von WiFi-Signalstärken ist aufgrund verschiedener Störungen und unterschiedlicher Sensorhardware schwierig. Das Ziel dieser Arbeit ist daher, im Gegensatz zu einem genauen Grundriss, die automatische Repräsentation von Standorten und Trajektorien durch eine topologische Karte, die Orte und Relationen zwischen ihnen darstellt (z.B. dass sie nacheinander besucht werden).
Im zweiten Teil dieser Arbeit untersuchen wir wissenschaftliche Trajektorien in thematischen Räumen. Ähnlich wie jeder Mensch Trajektorien in physischen Räumen hinterlässt, hinterlassenWissenschaftler Trajektorien in thematischen Räumen durch die Publikationen, die sie verfassen. Die Forschung wissenschaftlicher Autoren ist in der Regel auf ein oder mehrere spezifische (Forschungs-)Themen fokussiert. Im Laufe der Jahre können sich diese fokussierten Themen ändern, was wir - in dieser Arbeit - als Topic Space Trajectories bezeichnen. Neben den Autoren können Trajektorien im Themenraum auch von wissenschaftlichen Konferenzen oder Zeitschriften erzeugt werden. In einem größeren Maßstab können Trajektorien auch einen Überblick über das sich insgesamt verändernde Interesse an wissenschaftlichen Themen geben. In dieser Arbeit untersuchen wir Methoden zur Abbildung thematischer wissenschaftlicher Trajektorien und greifen dabei auf Methoden wie Dimensionsreduktion und Topic Models zurück. Auf dieser Grundlage untersuchen wirweiterhin, wie thematisches Fachwissen zwischen Wissenschaftlern in Form von Topic Flows durch Koautorennetzwerke weitergegeben wird. Schließlich untersuchen wir ein praktisches Szenario, in dem die Themen wissenschaftlicher Veranstaltungsorte verwendet werden, um ein erklärbares Empfehlungssystem für wissenschaftliche Veranstaltungsorte zu entwickeln.
Die verschiedenen Aspekte und Ansätze unserer Arbeit werden durch eine Fallstudie verknüpft. Im Bereich der physischen Trajektorien besteht unsere Fallstudie aus einem Büroszenario und einem Kongressszenario. Für thematische Trajektorien untersuchen wir Publikationen der wichtigsten Autoren, Konferenzen und Zeitschriften für maschinelles Lernen. Für Topic Flows schließlich wird die Fallstudie mit großen Publikationsdatensätzen aus Mathematik und Informatik fortgesetzt, die etwa 20 Mio. Publikationen aus über 60 Jahren Forschung umfassen.
Die Fallstudie veranschaulicht die Vorteile unserer Ansätze.