FB 16 Elektrotechnik / Informatik
https://kobra.uni-kassel.de:443/handle/123456789/200602146884
2024-03-19T09:50:49ZPatterns of Practice - Interdisciplinary Negotiation of Cultural Complexity through Practice-Based Methods in Informatics
https://kobra.uni-kassel.de:443/handle/123456789/15565
Following the principle of knowing through making, this thesis discusses development and application of a practice-based methodology for construction of digital artefacts within
cultural contexts. It addresses the epistemological diversity and complexity inhering within interdisciplinary projects, suggesting methodological devices able to navigate the variegated disciplinary landscape present within respective development projects. The conceptual pair complexity/complication acts as theoretical point of reference in order to frame mediations between the formal material of computer code and physically embodied practice in exhibition spaces. Inquiries conducted unfold poietically, in the mode of concrete construction of interactive artefacts. Interactive biographies, tangible tabletops, and collage generators are among the devices developed and deployed. Digital materiality emerges as a key category during the research process, pointing towards productive ambivalences at play within joint practices of digital making.
2022-01-01T00:00:00ZHeidt, Michael B.Following the principle of knowing through making, this thesis discusses development and application of a practice-based methodology for construction of digital artefacts within
cultural contexts. It addresses the epistemological diversity and complexity inhering within interdisciplinary projects, suggesting methodological devices able to navigate the variegated disciplinary landscape present within respective development projects. The conceptual pair complexity/complication acts as theoretical point of reference in order to frame mediations between the formal material of computer code and physically embodied practice in exhibition spaces. Inquiries conducted unfold poietically, in the mode of concrete construction of interactive artefacts. Interactive biographies, tangible tabletops, and collage generators are among the devices developed and deployed. Digital materiality emerges as a key category during the research process, pointing towards productive ambivalences at play within joint practices of digital making.Effektive Integration von heterogenen Produktkatalogen im schnelllebigen Umfeld des E-Commerce
https://kobra.uni-kassel.de:443/handle/123456789/15343
Online-Marktplätze generieren von Jahr zu Jahr einen größeren Anteil des Einzelhandelsumsatzes. Ein wichtiger Faktor für den Erfolg von Online-Marktplätzen ist die korrekte Darstellung der Produktdaten für ihre Kunden. Diese Daten werden häufig von Zulieferern in Form von Produktkatalogen zur Verfügung gestellt, die in den Online-Marktplatz integriert werden müssen. Um dies zu erreichen, sind insbesondere kleine und mittelständische Unternehmen häufig auf aufwändige manuelle Arbeitsschritte bei der Datenintegration angewiesen. Ein solcher Schritt bei der Datenintegration ist die Ermittlung von Zuordnungen zwischen den Benennungsschemata der Produktattribute der Zulieferer und dem Benennungsschema des Marktplatzes. Der Schritt ist aufwändig, da Zulieferer individuelle und häufig wechselnde Benennungsstrategien verwenden. Jede manuelle Katalogintegration erzeugt Paare von Produktkatalogen vor und nach dem Integrationsprozess. Bisher wurden diese Daten nicht genutzt, obwohl sie das Potenzial besitzen, die Schemazuordnung zu vereinfachen. Diese Arbeit widmet sich daher der Frage, inwieweit die im Rahmen eines Integrationsprozesses anfallenden Daten genutzt werden können, um das Bestimmen der Zuordnungen zu automatisieren oder zumindest die manuelle Zuordnung durch ein Empfehlungssystem zu unterstützen.
Zwei grundlegende Ansätze wurden verfolgt. Zunächst wurden ausschließlich die Attributnamen der Schemata für die Schemazuordnung verwendet. Dazu wurden mehrere Verfahren des maschinellen Lernens (ML) in Kombination mit verschiedenen Vektorisierungsstrategien für Attributnamen mit Verfahren verglichen, die ohne ML auskommen. Aufbauend auf den dabei gewonnenen Erkenntnissen wurde dann mit Attribut Label Ranking (ALR) ein neues Verfahren entwickelt, das neben Attributnamen auch Attributinstanzen zum Lernen von Zuordnungen verwendet. Die Evaluation der Verfahren erfolgte jeweils anhand von Produktdaten aus Integrationsprozessen eines Online-Marktplatzes für Antikörper. Die Ergebnisse zeigen das Potenzial der ML-Verfahren. Anhand von üblichen Vergleichsmetriken konnte die Erkennungsrate von Zuordnungen textbasierter Attribute im Vergleich zu ähnlichen Verfahren aus anderen Anwendungsbereichen um bis zu 0.5 verbessert werden. Erreichte Werte für Empfehlungsmetriken zeigen, dass die Verfahren als Empfehlungssystem zur Unterstützung der manuellen Arbeit eingesetzt werden können. Darüber hinaus ermöglicht ALR unter bestimmten Voraussetzungen eine vollautomatische Erkennung der Zuordnungen.; Online marketplaces generate a larger share of retail sales every year. An important factor for the success of online marketplaces is the correct presentation of product data to their customers. Suppliers often provide this data through product catalogs that the online marketplace needs to integrate into their web shop. In order to achieve this, small and medium-sized enterprises, in particular, often have to rely on time-consuming manual steps in data integration. One such step in data integration is the determination of mappings between the supplier naming schemes for product attributes and the marketplace naming scheme. This step is time-consuming because suppliers use individual naming strategies that can also change frequently. Every manual catalog integration creates pairs of product catalogs before and after the integration process. So far, this data has not yet been used, although it has the potential to simplify schema mapping. This work is dedicated to the question of how the data generated during an integration process can be used to automate the determination of schema mappings or, at least, to support the manual mapping process through a recommendation system.
This work employed two main approaches. First, only the attribute names of the schemas were used for schema mapping. For this purpose, several machine learning (ML) methods in combination with different vectorization strategies for attribute names were compared with methods that do not rely on ML. Second, by building upon the insights gained, a new method was developed with Attribute Label Ranking (ALR) using attribute instances and names to learn mappings. Both methods were evaluated using actual product data from integration processes of an online marketplace for antibodies.
The results show the potential of the ML methods. The recognition rate of mappings of text-based attributes improves by up to 0.5 in precision, recall and F-score compared to similar methods from different application areas. Achieved values for recommendation metrics show that the methods can be used as a recommendation system to support manual work. Furthermore, ALR enables fully automatic schema mappings under specific conditions.
2023-01-01T00:00:00ZSchmidts, Oliver MichaelOnline-Marktplätze generieren von Jahr zu Jahr einen größeren Anteil des Einzelhandelsumsatzes. Ein wichtiger Faktor für den Erfolg von Online-Marktplätzen ist die korrekte Darstellung der Produktdaten für ihre Kunden. Diese Daten werden häufig von Zulieferern in Form von Produktkatalogen zur Verfügung gestellt, die in den Online-Marktplatz integriert werden müssen. Um dies zu erreichen, sind insbesondere kleine und mittelständische Unternehmen häufig auf aufwändige manuelle Arbeitsschritte bei der Datenintegration angewiesen. Ein solcher Schritt bei der Datenintegration ist die Ermittlung von Zuordnungen zwischen den Benennungsschemata der Produktattribute der Zulieferer und dem Benennungsschema des Marktplatzes. Der Schritt ist aufwändig, da Zulieferer individuelle und häufig wechselnde Benennungsstrategien verwenden. Jede manuelle Katalogintegration erzeugt Paare von Produktkatalogen vor und nach dem Integrationsprozess. Bisher wurden diese Daten nicht genutzt, obwohl sie das Potenzial besitzen, die Schemazuordnung zu vereinfachen. Diese Arbeit widmet sich daher der Frage, inwieweit die im Rahmen eines Integrationsprozesses anfallenden Daten genutzt werden können, um das Bestimmen der Zuordnungen zu automatisieren oder zumindest die manuelle Zuordnung durch ein Empfehlungssystem zu unterstützen.
Zwei grundlegende Ansätze wurden verfolgt. Zunächst wurden ausschließlich die Attributnamen der Schemata für die Schemazuordnung verwendet. Dazu wurden mehrere Verfahren des maschinellen Lernens (ML) in Kombination mit verschiedenen Vektorisierungsstrategien für Attributnamen mit Verfahren verglichen, die ohne ML auskommen. Aufbauend auf den dabei gewonnenen Erkenntnissen wurde dann mit Attribut Label Ranking (ALR) ein neues Verfahren entwickelt, das neben Attributnamen auch Attributinstanzen zum Lernen von Zuordnungen verwendet. Die Evaluation der Verfahren erfolgte jeweils anhand von Produktdaten aus Integrationsprozessen eines Online-Marktplatzes für Antikörper. Die Ergebnisse zeigen das Potenzial der ML-Verfahren. Anhand von üblichen Vergleichsmetriken konnte die Erkennungsrate von Zuordnungen textbasierter Attribute im Vergleich zu ähnlichen Verfahren aus anderen Anwendungsbereichen um bis zu 0.5 verbessert werden. Erreichte Werte für Empfehlungsmetriken zeigen, dass die Verfahren als Empfehlungssystem zur Unterstützung der manuellen Arbeit eingesetzt werden können. Darüber hinaus ermöglicht ALR unter bestimmten Voraussetzungen eine vollautomatische Erkennung der Zuordnungen.
Online marketplaces generate a larger share of retail sales every year. An important factor for the success of online marketplaces is the correct presentation of product data to their customers. Suppliers often provide this data through product catalogs that the online marketplace needs to integrate into their web shop. In order to achieve this, small and medium-sized enterprises, in particular, often have to rely on time-consuming manual steps in data integration. One such step in data integration is the determination of mappings between the supplier naming schemes for product attributes and the marketplace naming scheme. This step is time-consuming because suppliers use individual naming strategies that can also change frequently. Every manual catalog integration creates pairs of product catalogs before and after the integration process. So far, this data has not yet been used, although it has the potential to simplify schema mapping. This work is dedicated to the question of how the data generated during an integration process can be used to automate the determination of schema mappings or, at least, to support the manual mapping process through a recommendation system.
This work employed two main approaches. First, only the attribute names of the schemas were used for schema mapping. For this purpose, several machine learning (ML) methods in combination with different vectorization strategies for attribute names were compared with methods that do not rely on ML. Second, by building upon the insights gained, a new method was developed with Attribute Label Ranking (ALR) using attribute instances and names to learn mappings. Both methods were evaluated using actual product data from integration processes of an online marketplace for antibodies.
The results show the potential of the ML methods. The recognition rate of mappings of text-based attributes improves by up to 0.5 in precision, recall and F-score compared to similar methods from different application areas. Achieved values for recommendation metrics show that the methods can be used as a recommendation system to support manual work. Furthermore, ALR enables fully automatic schema mappings under specific conditions.Regionalisierung von E-Kfz-Ladestellen in Szenarien für den zukünftigen Ausbau in Deutschland
https://kobra.uni-kassel.de:443/handle/123456789/15225
Ein wesentlicher Baustein zur Senkung der CO2-Emissionen im Verkehrssektor ist die Elektrifizierung des Individualverkehrs, wobei die schnell wachsende Lade-infrastruktur Auswirkungen auf das Stromnetz hat. Netzberechnungen erfordern die räumliche Verortung von zukünftigen Ladestellen. Die vorliegende Arbeit mo-delliert dafür Heimladestellen und öffentlich zugängliche Ladestellen holistisch und punktgenau, und ist für alle Gemeinden in Deutschland anwendbar. Zunächst wird die Anzahl an Elektrofahrzeugen und Ladestellen je Gemeinde bestimmt. Hierbei werden unter anderem der demografische Wandel und Pendlerstatistiken berücksichtigt. Fokus der Arbeit ist die daran anschließende Detailregionalisie-rung, die am Beispiel Hamburg vorgestellt wird. Das Heimlade-Modell basiert auf einer synthetischen Bevölkerung auf Haushaltsebene unter Einbeziehung sozio-ökonomischer Aspekte. Für öffentlich zugängliche Ladestellen werden Ladebe-darfe, unter anderem bei Points of Interest, den Parkplatzpotentialen gegenüber-gestellt. Modellumfang und Detailtiefe bieten gegenüber bisherigen Verfahren validierte Vorteile. Beispielsweise werden Minimalwerte öffentlicher Lade- bedarfe realistischer abgebildet als in einem verglichenen KI-Verfahren, und die haushaltsscharfe Zuordnung zeigt eine engere Korrelation zu Zensusdaten als straßenzugbasierte Ansätze. Für die praktische Anwendung in der Netzplanung ist eine Schnittstelle zu Ladezeitreihen und Netzberechnungen ausgearbeitet. Die so zugänglichen Modellergebnisse eignen sich für die recheneffiziente Abbildung einer großen Szenarienbandbreite, sowie für die probabilistische Berechnung eines konsekutiven Netzausbaus. Damit wurde ein sehr wertvolles Werkzeug geschaffen, um die dringend notwendige Umsetzung der Energie-wende zu unterstützen.
2023-04-01T00:00:00ZGauglitz, PhilipEin wesentlicher Baustein zur Senkung der CO2-Emissionen im Verkehrssektor ist die Elektrifizierung des Individualverkehrs, wobei die schnell wachsende Lade-infrastruktur Auswirkungen auf das Stromnetz hat. Netzberechnungen erfordern die räumliche Verortung von zukünftigen Ladestellen. Die vorliegende Arbeit mo-delliert dafür Heimladestellen und öffentlich zugängliche Ladestellen holistisch und punktgenau, und ist für alle Gemeinden in Deutschland anwendbar. Zunächst wird die Anzahl an Elektrofahrzeugen und Ladestellen je Gemeinde bestimmt. Hierbei werden unter anderem der demografische Wandel und Pendlerstatistiken berücksichtigt. Fokus der Arbeit ist die daran anschließende Detailregionalisie-rung, die am Beispiel Hamburg vorgestellt wird. Das Heimlade-Modell basiert auf einer synthetischen Bevölkerung auf Haushaltsebene unter Einbeziehung sozio-ökonomischer Aspekte. Für öffentlich zugängliche Ladestellen werden Ladebe-darfe, unter anderem bei Points of Interest, den Parkplatzpotentialen gegenüber-gestellt. Modellumfang und Detailtiefe bieten gegenüber bisherigen Verfahren validierte Vorteile. Beispielsweise werden Minimalwerte öffentlicher Lade- bedarfe realistischer abgebildet als in einem verglichenen KI-Verfahren, und die haushaltsscharfe Zuordnung zeigt eine engere Korrelation zu Zensusdaten als straßenzugbasierte Ansätze. Für die praktische Anwendung in der Netzplanung ist eine Schnittstelle zu Ladezeitreihen und Netzberechnungen ausgearbeitet. Die so zugänglichen Modellergebnisse eignen sich für die recheneffiziente Abbildung einer großen Szenarienbandbreite, sowie für die probabilistische Berechnung eines konsekutiven Netzausbaus. Damit wurde ein sehr wertvolles Werkzeug geschaffen, um die dringend notwendige Umsetzung der Energie-wende zu unterstützen.Orometry, Intrinsic Dimensionality and Learning: Novel Insights into Network Data
https://kobra.uni-kassel.de:443/handle/123456789/15182
Today, networks are an integral part of our world. Let it be real-life friendship networks or social connections that are based on social media. In this thesis, we contribute to the understanding of networks by studying networks from three different perspectives. First, we adapt notions and concepts from orometry to metric data and networks to gain novel insights from a local perspective. Specifically, we study measures of local outstandingness and propose concepts to derive small hierarchies from larger networks. These hierarchies are originally designed for the sake of defining dominance relationships between mountain peaks. Our adaption allows to identify outstanding entities on a local level and small hierarchies between them. Second, we evaluate networks from a global perspective by computing the intrinsic dimensionality of whole networks. Here, a low intrinsic dimensionality stands for data with highly distinguishable data points, which is crucial for learning. To accomplish this, we develop practical algorithms and speed-up techniques to transfer an axiomatically grounded framework to large-scale graph data. Furthermore, as an application, we present a feature selection method based on the developed method for computing intrinsic dimensions. Third, we propose two novel deep learning methods for representation learning on networks, leading to condensed perspectives on them. The first method learns embeddings with the help of techniques from formal concept analysis. This approach leads to a novel paradigm for embedding learning for bipartite graphs as it does not incorporate simple neighborhood information but the concept lattice structure of the corresponding formal context. The second method is a combination of a graph neural network and a language model and is tailored for a special network structure and the special task of author verification. This task deals with the verification of links between authors and publications. Our method is designed such that it can process raw texts and also incorporates past co-authorship edges. In conclusion, this thesis contributes to the understanding and investigation of networks from a local, global, and condensed perspective. This is done by proposing novel measures and structures for them based on orometric concepts and intrinsic dimensionality and by providing novel learning methods for bipartite networks in general and author-publication networks in specific.; Netzwerke sind integraler Bestandteil unseres Lebens, seien es echte Freundschaftsnetzwerke oder Verbindungen, welche auf sozialen Medien beruhen. In dieser Arbeit tragen wir dazu bei, solche Netzwerke besser zu verstehen. Dafür studieren wir Netzwerke aus drei Perspektiven: Erstens, adaptieren wir orometrische Konzepte auf metrische Daten und Netzwerke um diese Daten aus einer globalen Perspektive zu betrachten. Genauer gesagt untersuchen wir Maße für lokale Herausragendheit und stellen Konzepte vor, welche es ermöglichen Hierarchien von kleinen Teilmengen aus größeren Netzwerken abzuleiten. Diese Hierarchien sind ursprünglich dafür gedacht um Dominanzbeziehungen zwischen Berggipfeln darzustellen. Unsere Adaption auf Netzwerke führt zu überschaubaren Hierarchien zwischen herausragenden Akteuren und ist somit ein neuartiges Werkzeug im Rahmen der Netzwerkanalyse. Zweitens evaluieren wir die intrinsische Dimensionalität eines gesamten Netzwerkes um neue Einblicke aus einer globalen Perspektive zu erhalten. Dafür entwickeln wir Algorithmen und Effizienztechniken um ein axiomatisch fundiertes Framework für große Echtweltgraphen anwendbar zu machen. Zusätzlich erläutern wir eine abgeleitete Methode zur Featureselektion, welche sich als kompetitiv zu repräsentativen Baselines erweist. Drittens stellen wir zwei neuartige Deep-Learning Methoden für das Repräsentationslernen auf Netzwerken vor, was zu kondensierten Perspektiven führt. Die erste Methode lernt Einbettung mit der Hilfe des Begriffsverbandes eines formalen Kontextes. Dieses Vorgehen begründet ein neuartiges Paradigma zum Lernen von Einbettungen auf bipartiten Graphen, welches nicht auf Nachbarschaften, sondern auf Verbandsstrukturen beruht. Die zweite Methode kombiniert ein Graph Neuronales Netz mit einem Sprachmodell. Diese Methode wurde für die Verifikation von Autorenschaften entwickelt. Sie erlaubt, Textdaten und vergangene Ko-Autorenschaften in den Klassifikationsprozess einzubringen. Zusammenfassend leistet diese Arbeit einen Beitrag zur Untersuchung und Verarbeitung von Netzwerken durch die Einführung neuer Maße und Strukturen basierend auf orometrischen Konzepten und der intrinsischen Dimensionalität. Außerdem stellen wir neuartige Lernmethoden für spezielle Klassen von Netzwerken vor.
2023-11-01T00:00:00ZStubbemann, MaximilianToday, networks are an integral part of our world. Let it be real-life friendship networks or social connections that are based on social media. In this thesis, we contribute to the understanding of networks by studying networks from three different perspectives. First, we adapt notions and concepts from orometry to metric data and networks to gain novel insights from a local perspective. Specifically, we study measures of local outstandingness and propose concepts to derive small hierarchies from larger networks. These hierarchies are originally designed for the sake of defining dominance relationships between mountain peaks. Our adaption allows to identify outstanding entities on a local level and small hierarchies between them. Second, we evaluate networks from a global perspective by computing the intrinsic dimensionality of whole networks. Here, a low intrinsic dimensionality stands for data with highly distinguishable data points, which is crucial for learning. To accomplish this, we develop practical algorithms and speed-up techniques to transfer an axiomatically grounded framework to large-scale graph data. Furthermore, as an application, we present a feature selection method based on the developed method for computing intrinsic dimensions. Third, we propose two novel deep learning methods for representation learning on networks, leading to condensed perspectives on them. The first method learns embeddings with the help of techniques from formal concept analysis. This approach leads to a novel paradigm for embedding learning for bipartite graphs as it does not incorporate simple neighborhood information but the concept lattice structure of the corresponding formal context. The second method is a combination of a graph neural network and a language model and is tailored for a special network structure and the special task of author verification. This task deals with the verification of links between authors and publications. Our method is designed such that it can process raw texts and also incorporates past co-authorship edges. In conclusion, this thesis contributes to the understanding and investigation of networks from a local, global, and condensed perspective. This is done by proposing novel measures and structures for them based on orometric concepts and intrinsic dimensionality and by providing novel learning methods for bipartite networks in general and author-publication networks in specific.
Netzwerke sind integraler Bestandteil unseres Lebens, seien es echte Freundschaftsnetzwerke oder Verbindungen, welche auf sozialen Medien beruhen. In dieser Arbeit tragen wir dazu bei, solche Netzwerke besser zu verstehen. Dafür studieren wir Netzwerke aus drei Perspektiven: Erstens, adaptieren wir orometrische Konzepte auf metrische Daten und Netzwerke um diese Daten aus einer globalen Perspektive zu betrachten. Genauer gesagt untersuchen wir Maße für lokale Herausragendheit und stellen Konzepte vor, welche es ermöglichen Hierarchien von kleinen Teilmengen aus größeren Netzwerken abzuleiten. Diese Hierarchien sind ursprünglich dafür gedacht um Dominanzbeziehungen zwischen Berggipfeln darzustellen. Unsere Adaption auf Netzwerke führt zu überschaubaren Hierarchien zwischen herausragenden Akteuren und ist somit ein neuartiges Werkzeug im Rahmen der Netzwerkanalyse. Zweitens evaluieren wir die intrinsische Dimensionalität eines gesamten Netzwerkes um neue Einblicke aus einer globalen Perspektive zu erhalten. Dafür entwickeln wir Algorithmen und Effizienztechniken um ein axiomatisch fundiertes Framework für große Echtweltgraphen anwendbar zu machen. Zusätzlich erläutern wir eine abgeleitete Methode zur Featureselektion, welche sich als kompetitiv zu repräsentativen Baselines erweist. Drittens stellen wir zwei neuartige Deep-Learning Methoden für das Repräsentationslernen auf Netzwerken vor, was zu kondensierten Perspektiven führt. Die erste Methode lernt Einbettung mit der Hilfe des Begriffsverbandes eines formalen Kontextes. Dieses Vorgehen begründet ein neuartiges Paradigma zum Lernen von Einbettungen auf bipartiten Graphen, welches nicht auf Nachbarschaften, sondern auf Verbandsstrukturen beruht. Die zweite Methode kombiniert ein Graph Neuronales Netz mit einem Sprachmodell. Diese Methode wurde für die Verifikation von Autorenschaften entwickelt. Sie erlaubt, Textdaten und vergangene Ko-Autorenschaften in den Klassifikationsprozess einzubringen. Zusammenfassend leistet diese Arbeit einen Beitrag zur Untersuchung und Verarbeitung von Netzwerken durch die Einführung neuer Maße und Strukturen basierend auf orometrischen Konzepten und der intrinsischen Dimensionalität. Außerdem stellen wir neuartige Lernmethoden für spezielle Klassen von Netzwerken vor.