Datum
2022Autor
Gruhl, Christian M.Schlagwort
620 Ingenieurwissenschaften Autonomer AgentDatenAnomalieerkennungMaschinelles LernenSensorDatenstromWahrscheinlichkeitsmaßMetadata
Zur Langanzeige
Buch
Link zu kassel university press
Novelty Detection for Multivariate Data Streams with Probalistic Models
Zusammenfassung
The autonomous detection of unexpected changes in data is called novelty detection. Multivariate data streams consisting of measurements from multiple sensors often form the basis to detect such changes. Specific examples of such changes are, for instance, cardiac arrhythmias, power failures, storms or network attacks. Accordingly, changes can affect both a system itself and the environment in which it is embedded. This doctoral thesis investigates methods for online novelty detection in multivariate data streams and presents the CANDIES methodology. A unique feature of this method is the explicit separation of the input space of a probabilistic model into different regions – High-Density Regions (HDR) and Low-Density Regions (LDR) – with detection techniques specifically designed for each. While other detectors can usually only detect novelties or anomalies in LDR, the CANDIES method can also identify novelties in HDR. It also offers possibilities to handle concept drift and noise in data streams. Another distinctive feature of CANDIES is the notion of novelties as an agglomeration of anomalies that have a certain relation to each other (spatially or temporally). Additionally, the focus of this work is also on the experimental evaluation of novelty detection algorithms in general. For this purpose, a data generator that can synthesise data streams and novelties is presented, and a new evaluation measure, the FDS, is specifically designed to evaluate novelty detection methods. All methods, algorithms and tools developed and used in this thesis are also publicly and freely available online.
Das autonome Erkennen unerwarteter Veränderungen in Daten wird als Novelty Detection bezeichnet. Datenströme, die aus den Messwerten mehrerer Sensoren bestehen, bilden dabei oft die Grundlage, um solche Veränderungen erkennen zu können. Konkrete Beispiele solcher Veränderungen umfassen zum Beispiel Herzrhythmusstörungen, Stromausfälle, Unwetter, oder Netzwerkangriffe. Entsprechend können Veränderungen daher sowohl ein System selbst als auch die Umgebung, in der sich ein System befindet, betreffen. In dieser Dissertation werden Verfahren zur Online-Erkennung von Novelties in multivariaten Datenströmen untersucht und die CANDIES Methode vorgestellt. Eine Besonderheit dieser Methode ist die explizite Unterteilung des Eingaberaums eines probabilistischen Modells in verschiedene Regionen – Regionen mit hoher Wahrscheinlichkeitsmasse (HDR) und solche mit geringer Wahrscheinlichkeitsmasse (LDR) – und speziell darauf ausgelegten Erkennungstechniken. Während andere Detektoren in der Regel nur Novelties bzw. Anomalien in LDR erkennen können, ist es mit der CANDIES Methode möglich auch Novelties in HDR zu identifizieren. Daneben bietet sie auch Möglichkeiten mit Konzeptdrift und verrauschten Datenströmen umzugehen. Eine weitere Besonderheit von CANDIES ist das Versändnis von Novelties als Ansammlung von Anomalien, die einen bestimmten Bezug zueinander haben (räumlich oder zeitlich). Ein weiterer Schwerpunkt dieser Arbeit ist außerdem die experimentelle Auswertung von Novelty Detection Algorithmen im Allgemeinen. Dazu wird ein Daten Generator, der Datenströme und Novelties synthetisieren kann, sowie ein neues Evaluierungsmaß FDS, welches speziell auf die Bewertung von Novelty Detection Verfahren ausgelegt ist, vorgestellt. Alle Verfahren, Algorithmen und Werkzeuge, die in dieser Arbeit entwickelt und verwendet wurden, sind darüber hinaus öffentlich und frei verfügbar.
Zusätzliche Informationen
Zugleich: Dissertation, Universität Kassel, 2022Druckausgabe
Zitieren
@book{doi:10.17170/kobra-202205106160,
author={Gruhl, Christian M.},
title={Novelty Detection for Multivariate Data Streams with Probalistic Models},
publisher={kassel university press},
year={2022}
}
0500 Oax 0501 Text $btxt$2rdacontent 0502 Computermedien $bc$2rdacarrier 1100 2022$n2022 1500 1/eng 2050 ##0##http://hdl.handle.net/123456789/13902 3000 Gruhl, Christian M. 4000 Novelty Detection for Multivariate Data Streams with Probalistic Models / Gruhl, Christian M. 4030 4060 Online-Ressource 4085 ##0##=u http://nbn-resolving.de/http://hdl.handle.net/123456789/13902=x R 4204 \$dBuch 4170 5550 {{Autonomer Agent}} 5550 {{Daten}} 5550 {{Anomalieerkennung}} 5550 {{Maschinelles Lernen}} 5550 {{Sensor}} 5550 {{Datenstrom}} 5550 {{Wahrscheinlichkeitsmaß}} 7136 ##0##http://hdl.handle.net/123456789/13902
2022-06-07T13:08:41Z 2022-06-07T13:08:41Z 2022 doi:10.17170/kobra-202205106160 http://hdl.handle.net/123456789/13902 Zugleich: Dissertation, Universität Kassel, 2022 eng kassel university press Namensnennung - Weitergabe unter gleichen Bedingungen 4.0 International http://creativecommons.org/licenses/by-sa/4.0/ novelty detection anomaly detection machine learning data streams novelties anomalies outliers concept drift probabilistic modeling 620 Novelty Detection for Multivariate Data Streams with Probalistic Models Buch The autonomous detection of unexpected changes in data is called novelty detection. Multivariate data streams consisting of measurements from multiple sensors often form the basis to detect such changes. Specific examples of such changes are, for instance, cardiac arrhythmias, power failures, storms or network attacks. Accordingly, changes can affect both a system itself and the environment in which it is embedded. This doctoral thesis investigates methods for online novelty detection in multivariate data streams and presents the CANDIES methodology. A unique feature of this method is the explicit separation of the input space of a probabilistic model into different regions – High-Density Regions (HDR) and Low-Density Regions (LDR) – with detection techniques specifically designed for each. While other detectors can usually only detect novelties or anomalies in LDR, the CANDIES method can also identify novelties in HDR. It also offers possibilities to handle concept drift and noise in data streams. Another distinctive feature of CANDIES is the notion of novelties as an agglomeration of anomalies that have a certain relation to each other (spatially or temporally). Additionally, the focus of this work is also on the experimental evaluation of novelty detection algorithms in general. For this purpose, a data generator that can synthesise data streams and novelties is presented, and a new evaluation measure, the FDS, is specifically designed to evaluate novelty detection methods. All methods, algorithms and tools developed and used in this thesis are also publicly and freely available online. Das autonome Erkennen unerwarteter Veränderungen in Daten wird als Novelty Detection bezeichnet. Datenströme, die aus den Messwerten mehrerer Sensoren bestehen, bilden dabei oft die Grundlage, um solche Veränderungen erkennen zu können. Konkrete Beispiele solcher Veränderungen umfassen zum Beispiel Herzrhythmusstörungen, Stromausfälle, Unwetter, oder Netzwerkangriffe. Entsprechend können Veränderungen daher sowohl ein System selbst als auch die Umgebung, in der sich ein System befindet, betreffen. In dieser Dissertation werden Verfahren zur Online-Erkennung von Novelties in multivariaten Datenströmen untersucht und die CANDIES Methode vorgestellt. Eine Besonderheit dieser Methode ist die explizite Unterteilung des Eingaberaums eines probabilistischen Modells in verschiedene Regionen – Regionen mit hoher Wahrscheinlichkeitsmasse (HDR) und solche mit geringer Wahrscheinlichkeitsmasse (LDR) – und speziell darauf ausgelegten Erkennungstechniken. Während andere Detektoren in der Regel nur Novelties bzw. Anomalien in LDR erkennen können, ist es mit der CANDIES Methode möglich auch Novelties in HDR zu identifizieren. Daneben bietet sie auch Möglichkeiten mit Konzeptdrift und verrauschten Datenströmen umzugehen. Eine weitere Besonderheit von CANDIES ist das Versändnis von Novelties als Ansammlung von Anomalien, die einen bestimmten Bezug zueinander haben (räumlich oder zeitlich). Ein weiterer Schwerpunkt dieser Arbeit ist außerdem die experimentelle Auswertung von Novelty Detection Algorithmen im Allgemeinen. Dazu wird ein Daten Generator, der Datenströme und Novelties synthetisieren kann, sowie ein neues Evaluierungsmaß FDS, welches speziell auf die Bewertung von Novelty Detection Verfahren ausgelegt ist, vorgestellt. Alle Verfahren, Algorithmen und Werkzeuge, die in dieser Arbeit entwickelt und verwendet wurden, sind darüber hinaus öffentlich und frei verfügbar. open access Gruhl, Christian M. 2022-03-24 viii, 381 Seiten Kassel, Universität Kassel, Fachbereich Elektrotechnik / Informatik Sick, Bernhard (Prof. Dr.) Tomforde, Sven (Prof. Dr.) Kassel 978-3-7376-1038-4 Autonomer Agent Daten Anomalieerkennung Maschinelles Lernen Sensor Datenstrom Wahrscheinlichkeitsmaß publishedVersion Intelligent Embedded Systems Band 21 true https://www.genialokal.de/Produkt/Christian-Gruhl/Novelty-Detection-for-Multivariate-Data-Streams-with-Probabilistic-Models_lid_48440362.html 49,00 Intelligent Embedded Systems Naturwissenschaft, Technik, Informatik, Medizin Dissertation FB 16 / Elektrotechnik / Informatik Softcover DIN A5 true
Die folgenden Lizenzbestimmungen sind mit dieser Ressource verbunden: