Novelty Detection for Multivariate Data Streams with Probalistic Models

dc.contributor.corporatenameKassel, Universität Kassel, Fachbereich Elektrotechnik / Informatik
dc.contributor.refereeSick, Bernhard (Prof. Dr.)
dc.contributor.refereeTomforde, Sven (Prof. Dr.)
dc.date.accessioned2022-06-07T13:08:41Z
dc.date.available2022-06-07T13:08:41Z
dc.date.issued2022
dc.descriptionZugleich: Dissertation, Universität Kassel, 2022ger
dc.identifierdoi:10.17170/kobra-202205106160
dc.identifier.urihttp://hdl.handle.net/123456789/13902
dc.language.isoengeng
dc.publisherkassel university press
dc.publisher.placeKassel
dc.relation.isbn978-3-7376-1038-4
dc.rightsNamensnennung - Weitergabe unter gleichen Bedingungen 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by-sa/4.0/*
dc.subjectnovelty detectioneng
dc.subjectanomaly detectioneng
dc.subjectmachine learningeng
dc.subjectdata streamseng
dc.subjectnoveltieseng
dc.subjectanomalieseng
dc.subjectoutlierseng
dc.subjectconcept drifteng
dc.subjectprobabilistic modelingeng
dc.subject.ddc620
dc.subject.swdAutonomer Agentger
dc.subject.swdDatenger
dc.subject.swdAnomalieerkennungger
dc.subject.swdMaschinelles Lernenger
dc.subject.swdSensorger
dc.subject.swdDatenstromger
dc.subject.swdWahrscheinlichkeitsmaßger
dc.titleNovelty Detection for Multivariate Data Streams with Probalistic Modelseng
dc.typeBuch
dc.type.versionpublishedVersion
dcterms.abstractThe autonomous detection of unexpected changes in data is called novelty detection. Multivariate data streams consisting of measurements from multiple sensors often form the basis to detect such changes. Specific examples of such changes are, for instance, cardiac arrhythmias, power failures, storms or network attacks. Accordingly, changes can affect both a system itself and the environment in which it is embedded. This doctoral thesis investigates methods for online novelty detection in multivariate data streams and presents the CANDIES methodology. A unique feature of this method is the explicit separation of the input space of a probabilistic model into different regions – High-Density Regions (HDR) and Low-Density Regions (LDR) – with detection techniques specifically designed for each. While other detectors can usually only detect novelties or anomalies in LDR, the CANDIES method can also identify novelties in HDR. It also offers possibilities to handle concept drift and noise in data streams. Another distinctive feature of CANDIES is the notion of novelties as an agglomeration of anomalies that have a certain relation to each other (spatially or temporally). Additionally, the focus of this work is also on the experimental evaluation of novelty detection algorithms in general. For this purpose, a data generator that can synthesise data streams and novelties is presented, and a new evaluation measure, the FDS, is specifically designed to evaluate novelty detection methods. All methods, algorithms and tools developed and used in this thesis are also publicly and freely available online.eng
dcterms.abstractDas autonome Erkennen unerwarteter Veränderungen in Daten wird als Novelty Detection bezeichnet. Datenströme, die aus den Messwerten mehrerer Sensoren bestehen, bilden dabei oft die Grundlage, um solche Veränderungen erkennen zu können. Konkrete Beispiele solcher Veränderungen umfassen zum Beispiel Herzrhythmusstörungen, Stromausfälle, Unwetter, oder Netzwerkangriffe. Entsprechend können Veränderungen daher sowohl ein System selbst als auch die Umgebung, in der sich ein System befindet, betreffen. In dieser Dissertation werden Verfahren zur Online-Erkennung von Novelties in multivariaten Datenströmen untersucht und die CANDIES Methode vorgestellt. Eine Besonderheit dieser Methode ist die explizite Unterteilung des Eingaberaums eines probabilistischen Modells in verschiedene Regionen – Regionen mit hoher Wahrscheinlichkeitsmasse (HDR) und solche mit geringer Wahrscheinlichkeitsmasse (LDR) – und speziell darauf ausgelegten Erkennungstechniken. Während andere Detektoren in der Regel nur Novelties bzw. Anomalien in LDR erkennen können, ist es mit der CANDIES Methode möglich auch Novelties in HDR zu identifizieren. Daneben bietet sie auch Möglichkeiten mit Konzeptdrift und verrauschten Datenströmen umzugehen. Eine weitere Besonderheit von CANDIES ist das Versändnis von Novelties als Ansammlung von Anomalien, die einen bestimmten Bezug zueinander haben (räumlich oder zeitlich). Ein weiterer Schwerpunkt dieser Arbeit ist außerdem die experimentelle Auswertung von Novelty Detection Algorithmen im Allgemeinen. Dazu wird ein Daten Generator, der Datenströme und Novelties synthetisieren kann, sowie ein neues Evaluierungsmaß FDS, welches speziell auf die Bewertung von Novelty Detection Verfahren ausgelegt ist, vorgestellt. Alle Verfahren, Algorithmen und Werkzeuge, die in dieser Arbeit entwickelt und verwendet wurden, sind darüber hinaus öffentlich und frei verfügbar.ger
dcterms.accessRightsopen access
dcterms.creatorGruhl, Christian M.
dcterms.dateAccepted2022-03-24
dcterms.extentviii, 381 Seiten
dcterms.source.seriesIntelligent Embedded Systems
dcterms.source.volumeBand 21
kup.bindingSoftcover
kup.institutionFB 16 / Elektrotechnik / Informatik
kup.iskuptrue
kup.orderhttps://www.genialokal.de/Produkt/Christian-Gruhl/Novelty-Detection-for-Multivariate-Data-Streams-with-Probabilistic-Models_lid_48440362.html
kup.price49,00
kup.seriesIntelligent Embedded Systems
kup.sizeDIN A5
kup.subjectNaturwissenschaft, Technik, Informatik, Medizin
kup.typDissertation
ubks.epflichttrue

Files

Original bundle

Now showing 1 - 2 of 2
Thumbnail Image
Name:
kup_9783737610384.pdf
Size:
7.72 MB
Format:
Adobe Portable Document Format
Description:
No Thumbnail Available
Name:
orig_9783737610384.pdf
Size:
7.72 MB
Format:
Adobe Portable Document Format
Description:

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
3.03 KB
Format:
Item-specific license agreed upon to submission
Description: