Masterarbeit
Vergleich & Anpassung zweier Strategien zur Anomalieerkennung in Lastgängen basierend auf Verfahren aus den Bereichen Machine-Learning und Statistik
Abstract
In dieser Masterarbeit werden zwei Strategien zur Anomalieerkennung in Lastgängen ausgewertet. Dazu nutzt Strategie 1 das künstliche neuronale Netzwerk LSTM (Long Short-Term Memory) mit Datenzeitraum von einem Monat (1M) bzw. drei Monaten (3M) trainiert und Strategie 2 das Glättungsverfahren PEWMA (Probalistic Exponential Weighted Moving Average) zur Schätzung des zu untersuchenden Lastgangmonats. Durch den Vergleich mit Originallastgangdaten werden Residuen bzw. summierte Residuen der Sequenzlängen zwei, vier, sechs und acht Stunden durch Überschreitung eines vordefinierten Schwellenwertes als Anomalien identifiziert. Die Schwellenwerte werden zum einen durch den Z-Score Test definiert, d.h. Residuenwerte größer als 2, 2,5 oder 3 Standardabweichungen gelten als anomal. Zum anderen werden mittels ESD (Extreme Studentized Deviate) Test durch drei Signifikanzniveauwerte von 0,05, 0,10 und 0,15, bei maximal k = 40 Iterationen, Schwellenwerte gesetzt. Es werden fünf Lastgänge untersucht, welche sich durch das Clusterverfahren k-Means als repräsentative Stichprobe aus allen verfügbaren Datensätzen der Limón GmbH ergeben haben. Die Auswertung zeigt, dass für Strategie 1 ein maximales F1-Maß von 0,4 (1M) und für alle untersuchten Unternehmen ein durchschnittliches F1-Maß von maximal 0,24, SD = 0,09 (1M) für die Untersuchung auf Einzelresiduen erreicht werden konnte. In der Variante 3M konnte mit einem durchschnittlichen F1-Maß von 0,21, SD = 0,06 (3M) für summierte Residuen der Teilsequenzlänge von vier Stunden das höchste F1-Maß erzielt werden. Die auf PEWMA basierende Strategie 2 konnte im Vergleich zu Strategie 1 in keinem untersuchten Unternehmen eine höhere Anomalieerkennungsgüte aufweisen.
Citation
@masterthesis{doi:10.17170/kobra-202303037564,
author={Krawiec, Patrick},
title={Vergleich & Anpassung zweier Strategien zur Anomalieerkennung in Lastgängen basierend auf Verfahren aus den Bereichen Machine-Learning und Statistik},
school={Kassel, Universität Kassel, Fachbereich Maschinenbau},
month={11},
year={2020}
}
0500 Oax 0501 Text $btxt$2rdacontent 0502 Computermedien $bc$2rdacarrier 1100 2020$n2020 1500 1/ger 2050 ##0##http://hdl.handle.net/123456789/14465 3000 Krawiec, Patrick 4000 Vergleich & Anpassung zweier Strategien zur Anomalieerkennung in Lastgängen basierend auf Verfahren aus den Bereichen Machine-Learning und Statistik / Krawiec, Patrick 4030 4060 Online-Ressource 4085 ##0##=u http://nbn-resolving.de/http://hdl.handle.net/123456789/14465=x R 4204 \$dMasterarbeit 4170 5550 {{Anomalieerkennung}} 5550 {{Neuronales Netz}} 5550 {{Maschinelles Lernen}} 5550 {{Lastganglinie}} 7136 ##0##http://hdl.handle.net/123456789/14465
2023-03-06T09:29:22Z 2023-03-06T09:29:22Z 2020-11 doi:10.17170/kobra-202303037564 http://hdl.handle.net/123456789/14465 ger Attribution-NonCommercial-NoDerivatives 4.0 International http://creativecommons.org/licenses/by-nc-nd/4.0/ Anomalieerkennung LSTM PEWMA 620 Vergleich & Anpassung zweier Strategien zur Anomalieerkennung in Lastgängen basierend auf Verfahren aus den Bereichen Machine-Learning und Statistik Masterarbeit In dieser Masterarbeit werden zwei Strategien zur Anomalieerkennung in Lastgängen ausgewertet. Dazu nutzt Strategie 1 das künstliche neuronale Netzwerk LSTM (Long Short-Term Memory) mit Datenzeitraum von einem Monat (1M) bzw. drei Monaten (3M) trainiert und Strategie 2 das Glättungsverfahren PEWMA (Probalistic Exponential Weighted Moving Average) zur Schätzung des zu untersuchenden Lastgangmonats. Durch den Vergleich mit Originallastgangdaten werden Residuen bzw. summierte Residuen der Sequenzlängen zwei, vier, sechs und acht Stunden durch Überschreitung eines vordefinierten Schwellenwertes als Anomalien identifiziert. Die Schwellenwerte werden zum einen durch den Z-Score Test definiert, d.h. Residuenwerte größer als 2, 2,5 oder 3 Standardabweichungen gelten als anomal. Zum anderen werden mittels ESD (Extreme Studentized Deviate) Test durch drei Signifikanzniveauwerte von 0,05, 0,10 und 0,15, bei maximal k = 40 Iterationen, Schwellenwerte gesetzt. Es werden fünf Lastgänge untersucht, welche sich durch das Clusterverfahren k-Means als repräsentative Stichprobe aus allen verfügbaren Datensätzen der Limón GmbH ergeben haben. Die Auswertung zeigt, dass für Strategie 1 ein maximales F1-Maß von 0,4 (1M) und für alle untersuchten Unternehmen ein durchschnittliches F1-Maß von maximal 0,24, SD = 0,09 (1M) für die Untersuchung auf Einzelresiduen erreicht werden konnte. In der Variante 3M konnte mit einem durchschnittlichen F1-Maß von 0,21, SD = 0,06 (3M) für summierte Residuen der Teilsequenzlänge von vier Stunden das höchste F1-Maß erzielt werden. Die auf PEWMA basierende Strategie 2 konnte im Vergleich zu Strategie 1 in keinem untersuchten Unternehmen eine höhere Anomalieerkennungsgüte aufweisen. open access Krawiec, Patrick 2020-01 IV, 69, I-XXVIII Seiten Kassel, Universität Kassel, Fachbereich Maschinenbau Junge, Mark (Prof. Dr.) Hesselbach, Jens (Prof. Dr.) Anomalieerkennung Neuronales Netz Maschinelles Lernen Lastganglinie publishedVersion false
The following license files are associated with this item: