On the Detection and Selection of Informative Subsequences from Large Historical Data Records for Linear System Identification

dc.contributor.corporatenameKassel, Universität Kassel, Fachbereich Maschinenbau
dc.contributor.refereeKroll, Andreas (Prof. Dr,)
dc.contributor.refereeStursberg, Olaf (Prof. Dr.)
dc.date.accessioned2022-03-11T06:43:49Z
dc.date.available2022-03-11T06:43:49Z
dc.date.issued2022
dc.descriptionZugleich: Dissertation, Universität Kassel, 2021
dc.identifierdoi:10.17170/kobra-202201055361
dc.identifier.urihttp://hdl.handle.net/123456789/13685
dc.language.isoeng
dc.publisherkassel university press
dc.publisher.placeKassel
dc.relation.isbn978-3-7376-1009-4
dc.rightsNamensnennung - Weitergabe unter gleichen Bedingungen 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by-sa/4.0/*
dc.subjectinformative dataeng
dc.subjectlinear system identificationeng
dc.subjectinformation matrixeng
dc.subjectDS4SIDeng
dc.subject.ddc620
dc.subject.swdInformationsmodellger
dc.subject.swdErfassungger
dc.subject.swdDatenger
dc.subject.swdSystemidentifikationger
dc.titleOn the Detection and Selection of Informative Subsequences from Large Historical Data Records for Linear System Identificationeng
dc.typeBuch
dc.type.versionpublishedVersion
dcterms.abstractPerforming experiments for system identification of continuously operated plants might be restricted as it can impact negatively normal production or cause safety issues. In such cases, using historical logged data for system identification can become an attractive alternative instead of carrying out new experiments. However, since such plants work normally at operating points that are seldom changed, parameter estimation methods with logged data can suffer numerical problems. Methods to locate and select informative data sequences is a promising area that can support system identification in processes where erforming experiments is constrained. At least three main drawbacks of current approaches can be discussed. Firstly, detection tests used in data selection methods are based on time series models even though, they address dynamical systems where the input sequence should also be considered. In case of processes operating in closed loop, excitation caused by external disturbances is not detected if current approaches only evaluate changes in the set points. Secondly, upper interval bounds can be wrongly defined since the process is described by inputoutput models that assume white Gaussian noise (WGN) as additive stochastic disturbance. In practical applications, colored noise is more likely to be found than white Gaussian noise (WGN). Thirdly, in current methods model estimation with the retrieved selected intervals is not supported and therefore the quality of selected data for data-driven modeling cannot be practically assessed. In the data selection method proposed in the present thesis, called data selection for system identification (DS4SID), previous drawbacks are addressed and robust tests are designed and implemented. DS4SID can be applied to multivariate processes operating in open or closed-loop. Two tests are proposed for detection and bounding of informative intervals which simplifies the choice of user-defined parameters. A model is computed using a data merging method which can be used for further analysis. The performance of DS4SID is evaluated in a simulated and laboratory multivariate processes. A process unit of the lab-scale factory ŞμPlantŤ is used as industry-oriented case study. Models estimated with selected informative intervals are shown to have similar performance than estimates with the entire data set.eng
dcterms.abstractDie Durchführung von Experimenten zur Erfassung von Daten für die Systemidentifikation bei kontinuierlich betriebenen Prozessanlagen ist oft nur eingeschränkt möglich, entweder weil ein Stillstand unerwünscht ist oder aus Gründen der Betriebssicherheit. In diesem Fall stellt die Auswertung aufgezeichneter Daten eine wertvolle Alternative zur Durchführung neuer Experimente dar. Da die Betriebspunkte nur selten geändert werden, können Verfahren zur Parameterschätzung unter numerischen Problemen leiden. Die Entwicklung neuer Methoden zum Auffinden und Auswählen informativer Datensequenzen ist ein vielversprechendes Forschungsgebiet, das die Systemidentifikation unterstützen kann, bei denen die Durchführung von Experimenten nur begrenzt möglich ist. Es gibt mindestens drei wesentliche Nachteile der derzeitigen Methoden: Erstens arbeiten Datenselektionsverfahren zur Erkennung von Ausreißern nur auf einzelnen Zeitreihen, obwohl sie aus dynamischen Systemen stammen, bei denen auch die Eingangssignale berücksichtigt werden sollten. Zweitens können die oberen Intervallgrenzen falsch definiert werden, wenn das angenommene Rauschmodel nicht der Realität entspricht. Drittens wird in derzeitigen Datenselektionsverfahren keine Modellparameterschätzung durchgeführt und daher kann der Wert der selektierten Daten nicht praktisch bewertet werden. Mit der in dieser Arbeit vorgeschlagenen Datenselektionsmethode mit der Bezeichnung DS4SID werden die bisherigen Nachteile behoben und robuste Tests vorgestellt. Das zweistuĄge Verfahren detektiert Ausreißer und bestimmt die oberen Intervallgrenzen informativer Datensequenzen, was die Festlegung von Entwurfsparametern vereinfacht. Mit Hilfe des Zusammenführens der selektierten Datensequenzen wird ein Modell berechnet, welches für die weitere Auswertung verwendet werden kann. Die Leistungsfähigkeit von DS4SID wird mit Hilfe von Simulationsstudien und einer industrienahen Fallstudie eines realen Mehrgrößensystems überprüft. Dabei wurde eine Prozessinsel der Modellfabrik ŞμPlantŤ genutzt. Es konnte gezeigt werden, dass Modelle, die mit Hilfe von selektierten Daten berechnet worden sind, vergleichbar sind mit Modellen, die mit dem gesamten Datensatz berechnet wurden.ger
dcterms.accessRightsopen access
dcterms.creatorArengas Rojas, David Leonardo
dcterms.dateAccepted2021-06-15
dcterms.extentxi, 153 Seiten
dcterms.source.seriesSchriftenreihe Mess- und Regelungstechnik der Universität Kasselger
dcterms.source.volumeBand 11
kup.bindingSoftcover
kup.institutionFB 15 / Maschinenbau
kup.iskuptrue
kup.orderhttps://www.genialokal.de/Produkt/David-Leonardo-Arengas-Rojas/On-the-Detection-and-Selection-of-Informative-Subsequences-from-Large-Historical-Data-Records-for-Linear-System-Identification_lid_53563617.html
kup.price39,00
kup.seriesSchriftenreihe Mess- und Regelungstechnik der Universität Kasselger
kup.size17 x 24 xm
kup.subjectNaturwissenschaft, Technik, Informatik, Medizinger
kup.typDissertation
ubks.epflichttrue

Files

Original bundle

Now showing 1 - 2 of 2
Thumbnail Image
Name:
kup_9783737610094.pdf
Size:
3.73 MB
Format:
Adobe Portable Document Format
Description:
No Thumbnail Available
Name:
orig_9783737610094.pdf
Size:
3.83 MB
Format:
Adobe Portable Document Format
Description:

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
3.03 KB
Format:
Item-specific license agreed upon to submission
Description: