On the Detection and Selection of Informative Subsequences from Large Historical Data Records for Linear System Identification

On the Detection and Selection of Informative Subsequences from Large Historical Data Records for Linear System Identification

dc.contributor.corporatename	Kassel, Universität Kassel, Fachbereich Maschinenbau
dc.contributor.referee	Kroll, Andreas (Prof. Dr,)
dc.contributor.referee	Stursberg, Olaf (Prof. Dr.)
dc.date.accessioned	2022-03-11T06:43:49Z
dc.date.available	2022-03-11T06:43:49Z
dc.date.issued	2022
dc.description	Zugleich: Dissertation, Universität Kassel, 2021
dc.identifier	doi:10.17170/kobra-202201055361
dc.identifier.uri	http://hdl.handle.net/123456789/13685
dc.language.iso	eng
dc.publisher	kassel university press
dc.publisher.place	Kassel
dc.relation.isbn	978-3-7376-1009-4
dc.rights	Namensnennung - Weitergabe unter gleichen Bedingungen 4.0 International	*
dc.rights.uri	http://creativecommons.org/licenses/by-sa/4.0/	*
dc.subject	informative data	eng
dc.subject	linear system identification	eng
dc.subject	information matrix	eng
dc.subject	DS4SID	eng
dc.subject.ddc	620
dc.subject.swd	Informationsmodell	ger
dc.subject.swd	Erfassung	ger
dc.subject.swd	Daten	ger
dc.subject.swd	Systemidentifikation	ger
dc.title	On the Detection and Selection of Informative Subsequences from Large Historical Data Records for Linear System Identification	eng
dc.type	Buch
dc.type.version	publishedVersion
dcterms.abstract	Performing experiments for system identification of continuously operated plants might be restricted as it can impact negatively normal production or cause safety issues. In such cases, using historical logged data for system identification can become an attractive alternative instead of carrying out new experiments. However, since such plants work normally at operating points that are seldom changed, parameter estimation methods with logged data can suffer numerical problems. Methods to locate and select informative data sequences is a promising area that can support system identification in processes where erforming experiments is constrained. At least three main drawbacks of current approaches can be discussed. Firstly, detection tests used in data selection methods are based on time series models even though, they address dynamical systems where the input sequence should also be considered. In case of processes operating in closed loop, excitation caused by external disturbances is not detected if current approaches only evaluate changes in the set points. Secondly, upper interval bounds can be wrongly defined since the process is described by inputoutput models that assume white Gaussian noise (WGN) as additive stochastic disturbance. In practical applications, colored noise is more likely to be found than white Gaussian noise (WGN). Thirdly, in current methods model estimation with the retrieved selected intervals is not supported and therefore the quality of selected data for data-driven modeling cannot be practically assessed. In the data selection method proposed in the present thesis, called data selection for system identification (DS4SID), previous drawbacks are addressed and robust tests are designed and implemented. DS4SID can be applied to multivariate processes operating in open or closed-loop. Two tests are proposed for detection and bounding of informative intervals which simplifies the choice of user-defined parameters. A model is computed using a data merging method which can be used for further analysis. The performance of DS4SID is evaluated in a simulated and laboratory multivariate processes. A process unit of the lab-scale factory ŞμPlantŤ is used as industry-oriented case study. Models estimated with selected informative intervals are shown to have similar performance than estimates with the entire data set.	eng
dcterms.abstract	Die Durchführung von Experimenten zur Erfassung von Daten für die Systemidentifikation bei kontinuierlich betriebenen Prozessanlagen ist oft nur eingeschränkt möglich, entweder weil ein Stillstand unerwünscht ist oder aus Gründen der Betriebssicherheit. In diesem Fall stellt die Auswertung aufgezeichneter Daten eine wertvolle Alternative zur Durchführung neuer Experimente dar. Da die Betriebspunkte nur selten geändert werden, können Verfahren zur Parameterschätzung unter numerischen Problemen leiden. Die Entwicklung neuer Methoden zum Auffinden und Auswählen informativer Datensequenzen ist ein vielversprechendes Forschungsgebiet, das die Systemidentifikation unterstützen kann, bei denen die Durchführung von Experimenten nur begrenzt möglich ist. Es gibt mindestens drei wesentliche Nachteile der derzeitigen Methoden: Erstens arbeiten Datenselektionsverfahren zur Erkennung von Ausreißern nur auf einzelnen Zeitreihen, obwohl sie aus dynamischen Systemen stammen, bei denen auch die Eingangssignale berücksichtigt werden sollten. Zweitens können die oberen Intervallgrenzen falsch definiert werden, wenn das angenommene Rauschmodel nicht der Realität entspricht. Drittens wird in derzeitigen Datenselektionsverfahren keine Modellparameterschätzung durchgeführt und daher kann der Wert der selektierten Daten nicht praktisch bewertet werden. Mit der in dieser Arbeit vorgeschlagenen Datenselektionsmethode mit der Bezeichnung DS4SID werden die bisherigen Nachteile behoben und robuste Tests vorgestellt. Das zweistuĄge Verfahren detektiert Ausreißer und bestimmt die oberen Intervallgrenzen informativer Datensequenzen, was die Festlegung von Entwurfsparametern vereinfacht. Mit Hilfe des Zusammenführens der selektierten Datensequenzen wird ein Modell berechnet, welches für die weitere Auswertung verwendet werden kann. Die Leistungsfähigkeit von DS4SID wird mit Hilfe von Simulationsstudien und einer industrienahen Fallstudie eines realen Mehrgrößensystems überprüft. Dabei wurde eine Prozessinsel der Modellfabrik ŞμPlantŤ genutzt. Es konnte gezeigt werden, dass Modelle, die mit Hilfe von selektierten Daten berechnet worden sind, vergleichbar sind mit Modellen, die mit dem gesamten Datensatz berechnet wurden.	ger
dcterms.accessRights	open access
dcterms.creator	Arengas Rojas, David Leonardo
dcterms.dateAccepted	2021-06-15
dcterms.extent	xi, 153 Seiten
dcterms.source.series	Schriftenreihe Mess- und Regelungstechnik der Universität Kassel	ger
dcterms.source.volume	Band 11
kup.binding	Softcover
kup.institution	FB 15 / Maschinenbau
kup.iskup	true
kup.order	https://www.genialokal.de/Produkt/David-Leonardo-Arengas-Rojas/On-the-Detection-and-Selection-of-Informative-Subsequences-from-Large-Historical-Data-Records-for-Linear-System-Identification_lid_53563617.html
kup.price	39,00
kup.series	Schriftenreihe Mess- und Regelungstechnik der Universität Kassel	ger
kup.size	17 x 24 xm
kup.subject	Naturwissenschaft, Technik, Informatik, Medizin	ger
kup.typ	Dissertation
ubks.epflicht	true

Files

Original bundle

Now showing 1 - 2 of 2

Name:: kup_9783737610094.pdf
Size:: 3.73 MB
Format:: Adobe Portable Document Format
Description:

Download

Name:: orig_9783737610094.pdf
Size:: 3.83 MB
Format:: Adobe Portable Document Format
Description:

Download

License bundle

Now showing 1 - 1 of 1

Name:: license.txt
Size:: 3.03 KB
Format:: Item-specific license agreed upon to submission
Description:

Download

Collections

kup - kassel university press