On the Detection and Selection of Informative Subsequences from Large Historical Data Records for Linear System Identification
dc.contributor.corporatename | Kassel, Universität Kassel, Fachbereich Maschinenbau | |
dc.contributor.referee | Kroll, Andreas (Prof. Dr,) | |
dc.contributor.referee | Stursberg, Olaf (Prof. Dr.) | |
dc.date.accessioned | 2022-03-11T06:43:49Z | |
dc.date.available | 2022-03-11T06:43:49Z | |
dc.date.issued | 2022 | |
dc.description | Zugleich: Dissertation, Universität Kassel, 2021 | |
dc.identifier | doi:10.17170/kobra-202201055361 | |
dc.identifier.uri | http://hdl.handle.net/123456789/13685 | |
dc.language.iso | eng | |
dc.publisher | kassel university press | |
dc.publisher.place | Kassel | |
dc.relation.isbn | 978-3-7376-1009-4 | |
dc.rights | Namensnennung - Weitergabe unter gleichen Bedingungen 4.0 International | * |
dc.rights.uri | http://creativecommons.org/licenses/by-sa/4.0/ | * |
dc.subject | informative data | eng |
dc.subject | linear system identification | eng |
dc.subject | information matrix | eng |
dc.subject | DS4SID | eng |
dc.subject.ddc | 620 | |
dc.subject.swd | Informationsmodell | ger |
dc.subject.swd | Erfassung | ger |
dc.subject.swd | Daten | ger |
dc.subject.swd | Systemidentifikation | ger |
dc.title | On the Detection and Selection of Informative Subsequences from Large Historical Data Records for Linear System Identification | eng |
dc.type | Buch | |
dc.type.version | publishedVersion | |
dcterms.abstract | Performing experiments for system identification of continuously operated plants might be restricted as it can impact negatively normal production or cause safety issues. In such cases, using historical logged data for system identification can become an attractive alternative instead of carrying out new experiments. However, since such plants work normally at operating points that are seldom changed, parameter estimation methods with logged data can suffer numerical problems. Methods to locate and select informative data sequences is a promising area that can support system identification in processes where erforming experiments is constrained. At least three main drawbacks of current approaches can be discussed. Firstly, detection tests used in data selection methods are based on time series models even though, they address dynamical systems where the input sequence should also be considered. In case of processes operating in closed loop, excitation caused by external disturbances is not detected if current approaches only evaluate changes in the set points. Secondly, upper interval bounds can be wrongly defined since the process is described by inputoutput models that assume white Gaussian noise (WGN) as additive stochastic disturbance. In practical applications, colored noise is more likely to be found than white Gaussian noise (WGN). Thirdly, in current methods model estimation with the retrieved selected intervals is not supported and therefore the quality of selected data for data-driven modeling cannot be practically assessed. In the data selection method proposed in the present thesis, called data selection for system identification (DS4SID), previous drawbacks are addressed and robust tests are designed and implemented. DS4SID can be applied to multivariate processes operating in open or closed-loop. Two tests are proposed for detection and bounding of informative intervals which simplifies the choice of user-defined parameters. A model is computed using a data merging method which can be used for further analysis. The performance of DS4SID is evaluated in a simulated and laboratory multivariate processes. A process unit of the lab-scale factory ŞμPlantŤ is used as industry-oriented case study. Models estimated with selected informative intervals are shown to have similar performance than estimates with the entire data set. | eng |
dcterms.abstract | Die Durchführung von Experimenten zur Erfassung von Daten für die Systemidentifikation bei kontinuierlich betriebenen Prozessanlagen ist oft nur eingeschränkt möglich, entweder weil ein Stillstand unerwünscht ist oder aus Gründen der Betriebssicherheit. In diesem Fall stellt die Auswertung aufgezeichneter Daten eine wertvolle Alternative zur Durchführung neuer Experimente dar. Da die Betriebspunkte nur selten geändert werden, können Verfahren zur Parameterschätzung unter numerischen Problemen leiden. Die Entwicklung neuer Methoden zum Auffinden und Auswählen informativer Datensequenzen ist ein vielversprechendes Forschungsgebiet, das die Systemidentifikation unterstützen kann, bei denen die Durchführung von Experimenten nur begrenzt möglich ist. Es gibt mindestens drei wesentliche Nachteile der derzeitigen Methoden: Erstens arbeiten Datenselektionsverfahren zur Erkennung von Ausreißern nur auf einzelnen Zeitreihen, obwohl sie aus dynamischen Systemen stammen, bei denen auch die Eingangssignale berücksichtigt werden sollten. Zweitens können die oberen Intervallgrenzen falsch definiert werden, wenn das angenommene Rauschmodel nicht der Realität entspricht. Drittens wird in derzeitigen Datenselektionsverfahren keine Modellparameterschätzung durchgeführt und daher kann der Wert der selektierten Daten nicht praktisch bewertet werden. Mit der in dieser Arbeit vorgeschlagenen Datenselektionsmethode mit der Bezeichnung DS4SID werden die bisherigen Nachteile behoben und robuste Tests vorgestellt. Das zweistuĄge Verfahren detektiert Ausreißer und bestimmt die oberen Intervallgrenzen informativer Datensequenzen, was die Festlegung von Entwurfsparametern vereinfacht. Mit Hilfe des Zusammenführens der selektierten Datensequenzen wird ein Modell berechnet, welches für die weitere Auswertung verwendet werden kann. Die Leistungsfähigkeit von DS4SID wird mit Hilfe von Simulationsstudien und einer industrienahen Fallstudie eines realen Mehrgrößensystems überprüft. Dabei wurde eine Prozessinsel der Modellfabrik ŞμPlantŤ genutzt. Es konnte gezeigt werden, dass Modelle, die mit Hilfe von selektierten Daten berechnet worden sind, vergleichbar sind mit Modellen, die mit dem gesamten Datensatz berechnet wurden. | ger |
dcterms.accessRights | open access | |
dcterms.creator | Arengas Rojas, David Leonardo | |
dcterms.dateAccepted | 2021-06-15 | |
dcterms.extent | xi, 153 Seiten | |
dcterms.source.series | Schriftenreihe Mess- und Regelungstechnik der Universität Kassel | ger |
dcterms.source.volume | Band 11 | |
kup.binding | Softcover | |
kup.institution | FB 15 / Maschinenbau | |
kup.iskup | true | |
kup.order | https://www.genialokal.de/Produkt/David-Leonardo-Arengas-Rojas/On-the-Detection-and-Selection-of-Informative-Subsequences-from-Large-Historical-Data-Records-for-Linear-System-Identification_lid_53563617.html | |
kup.price | 39,00 | |
kup.series | Schriftenreihe Mess- und Regelungstechnik der Universität Kassel | ger |
kup.size | 17 x 24 xm | |
kup.subject | Naturwissenschaft, Technik, Informatik, Medizin | ger |
kup.typ | Dissertation | |
ubks.epflicht | true |
Files
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 3.03 KB
- Format:
- Item-specific license agreed upon to submission
- Description: