A Holistic, Decision-Theoretic Framework for Pool-Based Active Learning
dc.contributor.corporatename | Kassel, Universität Kassel, Fachbereich Elektrotechnik / Informatik | |
dc.contributor.referee | Sick, Bernhard (Prof. Dr.) | |
dc.contributor.referee | Krempl, Utrecht (Prof. Dr.) | |
dc.date.accessioned | 2021-10-28T10:33:29Z | |
dc.date.available | 2021-10-28T10:33:29Z | |
dc.date.issued | 2021 | |
dc.description | Zugleich: Dissertation, Universität Kassel, 2021 | ger |
dc.identifier | doi:10.17170/kobra-202109244802 | |
dc.identifier.uri | http://hdl.handle.net/123456789/13333 | |
dc.language.iso | eng | eng |
dc.publisher | kassel university press | |
dc.publisher.place | Kassel | |
dc.relation.isbn | 978-3-7376-0987-6 | |
dc.rights | Namensnennung - Weitergabe unter gleichen Bedingungen 4.0 International | * |
dc.rights.uri | http://creativecommons.org/licenses/by-sa/4.0/ | * |
dc.subject | machine learning | eng |
dc.subject | active learning | eng |
dc.subject | Bayesian estimation | eng |
dc.subject | holistic | eng |
dc.subject | probabilistic | eng |
dc.subject | decision-theoretic | eng |
dc.subject.ddc | 004 | |
dc.subject.swd | Maschinelles Lernen | ger |
dc.subject.swd | Aktives maschinelles Lernen | ger |
dc.subject.swd | Bayes-Verfahren | ger |
dc.subject.swd | Entscheidungstheorie | ger |
dc.subject.swd | Modell | ger |
dc.title | A Holistic, Decision-Theoretic Framework for Pool-Based Active Learning | eng |
dc.type | Buch | |
dc.type.version | publishedVersion | |
dcterms.abstract | Efficient labeling is an important topic in machine learning research as classifiers need labeled data. Whereas unlabeled data is easily gathered, labeling is exhausting, time-consuming, or expensive and should, therefore, be reduced to a minimum. Active learning aims to actively select useful, unlabeled instances for label acquisition to reduce the labeling effort while providing labeled training data such that the classifier performs well. This thesis proposes Probabilistic Active Learning, a holistic, decision-theoretic framework for active learning that enables optimization for every performance measure and classifier. Using the holistic mathematical description, we can define an upper baseline for active learning and identify theoretical similarities to other selection strategies. We evaluate our approach on 22 datasets for six different performance measures. Moreover, we show that our approach can be applied to multiple classifiers and can be used for batch selection. In another scenario, called transductive active learning, we provide a set of unlabeled instances and ask the active learning algorithm to return the correct labels only for this set. In contrast to the standard (inductive) scenario, where we aim to build a general classifier, we can either ask an oracle to provide the correct labels or use the classifier to predict the label. We introduce a new cost-based performance measure for transductive active learning and show the superiority of our probabilistic approach. | eng |
dcterms.abstract | Effizientes Labeling ist ein wichtiges Forschungsthema im maschinellen Lernen, da Klassifikatoren gelabelte Daten benötigen. Während ungelabelte Daten leicht gesammelt werden können, ist das Labeln mühsam, zeitaufwendig oder teuer und sollte daher auf ein Minimum reduziert werden. Aktives Lernen zielt darauf ab, nützliche, ungelabelte Instanzen aktiv für die Annotation auszuwählen, um den Aufwand für das Labeln zu reduzieren und gleichzeitig gelabelte Trainingsdaten bereitzustellen, so dass der Klassifikator eine gute Leistung erbringt. Diese Arbeit stellt Probabilistisches Aktives Lernen vor, ein ganzheitliches, entscheidungstheoretisches Konzept für Aktives Lernen, das die Optimierung für jedes Gütemaß und jeden Klassifikator ermöglicht. Mit Hilfe der ganzheitlichen mathematischen Beschreibung können wir eine obere Referenzmethode für aktives Lernen definieren und theoretische Ähnlichkeiten zu anderen Selektionsstrategien identifizieren. Wir evaluieren unseren Ansatz auf 22 Datensätzen für sechs verschiedene Gütemaße. Außerdem zeigen wir, dass unser Ansatz auf mehrere Klassifikatoren angewendet werden kann und für die Batch-Auswahl geeignet ist. In einem anderen Szenario, dem sogenannten transduktiven aktiven Lernen, stellen wir eine Menge von ungelabelten Instanzen zur Verfügung und bitten den aktiven Lernalgorithmus, die korrekten Labels für genau diese Menge zu ermitteln. Im Gegensatz zum (induktiven) Standardszenario, bei dem wir einen universellen Klassifikator erstellen wollen, können wir entweder ein Orakel bitten, die korrekten Labels zu liefern, oder den Klassifikator verwenden, um das Label vorherzusagen. Wir führen ein neues kostenbasiertes Gütemaß für transduktives aktives Lernen ein und zeigen die Überlegenheit unseres probabilistischen Ansatzes. | ger |
dcterms.accessRights | open access | |
dcterms.creator | Kottke, Daniel | |
dcterms.dateAccepted | 2021-09-07 | |
dcterms.extent | x, 241 Seiten | |
dcterms.source.series | Intelligent Embedded Systems | |
dcterms.source.volume | Band 19 | |
kup.binding | Softcover | |
kup.institution | FB 16 / Elektrotechnik / Informatik | |
kup.iskup | true | |
kup.order | https://www.genialokal.de/Produkt/Daniel-Kottke/A-Holistic-Decision-Theoretic-Framework-for-Pool-Based-Active-Learning_lid_47230289.html | |
kup.price | 39,00 | |
kup.series | Intelligent Embedded Systems | |
kup.size | DIN A5 | |
kup.subject | Naturwissenschaft, Technik, Informatik, Medizin | |
kup.typ | Dissertation | |
ubks.epflicht | true |
Files
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 3.03 KB
- Format:
- Item-specific license agreed upon to submission
- Description: