A Holistic, Decision-Theoretic Framework for Pool-Based Active Learning

A Holistic, Decision-Theoretic Framework for Pool-Based Active Learning

dc.contributor.corporatename	Kassel, Universität Kassel, Fachbereich Elektrotechnik / Informatik
dc.contributor.referee	Sick, Bernhard (Prof. Dr.)
dc.contributor.referee	Krempl, Utrecht (Prof. Dr.)
dc.date.accessioned	2021-10-28T10:33:29Z
dc.date.available	2021-10-28T10:33:29Z
dc.date.issued	2021
dc.description	Zugleich: Dissertation, Universität Kassel, 2021	ger
dc.identifier	doi:10.17170/kobra-202109244802
dc.identifier.uri	http://hdl.handle.net/123456789/13333
dc.language.iso	eng	eng
dc.publisher	kassel university press
dc.publisher.place	Kassel
dc.relation.isbn	978-3-7376-0987-6
dc.rights	Namensnennung - Weitergabe unter gleichen Bedingungen 4.0 International	*
dc.rights.uri	http://creativecommons.org/licenses/by-sa/4.0/	*
dc.subject	machine learning	eng
dc.subject	active learning	eng
dc.subject	Bayesian estimation	eng
dc.subject	holistic	eng
dc.subject	probabilistic	eng
dc.subject	decision-theoretic	eng
dc.subject.ddc	004
dc.subject.swd	Maschinelles Lernen	ger
dc.subject.swd	Aktives maschinelles Lernen	ger
dc.subject.swd	Bayes-Verfahren	ger
dc.subject.swd	Entscheidungstheorie	ger
dc.subject.swd	Modell	ger
dc.title	A Holistic, Decision-Theoretic Framework for Pool-Based Active Learning	eng
dc.type	Buch
dc.type.version	publishedVersion
dcterms.abstract	Efficient labeling is an important topic in machine learning research as classifiers need labeled data. Whereas unlabeled data is easily gathered, labeling is exhausting, time-consuming, or expensive and should, therefore, be reduced to a minimum. Active learning aims to actively select useful, unlabeled instances for label acquisition to reduce the labeling effort while providing labeled training data such that the classifier performs well. This thesis proposes Probabilistic Active Learning, a holistic, decision-theoretic framework for active learning that enables optimization for every performance measure and classifier. Using the holistic mathematical description, we can define an upper baseline for active learning and identify theoretical similarities to other selection strategies. We evaluate our approach on 22 datasets for six different performance measures. Moreover, we show that our approach can be applied to multiple classifiers and can be used for batch selection. In another scenario, called transductive active learning, we provide a set of unlabeled instances and ask the active learning algorithm to return the correct labels only for this set. In contrast to the standard (inductive) scenario, where we aim to build a general classifier, we can either ask an oracle to provide the correct labels or use the classifier to predict the label. We introduce a new cost-based performance measure for transductive active learning and show the superiority of our probabilistic approach.	eng
dcterms.abstract	Effizientes Labeling ist ein wichtiges Forschungsthema im maschinellen Lernen, da Klassifikatoren gelabelte Daten benötigen. Während ungelabelte Daten leicht gesammelt werden können, ist das Labeln mühsam, zeitaufwendig oder teuer und sollte daher auf ein Minimum reduziert werden. Aktives Lernen zielt darauf ab, nützliche, ungelabelte Instanzen aktiv für die Annotation auszuwählen, um den Aufwand für das Labeln zu reduzieren und gleichzeitig gelabelte Trainingsdaten bereitzustellen, so dass der Klassifikator eine gute Leistung erbringt. Diese Arbeit stellt Probabilistisches Aktives Lernen vor, ein ganzheitliches, entscheidungstheoretisches Konzept für Aktives Lernen, das die Optimierung für jedes Gütemaß und jeden Klassifikator ermöglicht. Mit Hilfe der ganzheitlichen mathematischen Beschreibung können wir eine obere Referenzmethode für aktives Lernen definieren und theoretische Ähnlichkeiten zu anderen Selektionsstrategien identifizieren. Wir evaluieren unseren Ansatz auf 22 Datensätzen für sechs verschiedene Gütemaße. Außerdem zeigen wir, dass unser Ansatz auf mehrere Klassifikatoren angewendet werden kann und für die Batch-Auswahl geeignet ist. In einem anderen Szenario, dem sogenannten transduktiven aktiven Lernen, stellen wir eine Menge von ungelabelten Instanzen zur Verfügung und bitten den aktiven Lernalgorithmus, die korrekten Labels für genau diese Menge zu ermitteln. Im Gegensatz zum (induktiven) Standardszenario, bei dem wir einen universellen Klassifikator erstellen wollen, können wir entweder ein Orakel bitten, die korrekten Labels zu liefern, oder den Klassifikator verwenden, um das Label vorherzusagen. Wir führen ein neues kostenbasiertes Gütemaß für transduktives aktives Lernen ein und zeigen die Überlegenheit unseres probabilistischen Ansatzes.	ger
dcterms.accessRights	open access
dcterms.creator	Kottke, Daniel
dcterms.dateAccepted	2021-09-07
dcterms.extent	x, 241 Seiten
dcterms.source.series	Intelligent Embedded Systems
dcterms.source.volume	Band 19
kup.binding	Softcover
kup.institution	FB 16 / Elektrotechnik / Informatik
kup.iskup	true
kup.order	https://www.genialokal.de/Produkt/Daniel-Kottke/A-Holistic-Decision-Theoretic-Framework-for-Pool-Based-Active-Learning_lid_47230289.html
kup.price	39,00
kup.series	Intelligent Embedded Systems
kup.size	DIN A5
kup.subject	Naturwissenschaft, Technik, Informatik, Medizin
kup.typ	Dissertation
ubks.epflicht	true