A Holistic, Decision-Theoretic Framework for Pool-Based Active Learning

dc.contributor.corporatenameKassel, Universität Kassel, Fachbereich Elektrotechnik / Informatik
dc.contributor.refereeSick, Bernhard (Prof. Dr.)
dc.contributor.refereeKrempl, Utrecht (Prof. Dr.)
dc.date.accessioned2021-10-28T10:33:29Z
dc.date.available2021-10-28T10:33:29Z
dc.date.issued2021
dc.descriptionZugleich: Dissertation, Universität Kassel, 2021ger
dc.identifierdoi:10.17170/kobra-202109244802
dc.identifier.urihttp://hdl.handle.net/123456789/13333
dc.language.isoengeng
dc.publisherkassel university press
dc.publisher.placeKassel
dc.relation.isbn978-3-7376-0987-6
dc.rightsNamensnennung - Weitergabe unter gleichen Bedingungen 4.0 International*
dc.rights.urihttp://creativecommons.org/licenses/by-sa/4.0/*
dc.subjectmachine learningeng
dc.subjectactive learningeng
dc.subjectBayesian estimationeng
dc.subjectholisticeng
dc.subjectprobabilisticeng
dc.subjectdecision-theoreticeng
dc.subject.ddc004
dc.subject.swdMaschinelles Lernenger
dc.subject.swdAktives maschinelles Lernenger
dc.subject.swdBayes-Verfahrenger
dc.subject.swdEntscheidungstheorieger
dc.subject.swdModellger
dc.titleA Holistic, Decision-Theoretic Framework for Pool-Based Active Learningeng
dc.typeBuch
dc.type.versionpublishedVersion
dcterms.abstractEfficient labeling is an important topic in machine learning research as classifiers need labeled data. Whereas unlabeled data is easily gathered, labeling is exhausting, time-consuming, or expensive and should, therefore, be reduced to a minimum. Active learning aims to actively select useful, unlabeled instances for label acquisition to reduce the labeling effort while providing labeled training data such that the classifier performs well. This thesis proposes Probabilistic Active Learning, a holistic, decision-theoretic framework for active learning that enables optimization for every performance measure and classifier. Using the holistic mathematical description, we can define an upper baseline for active learning and identify theoretical similarities to other selection strategies. We evaluate our approach on 22 datasets for six different performance measures. Moreover, we show that our approach can be applied to multiple classifiers and can be used for batch selection. In another scenario, called transductive active learning, we provide a set of unlabeled instances and ask the active learning algorithm to return the correct labels only for this set. In contrast to the standard (inductive) scenario, where we aim to build a general classifier, we can either ask an oracle to provide the correct labels or use the classifier to predict the label. We introduce a new cost-based performance measure for transductive active learning and show the superiority of our probabilistic approach.eng
dcterms.abstractEffizientes Labeling ist ein wichtiges Forschungsthema im maschinellen Lernen, da Klassifikatoren gelabelte Daten benötigen. Während ungelabelte Daten leicht gesammelt werden können, ist das Labeln mühsam, zeitaufwendig oder teuer und sollte daher auf ein Minimum reduziert werden. Aktives Lernen zielt darauf ab, nützliche, ungelabelte Instanzen aktiv für die Annotation auszuwählen, um den Aufwand für das Labeln zu reduzieren und gleichzeitig gelabelte Trainingsdaten bereitzustellen, so dass der Klassifikator eine gute Leistung erbringt. Diese Arbeit stellt Probabilistisches Aktives Lernen vor, ein ganzheitliches, entscheidungstheoretisches Konzept für Aktives Lernen, das die Optimierung für jedes Gütemaß und jeden Klassifikator ermöglicht. Mit Hilfe der ganzheitlichen mathematischen Beschreibung können wir eine obere Referenzmethode für aktives Lernen definieren und theoretische Ähnlichkeiten zu anderen Selektionsstrategien identifizieren. Wir evaluieren unseren Ansatz auf 22 Datensätzen für sechs verschiedene Gütemaße. Außerdem zeigen wir, dass unser Ansatz auf mehrere Klassifikatoren angewendet werden kann und für die Batch-Auswahl geeignet ist. In einem anderen Szenario, dem sogenannten transduktiven aktiven Lernen, stellen wir eine Menge von ungelabelten Instanzen zur Verfügung und bitten den aktiven Lernalgorithmus, die korrekten Labels für genau diese Menge zu ermitteln. Im Gegensatz zum (induktiven) Standardszenario, bei dem wir einen universellen Klassifikator erstellen wollen, können wir entweder ein Orakel bitten, die korrekten Labels zu liefern, oder den Klassifikator verwenden, um das Label vorherzusagen. Wir führen ein neues kostenbasiertes Gütemaß für transduktives aktives Lernen ein und zeigen die Überlegenheit unseres probabilistischen Ansatzes.ger
dcterms.accessRightsopen access
dcterms.creatorKottke, Daniel
dcterms.dateAccepted2021-09-07
dcterms.extentx, 241 Seiten
dcterms.source.seriesIntelligent Embedded Systems
dcterms.source.volumeBand 19
kup.bindingSoftcover
kup.institutionFB 16 / Elektrotechnik / Informatik
kup.iskuptrue
kup.orderhttps://www.genialokal.de/Produkt/Daniel-Kottke/A-Holistic-Decision-Theoretic-Framework-for-Pool-Based-Active-Learning_lid_47230289.html
kup.price39,00
kup.seriesIntelligent Embedded Systems
kup.sizeDIN A5
kup.subjectNaturwissenschaft, Technik, Informatik, Medizin
kup.typDissertation
ubks.epflichttrue

Files

Original bundle

Now showing 1 - 2 of 2
Thumbnail Image
Name:
kup_9783737609876.pdf
Size:
12.02 MB
Format:
Adobe Portable Document Format
Description:
No Thumbnail Available
Name:
orig_9783737609876.pdf
Size:
13.71 MB
Format:
Adobe Portable Document Format
Description:

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
3.03 KB
Format:
Item-specific license agreed upon to submission
Description: