• Media type: Doctoral Thesis; E-Book; Electronic Thesis
  • Title: An investigation on the power of unlabeled data
  • Contributor: Darnstädt, Malte (Dipl.) [Author]
  • imprint: RUB-Repository (Ruhr-Universität Bochum), 2015-09-30
  • Language: English
  • Keywords: Algorithmische Lerntheorie ; Captcha ; Teilüberwachtes Lernen ; Stichprobenumfang ; Maschinelles Lernen
  • Origination:
  • Footnote: Diese Datenquelle enthält auch Bestandsnachweise, die nicht zu einem Volltext führen.
  • Description: Diese Dissertation untersucht den Nutzen von ungelabelten Daten für das Lernen von binären Klassifikatoren und enthält drei wesentliche Beiträge: 1) Es wird bewiesen, dass Semi-Supervised Learning die Anzahl der zum Lernen benötigten Labels verglichen mit Supervised Learning nur um einen konstanten Faktor verringert, falls die Konzeptklasse endlich ist. Ein schwächeres Resultat gilt für Klassen mit endlicher VC-Dimension. Für Klassen unendlicher VC-Dimension wird hingegen gezeigt, dass die Reduktion beliebig groß sein kann. 2) Die Anzahl an benötigten Labels von Supervised Lernern im Co-Training-Framework mit bedingter Unabhängigkeit wird eingehend untersucht und mit der von Semi-Supervised Lernern verglichen. Es ergeben sich Verbindungen zur Analyse von agnostischen aktiven Lernern und dem Lernen aus positiven Beispielen. 3) Semi-Supervised und aktive Lerner werden erfolgreich zum Lösen von Audio-Captchas angewandt.
  • Access State: Open Access