Semi-supervised structured prediction models

Ulf Brefeld

doi:10.18452/15748

ScienceGate Book Chapters

DISSERTATION

Semi-supervised structured prediction models

Ulf Brefeld

Year: 2008 University: edoc Publication server (Humboldt University of Berlin) Pages: 1-168 Publisher: Humboldt-Universität zu Berlin

DOI: 10.18452/15748

Get Full-Text PDF Get Analytical Report

Abstract

Das Lernen aus strukturierten Eingabe- und Ausgabebeispielen ist die Grundlage für die automatisierte Verarbeitung natürlich auftretender Problemstellungen und eine Herausforderung für das Maschinelle Lernen. Die Einordnung von Objekten in eine Klassentaxonomie, die Eigennamenerkennung und das Parsen natürlicher Sprache sind mögliche Anwendungen. Klassische Verfahren scheitern an der komplexen Natur der Daten, da sie die multiplen Abhängigkeiten und Strukturen nicht erfassen können. Zudem ist die Erhebung von klassifizierten Beispielen in strukturierten Anwendungsgebieten aufwändig und ressourcenintensiv, während unklassifizierte Beispiele günstig und frei verfügbar sind. Diese Arbeit thematisiert halbüberwachte, diskriminative Vorhersagemodelle für strukturierte Daten. Ausgehend von klassischen halbüberwachten Verfahren werden die zugrundeliegenden analytischen Techniken und Algorithmen auf das Lernen mit strukturierten Variablen übertragen. Die untersuchten Verfahren basieren auf unterschiedlichen Prinzipien und Annahmen, wie zum Beispiel der Konsensmaximierung mehrerer Hypothesen im Lernen aus mehreren Sichten, oder der räumlichen Struktur der Daten im transduktiven Lernen. Desweiteren wird in einer Fallstudie zur Email-Batcherkennung die räumliche Struktur der Daten ausgenutzt und eine Lösung präsentiert, die der sequenziellen Natur der Daten gerecht wird. Aus den theoretischen Überlegungen werden halbüberwachte, strukturierte Vorhersagemodelle und effiziente Optmierungsstrategien abgeleitet. Die empirische Evaluierung umfasst Klassifikationsprobleme, Eigennamenerkennung und das Parsen natürlicher Sprache. Es zeigt sich, dass die halbüberwachten Methoden in vielen Anwendungen zu signifikant kleineren Fehlerraten führen als vollständig überwachte Baselineverfahren.

Keywords:

Humanities Political science Computer science Artificial intelligence Philosophy

Metrics

Cited By

0.00

FWCI (Field Weighted Citation Impact)

117

Refs

0.04

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Citation History

Topics

Machine Learning and Data Classification

Physical Sciences → Computer Science → Artificial Intelligence

Text and Document Classification Technologies

Physical Sciences → Computer Science → Artificial Intelligence

Machine Learning and Algorithms

Physical Sciences → Computer Science → Artificial Intelligence

Semi-supervised structured prediction models

Abstract

Metrics

Citation History

Topics

Related Documents

Tractable Semi-supervised Learning of Complex Structured Prediction Models

Semi-supervised learning for structured output prediction

Semi-supervised Structured Prediction with Neural CRF Autoencoder

Semi-supervised multi-task learning of structured prediction models for web information extraction

Semi-Supervised Video Segmentation Using Tree Structured Graphical Models