Syntactic parsing with generative language models

Albrecht, Marlene

doi:10.25365/thesis.79783

ScienceGate Book Chapters

JOURNAL ARTICLE

Syntactic parsing with generative language models

Albrecht, Marlene

Year: 2025 Journal: University of Vienna

DOI: 10.25365/thesis.79783

Get Full-Text PDF Get Analytical Report

Abstract

Für das Training generativer Sprachmodelle werden oft große Datenmengen benötigt, die allerdings nicht für alle Sprachen verfügbar sind. In-Context Learning bietet einen Ansatz, bei dem Modelle aus den im Prompt gezeigten Beispielen lernen. Das Ziel dieser Forschung war es, zu untersuchen, wie Faktoren wie Anzahl der Beispielannotationen, linguistische Diversität, Sprachähnlichkeit zwischen Quell- und Zielsprache und syntaktische Ähnlichkeit den Modelloutput beeinflussen. Hierfür wurden In-Context Learning Experimente zu POS-Tagging und Dependency Parsing mit romanischen Sprachen und Baskisch durchgeführt, wobei die romanischen Minderheitensprachen Galizisch, Katalanisch und Okzitanisch im Fokus standen. Die Ergebnisse zeigten, dass das Zeigen von Beispielen wenig Einfluss auf die Modellperformanz hat, wenn strukturelle und linguistische Constraints eingesetzt werden, da bereits 0-Shot Ergebnisse überzeugend sind. Darüber hinaus erzielen Constraints, die für eine Hochressourcensprache erstellt wurden, auch für Minderheitensprachen gute Ergebnisse. Zudem korrelieren Sprach- und syntaktische Ähnlichkeit der Beispielannotationen in manchen Fällen mit der Modellperformanz, wobei jedoch keine klaren Zusammenhänge ableitbar sind. Diese Forschung demonstriert das Potenzial computerlinguistischer Methoden in traditionellen philologischen Disziplinen, insbesondere der Romanistik, und deren Beitrag zur Optimierung von Verfahren für unterrepräsentierte Sprachen.

Keywords:

Generative grammar Parsing Dependency (UML) Dependency grammar

Metrics

Cited By

0.00

FWCI (Field Weighted Citation Impact)

Refs

0.85

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Topics

Natural Language Processing Techniques

Physical Sciences → Computer Science → Artificial Intelligence

Topic Modeling

Physical Sciences → Computer Science → Artificial Intelligence

Language and cultural evolution

Social Sciences → Social Sciences → Cultural Studies

Syntactic parsing with generative language models

Abstract

Metrics

Topics

Related Documents

Improved syntactic models for parsing speech with repairs

Optimization of English Syntactic Structure Parsing Based on Large Language Models (LLMs)

Neural Syntactic Generative Models with Exact Marginalization

Incremental generative models for syntactic and semantic natural language processing

Generative Pretrained Structured Transformers: Unsupervised Syntactic Language Models at Scale