Extracting Relations from Italian Wikipedia Using Self-Training

Lucia Siciliani; Pierluigi Cassotti; Pierpaolo Basile; Marco de Gemmis; Pasquale Lops; Giovanni Semeraro

doi:10.4000/books.aaccademia.10849

ScienceGate Book Chapters

BOOK-CHAPTER

Extracting Relations from Italian Wikipedia Using Self-Training

Lucia Siciliani Pierluigi Cassotti Pierpaolo Basile Marco de Gemmis Pasquale Lops Giovanni Semeraro

Year: 2022 Accademia University Press eBooks Pages: 307-313 Publisher: Accademia University Press

DOI: 10.4000/books.aaccademia.10849

Get Full-Text PDF Get Analytical Report

Abstract

In this paper, we describe a supervised approach for extracting relations from Wikipedia. In particular, we exploit a self-training strategy for enriching a small number of manually labeled triples with new self-labeled examples. We integrate the supervised stage in WikiOIE, an existing framework for unsupervised extraction of relations from Wikipedia. We rely on WikiOIE and its unsupervised pipeline for extracting the initial set of unlabelled triples. An evaluation involving different algorithms and parameters proves that self-training helps to improve performance. Finally, we provide a dataset of about three million triples extracted from the Italian version of Wikipedia and perform a preliminary evaluation conducted on a sample dataset, obtaining promising results.

Keywords:

Exploit Computer science Pipeline (software) Set (abstract data type) Sample (material) Artificial intelligence Training set Relationship extraction Machine learning Labeled data Data mining Information retrieval Information extraction

Metrics

Cited By

0.73

FWCI (Field Weighted Citation Impact)

Refs

0.74

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Citation History

Topics

Natural Language Processing Techniques

Physical Sciences → Computer Science → Artificial Intelligence

Wikis in Education and Collaboration

Social Sciences → Social Sciences → Communication

Topic Modeling

Physical Sciences → Computer Science → Artificial Intelligence

Extracting Relations from Italian Wikipedia Using Self-Training

Abstract

Metrics

Citation History

Topics

Related Documents

Extracting Relations from Italian Wikipedia using Self-Training

Extracting Semantic Concept Relations from Wikipedia

An Empirical Research on Extracting Relations from Wikipedia Text

Extracting Prerequisite Relations Among Wikipedia Concepts Using the Clickstream Data

Extracting Prerequisite Relations Among Concepts in Wikipedia