English Contrastive Learning Can Learn Universal Cross-lingual Sentence Embeddings

Yau-Shian Wang; Ashley Wu; Graham Neubig

doi:10.18653/v1/2022.emnlp-main.621

ScienceGate Book Chapters

JOURNAL ARTICLE

English Contrastive Learning Can Learn Universal Cross-lingual Sentence Embeddings

Yau-Shian Wang Ashley Wu Graham Neubig

Year: 2022 Pages: 9122-9133

DOI: 10.18653/v1/2022.emnlp-main.621

Get Full-Text PDF Get Analytical Report

Abstract

Universal cross-lingual sentence embeddings map semantically similar cross-lingual sentences into a shared embedding space. Aligning cross-lingual sentence embeddings usually requires supervised cross-lingual parallel sentences. In this work, we propose mSimCSE, which extends SimCSE to multilingual settings and reveal that contrastive learning on English data can surprisingly learn high-quality universal cross-lingual sentence embeddings without any parallel data.In unsupervised and weakly supervised settings, mSimCSE significantly improves previous sentence embedding methods on cross-lingual retrieval and multilingual STS tasks. The performance of unsupervised mSimCSE is comparable to fully supervised methods in retrieving low-resource languages and multilingual STS.The performance can be further enhanced when cross-lingual NLI data is available.

Keywords:

Computer science Sentence Natural language processing Artificial intelligence Embedding Speech recognition

Metrics

Cited By

2.94

FWCI (Field Weighted Citation Impact)

Refs

0.89

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Citation History

Topics

Topic Modeling

Physical Sciences → Computer Science → Artificial Intelligence

Multimodal Machine Learning Applications

Physical Sciences → Computer Science → Computer Vision and Pattern Recognition

Natural Language Processing Techniques

Physical Sciences → Computer Science → Artificial Intelligence

English Contrastive Learning Can Learn Universal Cross-lingual Sentence Embeddings

Abstract

Metrics

Citation History

Topics

Related Documents

Contrastive Learning for Universal Zero-Shot NLI with Cross-Lingual Sentence Embeddings

Contrastive Learning for Universal Zero-Shot NLI with Cross-Lingual Sentence Embeddings

Enhancing Multilingual Universal Sentence Embeddings by Monolingual Contrastive Learning

LEARNING CROSS-LINGUAL WORD EMBEDDINGS WITH UNIVERSAL CONCEPTS

LEARNING CROSS-LINGUAL WORD EMBEDDINGS WITH UNIVERSAL CONCEPTS