MIA 2022 Shared Task: Evaluating Cross-lingual Open-Retrieval Question Answering for 16 Diverse Languages

Akari Asai; Shayne Longpre; Jungo Kasai; Chia-Hsuan Lee; Rui Zhang; Junjie Hu; Ikuya Yamada; Jonathan H. Clark; Eunsol Choi

doi:10.18653/v1/2022.mia-1.11

ScienceGate Book Chapters

JOURNAL ARTICLE

MIA 2022 Shared Task: Evaluating Cross-lingual Open-Retrieval Question Answering for 16 Diverse Languages

Akari Asai Shayne Longpre Jungo Kasai Chia-Hsuan Lee Rui Zhang Junjie Hu Ikuya Yamada Jonathan H. Clark Eunsol Choi

Year: 2022

DOI: 10.18653/v1/2022.mia-1.11

Get Full-Text PDF Get Analytical Report

Abstract

We present the results of the Workshop on Multilingual Information Access (MIA) 2022 Shared Task, evaluating cross-lingual open-retrieval question answering (QA) systems in 16 typologically diverse languages. In this task, we adapted two large-scale cross-lingual open-retrieval QA datasets in 14 typologically diverse languages, and newly annotated open-retrieval QA data in 2 underrepresented languages: Tagalog and Tamil. Four teams submitted their systems. The best constrained system uses entity-aware contextualized representations for document retrieval, thereby achieving an average F1 score of 31.6, which is 4.1 F1 absolute higher than the challenging baseline. The best system obtains particularly significant improvements in Tamil (20.8 F1), whereas most of the other systems yield nearly zero scores. The best unconstrained system achieves 32.2 F1, outperforming our baseline by 4.5 points.

Keywords:

Computer science Question answering Tamil Task (project management) Natural language processing Baseline (sea) Tagalog Artificial intelligence Information retrieval Linguistics

Metrics

Cited By

1.17

FWCI (Field Weighted Citation Impact)

Refs

0.76

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Citation History

Topics

Topic Modeling

Physical Sciences → Computer Science → Artificial Intelligence

Natural Language Processing Techniques

Physical Sciences → Computer Science → Artificial Intelligence

Multimodal Machine Learning Applications

Physical Sciences → Computer Science → Computer Vision and Pattern Recognition

MIA 2022 Shared Task: Evaluating Cross-lingual Open-Retrieval Question Answering for 16 Diverse Languages

Abstract

Metrics

Citation History

Topics

Related Documents

Cross-lingual Open-Retrieval Question Answering for African Languages

XOR QA: Cross-lingual Open-Retrieval Question Answering

Improved Cross-Lingual Question Retrieval for Community Question Answering

Cross-lingual embedding for cross-lingual question retrieval in low-resource community question answering

Cross-lingual question answering