Named Entity Recognition for Code-Mixed Indian Corpus using Meta Embedding

Ruba Priyadharshini; Bharathi Raja Chakravarthi; Mani Vegupatti; John P. McCrae

doi:10.1109/icaccs48705.2020.9074379

ScienceGate Book Chapters

JOURNAL ARTICLE

Named Entity Recognition for Code-Mixed Indian Corpus using Meta Embedding

Ruba Priyadharshini Bharathi Raja Chakravarthi Mani Vegupatti John P. McCrae

Year: 2020 Pages: 68-72

DOI: 10.1109/icaccs48705.2020.9074379

Get Full-Text PDF Get Analytical Report

Abstract

In this paper, we utilize the pre-trained embedding, sub-word embedding and closely related languages of languages in the code mixed corpus to create a meta-embedding. We then use the Transformer to encode the code mixed sentence and use Conditional Random Field to predict the Named Entities in the code-mixed text. In contrast to classical Named Entity recognition where the text is monolingual, our approach can predict the Named Entities in code-mixed corpus written both in the native script as well as Roman script. Our method is a novel method to combine the embeddings of closely related languages to identify Named Entity from Code-Mixed Indian text written using native script and Roman script in social media.

Keywords:

Computer science Natural language processing Conditional random field Embedding Artificial intelligence Code (set theory) Word embedding Sentence Named-entity recognition Word (group theory) ENCODE Code-switching Word2vec Transformer Linguistics Programming language

Metrics

Cited By

12.92

FWCI (Field Weighted Citation Impact)

Refs

0.99

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Citation History

Topics

Natural Language Processing Techniques

Physical Sciences → Computer Science → Artificial Intelligence

Topic Modeling

Physical Sciences → Computer Science → Artificial Intelligence

Text Readability and Simplification

Physical Sciences → Computer Science → Artificial Intelligence

Named Entity Recognition for Code-Mixed Indian Corpus using Meta Embedding

Abstract

Metrics

Citation History

Topics

Related Documents

Code-Switched Named Entity Recognition with Embedding Attention

Named Entity Recognition on Arabic-English Code-Mixed Data

Named Entity Recognition Using Web Document Corpus

Named Entity Recognition Using Web Document Corpus

Named Entity Recognition Using Web Document Corpus