Efficient Automatic Punctuation Restoration Using Bidirectional Transformers with Robust Inference

Maury Courtland; Adam Faulkner; Gayle McElvain

doi:10.18653/v1/2020.iwslt-1.33

ScienceGate Book Chapters

JOURNAL ARTICLE

Efficient Automatic Punctuation Restoration Using Bidirectional Transformers with Robust Inference

Maury Courtland Adam Faulkner Gayle McElvain

Year: 2020

DOI: 10.18653/v1/2020.iwslt-1.33

Get Full-Text PDF Get Analytical Report

Abstract

Though people rarely speak in complete sentences, punctuation confers many benefits to the readers of transcribed speech. Unfortunately, most ASR systems do not produce punctuated output. To address this, we propose a solution for automatic punctuation that is both cost efficient and easy to train. Our solution benefits from the recent trend in fine-tuning transformer-based language models. We also modify the typical framing of this task by predicting punctuation for sequences rather than individual tokens, which makes for more efficient training and inference. Finally, we find that aggregating predictions across multiple context windows improves accuracy even further. Our best model achieves a new state of the art on benchmark data (TED Talks) with a combined F1 of 83.9, representing a 48.7% relative improvement (15.3 absolute) over the previous state of the art.

Keywords:

Punctuation Computer science Inference Transformer Benchmark (surveying) Language model Natural language processing Artificial intelligence Framing (construction) Speech recognition Machine learning Engineering

Metrics

Cited By

4.99

FWCI (Field Weighted Citation Impact)

Refs

0.95

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Citation History

Topics

Natural Language Processing Techniques

Physical Sciences → Computer Science → Artificial Intelligence

Speech and dialogue systems

Physical Sciences → Computer Science → Artificial Intelligence

Topic Modeling

Physical Sciences → Computer Science → Artificial Intelligence

Efficient Automatic Punctuation Restoration Using Bidirectional Transformers with Robust Inference

Abstract

Metrics

Citation History

Topics

Related Documents

Bidirectional LSTM for Automatic Punctuation Restoration

Towards explainable automatic punctuation restoration for Portuguese using transformers

AraPunc: Arabic Punctuation Restoration Using Transformers

Punctuation Restoration for Speech Transcripts using seq2seq Transformers

Punctuation Restoration in Spoken Italian Transcripts with Transformers