Document Image Binarization Using Multi-scale Fusion Network

Quang-Vinh Dang; Guee-Sang Lee

doi:10.5626/jok.2019.46.12.1314

ScienceGate Book Chapters

JOURNAL ARTICLE

Document Image Binarization Using Multi-scale Fusion Network

Quang-Vinh Dang Guee-Sang Lee

Year: 2019 Journal: Journal of KIISE Vol: 46 (12)Pages: 1314-1321 Publisher: Korea Information Science Society

DOI: 10.5626/jok.2019.46.12.1314

Get Full-Text PDF Get Analytical Report

Abstract

화질이 저하된 문서 이미지의 이진화는 문서 이미지 분석에 중대한 영향을 미친다. 본 논문에서는 다중 스케일 구조를 갖는 LadderNet을 이용하여 저하된 문서 이미지의 기능을 학습하고 노이즈 픽셀로부터 텍스트 및 배경 픽셀을 분류하는 방법을 제시한다. 본 논문에서는 적절히 수정된 형태의 두 가지 LadderNet 아키텍처를 고려한다. 하나는 더 깊은 네트워크 구조이고 다른 하나는 더 얕은 네트워크 구조이며, 각 구조는 문서 이미지 패치를 사용하여 독립적으로 학습된다. 더 작은 크기의 윈도우로 더 깊은 아키텍처에서 생성된 예측 출력에는 텍스트 획이 더 명확하지만 많은 노이즈가 존재한다. 반면에, 더 큰 크기의 윈도우를 갖는 더 얕은 아키텍처로부터는 배경에서 더 낮은 노이즈가 생성된다. 본 논문에서는 이 두 가지 네트워크의 출력을 결합하여 더 나은 결과를 생성한다. 문서 이미지 이진화를 위한 벤치 마크 DIBCO 데이터 세트를 이용한 실험결과, 기존 방법보다 우수한 성능을 보임이 확인되었다.

Keywords:

Artificial intelligence Scale (ratio) Computer science Image (mathematics) Fusion Computer vision Image fusion Pattern recognition (psychology) Cartography Geography

Metrics

Cited By

0.11

FWCI (Field Weighted Citation Impact)

Refs

0.46

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Citation History

Topics

Image Processing and 3D Reconstruction

Physical Sciences → Computer Science → Computer Vision and Pattern Recognition

Document Image Binarization Using Multi-scale Fusion Network

Abstract

Metrics

Citation History

Topics

Related Documents

Multi-scale Multi-attention Network for Moiré Document Image Binarization

Document image binarization using ”multi-scale” predefined filters

Multi-spectral document image binarization using image fusion and background subtraction techniques

Binarization for Document Image Based on Multi-scale Conditional Random Fields

SDF-Net: A Document Image Binarization Network Based on Semantic-Detail Fusion