JOURNAL ARTICLE

Document Image Binarization Using Multi-scale Fusion Network

Quang-Vinh DangGuee-Sang Lee

Year: 2019 Journal:   Journal of KIISE Vol: 46 (12)Pages: 1314-1321   Publisher: Korea Information Science Society

Abstract

화질이 저하된 문서 이미지의 이진화는 문서 이미지 분석에 중대한 영향을 미친다. 본 논문에서는 다중 스케일 구조를 갖는 LadderNet을 이용하여 저하된 문서 이미지의 기능을 학습하고 노이즈 픽셀로부터 텍스트 및 배경 픽셀을 분류하는 방법을 제시한다. 본 논문에서는 적절히 수정된 형태의 두 가지 LadderNet 아키텍처를 고려한다. 하나는 더 깊은 네트워크 구조이고 다른 하나는 더 얕은 네트워크 구조이며, 각 구조는 문서 이미지 패치를 사용하여 독립적으로 학습된다. 더 작은 크기의 윈도우로 더 깊은 아키텍처에서 생성된 예측 출력에는 텍스트 획이 더 명확하지만 많은 노이즈가 존재한다. 반면에, 더 큰 크기의 윈도우를 갖는 더 얕은 아키텍처로부터는 배경에서 더 낮은 노이즈가 생성된다. 본 논문에서는 이 두 가지 네트워크의 출력을 결합하여 더 나은 결과를 생성한다. 문서 이미지 이진화를 위한 벤치 마크 DIBCO 데이터 세트를 이용한 실험결과, 기존 방법보다 우수한 성능을 보임이 확인되었다.

Keywords:
Artificial intelligence Scale (ratio) Computer science Image (mathematics) Fusion Computer vision Image fusion Pattern recognition (psychology) Cartography Geography

Metrics

1
Cited By
0.11
FWCI (Field Weighted Citation Impact)
0
Refs
0.46
Citation Normalized Percentile
Is in top 1%
Is in top 10%

Citation History

Topics

Image Processing and 3D Reconstruction
Physical Sciences →  Computer Science →  Computer Vision and Pattern Recognition

Related Documents

JOURNAL ARTICLE

Multi-scale Multi-attention Network for Moiré Document Image Binarization

Yanqing GuoCaijuan JiXin ZhengQianyu WangXiangyang Luo

Journal:   Signal Processing Image Communication Year: 2020 Vol: 90 Pages: 116046-116046
JOURNAL ARTICLE

Document image binarization using ”multi-scale” predefined filters

Raid Saabna

Journal:   Ninth International Conference on Graphic and Image Processing (ICGIP 2017) Year: 2018 Vol: 2 Pages: 190-190
JOURNAL ARTICLE

Binarization for Document Image Based on Multi-scale Conditional Random Fields

Kun LiuHuajiang LvYu ShouYI Shui-Cai

Journal:   Shuju fenxi yu zhishi faxian Year: 2009 Vol: 25 (4)Pages: 79-81
© 2026 ScienceGate Book Chapters — All rights reserved.