Multi-Granularity and Multi-Modal Feature Fusion for Indoor Positioning

Lijuan Ye; Yifan Wang; Shenglei Pei; Yu Wang; Hong Zhao; Shi Dong

doi:10.3390/sym17040597

ScienceGate Book Chapters

JOURNAL ARTICLE

Multi-Granularity and Multi-Modal Feature Fusion for Indoor Positioning

Lijuan Ye Yifan Wang Shenglei Pei Yu Wang Hong Zhao Shi Dong

Year: 2025 Journal: Symmetry Vol: 17 (4)Pages: 597-597 Publisher: Multidisciplinary Digital Publishing Institute

DOI: 10.3390/sym17040597

Get Full-Text PDF Get Analytical Report

Abstract

Despite the widespread adoption of indoor positioning technology, the existing solutions still face significant challenges. On one hand, Wi-Fi-based positioning struggles to balance accuracy and efficiency in complex indoor environments and architectural layouts formed by pre-existing access points (APs). On the other hand, vision-based methods, while offering high-precision potential, are hindered by prohibitive costs associated with binocular camera systems required for depth image acquisition, limiting their large-scale deployment. Additionally, channel state information (CSI), containing multi-subcarrier data, maintains amplitude symmetry in ideal free-space conditions but becomes susceptible to periodic positioning errors in real environments due to multipath interference. Meanwhile, image-based positioning often suffers from spatial ambiguity in texture-repeated areas. To address these challenges, we propose a novel hybrid indoor positioning method that integrates multi-granularity and multi-modal features. By fusing CSI data with visual information, the system leverages spatial consistency constraints from images to mitigate CSI error fluctuations while utilizing CSI’s global stability to correct local ambiguities in image-based positioning. In the initial coarse-grained positioning phase, a neural network model is trained using image data to roughly localize indoor scenes. This model adeptly captures the geometric relationships within images, providing a foundation for more precise localization in subsequent stages. In the fine-grained positioning stage, CSI features from Wi-Fi signals and Scale-Invariant Feature Transform (SIFT) features from image data are fused, creating a rich feature fusion fingerprint library that enables high-precision positioning. The experimental results show that our proposed method synergistically combines the strengths of Wi-Fi fingerprints and visual positioning, resulting in a substantial enhancement in positioning accuracy. Specifically, our approach achieves an accuracy of 0.4 m for 45% of positioning points and 0.8 m for 67% of points. Overall, this approach charts a promising path forward for advancing indoor positioning technology.

Keywords:

Granularity Modal Computer science Feature (linguistics) Fusion Artificial intelligence Pattern recognition (psychology) Data mining Materials science

Metrics

Cited By

0.00

FWCI (Field Weighted Citation Impact)

Refs

0.09

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Topics

Indoor and Outdoor Localization Technologies

Physical Sciences → Engineering → Electrical and Electronic Engineering

Robotics and Sensor-Based Localization

Physical Sciences → Engineering → Aerospace Engineering

Video Surveillance and Tracking Methods

Physical Sciences → Computer Science → Computer Vision and Pattern Recognition

Multi-Granularity and Multi-Modal Feature Fusion for Indoor Positioning

Abstract

Metrics

Topics

Related Documents

Heterogeneous Feature Fusion Approach for Multi-Modal Indoor Localization

Discriminative Multi-modal Feature Fusion for RGBD Indoor Scene Recognition

MMFF-DDI:An Efficient Multi-Modal Multi-Granularity Feature Fusion Framework for Drug-Drug Interaction Prediction

Smartphone-Based 3D Indoor Pedestrian Positioning through Multi-Modal Data Fusion

Multi-Granularity Feature Fusion for Person Re-Identification