Optimizing Cross-Lingual Information Retrieval in Campus Administration using Retrieval-Augmented Generation and Semantic Chunking

Harsh Singh; Garvaansh Gupta

doi:10.22214/ijraset.2026.76860

ScienceGate Book Chapters

JOURNAL ARTICLE

Optimizing Cross-Lingual Information Retrieval in Campus Administration using Retrieval-Augmented Generation and Semantic Chunking

Harsh Singh Garvaansh Gupta

Year: 2026 Journal: International Journal for Research in Applied Science and Engineering Technology Vol: 14 (1)Pages: 447-455 Publisher: International Journal for Research in Applied Science and Engineering Technology (IJRASET)

DOI: 10.22214/ijraset.2026.76860

Get Full-Text PDF Get Analytical Report

Abstract

Digital transformation in Indian higher-education institutions is constrained not by the absence of information, but by the difficulty of accessing it across linguistic and structural boundaries. Administrative data such as admission rules, fee structures, examination schedules, and scholarship policies are published primarily in English and distributed across heterogeneous document formats, while students interact using Hindi, regional languages, and mixed Romanized scripts such as Hinglish. This paper presents an optimized Retrieval-Augmented Generation (RAG) architecture designed as a campus-scale natural language information system rather than a simple chatbot. The proposed framework integrates multilingual semantic embeddings, vector-based document retrieval, conversational state management, and grounded response generation into a unified, auditable architecture. A hybrid two-tier backend separates high-frequency user interaction from computationally intensive retrieval and inference, enabling scalable deployment across multiple institutions. Experimental evaluation demonstrates that the architectural design achieves high retrieval accuracy and low latency while preserving factual reliability, making it suitable for real-world administrative decision support in multilingual academic environments

Keywords:

Scalability Scripting language Document retrieval Software deployment Chunking (psychology) Latency (audio) Natural language Architecture

Metrics

Cited By

0.00

FWCI (Field Weighted Citation Impact)

Refs

0.70

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Topics

AI in Service Interactions

Physical Sciences → Computer Science → Artificial Intelligence

Topic Modeling

Physical Sciences → Computer Science → Artificial Intelligence

Information Retrieval and Search Behavior

Physical Sciences → Computer Science → Information Systems

Optimizing Cross-Lingual Information Retrieval in Campus Administration using Retrieval-Augmented Generation and Semantic Chunking

Abstract

Metrics

Topics

Related Documents

Semantic Cross-lingual Information Retrieval

XRAG: Cross-lingual Retrieval-Augmented Generation

Cross-lingual Information Retrieval

Cross-Lingual Information Retrieval

Cross-Lingual Information Retrieval