Data Driven Priority Scheduling on Spark Based Stream Processing

Tobi Ajila; Shikaresh Majumdar

doi:10.1109/bdcat.2018.00034

ScienceGate Book Chapters

JOURNAL ARTICLE

Data Driven Priority Scheduling on Spark Based Stream Processing

Tobi Ajila Shikaresh Majumdar

Year: 2018

DOI: 10.1109/bdcat.2018.00034

Get Full-Text PDF Get Analytical Report

Abstract

This paper focuses on priority based processing of streaming data. One of the greatest challenges in big data analytics is responding to a bursty input load. The common solutions are to use dynamic resource provisioning techniques, however, these techniques may not respond quickly enough to the change in the load. Another option is to overprovision, but this results in wasted computing resources. This paper describes a technique that can be used in cases where resources are statically provisioned. This technique enables users to prioritize certain input data items so that in cases where the load suddenly increases, the high priority items are given precedence over low priority items. This technique is implemented on the Spark Streaming engine.

Keywords:

Provisioning Computer science Stream processing SPARK (programming language) Scheduling (production processes) Big data Distributed computing Analytics Real-time computing Resource (disambiguation) Computer network Database Operating system Engineering

Metrics

Cited By

1.34

FWCI (Field Weighted Citation Impact)

Refs

0.86

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Citation History

Topics

Cloud Computing and Resource Management

Physical Sciences → Computer Science → Information Systems

Data Stream Mining Techniques

Physical Sciences → Computer Science → Artificial Intelligence

Advanced Database Systems and Queries

Physical Sciences → Computer Science → Computer Networks and Communications

Data Driven Priority Scheduling on Spark Based Stream Processing

Abstract

Metrics

Citation History

Topics

Related Documents

A Data Driven Priority Scheduling technique for a Stream Processing Platform

Data Driven Priority Scheduling on a Spark Streaming System

Priority-Based Resource Scheduling in Distributed Stream Processing Systems for Big Data Applications

Priority-Based Scheduling Techniques for a Multitenant Stream Processing Platform

Data-Priority Aware Fair Task Scheduling for Stream Processing at the Edge