Quark: An Integer RISC-V Vector Processor for Sub-Byte Quantized DNN Inference

MohammadHossein AskariHemmat; Théo Dupuis; Yoan Fournier; Nizar El Zarif; Matheus Cavalcante; Matteo Perotti; Frank K. Gürkaynak; Luca Benini; François Leduc-Primeau; Yvon Savaria; Jean‐Pierre David

doi:10.1109/iscas46773.2023.10181985

JOURNAL ARTICLE

Quark: An Integer RISC-V Vector Processor for Sub-Byte Quantized DNN Inference

MohammadHossein AskariHemmat Théo Dupuis Yoan Fournier Nizar El Zarif Matheus Cavalcante Matteo Perotti Frank K. Gürkaynak Luca Benini François Leduc-Primeau Yvon Savaria Jean‐Pierre David

Year: 2023 Pages: 1-5

DOI: 10.1109/iscas46773.2023.10181985

Get Full-Text PDF Get Analytical Report

Abstract

In this paper, we present Quark, an integer RISC-V vector processor specifically tailored for sub-byte DNN inference. Quark is implemented in GlobalFoundries' 22FDX FD-SOI technology. It is designed on top of Ara, an open-source 64-bit RISC-V vector processor. To accommodate sub-byte DNN inference, Quark extends Ara by adding specialized vector instructions to perform sub-byte quantized operations. We also remove the floating-point unit from Quarks' lanes and use the CVA6 RISC-V scalar core for the re-scaling operations that are required in quantized neural network inference. This makes each lane of Quark 2 times smaller and 1.9 times more power efficient compared to the ones of Ara. In this paper we show that Quark can run quantized models at sub-byte precision. Notably we show that for 1-bit and 2-bit quantized models, Quark can accelerate computation of Conv2d over various ranges of inputs and kernel sizes.

Keywords:

Byte Computer science Parallel computing Floating point Inference Multi-core processor Algorithm Artificial intelligence Computer hardware

Metrics

Cited By

2.00

FWCI (Field Weighted Citation Impact)

Refs

0.84

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Citation History

Topics

Advanced Neural Network Applications

Physical Sciences → Computer Science → Computer Vision and Pattern Recognition

Parallel Computing and Optimization Techniques

Physical Sciences → Computer Science → Hardware and Architecture

Domain Adaptation and Few-Shot Learning

Physical Sciences → Computer Science → Artificial Intelligence

Quark: An Integer RISC-V Vector Processor for Sub-Byte Quantized DNN Inference

Abstract

Metrics

Citation History

Topics

Related Documents

Sparq: A Custom RISC-V Vector Processor for Efficient Sub-Byte Quantized Inference

SPEED: A Scalable RISC-V Vector Processor Enabling Efficient Multiprecision DNN Inference

RISC-V²: A Scalable RISC-V Vector Processor

RISC-HD: Lightweight RISC-V Processor for Efficient Hyperdimensional Computing Inference

RISCSparse: Point Cloud Inference Engine on RISC-V Processor

Quark: An Integer RISC-V Vector Processor for Sub-Byte Quantized DNN Inference

Abstract

Metrics

Citation History

Topics

Related Documents

Sparq: A Custom RISC-V Vector Processor for Efficient Sub-Byte Quantized Inference

SPEED: A Scalable RISC-V Vector Processor Enabling Efficient Multiprecision DNN Inference

RISC-V2: A Scalable RISC-V Vector Processor

RISC-HD: Lightweight RISC-V Processor for Efficient Hyperdimensional Computing Inference

RISCSparse: Point Cloud Inference Engine on RISC-V Processor

RISC-V²: A Scalable RISC-V Vector Processor