Diseño de una arquitectura para el procesamiento distribuido de grandes volúmenes de datos

Julio César Huanca Marín; Luz Delia Quina Quina; Claudio Bravo; Guido Bravo Mendoza

doi:10.47190/nric.v3i3.9

ScienceGate Book Chapters

JOURNAL ARTICLE

Diseño de una arquitectura para el procesamiento distribuido de grandes volúmenes de datos

Julio César Huanca Marín Luz Delia Quina Quina Claudio Bravo Guido Bravo Mendoza

Year: 2021 Journal: Ñawparisun - Revista de Investigación Científica Vol: 3 (Vol. 3, Num. 3)Pages: 73-77

DOI: 10.47190/nric.v3i3.9

Get Full-Text PDF Get Analytical Report

Abstract

Actualmente, Big Data se ha convertido en un concepto que está presente en muchas actividades, y su importancia es debido a que es utilizado en diversos aspectos que conduzcan a mejorar decisiones en el campo empresarial y gubernamental. Es posible analizar los grandes volúmenes de datos, tanto estructurados como no estructurados, que a cada día aumentan en los diferentes negocios y campos del conocimiento. Para obtener resultados satisfactorios es importante diseñar una arquitectura físicamente en base a Hardware Commodity (homogénea, heterogénea), escalable horizontalmente y con tolerancia a fallas. De esta manera, actualmente, con la evolución de las herramientas, es conveniente utilizar un híbrido donde la parte lógica trabaja con el Framework Apache Hadoop 2.0, que realiza el procesamiento de datos en paralelo (utilizando YARN), con almacenamiento HDFS (Sistema de Archivos Distribuidos sobre Hadoop) y agregando Spark para el tratamiento en memoria con respuestas en tiempo real y la utilización de recursos gráficos mediante Apache Ambari.

Keywords:

Humanities Art

Metrics

Cited By

0.00

FWCI (Field Weighted Citation Impact)

Refs

0.21

Citation Normalized Percentile

Is in top 1%

Is in top 10%

Topics

Big Data and Business Intelligence

Social Sciences → Business, Management and Accounting → Management Information Systems

Advanced Database Systems and Queries

Physical Sciences → Computer Science → Computer Networks and Communications

Cloud Computing and Resource Management

Physical Sciences → Computer Science → Information Systems

Diseño de una arquitectura para el procesamiento distribuido de grandes volúmenes de datos

Abstract

Metrics

Topics

Related Documents

Procesamiento de grandes volúmenes de datos con los modelos de programación MapReduce y DLML

Análisis comparativo de herramientas para explorar grandes volúmenes de datos: propuesta metodológica.

Detección de anomalías en grandes volúmenes de datos

Detección de anomalías en grandes volúmenes de datos

Detección de anomalías en grandes volúmenes de datos