Professional Documents
Culture Documents
HADOOP
Switch
Rack
Servidores Clúster
(o nodos del clúster)
COMPONENTES DE HADOOP
HDFS YARN
[YARN + MAPREDUCE] Motor de
procesamiento
Almacena los datos en el clúster Gestiona los recursos del clúster
COMPONENTES
YARN Architecture
https://blog.cloudera.com/apache-hadoop-yarn-concepts-and-applications/
COMPONENTES
MapReduce Architecture
https://www.educba.com/how-mapreduce-work/
UN CLÚSTER
HADOOP
Por lo general un clúster Hadoop está conformado por al menos un nodo llamado “master” y
tres o más nodos llamados “esclavos”. El nodo “master” es el que recibe peticiones de
almacenamiento o procesamiento desde algún cliente y delega el trabajo a los nodos “slave”.
En Hadoop los módulos que se encargan del procesamiento de archivos son YARN (Yet Another
Resource Negotiator) y MapReduce. El módulo de YARN verifica los nodos “slave” que están
libres y los selecciona para el procesamiento. El módulo MapReduce ejecuta el procesamiento.
El cliente envía el
programa que quiere
El “master” por medio de
ejecutar
YARN busca qué nodos
no están ejecutando
nada y separa recursos
(memoria RAM y CPUs).
Los “slave” ejecutan el programa en
paralelo por medio de MapReduce
VENTAJAS DE HADOOP