Professional Documents
Culture Documents
Лабораторна робота 3
Лабораторна робота 3
ТЕОРЕТИЧНІ ВІДОМОСТІ
Завдання.
1. Постановка задачі кластеризації для всіх алгоритмів полягає в
наступному:
Хід роботи:
Задача підрахунку слів. Задачапідрахунку слів вирішується з
використанням технології MapReduce на локальному кластері Hadoop,
розгорнутому за допомогою Docker`a, як приклад моделі кластеризації. Мова
програмування Python.
ВстановленнякластеруHadoop, використовуючи Docker.
Архітектура базується на основі master-slave, де master-NameNode, slave-
DataNodes_N. В даному випадку необхідно створити конфігурацію 1 master 3
slave.
Копіювання локальнихmapper.py, reducer.pyв custom_hadoop_hdfs-
namenode_1
Контейнер custom_hadoop_hdfs-namenode_1
Вхідні дані:
mapper.py
#!/usr/bin/envpython
"""mapper.py"""
import sys
reducer.py
#!/usr/bin/env python
"""reducer.py"""
current_word = None
current_count = 0
word = None