You are on page 1of 14

HƯỚNG DẪN CÀI ĐẶT VÀ CẤU HÌNH HADOOP

TRÊN HỆ ĐIỀU HÀNH WINDOWS

1. Chuẩn bị
 Tải và giải nén file hadoop-2.6.0.rar vào thư mục C:\hadoop như sau:
C:\hadoop\hadoop-2.6.0

 Cài đặt jdk-8u211-windows-x64.exe. Thư mục cài đặt mặc định: C:\
Program Files\Java\jdk1.8.0_211

2. Cài đặt và cấu hình Hadoop trên hệ điều hành Windows


2.1 Thiết lập biến môi trường
 Trên cửa sổ Exlorer, chọn Computer, nháy nút phải chuột, chọn Properties

 Chọn nút New, thiết lập các biến môi trường như sau:
HADOOP_HOME C:\hadoop\hadoop-2.6.0
JAVA_HOME C:\Program Files\Java\jdk1.8.0_211

 Thêm các biến môi trường vào PATH


Trong cửa sổ System Variables, chọn mục Path => Chọn nút Edit
Chọn nút New, thêm các biến như sau:
%JAVA_HOME%\bin
%HADOOP_HOME%
%HADOOP_HOME%\bin
%HADOOP_HOME%\sbin
Đến đây đã xong bước cài đặt hadoop trên Windows.
2.2 Định dạng hệ thống tập tin HDFS
Mở cửa sổ lệnh dưới quyền Administrator.

 Chuyển vào thư mục C:\hadoop\hadoop-2.6.0


cd C:\hadoop\hadoop-2.6.0

 Xóa thư mục data trong C:\hadoop\hadoop-2.6.0\data nếu có.


 Thiết lập biến môi trường cho Hadoop
C:\hadoop\hadoop-2.6.0> etc\hadoop\hadoop-env.cmd

 Định dạnh hệ thống file Hadoop (Chỉ thực hiện 1 lần)


C:\hadoop\hadoop-2.6.0> bin\hdfs namenode -format
2.3 Khởi động các tiến trình của Hadoop
Chạy file start-all.cmd voi quyền Administrator để khởi động các tiến trình của
Hadoop.
C:\hadoop\hadoop-2.6.0> sbin\start-all.cmd

Xuất hiện 4 cửa sổ các tiến trình hadoop:


Chú ý: Các thông tin trên cửa sổ xuất hiện liên tục. Nếu xuất hiện dấu nhắc lệnh
trong bất kỳ cửa sổ nào thì phải kiểm tra lại trước khi thao tác trên Hadoop.
Thu nhỏ các cửa sổ của tiến trình Hadoop để thực hiện các lệnh thao tác tiếp sau.

3. XEM THÔNG TIN HỆ THỐNG HADOOP TRÊN WEB


3.1 Giao diện Web quản lý dịch vụ NameNode
Mở trình duyệt, gõ http://127.0.0.1:50070 để xem thông tin tổng quan về hadoop
trên cửa sổ Namenode.
Xem nội dung Summary

Xem thông tin về DataNode


Xem thông tin Startup Progress
Xem thông tin Utilities: Hiển thị danh sách các tập tin người dùng trên Hadoop

3.2 Giao diện Web quản lý trạng thái tài nguyên của hệ thống
http://127.0.0.1:50090

3.3 Giao diện Web quản lý trạng thái của hệ thống


Mở trình duyệt, gõ http://127.0.0.1:8088 để xem các job mapreduce đang chạy ở
đây
4. XEM THÔNG TIN HỆ THỐNG TẬP TIN Hadoop
Mở cửa sổ lệnh dưới quyền Administrator.
Chuyển đến thư mục hiện hành c:\hadoop\hadoop-2.6.0

 Xem tên máy đang chạy NameNode


c:\hadoop\hadoop-2.6.0> hostname

 Xem địa chỉ IP của máy đang chạy NameNode


c:\hadoop\hadoop-2.6.0> ipconfig

 Xem phiên bản Java đang sử dụng


c:\hadoop\hadoop-2.6.0> java –version

 Xem khai báo các biến môi trường:


c:\hadoop\hadoop-2.6.0> path
c:\hadoop\hadoop-2.6.0> echo %HADOOP_HOME%
c:\hadoop\hadoop-2.6.0> dir %HADOOP_HOME%\data
12/07/2019 07:57 AM <DIR> .
12/07/2019 07:57 AM <DIR> ..
12/07/2019 07:57 AM <DIR> datanode
12/07/2019 07:57 AM <DIR> namenode
0 File(s) 0 bytes
4 Dir(s) 10,810,109,952 bytes free
 Xem tài khoản đang sử dụng
c:\hadoop\hadoop-2.6.0> echo %USERNAME%

Biến $USER trả về tên tài khoản đăng nhập hiện hành.

 Xem các tiến trình hệ thống hadoop trên máy NameNode


c:\hadoop\hadoop-2.6.0> jps
4858 ResourceManager
4347 NameNode
4981 NodeManager
5294 Jps
4474 DataNode
4687 SecondaryNameNode
c:\hadoop\hadoop-2.6.0>

You might also like