Professional Documents
Culture Documents
1. Chuẩn bị
1.1 Đã cài đặt Hadoop tại thư mục C:\hadoop\hadoop-2.6.0
1.2 Khởi động các tiến trình của Hadoop
Chạy file start-all.cmd voi quyền Administrator để khởi động các tiến trình của Hadoop.
C:\hadoop\hadoop-2.6.0> sbin\start-all.cmd
Biến $USER trả về tên tài khoản đăng nhập hiện hành.
Tạo một thư mục mới input trong thư mục gốc của hadoop
c:\hadoop\hadoop-2.6.0> hdfs dfs -mkdir /input
Tạo mới một file. Chú ý thay XYZ bằng tên NSD
c:\hadoop\hadoop-2.6.0> echo "em con nho hay em da quen" > fileXYZ.txt
Xem nội dung file fileXYZ.txt vừa chép trong thư mục hadoop
c:\hadoop\hadoop-2.6.0> hadoop fs -cat /fileXYZ.txt
Show report on the overall HDFS file system. This command very useful for how much
disk is available , Name node information, how many Data Nodes are running and
corrupted blocks are in a cluster.
c:\hadoop\hadoop-2.6.0> hadoop dfsadmin -report
// Xóa thư mục output nếu đã có để tránh lỗi trùng thư mục chạy chương trình
Mapreduce
C:\hadoop\hadoop-2.6.0> hdfs dfs -rm -r /outputXYZ
Xem kết quả thực hiện các lệnh trên Web của hadoop
Mở trình duyệt, gõ http://127.0.0.1:50070
----------------------------------------------------------