You are on page 1of 7

Báo cáo thực hành Hadoop

Nhóm 3:
Lab 3: wordcount

Put some files in HDFS


WordCount.java ‘s content
Run a job

Compile java files to .jar files


output WordCount.jar
Improve code
Kết quả chạy từ WordCout.jar

kết quả chạy từ WordCountImproved.jar

=> Có thể thấy sau khi cải tiến thành WordCountImproved thì từ better đã được đếm gộp lại thành 1 lần
mà không bị đếm thành nhiều lần do có các kí tự gây nhiễu nữa.

You might also like