Professional Documents
Culture Documents
1
1
UEx
Big Data Analysis_ Nhom 02
https://utexhcmute.edu.vnw/mod/quiz/reiew.php?attempt=3293515&cmid=812134 1/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
Câu hỏi 1
Đúng
a. Grunt
b. FS
c. HDFS
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 2/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
ˆ - 2
Câu hỏi
Đúng
Đạt điểm 0,25 trên 0,25
a. 32MB
b. 64MB v
c. 64KB
d. 128KB
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 3⁄41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
ˆ - 3
Câu hỏi
Sai
Đạt điểm 0,00 trên 0,25
Kết quả của một câu truy vấn Hive có thể được lưu trữ ở
d. Localfile và HDFSfile
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 4/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
Câu hỏi 4
Sai
a. Allofthementioned x
b. Tez
c. Mapreduce
d. Local
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 5/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
Câu hỏi Ö
Đúng
Đạt điểm 0,25 trên 0,25
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 6/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
Câu hỏi Õ
Đúng
Đạt điểm 0,25 trên 0,25
Trong Pig, nếu dữ liệu có ít phần tử .. phần tử lược đồ đã được xác định thì
c. Pigsẽthêm giá trị null vào cuối các cột bản ghi v
d. Pig sẽ cảnh báo cho người dùng trước khi báo lỗi
The correct answer is: Pig sẽ thêm giá trị null vào cuối các cột bản ghi
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 7/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
Câu hỏi 7
Đúng
d. Hive cần một cơ sở dữ liệu quan hệ như Oracle để thực thi các thao tác truy vấn
và lưu trữ dữ liệu. v
The correct answer is: Hive cần một cơ sở dữ liệu quan hệ như Oracle để thực thi
các thao tác truy vấn và lưu trữ dữ liệu.
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 8/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
ˆ - 8
Câu hỏi
Đúng
Đạt điểm 0,25 trên 0,25
a. WRITE
b. READ
c. LOAD v
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 9⁄41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
Câu hỏi 8
Đúng
Đạt điểm 0,25 trên 0,25
Để tối ưu hóa việc kết (join) 3 bảng, các bảng có kích thước lớn nhất nên được đặt
làm
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 10/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
Câu hỏi 10
Sai
cu
Pig là một tool/platform dùng để phân tích các tập dữ liệu lớn được biểu diễn dưới
dạng các luồng dữ liệu (data flows).
d. Pig không thể thực hiện tất cả thao tác xử lý dữ liệu trong Hadoop
Thecorrect answer is: Pig không thể thực hiện tất cả thao tác xử lý dữ liệu trong
Hadoop
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 11/41
4/4/23, 6:15PM
Câu hỏi 11
Đúng
Đạt điểm 0,25 trên 0,25
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134
12/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
Câu hỏi 12
Đúng
Một cơ sở dữ liệu chứa các bảng có thể bị hủy bỏ mà không cần hủy bỏ các bảng bằng
cách dùng từ khóa
a. CASCADE v7
b. OVERWRITE
F DROP
d.. RESTRICT
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 13⁄41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
Câu hỏi 13
Sai
TrongPigLatin,_— là một framework để thu thập số liệu thống kê ở mức tập lệnh
(script-level)
a. PStatistics %
b. PigStatistics
c. Tất cả đều đúng
d. PigStats
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 14/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
Câu hỏi 14
Đúng
Đạt điểm 0,25 trên 0,25
Điều nào sau đây không thể thực hiện trong Hive?
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 15/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
ˆ - 1 5
Câu hỏi
Đúng
Đạt điểm 0,25 trên 0,25
a. Các khóa trong MAP không thể là số nguyên nhưng trong STRUCT là có thể
b. Chỉ một cặp các kiểu dữ liệu được cho phép dưới dạng key - value trong MAP trong
khi các kiểu dữ liệu tổng hợp đượcchophép. 3V
trong STRUCT
c. MAP là một cặp key - value nhưng STRUCT là một chuỗi các value
d. Không thể có nhiều hơn một cột kiểu MAP trong một bảng nhưng có thể có nhiều cột
kiểu STRUCT trong bảng
Thecorrect answer is: Chỉ một cặp các kiểu dữ liệu được cho phép dưới dạng key -
value trong MAP trong khi các kiểu dữ liệu tổng hợp được
cho phép trong STRUCT
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 16/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
Câu hỏi 16
Đúng
Đạt điểm 0,25 trên 0,25
a. $Spig_ant pigunit-jar
b. $pigtr_ant pigunit-jar
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 17/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
Câu hỏi 17
Sai
Đạt điểm 0,00 trên 0,25
a. Tasktracker
b. Reducer
c. Combiner
d. Jobtracker x
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 18/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
Câu hỏi 18
Đúng
Đạt điểm 0,25 trên 0,25
Định dạng tập tin mặc định được Hive sử dụng để lưu trữ dữ liệu trong HDFS là gì?
a. CSV
b. Avro
c. ORC v
d. Parquet
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 19/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
Câu hỏi 19
Đúng
Đạt điểm 0,25 trên 0,25
a. PigLatin là một ngôn ngữ kịch bản tương tự như SQL, thu hút các nhà phát triển
phần mềm vốn quen với ngôn ngữ kịch bản và SQL
b. Pig chỉ có thể hỗ trợ code viết bằng ngôn ngữ Java v
c. Pig cho phép các Data Worker viết các chương trình chuyển đổi dữ liệu phức tạp
mà không cần biết Java
d. Pig đã hoàn thiện vì vậy có thể thực hiện tất cả các thao tác dữ liệu cần thiết
trong Apache Hadoop với Pig
Thecorrect answer is: Pig chỉ có thể hỗ trợ code viết bằng ngôn ngữ Java
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 20/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
Câu hỏi 20
Đúng
Hive không cho phép các cập nhật ở mức dòng dữ liệu bá
The correct answer is: Hive không cho phép các cập nhật ở mức dòng dữ liệu
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 21/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
Câu hỏi 21
Sai
Định dạng tập tin nào sau đây không được hỗ trợ để lưu trữ dữ liệu trong Hive?
a. JSON x
b. CSV
c. XML
d. YAML
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 22/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
Câu hỏi 22
Đúng
Đạt điểm 0,25 trên 0,25
b. Định dạng tập tin để lưu trữ siêu dữ liệu trong Hive
d. Một thành phần lưu trữ siêu dữ liệu cho các bảng và phân vùng Hive v
Thecorrect answer is: Một thành phần lưu trữ siêu dữ liệu cho các bảng và phân vùng
Hive
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 23/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
Câu hỏi 23
Đúng
Ngôn ngữ kịch bản luồng dữ liệu nào dùng để phân tích dữ liệu phi cấu trúc?
a. Pig v
b. Mahoot
c. Hive
d. Hbase
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 24/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
Câu hỏi 24
Sai
d. Nhằm mục đích tăng hiệu suất của các truy vấn x
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 25/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
ˆ - 25
Câu hỏi
Đúng
Đạt điểm 0,25 trên 0,25
Hiển thị kế hoạch truy vấn cho các câu truy vấn Hive v
Thecorrect answer is: Hiển thị kế hoạch truy vấn cho các câu truy vấn Hive
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 26/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
Câu hỏi 26
Đúng
Đạt điểm 0,25 trên 0,25
a. bag v
b.. map
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 27/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
Câu hỏi 27
Sai
Đạt điểm 0,00 trên 0,25
a. Memstore
b. Block Cache x
c. HFile
d. WAL
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 28/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
Câu hỏi 28
Đúng
Đạt điểm 0,25 trên 0,25
Thuộc tính được đặt để chạy hive ở chế độ cục bộ mà không tạo tác vụ mapreduce là
a. hive.exec.mode.local.settings
b. hive.exec.mode.local.auto v
c. hiveexec.mode.local.config
d. hive.exec.mode.local.override
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 29/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
Câu hỏi 29
Đúng
Đạt điểm 0,25 trên 0,25
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 30/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
Câu hỏi 30
Sai
Đạt điểm 0,00 trên 0,25
a. Biểu diễn dưới dạng vật lý nhưng không thể truy cập
b. Biểu diễn dưới dạng vật lý và có thể truy cập x
c. Không biểu diễn dưới dạng vật lý và không thể truy cập
d. Không biểu diễn dưới dạng vật lý nhưng có thể truy cập
Thecorrect answer is: Không biểu diễn dưới dạng vật lý nhưng có thể truy cập
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 31/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
Câu hỏi 31
Đúng
Tập tin nào kiểm soát việc ghi nhật ký các tác vụ Mapreduce?
Cu
hive-exec-log4j.properties v
hive-dli-log4j.properties
hive-log4j.properties
d. hive-create-log4j.properties
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 32/41
4/4/23, 6:15PM
Câu hỏi 32
Đúng
ơ
2> ơi 1o N8
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 33⁄41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
Câu hỏi 33
Đúng
Đạt điểm 0,25 trên 0,25
Ưu điểm chính của việc tạo ra các bảng phân hoạch trong Hive là
The correct answer is: Hiệu suất truy vấn nhanh hơn
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 34/41
4/4/23, 6:15PM
Câu hỏi 34
Đúng
Đạt điểm 0,25 trên 0,25
The correct answer is: Hiệu suất truy vấn nhanh hơn
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134
35/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
Câu hỏi 35
Đúng
Đạt điểm 0,25 trên 0,25
Toán tử nào sau đây được dùng để xem kế hoạch thực thi map reduce?
a. DESCRIBE
b. STORE
c. EXPLAIN v
d. DUMP
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 36/41
4/A/23, 6:15 PM
Câu hỏi 36
Đúng
Đạt điểm 0,25 trên 0,25
Tập tin nào kiểm soát việc ghi nhật ký các tác vụ MapReduce?
a. hive-exec-log4j.properties
b. hive-create-log4j.properties
c. hive-log4j.properties
d. hive-cli-dlog4j.properties
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134
37/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
Câu hỏi 37
Đúng
Đạt điểm 0,25 trên 0,25
Dấu phân cách mặc định trong Hive để phân tách phần tử trong STRUCT là
a. Noo3
b. §\Noo4
c. Aoo2 v
d. A00T'
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 38/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
Câu hỏi 38
Sai
Đạt điểm 0,00 trên 0,25
Toán tử _ được sử dụng để xem quá trình thực hiện từng bước một chuỗi các câu lệnh
a. STORE
b. EXPLAIN %
c ILLUSTRATE
d. DESCRIBE
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 39/41
4/4/23, 6:15PM
Câu hỏi 39
Đúng
Đạt điểm 0,25 trên 0,25
Các bảng được tạo ra trong Hive được lưu trữ dưới dạng
The correct answer is: Một thư mục con trong thư mục CSDL
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134
40/41
4/4/23, 6:15PM Kiểm tra giữa kỳ lần 1: Xem lại lằn làm thử
Câu hỏi 40
Đúng
Đạt điểm 0,25 trên 0,25
Phép toán nào sau đầy không được hỗ trợ trong Hive?
Chuyển tới...
https://utex.hcmute.edu.vn/mod/quiz/review.php?attempt=3293515&cmid=812134 41/41