You are on page 1of 2

DỮ LIỆU LỚN

CÂU HỞI ÔN TẬP


CHƯƠNG 1- TỔNG QUAN VỀ DỮ LIỆU LỚN
1. Những yếu tố nào tạo nên kỷ nguyên dữ liệu lớn?
2. Kể tên một số ứng dụng của dữ liệu lớn?
3. Dữ liệu được sinh ra từ nguồn nào?
4. Kể tên 6 đặc điểm của dữ liệu lớn? Giải thích rõ từng đặc điểm?
5. Khoa học dữ liệu và DDL có quan hệ như thế nào?
6. Quy trình phân tích dữ liệu bao gồm những bước nào?
7. Hệ thống tệp phân tán là gì?
8. MapReduce là gì?
9. Hệ thống Hadoop có những thành phần nào?

CHƯƠNG 2- QUẢN LÝ VÀ MÔ HÌNH HÓA DỮ LIỆU LỚN


10.Mô hình dữ liệu là gì?
11.Cấu trúc dữ liệu là gì?
12.Phân biệt 4 loại thao tác trên dữ liệu?
13.Các loại ràng buộc và ích lợi của chúng là gì?
14.Có những loại mô hình dữ liệu nào? Phân biệt cách thức tổ chức dữ liệu của
mỗi mô hình dữ liệu?
15.Dữ liệu luồng (Streaming Data) là gì?
16.Nêu các đặc điểm của một hệ thống xử lý dữ liệu luồng?
17.Kể tên một số hệ thống xử lý dữ liệu luồng?
18.Hãy nêu sự khác nhau giữa Xử lý dữ liệu luồng (Streaming Data Processing)
với Xử lý dữ liệu bó (Batch Data Processing)?
19.Hãy phân biệt sự thay đổi có định kì (periodic) và sự thay đổi không định kì
(sporadic) của dữ liệu luồng?
20.Hãy trình bày sự khác nhau giữa hệ thống tệp phân tán (distributed file
system) với hệ thống tệp song song (parallel file system)?
21.“MapReduce-style DBMS” là gì?
22.Hãy nêu những đặc điểm của hệ thống quản lý dữ liệu lớn?
23.Giải thích sự khác nhau giữa ACID và BASE?
24.Định lý CAP là gì?
CHƯƠNG 3 – TÍCH HỢP DỮ LIỆU LỚN

25.Tích hợp dữ liệu là gì?


26.Trong ngữ cảnh dữ liệu lớn, tích hợp dữ liệu gặp các các vấn gì?

CHƯƠNG 4 – PHÂN TÍCH DỮ LIỆU ĐỒ THỊ LỚN


27.Mô tả cấu trúc dữ liệu lưu trữ thông tin của đồ thị và các thao tác thực hiện
được trên đồ thị?
28.Phân tích dữ liệu là gì? Mục đích của phân tích dữ liệu là gì? Phân tích đồ
thị là gì?
29.Mô hình dữ liệu đồ thị mở rộng bao gồm những thành phần nào?
30.Nêu một số khái niệm cơ bản trên đồ thị: Trọng số (weights) trong đồ thị là
gì? “Loop” trên đồ thị là gì? Đồ thị đa cạnh là gì? Một bước đi (Walk) trên
đồ thị là gì? Đường đi (Path) là gì? Chu trình (Cycle) trên đồ thị là gì?
“Acyclic graph” là đồ thị gì? Trail là gì? Reachability là gì?Diameter là gì?
31. Với đồ thị lớn, thuật toán Dijkstra có tốt không? Vì sao?
32.Đồ thị liên thông là gì? Liên thông mạnh và liên thông yếu là gì?
33.Nêu tên các bài toán đồ trên đồ thị liên thông?
34.Một mạng như thế nào được gọi là mạnh (Network Robustness)?
35.Có những cách nào để đánh giá một mạng là mạnh?
36.Cụm đồ thị là gì?
37.Có những bài toán phân tích cụm đồ thị nào?
38.Tìm cụm đồ thị như thế nào?
39.Ý tưởng chung của mô hình lập trình song song BSP là gì?
40.Một chương trình BSP được thực hiện như thế nào?
41.Mô tả lại các bước thực hiện thuật toán Tìm đường đi ngắn nhất theo mô
hình lập trình BSP?

You might also like