You are on page 1of 1

Họ và tên: Nguyễn Quốc Lưu

MSSV: 19521816

So sánh xây dựng ứng dụng dữ liệu dựa trên RDBMS & Spark

RDBMS (Relational Database Management System) và Spark là hai công nghệ


khác nhau để xây dựng ứng dụng dữ liệu. Dưới đây là một số so sánh giữa hai công
nghệ này:

- Cấu trúc dữ liệu: RDBMS sử dụng mô hình dữ liệu bảng để lưu trữ dữ liệu,
trong khi đó, Spark sử dụng RDD (Resilient Distributed Datasets) để lưu trữ
dữ liệu. RDD là một cấu trúc dữ liệu bất biến, phân tán và được tính toán
song song trên nhiều node.
- Tính khả dụng và xử lý: Spark là một công nghệ tính toán phân tán và có
khả năng xử lý dữ liệu lớn. Nó có thể xử lý các tập dữ liệu lớn hơn và nhanh
hơn so với RDBMS. RDBMS phù hợp với các ứng dụng có quy mô nhỏ hơn
và không cần xử lý dữ liệu lớn.
- Tính linh hoạt: RDBMS thường có khả năng thực hiện các truy vấn phức tạp
hơn so với Spark. Tuy nhiên, Spark có thể được sử dụng để xử lý các tác vụ
tính toán phức tạp hơn, chẳng hạn như machine learning và xử lý dữ liệu tập
trung.
- Tính toán thời gian thực: RDBMS có thể cung cấp kết quả truy vấn ngay lập
tức, còn Spark thường có thời gian trễ khi xử lý các tác vụ tính toán phức
tạp.
- Tính khả chuyển đổi: RDBMS được sử dụng rộng rãi trong các ứng dụng
công nghệ thông tin do tính khả chuyển đổi cao. Spark thường được sử dụng
trong các ứng dụng Big Data hoặc các hệ thống tính toán phân tán.

Tóm lại, việc sử dụng RDBMS hay Spark phụ thuộc vào yêu cầu của ứng dụng cụ
thể. Nếu bạn cần xử lý các tập dữ liệu lớn và có tính phân tán cao, thì Spark là một
lựa chọn tốt. Tuy nhiên, nếu bạn chỉ cần xử lý các tập dữ liệu nhỏ hơn và không
cần tính toán phân tán, RDBMS có thể là lựa chọn tốt hơn.

You might also like