You are on page 1of 33

CƠ SỞ DỮ LIỆU

BÀI 2 – MÔ HÌNH DỮ LIỆU


MÔ HÌNH DỮ LIỆU 2

1. Mô hình hóa dữ liệu và tầm quan trọng của mô hình hóa dữ liệu
2. Thành phần cơ bản trong mô hình dữ liệu
3. Quy tắc nghiệp vụ
4. Sự phát triển của mô hình dữ liệu
5. Các mô hình dữ liệu thay thế mới nổi
6. Phân loại mô hình dữ liệu
1. MÔ HÌNH HÓA DỮ LIỆU VÀ TẦM QUAN TRỌNG CỦA MÔ HÌNH DỮ LIỆU 3

 Mô hình - Model
 Sự trừu tượng hóa đối tượng hay sự vật của thế giới thực
 Mô hình dữ liệu – Data Model
 Sự biểu diễn đơn giản cho cấu trúc dữ liệu phức tạp của thế giới thực
 Thường bằng đồ họa
 Mô hình hóa dữ liệu – Data Modeling
 Quá trình tạo một mô hình dữ liệu để lưu trữ trong CSDL
1. MÔ HÌNH HÓA DỮ LIỆU VÀ TẦM QUAN TRỌNG CỦA MÔ HÌNH DỮ LIỆU 4
1. MÔ HÌNH HÓA DỮ LIỆU VÀ TẦM QUAN TRỌNG CỦA MÔ HÌNH DỮ LIỆU 5

 Tầm quan trọng của mô hình


MÔN HỌC

dữ liệu 1
# Mã môn
GIÁO VIÊN

# Mã gv
Tên môn 1
Họ tên
 Là một công cụ giao tiếp Đơn vị
@ Mã gv
n Địa chỉ
KẾT QUẢ
Điện thoại
 Cung cấp một cái nhìn tổng thể về # @ Mã sv
n
Email
# @ Mã môn SINH VIÊN Bằng cấp
cơ sở dữ liệu Điểm
n
1
# Mã sv
1

 Sắp xếp dữ liệu cho nhiều người


@ Mã lớp n
Họ tên LỚP
Địa chỉ 1
@ Mã SV
dùng khác nhau Điện thoại # Mã lớp
Email 1
Tên lớp
 Là một sự trừu tượng để tạo ra cơ Họ tên PH
Liên hệ
sở dữ liệu tốt
2. THÀNH PHẦN CƠ BẢN TRONG MÔ HÌNH DỮ LIỆU 6

 Thực thể - Entity: Đối tượng duy nhất và


khác biệt được sử dụng để thu thập và 1
MÔN HỌC
GIÁO VIÊN
# Mã môn
lưu trữ dữ liệu Tên môn 1 # Mã gv
Họ tên
Đơn vị n
 Thuộc tính - Attribute: đặc điểm, tính chất của KẾT QUẢ @ Mã gv
Địa chỉ
Điện thoại
n
một thực thể # @ Mã sv Email
# @ Mã môn n SINH VIÊN Bằng cấp
 Quan hệ - Relationship: mô tả một liên Điểm 1
# Mã sv
1

kết giữa các đối tượng @ Mã lớp


Họ tên
n LỚP
1
 Quan hệ 1 – Nhiều (One-to-Many) 1:M Địa chỉ
Điện thoại
@ Mã SV
1 # Mã lớp
 Quan hệ Nhiều – Nhiều (Many-to-Many) M:N Email Tên lớp
Họ tên PH
hoặc M:M Liên hệ

 Quan hệ 1 – 1 (One-to-One) 1:1


 Ràng buộc – Constraint: Bộ quy tắc để
đảm bảo tính toàn vẹn của dữ liệu
3. QUY TẮC NGHIỆP VỤ 7

 Mô tả ngắn gọn, chính xác và rõ ràng về chính sách, quy tắc của DN
 Phi công không thể làm 10/24 tiếng;
 SV không được đăng ký hơn 20 tín chỉ 1 kỳ
 Cho phép xác định các thực thể, thuộc tính, mối quan hệ và ràng buộc
 Một khách hàng có thể có nhiều hóa đơn
 Một hóa đơn chỉ thuộc về 1 khách hàng
 Một khóa đào tạo không thể được tổ chức nếu có ít hơn 20 SV

 Mô tả các đặc điểm chính và phân biệt của dữ liệu


 Sinh viên gồm: họ tên, ngày sinh và ma sinh viên xác đinh duy nhất 1 sinh viên
3. QUY TẮC NGHIỆP VỤ 8

 Các quy tắc nghiệp vụ được xem xét dựa trên:


 Người quản lý công ty
 Người hoạch đinh chính sách
 Trưởng các phòng ban
 Tài liệu văn bản: Quy đinh, Các tiêu chuẩn, Hướng dẫn hoạt động
 Phỏng vấn trực tiếp người dùng cuối
3. QUY TẮC NGHIỆP VỤ 9

 Lý do xác định và lập hồ sơ các quy tắc nghiệp vụ


 Giúp chuẩn hóa chế độ xem dữ liệu của công ty
 Công cụ giao tiếp giữa người dùng và nhà thiết kế
 Cho phép nhà thiết kế:
 Hiểu bản chất, vai trò, phạm vi dữ liệu và quy trình nghiệp vụ
 Xây dựng các mối quan hệ với các quy tắc, ràng buộc phù hợp
 Tạo mô hình dữ liệu chính xác
3. QUY TẮC NGHIỆP VỤ 10

 Cách chuyển quy tắc nghiệp vụ -> Mô hình dữ liệu


 Danh từ -> thực thể
 Động từ -> mối quan hệ giữa các thực thể
 Mối quan hệ là hai chiều
 Các câu hỏi để xác định kiểu quan hệ
 Có bao nhiêu trường hợp của B có liên quan đến một trường hợp của A?
 Có bao nhiêu trường hợp của A có liên quan đến một trường hợp của B?
 Ví dụ: xác định kiểu quan hệ giữa SINH VIÊN và LỚP HỌC
 Có bao nhiêu sinh viên có thể tham gia vào 1 lớp học? -> Trả lời: Nhiều sinh viên
 Có bao nhiêu lớp học mà 1 sinh viên có thể tham gia? -> Trả lời: Nhiều lớp học
 Do đó, có mối quan hệ nhiều – nhiều giữa LỚP HỌC và SINH VIÊN
3. QUY TẮC NGHIỆP VỤ 11

 Quy ước đặt tên trong Mô hình dữ liệu


 Tên thực thể - Bắt buộc
 Mô tả các đối tượng trong môi trường doanh nghiệp
 Sử dụng thuật ngữ quen thuộc với người dùng
 Tên thuộc tính - Bắt buộc phải mô tả về dữ liệu được đại diện bởi thuộc tính
 Đặt tên thích hợp:
 Tạo điều kiện giao tiếp giữa các bên
 Thúc đẩy việc tự lập tài liệu
 Ví dụ:
 Thực thể: SINH VIÊN, MÔN HỌC
 Thuộc tính: Mã SV, Họ tên, Ngày sinh, Mã môn, Tên môn, Số Tín chỉ...
3. QUY TẮC NGHIỆP VỤ 12

 Vẽ ERD cho giả thiết sau:


 Một phòng ban tuyển dụng nhiều nhân viên, một nhân viên được tuyển bởi
nhiều nhất một phòng ban

 Mỗi khách hàng có nhiều tài khoản thanh toán, mỗi tài khoản thanh toán chỉ
thuộc 1 khách hàng
 Một SV có thể học nhiều môn học, một môn học có nhiều SV đăng ký
 Một giáo viên hướng dẫn nhiều KLTN, một KLTN chỉ do 1 GV hướng dẫn

https://app.diagrams.net/
4. SỰ PHÁT TRIỂN CỦA CÁC MÔ HÌNH DỮ LIỆU 13

GENERATION TIME DATA MODEL EXAMPLES COMMENTS


Used mainly on IBM mainframe systems
First 1960s–1970s File system VMS/VSAM
Managed records, not relationships
Hierarchical and Early database systems
Second 1970s IMS, ADABAS, IDS-II
network Navigational access
DB2
Oracle Conceptual simplicity
Third Mid-1970s Relational MS Entity relationship (ER) modeling and support for
SQL Server relational data modeling
MySQL
Versant
Object-oriented Object/relational supports object data types
Objectivity/DB
Fourth Mid-1980s Object/relational Star Schema support for data warehousing
DB2 UDB
(O/R) Web databases become common
Oracle 12c
dbXML Unstructured data support
Tamino O/R model supports XML documents
XML Hybrid
Fifth Mid-1990s DB2 UDB Hybrid DBMS adds object front end to relational
DBMS
Oracle 12c databases
MS SQL Server Support large databases (terabyte size)

SimpleDB (Amazon) Distributed, highly scalable


Emerging BigTable (Google) High performance, fault tolerant
Early 2000s Key-value store
Models: Cassandra (Apache) Very large storage (petabytes)
to present Column store
NoSQL MongoDB Suited for sparse data
Riak Proprietary application programming interface (API)
4. SỰ PHÁT TRIỂN CỦA CÁC MÔ HÌNH DỮ LIỆU 14

 Mô hình dữ liệu mạng (Network data model)


 Mối liên hệ bị hạn chế trong kiểu nhị phân và nhiều - một (Đường nối ➔)
 Hệ thống ký hiệu mô tả dữ liệu
 Tập thực thể: kiểu mẫu tin logic
 Bản ghi (bộ dữ liệu): mẫu tin logic
 Thuộc tính (trường): khuôn dạng mẫu tin logic

Có kết Có kết
Sinh viên quả Bảng điểm quả Môn học

thuộc quản lý dạy

Lớp Giáo viên


4. SỰ PHÁT TRIỂN CỦA CÁC MÔ HÌNH DỮ LIỆU 15

 Mô hình dữ liệu phân cấp (Hierarchical data model)


 IBM - 1968
 Gồm nhiều cây, đường nối chỉ đi theo hướng từ con đến cha
 Hệ thống ký hiệu mô tả dữ liệu (giống mô hình mạng)
 Thể hiện của CSDL  lược đồ chứa tập các cây
 Mỗi cây được gọi là mẫu tin CSDL

Lớp Giáo viên


Lớp Giáo viên

Sinh viên* Sinh viên Môn học


Lớp trưởng Sinh viên Môn học

Bảng điểm Bảng điểm*


Bảng điểm Bảng điểm
4. SỰ PHÁT TRIỂN CỦA CÁC MÔ HÌNH DỮ LIỆU 16

 Mô hình dữ liệu quan hệ (Relational data model)


 E.F.Codd – IBM – 1970
 Nền tảng là toán quan hệ
 Bảng (Quan hệ)
 Ma trận, bao gồm các giao nhau giữa hàng và cột
 Mỗi hàng trong bảng gọi là 1 bộ (tuple)
 Mỗi cột là 1 thuộc tính
 Mô hình dữ liệu quan hệ được thực hiện thông qua hệ quản trị CSDL quan hệ
(RDBMS)
4. SỰ PHÁT TRIỂN CỦA CÁC MÔ HÌNH DỮ LIỆU 17

 Mô hình dữ liệu quan hệ (2)


Sơ đồ quan hệ Bảng
• Biểu diễn các thực thể, • Lưu trữ tập hợp các thực thể có liên quan
thuộc tính • Liên kết giữa 2 bảng cho phép kết nối 2
• và mối quan hệ bảng
4. SỰ PHÁT TRIỂN CỦA CÁC MÔ HÌNH DỮ LIỆU 18

 Mô hình thực thể quan hệ - ERM (Entity Relationship Model)


 Mô hình được chấp nhận rộng rãi cho mô hình dữ liệu
 Giới thiệu bởi Chen, 1976
 Mô hình dữ liệu mô tả các mối quan hệ giữa các thực thể ở mức khái niệm
với sự trợ giúp của sơ đồ ERD (Entity relationship diagram)
 Thực thể
 Thuộc tính
 Mối quan hệ (1: 1, 1: M và M: N)
 Sử dụng ký hiệu theo 2 kiểu: Chen hoặc Crow’s foot
4. SỰ PHÁT TRIỂN CỦA CÁC MÔ HÌNH DỮ LIỆU 19

 Ký hiệu trong mô hình thực thể quan hệ


4. SỰ PHÁT TRIỂN CỦA CÁC MÔ HÌNH DỮ LIỆU 20

 Mô hình dữ liệu hướng đối tượng (Object Oriented data model)


 Đối tượng: thuộc tính và các phương thức thao tác trên thuộc tính
 Lớp: Tập hợp các đối tượng tương tự có cấu trúc và hành vi dùng chung
được tổ chức theo hệ thống phân cấp lớp
 Phân cấp lớp: mỗi lớp chỉ có một cha mẹ
 Kế thừa: Đối tượng kế thừa các phương thức và thuộc tính của lớp cha
 Được mô tả bằng cách sử dụng UML
4. SỰ PHÁT TRIỂN CỦA CÁC MÔ HÌNH DỮ LIỆU 21

 Mô hình dữ liệu hướng đối tượng


4. SỰ PHÁT TRIỂN CỦA CÁC MÔ HÌNH DỮ LIỆU 22

 Đối tượng/Quan hệ và XML


 Mô hình dữ liệu hướng đối tượng là sự mở rộng của mô hình dữ liệu quan hệ
 Mô hình dữ liệu quan hệ thêm các tính năng hướng đối tượng
 Tạo ra CSDL quan hệ có hỗ trợ thêm tính năng của hướng đối tượng
 Mô hình dữ liệu quan hệ mở rộng (ERDM)
 Hỗ trợ các tính năng OO và biểu diễn dữ liệu phức tạp
 Hệ thống quản lý CSDL đối tượng / quan hệ (O / R DBMS)
 Dựa trên ERDM, tập trung vào việc quản lý dữ liệu tốt hơn
 Ngôn ngữ đánh dấu có thể mở rộng (XML)
 XML
 Ngôn ngữ đánh dấu mở rộng (Extensible Markup Language –XML)
 Quản lý dữ liệu phi cấu trúc để trao đổi hiệu quả và hiệu quả tất cả các loại dữ liệu
5. CÁC MÔ HÌNH DỮ LIỆU THAY THẾ MỚI NỔI 23

 Big Data - Dữ liệu lớn


 Tìm những cách mới và tốt hơn để quản lý lượng lớn dữ liệu web và dữ liệu
do cảm biến
 Cung cấp hiệu suất cao và khả năng mở rộng với chi phí hợp lý
 Đặc điểm
 Volume: Khối lượng;
 Velocity: Tốc độ;
 Variety: Đa dạng.
 Thách thức:
 Khối lượng không cho phép sử dụng các cấu trúc thông thường
 Đắt tiền
 Các công cụ OLAP tỏ ra không nhất quán khi xử lý dữ liệu phi cấu trúc
5. CÁC MÔ HÌNH DỮ LIỆU THAY THẾ MỚI NỔI 24

 Big Data - Dữ liệu lớn


5. CÁC MÔ HÌNH DỮ LIỆU THAY THẾ MỚI NỔI 25

 NoSQL
 Hệ quản trị CSDL thế hệ mới không dựa trên mô hình CSDL quan hệ và SQL
 Hỗ trợ kiến trúc CSDL phân tán
 Cung cấp khả năng mở rộng, tính sẵn sàng, khả năng chịu lỗi
 Hỗ trợ rất lớn dữ liệu thưa - sparse data
 Hướng tới hiệu suất thay vì tính nhất quán
 Lưu trữ dữ liệu dưới dạng key-value
5. CÁC MÔ HÌNH DỮ LIỆU THAY THẾ MỚI NỔI 26

 Dữ liệu thưa – Sparse Data


 Số lượng lớn thuộc tính
 Số lượng dữ liệu thực tế thấp
 Key-value: Khóa và Giá trị
 Mỗi khóa có 1 giá trị tương ứng với
thuộc tính
5. CÁC MÔ HÌNH DỮ LIỆU THAY THẾ MỚI NỔI 27
6. PHÂN LOẠI MÔ HÌNH DỮ LIỆU 28

 Các mức trừu


tượng hóa dữ liệu
 Mô hình ngoài –
external model
 Mô hình khái niệm –
concept model
 Mô hình trong –
internal model
 Mô hình vật lý –
Physical model
6. PHÂN LOẠI MÔ HÌNH DỮ LIỆU 29

 Mô hình ngoài – External model


 Chế độ xem của người dùng cuối (người lập
trình ứng dụng) về môi trường dữ liệu
 Biểu đồ ER được sử dụng để biểu diễn các
khung nhìn bên ngoài
 Lược đồ ngoài (External schema)
 Biểu diễn cụ thể chế độ xem bên ngoài
6. PHÂN LOẠI MÔ HÌNH DỮ LIỆU 30

 Mô hình khái niệm – Concept model


 Đầu ra của quá trình thiết kế khái niệm.
 Cái nhìn toàn cục về toàn bộ CSDL và mô tả
các đối tượng dữ liệu chính (tránh chi tiết)
bao gồm: thực thể, mối quan hệ, ràng buộc
 Lược đồ khái niệm (Conceptual schema):
Một biểu diễn của mô hình khái niệm,
thường được thể hiện bằng đồ thị.
6. PHÂN LOẠI MÔ HÌNH DỮ LIỆU 31

 Mô hình trong – Internal model


 Ánh xạ mô hình khái niệm tới DBMS
 Lược đồ trong (Internal schema)
 Sử dụng các cấu trúc CSDL được hỗ
trợ bởi DBMS đã chọn
 Độc lập logic – Logic
Independence
 Mô hình bên trong có thể thay đổi mà
không ảnh hưởng đến mô hình khái niệm
6. PHÂN LOẠI MÔ HÌNH DỮ LIỆU 32

 Mô hình vật lý – Physical model


 Mức trừu tượng thấp nhất
 Mô tả cách dữ liệu được lưu trên thiết bị lưu trữ
 Yêu cầu định nghĩa về phương pháp lưu trữ vật lý và truy cập dữ liệu
 Mô hình quan hệ hướng đến mức logic
 Không yêu cầu chi tiết mức vật lý
 Độc lập vật lý – Physical independence: Những thay đổi trong mô hình vật
lý không ảnh hưởng đến mô hình nội bộ
BÀI TẬP 33

You might also like