You are on page 1of 36

TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU

Vũ Ngọc Thanh Sang


GIỚI THIỆU VỀ CƠ SỞ DỮ LIỆU

• Dữ liệu (Data) là các giá trị phản ánh về sự vật, hiện tượng trong thế giới
khách quan. Dữ liệu là các giá trị thô, chưa có ý nghĩa với người sử dụng.
Ø Ví dụ: Nguyễn Văn Nam, 845102, 14 / 10 / 02, 18
• Dữ liệu có thể biểu diễn dưới nhiều dạng khác nhau (âm thanh, văn bản,
hình ảnh, v.v...)
• 2 loại dữ liệu:
Ø Tĩnh: Tên, tuổi, địa chỉ …
Ø Động: Doanh thu, số lượng kho …
GIỚI THIỆU VỀ CƠ SỞ DỮ LIỆU

• Thông tin là ý nghĩa được rút ra từ dữ liệu thông qua quá trình xử lý
(phân tích, tổng hợp, v.v..), phù hợp với mục đích cụ thể của người sử
dụng.
• Thông tin có thể gồm nhiều giá trị dữ liệu được tổ chức sao cho nó mang
lại một ý nghĩa cho một đối tượng cụ thể, trong một ngữ cảnh cụ thể.
• Ví dụ với dữ liệu trên có thông tin như sau:
Thủ kho Nguyễn Văn Nam xuất mặt hàng có danh mục là 845102 vào
ngày 14/10/ 02 với số lượng 18.
GIỚI THIỆU VỀ CƠ SỞ DỮ LIỆU

Quá trình tạo ra thông tin: Xử Lý Thông Tin ~ Xử lý dữ liệu

§Các kí tư, số liệu… §Thông tin không định dạng


DỮ LIỆU
§Dữ liệu thô §Dữ liệu chung chung

§Phân loại §Tính toán


XỬ LÝ §Sắp xếp §Chọn lựa
§Tổng hợp

§ Tài liệu đã xử lý § Giá trị hữu hình


THÔNG TIN § Thông tin có định dạng § Giá trị vô hình
§ Dữ liệu trong ngữ cảnh
GIỚI THIỆU VỀ CƠ SỞ DỮ LIỆU

v Hệ thống các tập tin cổ điển: Được tổ chức riêng rẽ, phục vụ một mục
đích hay một bộ phận nào đó của doanh nghiệp.
Nhược điểm:
- Tính phụ thuộc giữa chương trình và dữ liệu .
- Lưu trữ trùng lặp dữ liệu
- Việc chia sẻ dữ liệu bị hạn chế
- Tốn thời gian xây dựng
- Chi phí cho bảo trì chương trình lớn
GIỚI THIỆU VỀ CƠ SỞ DỮ LIỆU

Cơ sở dữ liệu
v Định nghĩa:
• Tập hợp các dữ liệu có mối liên hệ với nhau.
• Biểu diễn 1 phần thế giới thực.
• Tập hợp có cấu trúc của những dữ liệu liên quan.
• Được thiết kế, xây dựng, lưu trữ cho mục đích cụ thể.
v Mục đích: Nhằm thoả mãn nhu cầu khai thác thông tin của một hay
nhiều người sử dụng phục vụ cho nhiều mục đích khác nhau.
GIỚI THIỆU VỀ CƠ SỞ DỮ LIỆU

vTiêu chuẩn của một CSDL:


• Tính bảo mật
• Tính độc lập
• Tránh sự dư thừa thông tin
• Có khả năng lưu trữ, phục hồi khi gặp sự cố
• Hiệu suất sử dụng tốt, đảm bảo chế độ ưu tiên khi truy nhập dữ liệu.
GIỚI THIỆU VỀ CƠ SỞ DỮ LIỆU

v Các đối tượng sử dụng CSDL:


• Những người sử dụng không chuyên về lĩnh vực tin học
• Các chuyên viên tin học.
• Những người quản trị CSDL: là người tổ chức CSDL, cấp quyền hạn
khai thác dữ liệu và giải quyết các tranh chấp khi gặp sự cố.
QUÁ TRÌNH PHÁT TRIỂN CỦA CƠ SỞ DỮ LIỆU

v Tiếp cận theo tập tin – Mô hình

Ứng dụng 1 Tập tin 1

Hệ Thống
Ứng dung 2 Quản Lý Tập tin 2
Tập Tin

Ứng dung n Tập tin m


QUÁ TRÌNH PHÁT TRIỂN CỦA CƠ SỞ DỮ LIỆU

v Tiếp cận theo tập tin


✕ Mỗi người dùng sẽ lưu trữ tập tin với thông tin theo nhu cầu riêng.
✕ Dữ liệu dễ bị trùng lặp.
✕ Dễ bị thiếu nhất quán.
✕ Chia sẻ dữ liệu rất khó khăn.
✕ Truy xuất khó.
✕ Khó khôi phục dữ liệu khi có sự cố
QUÁ TRÌNH PHÁT TRIỂN CỦA CƠ SỞ DỮ LIỆU

v Tiếp cận theo Cơ sở dữ liệu – Mô hình

Ứng dụng 1

Hệ
Ứng dung 2 Quản Trị
CSDL
CSDL
Ứng dung n
QUÁ TRÌNH PHÁT TRIỂN CỦA CƠ SỞ DỮ LIỆU

v Tiếp cận theo CSDL


✓ Tối thiểu hoá dư thừa thông tin
✓ Tính độc lập chương trình – ứng dụng
✓ Nâng cao tính nhất quán dữ liệu
✓ Nâng cao tính chia dữ liệu
✓ Nâng cao chất lượsẻng dữ liệu
✓ Nâng cao khả năng truy cập và trả lại dữ liệu
✓ Giảm chi phí bảo trì chương trình
QUÁ TRÌNH PHÁT TRIỂN CỦA CƠ SỞ DỮ LIỆU

vĐặc tính của CSDL:


• Tính tự mô tả
• Tính độc lập giữa chương trình và dữ liệu
• Tính trừu tượng dữ liệu
• Tính nhất quán
• Các cách nhìn dữ liệu
QUÁ TRÌNH PHÁT TRIỂN CỦA CƠ SỞ DỮ LIỆU

• Tính tự mô tả
⎯ Hệ CSDL không chỉ chứa bản thân CSDL mà còn chứa định nghĩa đầy
đủ (mô tả) của CSDL
⎯ Các định nghĩa được lưu trữ trong catalog: Chứa các thông tin về cấu
trúc tập tin, kiểu và dạng thức lưu trữ của mỗi thành phần dữ liệu và
những ràng buộc dữ liệu
⎯ Dữ liệu trong catalog gọi là meta-data.
QUÁ TRÌNH PHÁT TRIỂN CỦA CƠ SỞ DỮ LIỆU

• Tính độc lập giữa chương trình và dữ liệu


⎯ Vì định nghĩa về cấu trúc CSDL được lưu trữ trong catalog nên khi có
thay đổi nhỏ về cấu trúc ta ít phải sửa lại chương trình.

Chương trình
Độc lập
Dữ liệu
QUÁ TRÌNH PHÁT TRIỂN CỦA CƠ SỞ DỮ LIỆU

• Tính trừu tượng dữ liệu


⎯ CSDL chỉ cung cấp biểu diễn về dữ liệu ở mức khái niệm và ẩn nhiều
chi tiết về cách thức lưu trữ.
⎯ Sự trừu tượng hóa giúp cho tính độc lập chương trình và dữ liệu.
⎯ Sự trừu tượng hóa được thể hiện qua mô hình dữ liệu.
QUÁ TRÌNH PHÁT TRIỂN CỦA CƠ SỞ DỮ LIỆU

• Tính nhất quán


⎯ Lưu trữ dữ liệu thống nhất
⎯ Tránh được tình trạng trùng lắp thông tin
⎯ Có cơ chế điều khiển truy xuất dữ liệu hợp lý
⎯ Tránh được việc tranh chấp dữ liệu
⎯ Bảo đảm dữ liệu luôn đúng tại mọi thời điểm
QUÁ TRÌNH PHÁT TRIỂN CỦA CƠ SỞ DỮ LIỆU

• Các cách nhìn dữ liệu


⎯ Hỗ trợ nhiều cách nhìn dữ liệu
⎯ Một CSDL có nhiều người sử dụng
⎯ Mỗi người đòi hỏi cách nhìn (view) khác nhau về CSDL
⎯ Một cách nhìn là một phần của CSDL hoặc các dữ liệu được dẫn xuất từ
CSDL
ƯU ĐIỂM CỦA CƠ SỞ DỮ LIỆU

1. Thu thập thêm thông tin


2. Chia sẻ dữ liệu
3. Hạn chế xung đột dữ liệu
4. Kiểm soát sự dư thừa dữ liệu
5. Tạo điều kiện cho sự nhất quán dữ liệu
6. Cải thiện tính toàn vẹn dữ liệu
7. Cải thiện khả năng bảo mật
8. Tăng hiệu suất
9. Cung cấp sự độc lập về dữ liệu
NHƯỢC ĐIỂM CỦA CƠ SỞ DỮ LIỆU

1. Yêu cầu nhiều dung lượng ổ cứng và bộ nhớ


2. Sự phức tạp trong việc truy vấn dữ liệu
3. Sử dụng chung dữ liệu dẫn tới nguy cơ sai lệch dữ liệu
4. Khó khăn trong việc khôi phục dữ liệu
HỆ QUẢN TRỊ CSDL

v Khái niệm HQT CSDL:


⎯ HQT CSDL là các chương trình cho phép người dùng tạo ra và lưu trữ
dữ liệu.
⎯ Hệ quản trị CSDL cung cấp một giao diện cho phép người dùng định
nghĩa, xây dựng, xử lý và chia sẻ CSDL giữa những người dùng khác
nhau.
⎯ Mỗi hệ QT CSDL được cài đặt dựa trên mô hình dữ liệu cụ thể và hỗ trợ
tối đa cho người dùng thực hiện các thao tác trên đó.
⎯ Ví dụ: FOXPRO, ACCESS, ORACLE, SQL SERVER…
QUÁ TRÌNH PHÁT TRIỂN CỦA CƠ SỞ DỮ LIỆU

v Tính năng của HQT CSDL


• Hạn chế sự trùng lặp dữ liệu.
• Có khả năng chia sẻ dữ liệu.
• Phân quyền, quản lý tài khoản đăng nhập.
• Đảm bảo các ràng buộc giữa các dữ liệu.
• Khả năng sao lưu, backup.
• Tạo cơ chế đảm bảo an toàn và bí mật cho DL trong quá trình thao tác
QUÁ TRÌNH PHÁT TRIỂN CỦA CƠ SỞ DỮ LIỆU

v Kiến trúc của hệ QT CSDL

User 1 View 1

CSDL mức CSDL mức


User 2 View 2
khái niệm vật lý

User n View n

View Level Logical Level Physical Level


QUÁ TRÌNH PHÁT TRIỂN CỦA CƠ SỞ DỮ LIỆU

• View Level: là tập tất cả các dữ liệu mà người sử dụng cụ thể có thể nhìn
thấy và được phép truy cập, là mức của người sử dụng và các chương trình
ứng dụng.
• Logical Level: giải quyết vấn đề lưu trữ dữ liệu loại gì, lưu trữ bao nhiêu,
mối quan hệ trong CSDL và mối quan hệ giữa các loại dữ liệu này như thế
nào?
• Physical Level: Đây là mức lưu trữ dữ liệu. Mục đích của mức này giải
quyết vấn đề dữ liệu là gì, dữ liệu được lưu trữ như thế nào và nhằm mục
đích gì.
QUÁ TRÌNH PHÁT TRIỂN CỦA CƠ SỞ DỮ LIỆU

v Thao tác trên hệ QT CSDL

Data Structures Data Storage Data Security

• Tạo bảng • Tổ chức dữ liệu • Kiểm soát truy cập


• Xác định thông số của cột • Xây dựng công cụ tìm • Quản lý người dùng đăng
• Công thức hóa các mối kiếm nhập
quan hệ • Hạn chế dữ liệu dư thừa
• Xác thực dữ liệu • Sao lưu dữ liệu
HỆ QUẢN TRỊ CƠ SỞ DỮ LIỆU

Desktop Server Cloud

Microsoft Access SQL Server Azure SQL Database

FileMaker Oracle Amazon RDS

Open Office Base PostgresSQL


THUỘC TÍNH QUAN TRỌNG CỦA HQT CSDL TRONG GIAO DỊCH

v ACID: atomicity, consistency, isolation, và durability.


Tính nguyên tố (Atomicity): Một giao dịch có nhiều thao tác khác biệt thì
hoặc là toàn bộ các thao tác hoặc là không một thao tác nào được hoàn
thành. Chẳng hạn việc chuyển tiền có thể thành công hay trục trặc vì nhiều
lý do nhưng tính nguyên tố bảo đảm rằng một tài khoản sẽ không bị trừ tiền
nếu như tài khoản kia chưa được cộng số tiền tương ứng.
THUỘC TÍNH QUAN TRỌNG CỦA HQT CSDL TRONG GIAO DỊCH

v ACID: atomicity, consistency, isolation, và durability.


Tính nhất quán (Consistency): Một giao dịch hoặc là sẽ tạo ra một trạng
thái mới và hợp lệ cho dữ liệu, hoặc trong trường hợp có lỗi sẽ chuyển toàn
bộ dữ liệu về trạng thái trước khi thực thi giao dịch.
THUỘC TÍNH QUAN TRỌNG CỦA HQT CSDL TRONG GIAO DỊCH

v ACID: atomicity, consistency, isolation, và durability.


Tính độc lập (Isolation): Một giao dịch đang thực thi và chưa được xác
nhận phải bảo đảm tách biệt khỏi các giao dịch khác.
THUỘC TÍNH QUAN TRỌNG CỦA HQT CSDL TRONG GIAO DỊCH

v ACID: atomicity, consistency, isolation, và durability.


Tính bền vững (Durability): Dữ liệu được xác nhận sẽ được hệ thống lưu lại
sao cho ngay cả trong trường hợp hỏng hóc hoặc có lỗi hệ thống, dữ liệu
vẫn đảm bảo trong trạng thái chuẩn xác.
LƯU TRỮ DỮ LIỆU

v Flat File Database – Cơ sở dữ liệu phẳng

FirstName LastName Phone Room Vehicle Model

Nguyễn Minh Hoàng 0987364412 101 Xe hơi Honda CR-V

Nguyễn Minh Hoàng 0987364412 101 Xe máy Air Blade

Phan Hoàng 0932417723 203 Xe máy Vision

Vũ Thị Hồng 0934718823 301 Xe hơi Kia Morning

Vũ Thị Hồng 0934718823 301 Xe máy Jupiter


LƯU TRỮ DỮ LIỆU

v Relational Database – Dữ lieu quan hệ


ID FirstName LastName Phone Room ID Vehicle Model

1 Nguyễn Minh Hoàng 0987364412 101 1 Xe hơi Honda CR-V

2 Phan Hoàng 0932417723 203 1 Xe máy Air Blade

3 Vũ Thị Hồng 0934718823 301 2 Xe máy Vision

3 Xe hơi Kia Morning

3 Xe máy Jupiter
ƯU ĐIỂM KHI SỬ DỤNG DỮ LIỆU QUAN HỆ

✓ Linh hoạt trong việc truy xuất dữ liệu bằng SQL


✓ Mô hình hóa dữ liệu
✓ Khả năng kết hợp dữ liệu khi dùng hàm JOINS
✓ Khả năng sử dụng hàm hợp và phân tích
✓ Chỉ mục thứ cấp (secondary indexes) có sẵn
✓ Phù hợp cho dữ liệu nhỏ
✓ Phù hợp với giao dịch ACID
✓ Dễ dàng thay đổi theo yêu cầu của doanh nghiệp
ỨNG DỤNG CỦA CƠ SỞ DỮ LIỆU

• Ngân hàng: Thông tin khác hàng, tài khoản, các khoản vay, các giao dịch.
• Hãng hàng không: Thông tin đặt chỗ và lịch trình.
• Trường đại học: Thông tin sinh viên, đăng ký môn học, đánh giá kết quả
học tập.
• Nhân sự: Thông tin nhân viên, lương, thuế, phúc lợi.
• Viễn thông: Thông tin khách hàng, cuộc gọi đến và đi, cước hằng tháng.
THANK YOU FOR YOUR ATTENTION.

You might also like