Professional Documents
Culture Documents
2
Trợ giảng
Nguyễn Thị Ánh, Lê Thị Huế
Trường ĐH Thăng Long
{A40670,A41131}@thanglong.edu.vn
3
Học liệu
Database Systems
(Msteam)
Bài giảng, bài thực hành, video, bài tập
4
Nộidung
1 Cơ sở dữ liệu là gì?
5
Mục tiêu
Quá trình phát triển từ hệ thống tệp đến các CSDL hiện đại
Tổng quan về giải pháp CSDL: mô tả, lợi thế và thách thức
7
8
CƠ SỞ DỮ LIỆU LÀ GÌ
10
DỮ LIỆU VÀ THÔNG TIN
11
DỮ LIỆU VỚI THÔNG TIN
Quyết định
‐ Thông tin chính xác, phù hợp, kịp thời là chìa khóa đưa ra quyết định kinh doanh tốt.
‐ Quản lý dữ liệu: tập trung vào lưu trữ dữ liệu và trích xuất thông tin
12
GIỚI THIỆU VỀ CƠ SỞ DỮ LIỆU
14
CÁC LOẠI CƠ SỞ DỮ LIỆU
15
CÁC LOẠI CƠ SỞ DỮ LIỆU
16
C
CÁC LOẠI CƠ SỞ DỮ LIỆU
17
CÁC LOẠI CƠ SỞ DỮ LIỆU
18
TẠI SAO THIẾT KẾ DỮ LIỆU LẠI QUAN TRỌNG ?
Thiết kế cơ sở dữ liệu tập trung vào thiết kế cấu trúc của cơ sở dữ liệu
▪ Người thiết kế trước tiên phải xác định được cách sử dụng CSDL dự kiến
Thiết kế CSDL tốt:
▪ Quản lý dữ liệu trở nên dễ dàng
▪ Tạo ra thông tin chính xác và có giá trị
Thiết kế CSDL chưa tốt:
▪ Gây ra những khó khăn
dễ dẫn đến những sai lầm
19
TẠI SAO THIẾT KẾ DỮ LIỆU LẠI QUAN TRỌNG ?
20
TẠI SAO THIẾT KẾ DỮ LIỆU LẠI QUAN
TRỌNG ?
FIGURE 1.6 EMPLOYEE SKILLS CERTIFICATION IN A GOOD DESIGN
21
2
Hệ thống tệp tiến hoá
lên hệ thống cơ sở dữ
liệu
22
Database systems: From files to DB
QUẢN LÝ THEO HỆ THỐNG TỆP
23
QUẢN LÝ THEO HỆ THỐNG TỆP
Tên Địnhnghĩa
Dữ liệu – Data Giá trị thô, giống như một SĐT, một ngày, một chuỗi tên, một số thực,…
Trường – Một nhóm ký tự có nghĩa (vd trường tên, trường tuổi, ..). Mỗi trường dùng để định nghĩa và lưu
Field trữ dữ liệu. Dữ liệu là giá trị của trường.
Bản ghi – Một nhóm các trường liên quan, hợp lại mô tả người, địa điểm, thứ gì đó. VD: Bản ghi Khách
Record hàng gồm các trường : tên, địa chỉ, số ĐT, số tài khoản,…
Tệp – Tập hợp các bản ghi có liên quan. VD: Tệp Danh sách sinh viên của trường Đại học Thăng 24
File Long
QUẢN LÝ THEO HỆ THỐNG TỆP
Là các công cụ trên máy tính giúp người dùng cuối làm việc trực tiếp với dữ liệu
Người dùng dùng công cụ hiện đại song vẫn tư duy theo cách thủ công, nên lặp
lại các vấn đề của hệ thống file
Microsoft Excel:
‐ Cho phép người dùng nhập dữ liệu với nhiều hàng và nhiều cột để tính toán dễ
dàng với các hàm.
‐ Được sử dụng rộng rãi bởi người kinh doanh.
‐ Kết thúc công việc, người dùng vẫn lưu dữ liệu dưới dạng bảng tính giống như
thủ công. (Thay vì lưu trên giấy thì lưu trên bảng tính)
‐ Khi số lượng bảng tính lớn thì vấn đề trở lên phức tạp.
26
CÔNG CỤ CẢI THIỆN HIỆU SUẤT NGƯỜI
DÙNG
27
VẤN ĐỀ VỚI HỆ THỐNG TỆP
28
VẤN ĐỀ VỚI HỆ THỐNG TỆP
Lập trình phức tạp kéo theo thời gian phát triển dài
▪ Mọi nhiệm vụ trích xuất thông tin đều đòi hỏi lập trình: Phải chỉ ra cả What lẫn
How
▪ Không thể tạo ra các truy vấn tức thời (ad-hoc query) kể cả đơn giản nhất
Phức tạp trong quản trị hệ thống:
▪ Mỗi tệp có chương trình quản lý tệp riêng, mỗi cá nhân/phòng ban có dữ liệu riêng
▪ Số tệp, số chương trình bùng nổ
Thiếu an ninh và chia sẻ dữ liệu:
▪ Thiếu an ninh nên khó chia sẻ (??)
▪ Chỉ có tính năng bảo vệ thô sơ dựa trên hệ điều hành, thường bị bỏ qua.
Khó thay đổi cấu trúc tệp 29
▪ Thay đổi nhỏ nhất cũng kéo theo phải sửa mọi chương trình liên quan
SỰ PHỤ THUỘC DỮ LIỆU VÀ CẤU TRÚC
Phụ thuộc cấu trúc (ngược với Độc lập cấu trúc)
▪ Việc truy cập 1 tệp bị phụ thuộc vào cấu trúc của tệp
▪ Chương trình truy cập phải thay đổi khi cấu trúc tệp thay đổi
Phụ thuộc dữ liệu (ngược với Độc lập dữ liệu):
▪ Chương trình truy cập phải thay đổi khi kiểu lưu trữ dữ liệu thay đổi
Yêu cầu người dùng quản lý sự khác biệt giữa định dạng lôgic và định dạng vật lý.
▪ Định dạng lôgic: là cách con người nhìn dữ liệu
▪ Định dạng vật lý: là cách máy tính phải làm việc với dữ liệu
Mỗi chương trình truy cập tệp phải nói cho máy tính cách làm việc với tệp đó
▪ Mã xác định loại tệp cụ thể, với đặc tả cụ thể cho bản ghi và các trường
30
SỰ DƯ THỪA DỮ LIỆU
Cấu trúc hệ thống tệp gây khó cho kết hợp dữ liệu từ nhiều nguồn (??).
Cùng 1 dữ liệu do đó có thể lưu trữ nhiều nơi, bởi nhiều người
‐ Mỗi nơi trở thành 1 “ốc đảo” thông tin
Sự dư thừa dữ liệu: Cùng dữ liệu được lưu ở nhiều nơi
Rủi ro an ninh (??)
Sự không nhất quán:
‐ Sự khác nhau và xung đột giữa các phiên bản dữ liệu (??)
Vấn đề về tính toàn vẹn:
‐ Dữ liệu có thể vi phạm các ràng buộc trong thế giới thực
Sự bất thường:
‐ Update, Insert, Delete
31
HỆ THỐNG CƠ SỞ DỮ LIỆU
Hệ thống cơ sở dữ liệu:
‐ Gồm các dữ liệu có liên quan về logic được lưu trữ trong 1 kho chứa logic duy nhất.
‐ Dù về mặt vật lý có thể đang lưu trữ phân tán trong nhiều thiết bị
‐ Hệ quản trị CSDL (DBMS) loại bỏ hầu hết các vấn đề của hệ thống tệp.
‐ DBMS lưu trữ: cấu trúc, mối quan hệ giữa các cấu trúc và cách truy cập dữ liệu.
33
HỆ THỐNG CƠ SỞ DỮ LIỆU
34
MÔI TRƯỜNG HỆ THỐNG CƠ SỞ DỮ LIỆU
Phần cứng:
‐ Tất cả các thiết bị vật lý của hệ thống
Phần mềm:
‐ Gồm 3 loại phần mềm: Hệ điều hành, Phần mềm DBMS, Chương trình ứng dụng.
Con người: tất cả người tham gia vào Hệ thống CSDL
‐ Quản trị dữ liệu và Hệ thống
‐ Người thiết kế CSDL
‐ Lập trình và phân tích hệ thống
‐ Người dùng cuối
Thủ tục:
‐ Các hướng dẫn và quy tắc điều chỉnh việc thiết kế và sử dụng hệ thống cơ sở dữ liệu
Dữ liệu:
‐ Tập hợp những sự kiện được lưu trữ trong CSDL
35
MÔI TRƯỜNG HỆ THỐNG CƠ SỞ DỮ LIỆU
Hệ thống CSDL có thể có các cấp độ phức tạp và tiêu chuẩn khác nhau.
▪ Hệ thống CSDL ở cửa hàng bán lẻ vs. hệ thống CSDL bảo hiểm quốc gia
▪ Giải pháp CSDL phải đem lại hiệu quả chi phí lẫn hiệu quả chiến lược cho tổ
chức.
▪ Công nghệ CSDL được sử dụng sẽ ảnh hưởng đến lựa chọn hệ thống CSDL
37
CHỨC NĂNG CỦA HỆ QTCSDL(DBMS)
38
CHỨC NĂNG CỦA HỆ QTCSDL(DBMS)
39
CHỨC NĂNG CỦA HỆ QTCSDL(DBMS)
40
CHỨC NĂNG CỦA HỆ QTCSDL(DBMS)
41
CHỨC NĂNG CỦA HỆ QTCSDL(DBMS)
Các ngôn ngữ truy cập cơ sở dữ liệu và giao diện lập trình ứng dụng
▪ DBMS cung cấp cách truy cập dữ liệu qua ngôn ngữ truy vấn
▪ Là ngôn ngữ phi thủ tục: chỉ ra cái cần làm mà không cần chỉ ra làm như thế
nào.
▪ SQL (Structured Query Language – Ngôn ngữ truy vấn cấu trúc):
‐ Là ngôn ngữ chuẩn được đa số DBMS hỗ trợ: Oracle, SQL Server,
DB2,…
Giao diện giao tiếp CSDL:
▪ DBMS hiện chấp nhận các truy vấn người dùng qua nhiều môi trường mạng.
‐ Lấy kết quả truy vấn sau khi điền biểu mẫu trên màn hình trình duyệt Web.
‐ DBMS tự động đưa các báo cáo định nghĩa trước lên Web
‐ Có thể kết nối bên thứ 3 để phân phối thông tin qua email hoặc ứng dụng 44
khác.
VAI TRÒ VÀ ƯU ĐIỂM CỦA DBMS
45
VAI TRÒ VÀ ƯU ĐIỂM CỦA DBMS
Ưu điểm:
‐ Cải thiện chia sẻ dữ liệu
‐ Cải thiện bảo mật dữ liệu
‐ Tích hợp dữ liệu tốt hơn
‐ Tối thiểu hóa sự xung đột dữ liệu
‐ Cải thiện truy cập dữ liệu
‐ Cải thiện việc ra quyết định
‐ Tăng hiệu suất của người dùng
‐ Đảm bảo an toàn - dự phòng và khôi
phục
46
THÁCH THỨC CỦA DBMS
HTCSDL cung cấp một nền tảng thực thi các quy định và tiêu chuẩn nghiêm ngặt hơn:
‐ Chuyển từ lập trình sang quản lý nguồn lực dữ liệu và phần mềm CSDL.
‐ HT CSDL cho phép sử dụng dữ liệu theo cách tinh vi hơn, miễn là CSDL thiết kế tốt
Nhược điểm của HT CSDL:
‐ Tăng chi phí: đòi hỏi phần cứng, phần mềm, nhân lực trình độ cao…
‐ Phức tạp trong quản lý: sự phức tạp trong công nghệ, vấn đề an ninh
‐ Sự cập thời: cập nhật thường xuyên các bản vá lỗi và các biện pháp bảo mật
‐ Phụ thuộc nhà cung cấp: đầu tư nhiều, ngại thay đổi, dễ bị ép giá
‐ Thay thế và nâng cấp thường xuyên: do nhà cung cấp thay đổi, chi phí nâng cấp + đào
tạo
47
NGHỀ NGHIỆP LIÊN QUAN ĐẾN CSDL
Nghề nghiệp Mô tả Yêu cầu kỹ năng
Phát triển CSDL Tạo và duy trì các ứng dụng dựa trên CSDL Lập trình, SQL, cơ bản CSDL
Thiết kế CSDL Thiết kế và duy trì CSDL Thiết kế hệ thống, CSDL, SQL
Quản trị CSDL Quản lý và duy trì DBMS và CSDL Cơ bản CSDL,SQL, khoá học của nhà cung cấp
Phân tích CSDL Phát triển CSDL cho trích xuất các báo cáo hỗ SQL, tối ưu truy vấn, kho dữ liệu
trợ việc ra quyết định
Kiến trúc sư CSDL Thiết kế và triển khai môi trường CSDL (Khái niệm, Cơ bản DBMS, Mô hình hoá DL, SQL, kiến
Lôgic, Vật lý) thức về phần cứng,…
Tư vấn CSDL Nâng cấp công nghệ CSDL cho tổ chức để cải Cơ bản CSDL, mô hình hoá DL, thiết kế dữ
thiện quy trình kinh doanh và đạt mục tiêu cụ thể liệu, SQL, DBMS, phần cứng, các công nghệ
của nhà cung cấp,..
Bảo mật CSDL Triển khai các chính sách bảo mật cho quản trị dữ Cơ bản DBMS, quản trị CSDL, SQL, kỹ thuật
liệu bảo mật dữ liệu,…
Kiến trúc sư dữ liệu điện Thiết kế và triển khai cơ sở hạ tầng cho hệ Công nghệ Internet, lưu trữ đám mây,
toán thống CSDL đám mây. an toàn dữ liệu, tinh chỉnh hiệu suất, dữ liệu
đám mây lớn,..
Khoa học dữ liệu Phân tích 1 lượng lớn dữ liệu để tìm thông tin ẩn Phân tích dữ liệu, thống kê, toán nâng cao,
chứa, mối quan hệ và dự đoán hành vi SQL, lập trình, khai phá dữ liệu, học máy, 48
Copyright by Dau HaiPh ong -2021trực quan hóa dữ liệu,…
TỔNG KẾT
49
TỔNG KẾT
CSDL được phát triển từ tệp tin thủ công (giấy) và máy tính
Trong hệ thống tệp tin thì dữ liệu lưu trữ trong các tệp độc lập
▪ Mỗi một tệp có 1 chương trình quản lý riêng
Một số hạn chế của hệ thống tệp tin:
▪ Lập trình khó khăn
▪ Quản trị khó khăn
▪ Thay đổi cấu trúc khó khăn
▪ Bảo mật và chia sẻ khó khăn
Các nguyên nhân chính:
▪ Phụ thuộc cấu trúc và dữ liệu
▪ Dư thừa dữ liệu 50
TỔNG KẾT
Hệ quản trị CSDL (DBMS) sinh ra nhằm khắc phục hạn chế của hệ tệp tin
DBMS thể hiện CSDL với người dùng như 1 kho duy nhất
‐ Thúc đẩy chia sẻ dữ liệu
‐ Loại bỏ sự cô lập thông tin
DBMS thực thi tính toàn vẹn, loại bỏ sự dư thừa và đảm bảo an toàn dữ liệu.
51
52
BÀI TẬP
53
CẢM ƠN
Liên hệ
thuydt@thanglong.edu.vn
54