You are on page 1of 51

CƠ SỞ DỮ LIỆU Q UA N HỆ

1. GIỚI THIỆU HỆ THỐNG CƠ SỞ DỮ


LIỆU
Giảng viên
Ths. Đinh Thị Thúy - Phòng Thí Nghiệm Trí Tuệ Nhân tạo –
ĐH Thăng Long
Email: thuydt@thanglong.edu.vn

2
Trợ giảng
Nguyễn Thị Ánh, Lê Thị Huế
Trường ĐH Thăng Long
{A40670,A41131}@thanglong.edu.vn

3
Học liệu
Database Systems
(Msteam)
Bài giảng, bài thực hành, video, bài tập

4
Nộidung

1 Cơ sở dữ liệu là gì?

2 Dữ liệu và Thông tin

3 Tầm quan trọng của Thiết kế CSDL

4 Thành phần chính trong Hệ thống CSDL

5 Một số vấn đề liên quan

5
Mục tiêu

 Tại sao cần quản lý dữ liệu?

 Sự khác biệt giữa Dữ liệu và Thông tin

 Các loại CSDL cơ bản

 Tại sao CSDL cần phải được thiết kế?

 Quá trình phát triển từ hệ thống tệp đến các CSDL hiện đại

 Tổng quan về giải pháp CSDL: mô tả, lợi thế và thách thức

 Các nghề nghiệp liên quan CSDL


6
1
Cơ sở dữ liệu là gì?
Database systems: What & Why

7
8
CƠ SỞ DỮ LIỆU LÀ GÌ

� Đặt vấn đề:


‐ Một quyết định tốt cần dựa trên dữ liệu tốt lấy từ thực tế.
‐ Dữ liệu có ở khắp nơi, dung lượng lớn, dùng chung, đặt ra nhu cầu quản lý dữ
liệu (thu thập đủ, lưu trữ tốt, chia sẻ an toàn, trích xuất kịp thời và ý nghĩa).
‐ Dữ liệu được quản lý tốt nhất khi lưu trong cơ sở dữ liệu (CSDL).
� Tại sao lại cần học CSDL?
‐ CSDL giải quyết nhiều vấn đề quản trị dữ liệu, nên được dùng trong hầu hết
các lĩnh vực hiện đại liên quan quản trị dữ liệu: Kinh doanh, Nghiên cứu,
Quản trị,…
‐ Điều quan trọng là hiểu cách CSDL làm việc và tương tác với các ứng dụng
9
DỮ LIỆU VÀ THÔNG TIN

10
DỮ LIỆU VÀ THÔNG TIN

‐ Dữ liệu là các sự kiện thô.


‐ Có định dạng phù hợp tuỳ vào đang lưu trữ, xử lý hay hiển thị
‐ Thông tin là kết quả từ việc xử lý dữ liệu để làm lộ ra ý nghĩa.
‐ Cần ngữ cảnh để thể hiện được ý nghĩa
‐ Tri thức là các thông tin được sắp xếp trong một quy luật
‐ Giúp tìm ra thông tin mới từ thông tin cũ

11
DỮ LIỆU VỚI THÔNG TIN

Dữ liệu Ý nghĩa Quy luật


Thông tin
Tri thức

Quyết định

‐ Thông tin chính xác, phù hợp, kịp thời là chìa khóa đưa ra quyết định kinh doanh tốt.
‐ Quản lý dữ liệu: tập trung vào lưu trữ dữ liệu và trích xuất thông tin

12
GIỚI THIỆU VỀ CƠ SỞ DỮ LIỆU

 CSDL: một cấu trúc máy tính dùng để lưu trữ:


▪ Dữ liệu người dùng cuối: dữ liệu thô
▪ Siêu dữ liệu: dữ liệu về dữ liệu, qua đó dữ liệu người
dùng cuối được tích hợp và quản lý.
• Các đặc tính của dữ liệu
• Mối quan hệ giữa các dữ liệu
 Hệ quản trị cơ sở dữ liệu (DBMS - HQTCSDL): một tập
hợp các chương trình quản lý cấu trúc và kiểm soát truy
cập CSDL

14
CÁC LOẠI CƠ SỞ DỮ LIỆU

 CSDL có thể phân loại theo:  CSDL 1 người dùng:


▪ Số lượng người dùng: Cá nhân hay nhiều người ▪ Hỗ trợ 1 người dùng tại 1 thời điểm
▪ Vị trí CSDL: Tập trung hay phân tán ▪ CSDL cài trên PC cho 1 người dùng
‐ Hạ tầng vận hành: Hệ điều hành, mạng  CSDL nhiều người dùng:
‐ CSDL đám mây: Microsoft Azure, Amazon ▪ Hỗ trợ nhiều người dùng tại 1 thời điểm
AWS,… ▪ CSDL doanh nghiệp & nhóm
▪ Kiểu dữ liệu: Dùng chung hay chuyên biệt hoá
▪ Mục đích sử dụng: Hoạt động hay phân tích
▪ Mức độ cấu trúc hoá: Có, không, bán.

15
CÁC LOẠI CƠ SỞ DỮ LIỆU

 CSDL phân tán:


▪ CSDL được phân tán tại một vài trạm khác nhau.
 CSDL hoạt động
▪ Hỗ trợ các hoạt động hàng ngày của công ty.
▪ CSDL giao dịch hoặc sản xuất
 CSDL phân tích: gồm Kho dữ liệu kèm một tập công cụ phân tích
▪ Lưu dữ liệu lịch sử để giúp ra quyết định kinh doanh

16
C
CÁC LOẠI CƠ SỞ DỮ LIỆU

 Dữ liệu phi cấu trúc:


▪ Tồn tại ở trạng thái nguyên bản, chưa định dạng.
 Dữ liệu có cấu trúc:
▪ Là kết quả của định dạng theo yêu cầu.
 Dữ liệu bán cấu trúc:
▪ Là dữ liệu đã được xử lý 1 phần.
 XML:
▪ Ngôn ngữ cho phép trình bày các phần tử dữ liệu trong định dạng văn bản.

17
CÁC LOẠI CƠ SỞ DỮ LIỆU

18
TẠI SAO THIẾT KẾ DỮ LIỆU LẠI QUAN TRỌNG ?

 Thiết kế cơ sở dữ liệu tập trung vào thiết kế cấu trúc của cơ sở dữ liệu
▪ Người thiết kế trước tiên phải xác định được cách sử dụng CSDL dự kiến
 Thiết kế CSDL tốt:
▪ Quản lý dữ liệu trở nên dễ dàng
▪ Tạo ra thông tin chính xác và có giá trị
 Thiết kế CSDL chưa tốt:
▪ Gây ra những khó khăn
dễ dẫn đến những sai lầm

19
TẠI SAO THIẾT KẾ DỮ LIỆU LẠI QUAN TRỌNG ?

20
TẠI SAO THIẾT KẾ DỮ LIỆU LẠI QUAN
TRỌNG ?
 FIGURE 1.6 EMPLOYEE SKILLS CERTIFICATION IN A GOOD DESIGN

21
2
Hệ thống tệp tiến hoá
lên hệ thống cơ sở dữ
liệu
22
Database systems: From files to DB
QUẢN LÝ THEO HỆ THỐNG TỆP

 Lý do để nghiên cứu Hệ thống tệp:


▪ Ví dụ trực quan minh hoạ các vấn đề hay gặp khi thiết kế dữ liệu.
▪ Hiểu các vấn đề Hệ thống tệp giúp tránh các vấn đề với hệ thống CSDL.
▪ Các kiến thức về hệ thống tệp giúp dễ chuyển dữ liệu từ hệ này sang CSDL.
 Hệ thống tệp tin gồm các tệp tin.
▪ Mỗi tệp tin chứa các nội dung liên quan nhau, tổ chức theo nhu cầu sử dụng
 Hệ thống tệp thủ công (giấy-bút):
▪ Dữ liệu được ghi vào các tệp hồ sơ theo cách dễ lưu lại và sử dụng dữ liệu
▪ Tủ hồ sơ tương đương một kho dữ liệu với tập hợp dữ liệu nhỏ
▪ Khi dữ liệu lớn và cần báo cáo phức tạp hơn sẽ cần tới máy tính.

23
QUẢN LÝ THEO HỆ THỐNG TỆP

Tên Địnhnghĩa
Dữ liệu – Data Giá trị thô, giống như một SĐT, một ngày, một chuỗi tên, một số thực,…
Trường – Một nhóm ký tự có nghĩa (vd trường tên, trường tuổi, ..). Mỗi trường dùng để định nghĩa và lưu
Field trữ dữ liệu. Dữ liệu là giá trị của trường.
Bản ghi – Một nhóm các trường liên quan, hợp lại mô tả người, địa điểm, thứ gì đó. VD: Bản ghi Khách
Record hàng gồm các trường : tên, địa chỉ, số ĐT, số tài khoản,…

Tệp – Tập hợp các bản ghi có liên quan. VD: Tệp Danh sách sinh viên của trường Đại học Thăng 24
File Long
QUẢN LÝ THEO HỆ THỐNG TỆP

 Hệ thống tệp tin máy tính:


▪ Cách tổ chức hệ thống tệp tin vẫn giống hệ thống tệp thủ công
‐ Mỗi tệp thủ công chuyển thành một tệp máy tính có cấu trúc
‐ Thêm chương trình quản lý dữ liệu (thêm, sửa, xoá dữ liệu)
‐ Thêm chương trình trích xuất báo cáo từ dữ liệu
 Hệ thống tệp bắt đầu nảy sinh vấn đề khi phình to:
▪ Mỗi tệp chỉ thuộc sở hữu của cá nhân/phòng ban và cần chương trình riêng
▪ Số tệp, số yêu cầu báo cáo, số chương trình báo cáo bùng nổ
▪ Nhiều tệp liên kết, trùng lặp, chồng lấn, không có cách đảm bảo sự nhất quán.
▪ Người dùng bị ngăn cách với dữ liệu, phải đi qua chuyên gia lập trình
25
CÔNG CỤ CẢI THIỆN HIỆU SUẤT NGƯỜI
DÙNG

 Là các công cụ trên máy tính giúp người dùng cuối làm việc trực tiếp với dữ liệu
 Người dùng dùng công cụ hiện đại song vẫn tư duy theo cách thủ công, nên lặp
lại các vấn đề của hệ thống file
 Microsoft Excel:
‐ Cho phép người dùng nhập dữ liệu với nhiều hàng và nhiều cột để tính toán dễ
dàng với các hàm.
‐ Được sử dụng rộng rãi bởi người kinh doanh.
‐ Kết thúc công việc, người dùng vẫn lưu dữ liệu dưới dạng bảng tính giống như
thủ công. (Thay vì lưu trên giấy thì lưu trên bảng tính)
‐ Khi số lượng bảng tính lớn thì vấn đề trở lên phức tạp.

26
CÔNG CỤ CẢI THIỆN HIỆU SUẤT NGƯỜI
DÙNG

27
VẤN ĐỀ VỚI HỆ THỐNG TỆP

 Hệ thống tệp là sự cải tiến so với hệ thống thủ công:


▪ Hệ thống tập tin được sử dụng trong hơn hai thập kỷ.
 Hiểu những hạn chế của các hệ thống tệp giúp hiểu
việc phát triển các cơ sở dữ liệu hiện đại
▪ Lập trình phức tạp
▪ Quản trị phức tạp
▪ Ít tính an ninh và chia sẻ
▪ Khó khăn trong thay đổi cấu trúc lưu trữ

28
VẤN ĐỀ VỚI HỆ THỐNG TỆP

 Lập trình phức tạp kéo theo thời gian phát triển dài
▪ Mọi nhiệm vụ trích xuất thông tin đều đòi hỏi lập trình: Phải chỉ ra cả What lẫn
How
▪ Không thể tạo ra các truy vấn tức thời (ad-hoc query) kể cả đơn giản nhất
 Phức tạp trong quản trị hệ thống:
▪ Mỗi tệp có chương trình quản lý tệp riêng, mỗi cá nhân/phòng ban có dữ liệu riêng
▪ Số tệp, số chương trình bùng nổ
 Thiếu an ninh và chia sẻ dữ liệu:
▪ Thiếu an ninh nên khó chia sẻ (??)
▪ Chỉ có tính năng bảo vệ thô sơ dựa trên hệ điều hành, thường bị bỏ qua.
 Khó thay đổi cấu trúc tệp 29
▪ Thay đổi nhỏ nhất cũng kéo theo phải sửa mọi chương trình liên quan
SỰ PHỤ THUỘC DỮ LIỆU VÀ CẤU TRÚC

 Phụ thuộc cấu trúc (ngược với Độc lập cấu trúc)
▪ Việc truy cập 1 tệp bị phụ thuộc vào cấu trúc của tệp
▪ Chương trình truy cập phải thay đổi khi cấu trúc tệp thay đổi
 Phụ thuộc dữ liệu (ngược với Độc lập dữ liệu):
▪ Chương trình truy cập phải thay đổi khi kiểu lưu trữ dữ liệu thay đổi
 Yêu cầu người dùng quản lý sự khác biệt giữa định dạng lôgic và định dạng vật lý.
▪ Định dạng lôgic: là cách con người nhìn dữ liệu
▪ Định dạng vật lý: là cách máy tính phải làm việc với dữ liệu
 Mỗi chương trình truy cập tệp phải nói cho máy tính cách làm việc với tệp đó
▪ Mã xác định loại tệp cụ thể, với đặc tả cụ thể cho bản ghi và các trường

30
SỰ DƯ THỪA DỮ LIỆU

 Cấu trúc hệ thống tệp gây khó cho kết hợp dữ liệu từ nhiều nguồn (??).
 Cùng 1 dữ liệu do đó có thể lưu trữ nhiều nơi, bởi nhiều người
‐ Mỗi nơi trở thành 1 “ốc đảo” thông tin
 Sự dư thừa dữ liệu: Cùng dữ liệu được lưu ở nhiều nơi
 Rủi ro an ninh (??)
 Sự không nhất quán:
‐ Sự khác nhau và xung đột giữa các phiên bản dữ liệu (??)
 Vấn đề về tính toàn vẹn:
‐ Dữ liệu có thể vi phạm các ràng buộc trong thế giới thực
 Sự bất thường:
‐ Update, Insert, Delete
31
HỆ THỐNG CƠ SỞ DỮ LIỆU

 Hệ thống cơ sở dữ liệu:
‐ Gồm các dữ liệu có liên quan về logic được lưu trữ trong 1 kho chứa logic duy nhất.
‐ Dù về mặt vật lý có thể đang lưu trữ phân tán trong nhiều thiết bị
‐ Hệ quản trị CSDL (DBMS) loại bỏ hầu hết các vấn đề của hệ thống tệp.
‐ DBMS lưu trữ: cấu trúc, mối quan hệ giữa các cấu trúc và cách truy cập dữ liệu.

33
HỆ THỐNG CƠ SỞ DỮ LIỆU

 Một tập hợp các thành phần


giúp định nghĩa và điều tiết
việc thu thập, lưu trữ, quản
lý, sử dụng dữ liệu trong
CSDL.
 Gồm 5 thành phần chính:
▪ Phần cứng, Phần mềm,
Con người, Quy tắc, Dữ
liệu

34
MÔI TRƯỜNG HỆ THỐNG CƠ SỞ DỮ LIỆU

 Phần cứng:
‐ Tất cả các thiết bị vật lý của hệ thống
 Phần mềm:
‐ Gồm 3 loại phần mềm: Hệ điều hành, Phần mềm DBMS, Chương trình ứng dụng.
 Con người: tất cả người tham gia vào Hệ thống CSDL
‐ Quản trị dữ liệu và Hệ thống
‐ Người thiết kế CSDL
‐ Lập trình và phân tích hệ thống
‐ Người dùng cuối
 Thủ tục:
‐ Các hướng dẫn và quy tắc điều chỉnh việc thiết kế và sử dụng hệ thống cơ sở dữ liệu
 Dữ liệu:
‐ Tập hợp những sự kiện được lưu trữ trong CSDL
35
MÔI TRƯỜNG HỆ THỐNG CƠ SỞ DỮ LIỆU

 Hệ thống CSDL có thể có các cấp độ phức tạp và tiêu chuẩn khác nhau.
▪ Hệ thống CSDL ở cửa hàng bán lẻ vs. hệ thống CSDL bảo hiểm quốc gia
▪ Giải pháp CSDL phải đem lại hiệu quả chi phí lẫn hiệu quả chiến lược cho tổ
chức.
▪ Công nghệ CSDL được sử dụng sẽ ảnh hưởng đến lựa chọn hệ thống CSDL

37
CHỨC NĂNG CỦA HỆ QTCSDL(DBMS)

 Quản lý từ điển dữ liệu:


▪ Từ điển dữ liệu lưu trữ định nghĩa và quan hệ của các phần tử (các siêu dữ
liệu)
▪ Giúp DBMS tự tra ra thông tin này, không cần mã hoá chúng trong chương
trình.
▪ Mọi thay đổi về cấu trúc CSDL đều được tự động lưu lại trong từ điển, giải
phóng người dùng khỏi việc thay đổi các chương trình truy cập
▪ Cung cấp sự trừu tượng dữ liệu, loại bỏ sự phụ thuộc cấu trúc và dữ liệu
‐ Ví dụ: Minh họa cách MS SQL Server định nghĩa dữ liệu cho bảng
CUSTOMER.

38
CHỨC NĂNG CỦA HỆ QTCSDL(DBMS)

39
CHỨC NĂNG CỦA HỆ QTCSDL(DBMS)

 Quản lý lưu trữ dữ liệu:


▪ DBMS tạo và quản lý nhiều cấu trúc phức tạp cần thiết cho việc lưu trữ, giảm
gánh nặng lập trình các đặc tính dữ liệu mức vật lý.
▪ DBMS hiện đại còn lưu trữ mẫu nhập liệu, báo cáo, quy tắc xác thực dữ liệu,…
▪ Quản lý lưu trữ đóng vai trò quan trọng trong tinh chỉnh hiệu suất CSDL (các hoạt
động làm cho CSDL lưu trữ và truy cập hiệu quả hơn)
‐ Dù về mặt logic trông như một đơn vị lưu trữ duy nhất, thực tế CSDL lưu trữ
trong nhiều tệp vật lý, có thể nằm ở nhiều thiết bị lưu trữ khác nhau

40
CHỨC NĂNG CỦA HỆ QTCSDL(DBMS)

 Ví dụ: CSDL trên


Oracle

41
CHỨC NĂNG CỦA HỆ QTCSDL(DBMS)

 Trình bày và chuyển đổi dữ liệu:


▪ DBMS chuyển đổi dữ liệu nhập vào cho phù hợp với cấu trúc vật lý
▪ DBMS chuyển đổi dữ liệu vật lý phù hợp với mong muốn logic của người dùng
▪ VD: “July 11, 2017” vs. “11/07/2017” vs. “07/11/2017”
 Quản lý bảo mật: đặc biệt cần với CSDL đa người dùng
▪ DBMS tạo hệ thống bảo mật đảm bảo an ninh người dùng và riêng tư dữ liệu
▪ Các quy tắc bảo mật xác định quyền truy cập (ai, dữ liệu nào, được làm gì)
▪ Cấp quyền thông qua xác thực người dùng (username & password, vân tay, …)
 Kiểm soát đa truy cập:
▪ Đảm bảo việc truy cập đồng thời không ảnh hưởng đến tính toàn vẹn dữ liệu.
42
CHỨC NĂNG CỦA HỆ QTCSDL(DBMS)

 Quản lý dự phòng và khôi phục dữ liệu:


▪ DBMS cung cấp cách dự phòng và khôi phục dữ liệu
đảm bảo dữ liệu được an toàn và toàn vẹn.
 Quản lý tính toàn vẹn dữ liệu:
▪ DBMS khuyến khích và thực thi các quy tắc toàn
vẹn để giảm thiểu dư thừa, tối đa hóa sự nhất quán
dữ liệu.
▪ Các mối quan hệ lưu trong từ điển dữ liệu dùng để thực
thi tính toàn vẹn dữ liệu.
▪ Tính toàn vẹn dữ liệu đặc biệt quan trọng với Hệ
CSDL giao dịch.
43
CHỨC NĂNG CỦA HỆ QTCSDL(DBMS)

 Các ngôn ngữ truy cập cơ sở dữ liệu và giao diện lập trình ứng dụng
▪ DBMS cung cấp cách truy cập dữ liệu qua ngôn ngữ truy vấn
▪ Là ngôn ngữ phi thủ tục: chỉ ra cái cần làm mà không cần chỉ ra làm như thế
nào.
▪ SQL (Structured Query Language – Ngôn ngữ truy vấn cấu trúc):
‐ Là ngôn ngữ chuẩn được đa số DBMS hỗ trợ: Oracle, SQL Server,
DB2,…
 Giao diện giao tiếp CSDL:
▪ DBMS hiện chấp nhận các truy vấn người dùng qua nhiều môi trường mạng.
‐ Lấy kết quả truy vấn sau khi điền biểu mẫu trên màn hình trình duyệt Web.
‐ DBMS tự động đưa các báo cáo định nghĩa trước lên Web
‐ Có thể kết nối bên thứ 3 để phân phối thông tin qua email hoặc ứng dụng 44
khác.
VAI TRÒ VÀ ƯU ĐIỂM CỦA DBMS

 DBMS là giao diện trung gian


giữa người dùng và cơ sở dữ
liệu:
‐ Lưu CSDL như tập hợp tệp
‐ Cho phép truy cập CSDL
mà che đi các chi tiết phức
tạp
 DBMS cho phép chia sẻ dữ liệu
 DBMS cung cấp khung nhìn
tích hợp về dữ liệu

45
VAI TRÒ VÀ ƯU ĐIỂM CỦA DBMS

 Ưu điểm:
‐ Cải thiện chia sẻ dữ liệu
‐ Cải thiện bảo mật dữ liệu
‐ Tích hợp dữ liệu tốt hơn
‐ Tối thiểu hóa sự xung đột dữ liệu
‐ Cải thiện truy cập dữ liệu
‐ Cải thiện việc ra quyết định
‐ Tăng hiệu suất của người dùng
‐ Đảm bảo an toàn - dự phòng và khôi
phục
46
THÁCH THỨC CỦA DBMS

 HTCSDL cung cấp một nền tảng thực thi các quy định và tiêu chuẩn nghiêm ngặt hơn:
‐ Chuyển từ lập trình sang quản lý nguồn lực dữ liệu và phần mềm CSDL.
‐ HT CSDL cho phép sử dụng dữ liệu theo cách tinh vi hơn, miễn là CSDL thiết kế tốt
 Nhược điểm của HT CSDL:
‐ Tăng chi phí: đòi hỏi phần cứng, phần mềm, nhân lực trình độ cao…
‐ Phức tạp trong quản lý: sự phức tạp trong công nghệ, vấn đề an ninh
‐ Sự cập thời: cập nhật thường xuyên các bản vá lỗi và các biện pháp bảo mật
‐ Phụ thuộc nhà cung cấp: đầu tư nhiều, ngại thay đổi, dễ bị ép giá
‐ Thay thế và nâng cấp thường xuyên: do nhà cung cấp thay đổi, chi phí nâng cấp + đào
tạo
47
NGHỀ NGHIỆP LIÊN QUAN ĐẾN CSDL
Nghề nghiệp Mô tả Yêu cầu kỹ năng
Phát triển CSDL Tạo và duy trì các ứng dụng dựa trên CSDL Lập trình, SQL, cơ bản CSDL

Thiết kế CSDL Thiết kế và duy trì CSDL Thiết kế hệ thống, CSDL, SQL
Quản trị CSDL Quản lý và duy trì DBMS và CSDL Cơ bản CSDL,SQL, khoá học của nhà cung cấp

Phân tích CSDL Phát triển CSDL cho trích xuất các báo cáo hỗ SQL, tối ưu truy vấn, kho dữ liệu
trợ việc ra quyết định
Kiến trúc sư CSDL Thiết kế và triển khai môi trường CSDL (Khái niệm, Cơ bản DBMS, Mô hình hoá DL, SQL, kiến
Lôgic, Vật lý) thức về phần cứng,…
Tư vấn CSDL Nâng cấp công nghệ CSDL cho tổ chức để cải Cơ bản CSDL, mô hình hoá DL, thiết kế dữ
thiện quy trình kinh doanh và đạt mục tiêu cụ thể liệu, SQL, DBMS, phần cứng, các công nghệ
của nhà cung cấp,..
Bảo mật CSDL Triển khai các chính sách bảo mật cho quản trị dữ Cơ bản DBMS, quản trị CSDL, SQL, kỹ thuật
liệu bảo mật dữ liệu,…
Kiến trúc sư dữ liệu điện Thiết kế và triển khai cơ sở hạ tầng cho hệ Công nghệ Internet, lưu trữ đám mây,
toán thống CSDL đám mây. an toàn dữ liệu, tinh chỉnh hiệu suất, dữ liệu
đám mây lớn,..
Khoa học dữ liệu Phân tích 1 lượng lớn dữ liệu để tìm thông tin ẩn Phân tích dữ liệu, thống kê, toán nâng cao,
chứa, mối quan hệ và dự đoán hành vi SQL, lập trình, khai phá dữ liệu, học máy, 48
Copyright by Dau HaiPh ong -2021trực quan hóa dữ liệu,…
TỔNG KẾT

 Dữ liệu là dữ liệu thô


 Thông tin là kết quả của quá trình xử lý dữ liệu để biết ý nghĩa của nó
 Thông tin chính xác, phù hợp và kịp thời là chìa khóa để đưa ra quyết định tốt
 Dữ liệu thường được lưu trữ trong một cơ sở dữ liệu
 DBMS triển khai và quản lý nội dung của CSDL
 Siêu dữ liệu (Metadata): là dữ liệu của dữ liệu
 Thiết kế cơ sở dữ liệu xác định cấu trúc cơ sở dữ liệu
▪ CSDL được thiết kế tốt sẽ tạo ra quản lý dữ liệu tốt và sinh ra thông tin có giá trị
▪ Thiết kế CSDL kém sẽ dẫn đến các quyết định tồi

49
TỔNG KẾT

 CSDL được phát triển từ tệp tin thủ công (giấy) và máy tính
 Trong hệ thống tệp tin thì dữ liệu lưu trữ trong các tệp độc lập
▪ Mỗi một tệp có 1 chương trình quản lý riêng
 Một số hạn chế của hệ thống tệp tin:
▪ Lập trình khó khăn
▪ Quản trị khó khăn
▪ Thay đổi cấu trúc khó khăn
▪ Bảo mật và chia sẻ khó khăn
 Các nguyên nhân chính:
▪ Phụ thuộc cấu trúc và dữ liệu
▪ Dư thừa dữ liệu 50
TỔNG KẾT
 Hệ quản trị CSDL (DBMS) sinh ra nhằm khắc phục hạn chế của hệ tệp tin
 DBMS thể hiện CSDL với người dùng như 1 kho duy nhất
‐ Thúc đẩy chia sẻ dữ liệu
‐ Loại bỏ sự cô lập thông tin
 DBMS thực thi tính toàn vẹn, loại bỏ sự dư thừa và đảm bảo an toàn dữ liệu.

51
52
BÀI TẬP

 Trả lời các câu hỏi trang 31

 Làm các bài tập trang 32

53
CẢM ƠN
Liên hệ
thuydt@thanglong.edu.vn

54

You might also like