You are on page 1of 8

BÀI TẬP CHƯƠNG 1 - DATABASE CONCEPTS 

HOÀNG CHÍ HIẾU – A41174 


--o0o-- 
I. REVIEW QUESTIONS 
1. Define each of the following terms: 
a. data 
b. field 
c. record 
d. file 
Trả lời: 
a. data: (Dữ liệu) là sự kiện thô, ví dụ như SĐT, ngày sinh, tên khách hàng, doanh số, ... 
b. field: (Trường) là đặc điểm, nhóm các đặc điểm có ý nghĩa cụ thể. Một field được sử
dụng để định nghĩa và lưu trữ dữ liệu 
c. record: (Bản ghi) là 1 hoặc nhiều trường mô tả người, địa điểm, 1 thứ gì đó. VD: các
trường để mô tả khách hàng, bao gồm tên, địa chỉ, SĐT, số TK, ... 
d. file: (Tệp) là tập hợp các bản ghi có liên quan với nhau về mặt logic. VD: 1 tệp ghi danh
sách sinh viên của trường ĐH Thăng Long 
 
2. What is data redundancy, and which characteristics of the file system can lead to it? 
Trả lời:  
Data redundancy (Sự dư thừa dữ liệu) 
Nguyên nhân:  
 Cấu trúc hệ thống tệp tin khó kết hợp dữ liệu từ nhiều nguồn 
 Tổ chức sai dẫn đến lưu trữ cùng 1 dữ liệu ở nhiều nơi 
 Sự không nhất quán dẫn tới khác nhau và xung đột giữa các phiên bản 
 
3. What is data independence, and why is it lacking in file systems? 
Trả lời:  
Data independence (Sự độc lập dữ liệu) để chỉ việc truy cập dữ liệu không bị ảnh hưởng bởi
thay đổi trong lưu trữ 
Trong một hệ thống tệp, mỗi tệp dữ liệu đề yêu cầu cấp quyền để quản lý dữ liệu.  
Do đó, các hệ thống tệp đều thiếu tính độc lập về dữ liệu. 
 
4. What is a DBMS, and what are its functions? 
Trả lời:  
DBMS (Hệ quản trị CSDL) là tập hợp các chương trình để quản lý cấu trúc và kiểm soát truy
cập dữ liệu 
Chức năng:  
 Là trung gian giữa người dùng và cơ sở dữ liệu 
 Cho phép chia sẻ dữ liệu 
 Tích hợp nhiều khung nhìn của người dùng về dữ liệu 
 
5. What is structural independence, and why is it important? 
Trả lời: 
Structural Independence (Sự độc lập cấu trúc dữ liệu) là sự thay đổi cấu trúc của tệp không
làm ảnh hưởng đến quyền truy cập
Việc độc lập CTDL quan trọng, bởi vì nếu không có nó, bất kì thay đổi nào (chẳng hạn như
thêm trường (adding a field)) sẽ làm cho các ứng dụng truy cập cấu trúc tệp mới không thể
hoạt động
 
6. Explain the differences among data, information, and a database. 
Trả lời:  
Data (Dữ liệu) được coi là dữ kiện thô, chưa được xử lý 
Information (Thông tin) là dữ liệu đã được xử lý và sắp xếp 
Database (Cơ sở dữ liệu) là một tập hợp những dữ liệu có liên quan tới nhau, ví dụ như danh
sách học sinh trong lớp, bảng chấm công nhân viên, danh sách kiểm kê hàng hoá, ... 
 
7. What is the role of a DBMS, and what are its advantages? What are its disadvantages? 
Trả lời:  
Một DBMS (1 hệ quản trị CSDL) có thể: 
 Quản lý từ điển dữ liệu 
 Quản lý lưu trữ dữ liệu 
 Trình bày và chuyển đổi dữ liệu 
 Quản lý bảo mật 
 Kiểm soát nhiều người truy cập 
 Quản lý dự phòng và khôi phục dữ liệu 
 Quản lý tính toàn vẹn dữ liệu 
Ưu điểm: 
 Bảo mật tốt hơn bằng việc kiểm soát việc truy cập dữ liệu của người dùng 
  Cho phép các chế độ xem dữ liệu khác nhau tuỳ thuộc người dùng 
 Cung cấp sự độc lập dữ liệu 
 Giảm sự dư thừa dữ liệu 
 Cho phép thực hiện các truy vấn một cách hiệu quả 
Nhược điểm: 
 Tăng chi phí: đòi hỏi phần cứng, phần mềm,... 
 Phức tạp trong quản lý, công nghệ và cách vận hành đúng cách,... 
 Yêu cầu sự duy trì, cần cập nhật thường xuyên, áp dụng biện pháp bảo mật 

8. List and describe the different types of databases. 


Trả lời: 
Dữ liệu phi cấu trúc: Tồn tại ở trạng thái nguyên bản, chưa định dạng 
Dữ liệu có cấu trúc: Là kết quả của định dạng theo yêu cầu 
Dữ liệu bán cấu trúc: Là dữ liệu đã được xử lý 1 phần 
XML: Trình bày phần tử dữ liệu trong định dạng văn bản 
 
9. What are the main components of a database system? 
Trả lời: 
Gồm 5 bộ phận chính: 
 Phần cứng: Tất cả các thiết bị vật lý của hệ thống
 Phần mềm: Gồm 3 loại phần mềm: Hệ điều hành, Phần mềm DBMS và Chương
trình ứng dụng
 Con người: Tất cả người tham gia vào Hệ thống CSDL
 Quy tắc: Hướng dẫn và quy tắc điều chỉnh việc thiết kế và sử dụng hệ thống
CSDL
 Dữ liệu: Tập hợp những sự kiện được lưu trữ trong CSDL
 
10. What is metadata? 
Trả lời:  
Là dữ liệu của dữ liệu, qua đó dữ liệu người dùng cuối được tích hợp và quản lý
 Cung cấp mô tả về các đặc tính dữ liệu và mối quan hệ trong dữ liệu
 Bổ sung và mở rộng giá trị dữ liệu

11. Explain why database design is important. 


Trả lời:
Thiết kế cơ sở dữ liệu có thể giúp quản lý dữ liệu trở nên dễ dàng, tạo ra thông tin
chính xác và có giá trị.
 
12. What are the potential costs of implementing a database system? 
Trả lời:
Hệ thống cơ sở dữ liệu yêu cầu phần cứng và phần mềm phức tạp, và nhân sự có tay nghề
cao. Chi phí duy trì phần cứng, phần mềm và nhân sự cần thiết để vận hành và quản lý một hệ
thống CSDL khá tốn kém.

Chi phí đào tạo, cấp phép và tuân thủ quy định có thể được bỏ qua khi đã lắp đặt các hệ thống
CSDL.
 
13. Use examples to compare and contrast unstructured and structured data. Which type is more
prevalent in a typical business environment? 
Trả lời:
So sánh giữa 2 kiểu dữ liệu:

Unstructured Data (Dữ liệu không có cấu trúc): Tồn tại ở trạng thái nguyên bản, chưa được
định dạng. Ví dụ:

Structured Data (Dữ liệu có cấu trúc): Có dạng bảng, là kết quả của định dạng theo yêu cầu.
Ví dụ:
Kiểu dữ liệu nào phù hợp trong môi trường doanh nghiệp cơ bản: ??

 
14. What are some basic database functions that a spreadsheet cannot perform? 
Trả lời:
Các bảng tính không hỗ trợ các chức năng cơ bản như:
- Hỗ trợ tự lập tài liệu thông qua siêu dữ liệu
- Thực thi các loại dữ liệu hoặc tên miền để đảm bảo tính nhất quán của dữ liệu
trong một cột, các mối quan hệ được xác định giữa các bảng hoặc ràng buộc để đảm
bảo tính nhất quán của dữ liệu trên các bảng liên quan 
15. What common problems do a collection of spreadsheets created by end users share with the
typical file system? 
Trả lời:
- Thời gian phát triển bị kéo dài
- Khó nhận được câu trả lời nhanh
- Hệ thống quản trị phức tạp
- Thiếu bảo mật và giới hạn việc chia sẻ dữ liệu
- Extensive programming
 
16. Explain the significance of the loss of direct, hands-on access to business data thatend users
experienced with the advent of computerized data repositories. 
Trả lời:
Việc mất quyền truy cập trực tiếp vào dữ liệu kinh doanh cho người dùng cuối gây ra ảnh
hưởng nghiêm trọng, vì nó cung cấp cho họ các công cụ để chuyển đổi dữ liệu thành thông tin
họ cần. Ngoài ra, các thao tác với dữ liệu của công ty cho phép họ tạo ra thông tin mới.

Tuy nhiên, điều này tách biệt người dùng cuối khỏi dữ liệu. Mặc dù giúp tăng cường sự bảo
mật và ngăn chặn sự dư thừa thông tin, nhưng nó cũng tạo ra độ trễ nhất định khi người
dùng cuối yêu cầu thông tin từ dữ liệu
 
17. Explain why the cost of ownership may be lower with a cloud database than with a 
traditional, company database. 
Trả lời:
Cơ sở dữ liệu đám mây giúp bỏ đi việc thiết lập và duy trì các trung tâm dữ liệu.

Cơ sở dữ liệu đám mây là một bộ nhớ trực tuyến khổng lồ, các cá nhân và công ty chỉ phải bỏ
chi phí đăng ký sử dụng chúng.

Trong khi đó, để một công ty xây dựng 1 trung tâm dữ liệu, họ sẽ cần nhân công lành nghề, hệ
thống máy chủ tốc độ cao và các thiết bị lưu trữ lớn. Ngoài ra, việc cung cấp và quản lý nguồn
điện hàng ngày, với các kỹ năng và vận dụng cần thiết, có thể gây tổn thất chi phí kha khá.
 
II. PROBLEMS 

 
1. How many records does the file contain? How many fields are there per record? 
Trả lời:
File chứa 7 bản ghi, mỗi bản ghi chứa 5 trường.
 
2. What problem would you encounter if you wanted to produce a listing by city? How would you
solve this problem by altering the file structure? 
Trả lời:
Thông tin về City nằm trong mục Address, bởi vậy việc tạo ra 1 danh sách theo City sẽ khó
khăn.

Giải pháp:
Tách field MANAGER_ADDRESS thành các fields:
 MNG_ADDRESS
 MNG_CITY
 MNG_STATE
 MNG_ZIPCODE
 
3. If you wanted to produce a listing of the file contents by last name, area code, city, state, or zip
code, how would you alter the file structure? 
Trả lời:
Tách field PROJECT_MANAGER thành 2 fields:
 PROJECT_MANAGER_FNAME
 PROJECT_MANAGER_LNAME

Tách field MANAGER_ADDRESS thành các fields như câu 2


 
4. What data redundancies do you detect? How could those redundancies lead to anomalies? 
Trả lời:
Một số field PROJECT_MANAGER, MANAGER_PHONE và MANAGER_ADDRESS bị
trùng nhau. Điều này có thể dẫn tới nhiều lỗi hệ thống khi người dùng cố gắng thay đổi thông
tin 1 field nào đó.
 
5. Identify and discuss the serious data redundancy problems exhibited by the file structure shown
in Figure P1.5. 
Trả lời:
Có nhiều field bị lặp lại, ví dụ field PROJ_NUM, PROJ_NAME và EMP_NAME
 
 
6. Looking at the EMP_NAME and EMP_PHONE contents in Figure P1.5, what change(s) would
you recommend? 
Trả lời:
Chia field EMP_NAME thành 2 fields EMP_LNAME và EMP_FNAME
Field EMP_PHONE ổn, không có cải thiện thêm gì
 
7. Identify the various data sources in the file you examined in Problem 5. 
Trả lời:
Nguồn dữ liệu bao gồm:
Tên nhân viên (EMP_NAME)
SĐT của nhân viên (EMP_PHONE)
Thông tin về vị trí làm việc trong công ty của họ (EMP_NUM, JOB_CODE)
Thông tin về dự án (PROJ_NUM, PROJ_NAME, PROJ_HOURS)
 
8. Given your answer to Problem 7, what new files should you create to help eliminate the data
redundancies found in the file shown in Figure P1.5? 
Trả lời:
Chia các PROJ_NUM thành các bảng khác nhau, mỗi Dự án lại có quan hệ 1-to-many với các
Nhân viên.
Tạo một bảng khác để mô tả quan hệ 1-to-many giữa JOB_CODE và EMPLOYEE.
 
9. Identify and discuss the serious data redundancy problems exhibited by the file structure shown
in Figure P1.9. (The file is meant to be used as a teacher class assignment schedule. One of the
many problems with data redundancy is the likely occurrence of data inconsistencies two
different initials have been entered for the teacher named Maria Cordoza.) 

 
Trả lời:
Các BUILDING_CODE bị xếp lộn xộn, thông tin không nhất quát. Đề xuất tách
BUILDING_CODE ra thành 1 thuộc tính ở bảng khác, liên kết với bảng còn lại theo quan hệ
1-to-many.
 
10. Given the file structure shown in Figure P1.9, what problem(s) might you encounter if
building KOM were deleted? 

Trả lời:
Nếu KOM bị xoá, dữ liệu về các TEACHER_NAME Willston, Hawkíns, Cordoza và
ROOM_CODE 204E, 123, 34 tương ứng cũng sẽ bị xoá theo.
 
11. Using your school’s student information system, print your class schedule. The schedule
probably would contain the student identification number, student name, class code, class name,
class credit hours, class instructor name, the class meeting days and times, and the class room
number. Use Figure P1.11 as a template to complete the following actions. 

a) Create a spreadsheet using the template shown in Figure P1.11 and enter your current class
schedule. 

Trả lời:

 
b) Enter the class schedule of two of your classmates into the same spreadsheet. 

Trả lời:
 
c) Discuss the redundancies and anomalies caused by this design. 
 
Trả lời:
STU_ID và STU_NAME lặp lại nhiều lần. Đề xuất nên tạo 2 bảng STUDENT và CLASS theo
quan hệ 1-to-many.

You might also like