You are on page 1of 8

BÀI TẬP CHƯƠNG 1 - DATABASE CONCEPTS

HỌ VÀ TÊN : Nguyễn Thiện Đức – MÃ SINH VIÊN: A41674


--o0o--

I. REVIEW QUESTIONS
1. Define each of the following terms:
a. data : là các dữ liệu thô.
b. field : là đặc điểm, nhóm các đặc điểm có ý nghĩa cụ thể là một trường để
định nghĩa và lưu trữ dữ liệu.
c. record : Là 1 hoặc nhiều trường mô tả người, địa điểm, 1 thứ gì đó.
d. file : Là tập hợp các bản ghi có liên qua với nhau về mặt logic
Trả lời

2. What is data redundancy, and which characteristics of the file system can lead to it?
Dư thừa dữ liệu là các dữ liệu khác nhau nên dẫn đến sai sót.
Những đặc điểm dẫn đến dư thừa dữ liệu :
_ Cấu trúc hệ thống tệp tin khó kết hợp dữ liệu từ nhiều nguồn.
_ Cách thức tổ chức dẫn đến lưu trữ cùng 1 dữ liệu ở nhiều địa điểm khác nhau.
_ Sự dư thừa dữ liệu.
_ Sự không nhất quán.
_ Sự bất thường
3. What is data independence, and why is it lacking in file systems?
Độc lập dữ liệu: Việc truy cập dữ liệu không bị ảnh hưởng bởi thay đổi trong lưu trữ.

Hệ thống tệp thiếu tính độc lập về dữ liệu vì tất cả các chương trình truy cập dữ liệu
có thể thay đổi khi có bất kỳ đặc điểm lưu trữ dữ liệu nào của hệ thống tệp.

1
4. What is a DBMS, and what are its functions?
DBMS là hệ thống phần mềm cho phép người dùng xác định, tạo, duy trì và kiểm soát
truy cập vào cơ sở dữ liệu.

Các chức năng:


• DBMS hiện nay cung cấp cho người dùng truy cập bằng nhiều môi trường mạng
khác nhau.
• Sinh ra câu truy vấn trên màn hình của trình duyệt Web.
• Tự động đưa ra các báo cáo định trước trên Web
• Có thể kết nối với bên thứ 3 để phân phối thông tin qua email hoặc ứng dụng khác

5. What is structural independence, and why is it important?

Độc lập cấu trúc : Đó là khả năng thực hiện các thay đổi trong cấu trúc của cơ sở dữ
liệu mà không ảnh hưởng đến khả năng vận hành dữ liệu của người dùng.
_Điều quan trọng là vì nếu không có nó, bất kỳ thay đổi nào chẳng hạn như thêm
trường sẽ làm cho các ứng dụng truy cập cấu trúc tệp mới không thể hoạt động.

6. Explain the differences among data, information, and a database.


_Thông tin là xử lý, trích xuất từ dữ liệu biến thành thứ con người có thể hiểu được.
_Dữ liệu là một tập hợp các dữ kiện
_Cơ sở dữ liệu là một tập hợp có tổ chức các thông tin có cấu trúc hoặc dữ liệu,
thường được lưu trữ trực tuyến trong một hệ thống máy tính.
7. What is the role of a DBMS, and what are its advantages? What are its
disadvantages?

Vai trò:
_DBMS là trung gian giữa người dùng và cơ sở dữ liệu:
2
_DBMS cho phép chia sẻ dữ liệu
_DBMS tích hợp nhiều khung nhìn của người dùng về dữ liệu
Ưu điểm:
 Cải thiện chia sẻ dữ liệu
 Cải thiện bảo mật dữ liệu
 Tích hợp dữ liệu tốt hơn
 Tối thiểu hóa sự xung đột dữ liệu
 Cải thiện truy cập dữ liệu
 Cải thiện việc ra quyết định
 Làm tăng hiệu suất của người dùng
 Dự phòng và Khôi phục
Nhược điểm:
_Tăng chi phí
_Độ phức tạp trong quản lý

8. List and describe the different types of databases.


CSDL có thể phân loại theo:
 Số lượng người dùng: Cá nhân hay nhiều người dùng
 Vị trí CSDL: tập trung hay phân tán
• Hạ tầng vận hành: Hệ điều hành, mạng
• CSDL đám mây: Microsoft Azure, Amazon AWS,…
 Theo nhu cầu và mở rộng của sử dụng
CSDL 1 người dùng:
 Hỗ trợ 1 người dùng tại 1 thời điểm
 CSDL cài trên PC cho 1 người dùng
3
CSDL nhiều người dùng:
 Hỗ trợ nhiều người dùng tại cùng 1 thời điểm
 CSDL doanh nghiệp & nhóm
CSDL tập trung:
 Đặt CSDL tại 1 trạm
CSDL phân tán:
 CSDL được phân tán tại một vài trạm khác nhau.
CSDL hoạt động:
 Hỗ trợ các hoạt động hang ngày của công ty.
 CSDL giao dịch hoặc sản xuất
Kho dữ liệu:  Lưu trữ dữ liệu để sử dụng cho các quyết định.
9. What are the main components of a database system?

10. What is metadata?


Siêu dữ liệu là dạng dữ liệu mô tả thông tin chi tiết về dữ liệu
11. Explain why database design is important.
Người thiết kế phải xác định được việc sử dụng CSDL dự kiến
Quản lý dữ liệu trở nên dễ dàng
Tạo ra thông tin chính xác và có giá trị
12. What are the potential costs of implementing a database system?
Chi phí tiềm năng của việc triển khai một hệ thống cơ sở dữ liệu có thể bao gồm:
phần cứng và phần mềm phức tạp, nhân viên được đào tạo. chi phí đào tạo, cấp phép
và tuân thủ quy định
13. Use examples to compare and contrast unstructured and structured data. Which
type is more prevalent in a typical business environment?

4
14. What are some basic database functions that a spreadsheet cannot perform?
Bảng tính không hỗ trợ chức năng cơ bản như: hỗ trợ tự lập tài liệu thông qua siêu dữ
liệu. thực thi các loại dữ liệu hoặc miền để đảm bảo tính nhất quán của dữ liệu trong
một cột, các mối quan hệ được xác định giữa các bảng hoặc các quy định đối lập để
đảm bảo tính nhất quán của dữ liệu trên các bảng liên quan
15. What common problems do a collection of spreadsheets created by end users
share with the typical file system?
Các vấn đề thường gặp khi sử dụng cả tập hợp bảng tính do người dùng cuối tạo và hệ
thống tệp điển hình bao gồm: thời gian phát triển kéo dài. khó nhận được câu trả lời
nhanh chóng. quản trị hệ thống phức tạp. thiếu bảo mật và chia sẻ dữ liệu hạn chế. lập
trình rộng rãi.
16. Explain the significance of the loss of direct, hands-on access to business data
thatend users experienced with the advent of computerized data repositories.
Việc mất quyền truy cập trực tiếp vào dữ liệu kinh doanh cho người dùng cuối là rất
quan trọng vì nó cung cấp cho họ các công cụ để chuyển đổi dữ liệu của họ thành
thông tin họ cần và thao tác với dữ liệu của công ty cho phép họ tạo ra thông tin mới.
17. Explain why the cost of ownership may be lower with a cloud database than with
a
traditional, company database.
Cơ sở dữ liệu đám mây nằm trên Internet thay vì trong cơ sở hạ tầng mạng của chính
tổ chức. Điều này có thể giảm chi phí vì tổ chức không bắt buộc phải mua và duy trì
phần cứng và phần mềm cần thiết để chứa cơ sở dữ liệu và hỗ trợ các mức hiệu suất
cần thiết của hệ thống.

II. PROBLEMS

5
1. How many records does the file contain? How many fields are there per record?
7 records and 5 fields
2. What problem would you encounter if you wanted to produce a listing by city?
How would you solve this problem by altering the file structure?

Một vấn đề chính để nghe tên thành phố là các truy vấn. Việc viết và tìm kiếm cơ sở
dữ liệu sẽ trở nên khó khăn hơn và trở nên phức tạp.
Cách giải quyết: tạo một trường mới lưu trữ tên thành phố của các Manager.

3. If you wanted to produce a listing of the file contents by last name, area code, city,
state, or zip code, how would you alter the file structure?

Chia nhỏ tất cả thành những gì họ có bây giờ và phá vỡ nó để có cấu trúc tệp

4. What data redundancies do you detect? How could those redundancies lead to
anomalies?

Nhìn vào Cấu trúc tệp, chúng ta có thể thấy rằng Holly B. Parker đã xuất hiện ba lần.
Lặp lại 3 lần, điều này có thể là một sự dư thừa. Bản thân các tệp tin phải được sửa
chữa và cập nhật chính xác. Vì Holly B. Parker đã xuất hiện ba lần, cô ấy sẽ cần phải
đảm bảo rằng mọi thứ cô ấy đã tải lên sẽ chính xác. Nếu một thứ bị lộn xộn hoặc
không đúng, nó có thể là một vấn đề. Vấn đề sẽ xem xét các dữ liệu khác nhau ngay
cả khi đó là của cùng một người.

5. Identify and discuss the serious data redundancy problems exhibited by the file
structure shown in Figure P1.5.
Nó có nhiều điểm bất thường. Trong JOB_CODE = EE thay đổiJOB_CHG_HOUR,
nó sẽ cần được thay đổi hai lần. Điều này sẽ gây ra sự cố trong tương lai nếu bất kỳ
6
dữ liệu nào bị thay đổi. Nhìn chung, toàn bộ Cấu trúc tệp này có vấn đề và cần được
thay đổi

6. Looking at the EMP_NAME and EMP_PHONE contents in Figure P1.5, what


change(s) would you recommend?

7. Identify the various data sources in the file you examined in Problem 5.
Nguồn dữ liệu là dữ liệu nhân viên như tên và số điện thoại của họ. Ngoài ra, dữ liệu
dự án sẽ sử dụng tên dự án và giờ dự án. Tuy nhiên, tên và giờ làm việc của dự án
không phải là đặc điểm của người thiếu việc làm nên những tên đó không thực sự
thuộc về hồ sơ và phải nằm trong một tập tin riêng biệt. Ngoài ra còn có phí công việc
theo dữ liệu công việc mỗi giờ
8. Given your answer to Problem 7, what new files should you create to help
eliminate the data redundancies found in the file shown in Figure P1.5?
Các tệp dữ liệu mới sẽ được tạo phải nằm dọc theo các dòng của JOB, EMPLOYEE,
PROJECT và JOB_CHARGE. Bằng cách này, dữ liệu về dự án có thể được tách
thành tệp dự án như tên dự án và số dự án.
Tệp NHÂN VIÊN phải có dữ liệu liên quan đến nhân viên như tên, số nhân viên, địa
chỉ và số điện thoại của họ.
Tệp JOB sẽ chứa dữ liệu thanh toán như phí công việc mỗi giờ và mã công việc.
Tệp CHARGE sẽ có dữ liệu về số giờ theo mã công việc.

7
9. Identify and discuss the serious data redundancy problems exhibited by the file
structure shown in Figure P1.9. (The file is meant to be used as a teacher class
assignment schedule. One of the many problems with data redundancy is the likely
occurrence of data inconsistencies two different initials have been entered for the
teacher named Maria Cordoza.)
Có một số vấn đề nghiêm trọng về dư thừa dữ liệu trong cấu trúc tệp. Một ví dụ là họ
và tên của giáo viên. Horace Willinston có thể được nhìn thấy hai lần trong cấu trúc
tệp, điều đó có nghĩa là nếu có một thay đổi đối với tên, tất cả các trường có tên cũng
phải có thay đổi được thực hiện. Nếu thay đổi chỉ xảy ra với một bản ghi liên quan
đến HoraceWilliston, chứ không phải bản ghi khác, nó có thể gây ra vấn đề trong việc
xác định xem bản ghi thứ hai là giáo viên khác hay thực tế là cùng một giáo viên.
Cũng có thể thấy ví dụ tương tự về dự phòng dữ liệu này trong tất cả các cột khác cho
cấu trúc tệp.

10. Given the file structure shown in Figure P1.9, what problem(s) might you
encounter if building KOM were deleted?
Nếu KOM bị xóa, tất cả dữ liệu về Horace Willinston, Maria Cordoza và
AnneHawkins sẽ bị xóa. Điều này bao gồm ngày và giờ của giáo viên cụ thể đó, tên
giáo viên, mã phòng và mã xây dựng. Đây là lý do tại sao điều quan trọng đối với các
thực thể (cột) phải có bảng riêng với dữ liệu của riêng chúng

You might also like