You are on page 1of 2

BÀI 1 – GIỚI THIỆU CƠ SỞ DỮ LIỆU

Với cấu trúc tệp được hiển thị trong Hình P1.1, hãy trả lời các câu hỏi 1–4.

• Tệp chứa bao nhiêu bản ghi? Có bao nhiêu trường cho mỗi bản ghi?
Có 7 bản ghi từ 21-5Z cho đến 31-7P. Có 5 trường khác nhau
• Bạn sẽ gặp vấn đề gì nếu muốn tạo một danh sách theo thành phố? Bạn sẽ giải quyết
vấn đề này bằng cách thay đổi cấu trúc tệp như thế nào?
Vấn đề là không có tên thành phố. Để giải quyết thì cần thêm cột tên thành phố
• Nếu bạn muốn tạo danh sách nội dung tệp theo họ, mã vùng, thành phố, tiểu bang
hoặc mã zip, bạn sẽ thay đổi cấu trúc tệp như thế nào?
Chia họ, mã vùng, thành phố, tiểu bang hoặc mã zip và những dữ liệu của chúng thành
các cột riêng.
• Bạn phát hiện ra những điểm dư thừa dữ liệu nào? Làm thế nào mà những dư thừa
đó lại có thể dẫn đến bất thường?
Vấn đề là ở cột PROJECT_MANAGER, Holly B.Parker xuất hiện 3 lần. Việc này có thể là sự
dư thừa. Cái thư mục cần được điều chỉnh và cập nhật chính xác. Từ khi Holly B.Parker
xuất hiện 3 lần, cô ấy sẽ cần đảm bảo rằng mọi thứ mà cô ấy tải lên sẽ được chỉnh sửa.
Nếu một thứ gì đó hỗn độn hoặc không chính xác, nó có thể là vấn đề. Vần đề này sẽ
được cho là một dữ liệu khác kể cả khi nó là cùng một người.
• Xác định và thảo luận về các vấn đề dư thừa dữ liệu nghiêm trọng được thể hiện bởi
cấu trúc tệp được hiển thị trong Hình P1.5.
JOB_CODE chuyển thành JOB_CHG_HOUR, nó sẽ cần được chuyển đổi 2 lần. Điều này sẽ
gây ra vấn đề trong tương lai nếu như bất cứ dữ liện nào thay đổi.

• Nhìn vào thông tin trong cột EMP_NAME và EMP_PHONE trong Hình P1.5, bạn sẽ đề
xuất các thay đổi nào?
Em đề xuất là nên sắp xếp chúng bằng những cái tên. Vì thế để nó dưới dạng
EMP_FNAME và EMP_LNAME. Cách này sẽ ổn và dễ hơn trong việc tìm dữ liệu từ nhân
viên. Tôi cũng cho rằng EMP_PHONE có thể được sắp xếp tốt hơn. Bằng cách này, việc có
sự khác biệt về mã vùng với các số điệt thoại có thể được sắp xếp hợp lý hơn.
• Xác định các nguồn dữ liệu khác nhau trong tệp bạn đã kiểm tra trong câu 5.
Nguồn dữ liệu là các dữ liệu của nhân viên như tên của họ và số điện thoại của họ, ngoài
ra cả những dữ liệu của dự án như tên dự án và giờ thực hiện dự án. Tuy nhiên, tên dự
án và giờ thực hiện đều không phải là nét đặc trưng của một nhân viên vậy nên những
người không thực sự ở trong dữ liệu và nên ở trong một dữ liệu riêng biệt. Ngoài ra còn
có dữ liệu công việc như là thù lao mỗi giờ.
• Bạn nên tạo tệp mới nào để giúp loại bỏ số dư thừa dữ liệu được tìm thấy trong tệp
được hiển thị trong Hình P1.5?
Tệp dữ liệu mới cần được tạo nên ở cùng hàng với JOB, EMPLOYEE, PROJECT, và
JOB_CHARGE. Bằng cách này, dữ liệu về dự án sẽ được tách rời thành dự liệu dự án như
tên dự án và mã số dự án. Tệp EMPLOYEE cần nên có dữ liệu liên quan tới nhân viên
chẳng hạn như tên của họ, mã số của họ, địa chỉ và số điện thoại. Tệp JOB nên có danh
sách hoá đơn như là thù lao trong một giờ hay mã công việc. Cuối cùng, tệp CHARGE
nên có dữ liệu về số giờ dựa trên mã công việc.
• Xác định và thảo luận về các vấn đề dư thừa dữ liệu nghiêm trọng được thể hiện bởi
cấu trúc tệp được hiển thị trong Hình P1.9. (Tệp được sử dụng làm lịch phân công lớp
học của giáo viên. Một trong những vấn đề với dư thừa dữ liệu là khả năng xảy ra mâu
thuẫn dữ liệu - hai chữ cái đầu khác nhau đã được nhập cho giáo viên tên là Maria
Cordoza.)
Vấn đề là là tên và họ của cô giáo. Horace Willinston được xuất hiện 2 lần trong cấu trúc
tệp. Điều đó có nghĩa là nếu như có một sự thay đổi về tên, tất cả những lĩnh vực có tên
cũng phải được thay đổi. Nếu sự thay đổi chỉ sảy ra khi một bản ghi liên quan tới Horace
Willinston, nhưng không phải cái kia, nó có thể sẽ gây ra vấn đề trong việc tính toán nếu
như bản ghi thứ hai là một giáo viên khác hay thực tế là cùng một người. Ví dụ trùng
nhau của dữ liệu dư thừa này có thể thấy ở trong tất cả các cột khác trong cấu trúc dữ
liệu.

• Với cấu trúc tệp được hiển thị trong Hình P1.9, bạn có thể gặp (các) vấn đề nào nếu
việc tòa nhà KOM bị xóa?
Nếu như toà nhà KOM bị xoá, tất cả dữ liệu về Horace Willinston, Maria Cordoza và Anne
Hawkins sẽ bị xoá. Điều này bao gồm cả những ngày và giờ riêng biệt của giáo viên, tên
của các giáo viên, mã phòng học, và các mã toà nhà. Vì vậy mà điều này là cần thiết cho
việc các cột này nên có bảng riêng cùng với dữ liệu riêng của nó.

You might also like