You are on page 1of 3

CASE

PROBLEM 1: Trung Tâm Y Khoa Wentworth (Wentworth Medical Center)



Các nhà xã hội học và bác sĩ của trung tâm y khoa Wentworth, New York, đã có một nghiên cứu về mối
quan hệ giữa mức độ trầm cảm (depression) và vị trí địa lý (geographic location), đối tượng nghiên
cứu là những người có độ tuổi trên 65 đến từ 3 thành phố lớn khác nhau: Florida, New York, và North
Carolina.

Sau đây là 2 tập dữ liệu thu được từ 2 nhóm (medical 1 & 2) đối tượng ở trên (60 người/nhóm: 20
người đến từ mỗi thành phố). Hai nhóm này được phân chia dựa trên tình trạng sức khoẻ của đối
tượng như sau:
! Medical 1: Nhóm đối tượng có tình trạng sức khoẻ hoàn toàn khoẻ mạnh
! Medical 2: Nhóm đối tượng mắc 1 số chứng bệnh kinh niên như: đau khớp, cao huyết áp, đau
tim...
(Lưu ý: chỉ số càng cao, mức độ trầm cảm càng cao)

MEDICAL MEDICAL
1 2
North North
Florida New York Carolina Florida New York Carolina
3 8 10 13 14 10
7 11 7 12 9 12
7 9 3 17 15 15
3 7 5 17 12 18
8 8 11 20 16 12
8 7 8 21 24 14
8 8 4 16 18 17
5 4 3 14 14 8
5 13 7 13 15 14
2 10 8 17 17 16
6 6 8 12 20 18
2 8 7 9 11 17
6 12 3 12 23 19
6 8 9 15 19 15
9 6 8 16 17 13
7 8 12 15 14 14
5 5 6 13 9 11
4 7 3 10 14 12
7 7 8 11 13 13
3 8 11 17 11 11

1) Dùng các thống kê mô tả để tóm tắt 2 bộ dữ liệu đến từ 2 nghiên cứu của 2 nhóm đối tượng
medical 1 và medical 2. Từ đó đưa ra một số kết luận của bạn về sự khác biệt về mức độ trầm
cảm của từng nhóm đối tượng này theo vị trí địa lý (các thành phố).

2) Dùng phương pháp ANOVA cho từng nhóm đối tượng medical 1 & 2, để xem có hay
không sự khác biệt về mức độ trầm cảm của từng nhóm đối tượng này theo vị trí địa lý (các
thành phố). Chú ý: nêu rõ các giả thuyết thống kê - trong trường hợp có sự khác biệt hãy chỉ ra
sự khác biệt này xảy ra giữa các thành phố nào (Dùng Tukey's test và/hoặc Fisher's LSD test).
KẾT LUẬN

3) Gộp chung cả 2 mẫu medical 1 và medical 2 thành một mẫu (Mẫu này được xem như là thu
được từ cách thiết kế lấy dữ liệu theo khối - Blocked design - với các blocks là tình trạng sức
khoẻ medical 1 & 2) và dùng phương pháo ANOVA để phân tích xem có hay không sự khác
biệt về mức độ trầm cảm của từng nhóm đối tượng này theo vị trí địa lý. KẾT LUẬN

CASE PROBLEM 2: Compensation for Sales Professionals (Lương của những người
làm nghề sale)

Sau đây là 1 phần của bảng dữ liệu đến từ một cuộc khảo sát với đối tượng là các người làm
nghề sale ở vùng San Francisco. Qua cuộc khảo sát này các nhà nghiên cứu muốn tìm hiểu về
mối quan hệ giữa tiền lương và mức kinh nghiệm (Low: 1-10 năm; Medium: 11-20 năm;
High: trên 20 năm) của các đối tượng này và đồng thời thông tin về việc họ có được thuê để
làm cho vị trí bán hàng hay không cũng được ghi lại (position: Inside/Outside).
( File dữ liệu đầy đủ được đính kèm)

Observation Salary ($) Position Experience


1 53938 Inside Medium
2 52694 Inside Medium
3 70515 Outside Low
4 52031 Inside Medium
5 62283 Outside Low
6 57718 Inside Low
7 79081 Outside High
8 48621 Inside Low
9 72835 Outside High
.......

Trả lời một số câu hỏi sau cho bảng báo cáo:

1) Tóm tắt dữ liệu bằng một số thống kê mô tả.

2) Tìm khoảng tin cậy 95% để ước lượng mức lương trung bình của những người làm nghề
sales không kể đến năm kinh nghiệm cũng như thể loại công việc (position).

3) Tìm khoảng tin cậy 95% để ước lượng mức lương trung bình của những người làm nghề
sales với vị trí là "inside".

4) Tìm khoảng tin cậy 95% để ước lượng mức lương trung bình của những người làm nghề
sales với vị trí là "outside".
5) Dùng phân tích ANOVA để xem có sự khác biệt về mức lương theo vị trí công việc (bỏ qua
yếu tố năm kinh nghiệm).

6) Dùng phân tích ANOVA để xem có sự khác biệt về mức lương theo năm kinh nghiệm (bỏ
qua yếu tố vị trí công việc).

7) Dùng phân tích ANOVA kiểm định các giả thuyết thống kê rằng có hay không sự khác biệt
về mức lương là do kinh nghiệm, vị trí công việc, và mối tương tác (interaction) giữa 2 yếu tố
này.

You might also like