You are on page 1of 7

TRƯỜNG ĐẠI HỌC KINH TẾ LUẬT ĐỀ THI CUỐI KỲ

KHOA TOÁN KINH TẾ Học kỳ V Năm học 2022 – 2023


_____________________ (Được sử dụng tài liệu của UEL và một tờ A4
viết tay)

Môn: PHÂN TÍCH DỮ LIỆU TRONG KINH DOANH - Thời lượng: 60 phút
Mã đề: 02

Tên SV : …………………………...................... MSSV: ………….……....… Mã lớp:


……….......................
Đề thi gồm có: 7 trang
Chữ ký Giám thị 1 Chữ ký Giám thị 2
A

Điểm (số) Điểm (chữ) Cán bộ chấm thi 1 Cán bộ chấm thi 2

HƯỚNG DẪN TRẢ LỜI


Chọn b Bỏ b - Chọn c Bỏ c - Chọn lại b
1 1 1
a a a
b b b
c c c
d d d

Phần trả lời trắc nghiệm (16 câu)


1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
a
b
c
d

PHẦN I (4 điểm): Trắc nghiệm, mỗi câu hỏi trắc nghiệm là 0,25 điểm

Câu 1: Đặt biến v là Verbal, g là general, p là paragraph, s là sentence, wc là wordc và wm là wordm.


Phương trình tương ứng với thiết kế CFA trong hình vẽ dưới đây là:
𝑔 = 𝛽𝑔0 + 𝛽𝑔1 𝑣 + 𝜖1
𝑝 = 𝛽𝑝0 + 𝛽𝑝1 𝑣 + 𝜖2
a) 𝑠 = 𝛽𝑠0 + 𝛽𝑠1 𝑣 + 𝜖3
𝑤𝑐 = 𝛽0𝑤𝑐 + 𝛽1𝑤𝑐 𝑣 + 𝜖4
{𝑤𝑚 = 𝛽0𝑤𝑚 + 𝛽1𝑤𝑚 𝑣 + 𝜖5

1
𝑣 = 𝛽𝑔0 + 𝛽𝑔1 𝑔 + 𝜖1
𝑣 = 𝛽𝑝0 + 𝛽𝑝1 𝑝 + 𝜖2
b) 𝑣 = 𝛽𝑠0 + 𝛽𝑠1 𝑠 + 𝜖3
𝑣 = 𝛽0𝑤𝑐 + 𝛽1𝑤𝑐 𝑤𝑐 + 𝜖4
{𝑣 = 𝛽0𝑤𝑚 + 𝛽1𝑤𝑚 𝑤𝑚 + 𝜖5
c) 𝑣 = 𝛽0 + 𝛽𝑔 𝑔 + 𝛽𝑝 𝑝 + 𝛽𝑠 𝑠 + 𝛽𝑤𝑐 𝑤𝑐 + 𝛽𝑤𝑚 𝑤𝑚
d) Một đáp án khác

Câu 2: Một thầy giáo muốn nghiên cứu mức độ ảnh hưởng của các yếu tố nhiệt độ phòng thi, ánh
sáng trong phòng thi và độ ẩm trong phòng thi đến điếm số của sinh viên trong một kỳ thi trên máy
tính. Phương pháp thống kê nào thích hợp để thực hiện nghiên cứu ?
a) Hồi quy logistic
b) Kiểm định ANOVA
c) Hồi quy tuyến tính
d) Kiểm định chi bình phương

Câu 3: Chọn câu trả lời đúng


a) Kiểm định tham số (parametric test) cần nhiều giả thiết về tổng thể hon kiểm định phi tham số
b) Kiểm định phi tham số có thể được dùng cho cả dữ liệu định tính và dữ liệu định lượng.
c) Khi tổng thể không tuân theo phân phối chuẩn thì kiểm định phi tham số sẽ thích hợp hơn
kiểm định tham số
d) Tất cả các câu trên đều đúng

Câu 4: Vì sao trong mô hình hồi quy tuyến tính không nên thêm các biến x (biến giải thích) mới
không liên quan đến y (biến đáp ứng)
a) vì hệ số R bình phương sẽ giảm.
b) vì sai số trung bình bình phương (MSE) sẽ tăng lên.
c) vì có thể dẫn đến kết luận sai lầm là mô hình có ý nghĩa thống kê cao (statistically significant)
trong khi thực tế không như vậy.
d) vì một lý do khác.

Câu 5: Trong phân tích PCA ở bảng dưới đây, tỉ lệ phần trăm phương sai của bộ dữ liệu được giải
thích bới phương sai thành phần chính thứ nhất (component) Comp1 là:
a) 74.61%
b) 2.98%

2
c) 2.36%
d) Một đáp án khác

Câu 6: Trong bảng phân tích PCA ở câu 5, để thực hiện yêu cầu giảm bớt số biến giải thích sao cho
tỉ lệ phần trăm phương sai giải thích được của bộ biến rút gọn không thấp hơn 95% phương sai của
bộ dữ liệu gốc thì ta cần chọn các thành phần chính nào (component) trong danh sách trên ?
a) Comp1
b) Comp1, Comp2
c) Comp1, Comp2, Comp3
d) Một đáp án khác.

Câu 7: Kiểm định phi tham số nào dưới đây có thể thay thế cho kiểm định ANOVA trong trường
hợp các giả thiết của kiểm định ANOVA không được thỏa mãn ?
a) Kiểm định tổng hạng Wilcoxon
b) Kiểm định dấu hạng Wilcoxon
c) Kiểm định chi bình phương
d) Kiểm định Kruskal-Wallis

Câu 8: Hình dưới đây trình bày kết quả ước lượng mô hình hồi quy tuyến tính với biến đáp ứng
hardness cho 3 trường hợp
1. Biến giải thích là thành phần chính thứ nhất pc1
2. Biến giải thích là thành phần chính thứ nhất và thứ hai pc1, pc2
3. Biến giải thích là thành phần chính thứ nhất, thứ hai và thứ ba pc1, pc2, pc3
Với mức ý nghĩa 𝛼 = 0.05, mô hình hồi quy tuyến tính có ý nghĩa thống kê với số lượng biến giải
thích tối thiểu là
a) Mô hình 1, 1 biến giải thích pc1.
b) Mô hình 2, 2 biến giải thích pc1, pc2.
c) Mô hình 3, 3 biến giải thích pc1, pc2, pc3.
d) Một đáp án khác

3
Câu 9: Trong mô hình hồi quy logistic (logistic regression), giả sử giá trị dự báo logit bằng 0 (tính
bằng cách thế giá trị cụ thể vào các biến giải thích x_i với mô hình sau khi ước lượng). Từ đó, xác
suất y=1 đối với dự báo này là:
a) 100%
b) 50%
c) 75%

4
d) 25%

Câu 10: Trong hồi quy tuyến tính bội (multiple linear regression), công cụ nào dưới đây là công cụ
tốt nhất để đánh giá mức độ phù hợp của mô hình (goodness of fit) ?
a) R bình phương hiệu chỉnh (adjusted R squared)
b) R bình phương (R squared)
c) Hệ số của các biến giải thích x_i
d) Hệ số tự do beta_0

Câu 11, 12, 13 và 14 sử dụng bảng ANOVA dưới đây


Một nhà nghiên cứu ngư nghiệp muốn kiểm định trung bình trọng lượng của một loại cá đánh bắt ở
ba vùng biển khác nhau. Cho mức ý nghĩa 𝛼 = 0.05. Hãy điền đầy đủ thông tin khuyết trong bảng
để trả lời các câu hỏi ở phần sau:
Nguồn biến thiên Tổng bình Bậc tự do Trung bình bình Thống kê F
phương phương
Giữa các nhóm 17.04
Nội bộ nhóm 9
Tổng 31.23

Câu 11: Giả thuyết 𝐻0 của kiểm định này là:


a) 𝜇1 = 𝜇2 = 𝜇3
b) Trung bình của ba tổng thể có sự khác biệt
c) Ít nhất một trung bình tổng thể có khác biệt so với hai tổng thể còn lại
d) 𝜇1 = 𝜇2 = 𝜇3 = 0

Câu 12: Thống kê F là


a) 8.52
b) 5.40
c) 2.00
d) 0.1854

Câu 13: Giá trị tới hạn (critical value) của kiểm định này là
a) 3.59
b) 3.86
c) 3.98
d) 4.26

Câu 14: Kết luận của kiểm định này là


a) Chưa đủ cơ sở để kết luận trung bình trọng lượng đánh bắt ở 3 địa điểm là khác nhau
b) Đủ cơ sở để kết luận trung bình trọng lượng đánh bắt ở 3 địa điểm là khác nhau
c) Đủ cơ sở để kết luận trung bình trọng lượng đánh bắt ở 3 địa điểm là giống nhau
d) Chưa đủ cơ sở để kết luận trung bình trọng lượng đánh bắt ở 3 địa điểm là giống nhau

Câu 15: Phương pháp bình phương tối thiểu trong hồi quy tuyến tính đơn chính xác là để:
a) Tìm khoảng cách tối thiểu giữa các điểm dữ liệu trong bộ dữ liệu
b) Tìm đường thẳng đi qua nhiều điểm dữ liệu nhất trong bộ dữ liệu
c) Tìm hệ số góc và hệ số tự do của phương trình đường thẳng sao cho tổng bình phương phần
dư (residual sum of squares) đạt giá trị nhỏ nhất.

5
d) Tìm hệ số góc và hệ số tự do của phương trình đường thẳng sao cho tổng phần dư (residual
sum) đạt giá trị nhỏ nhất.

Câu 16: Chọn câu trả lời đúng trong các câu sau:
a) Hệ số biến giả cho biết ước lượng của hiệu hai trung bình.
b) Hệ số biến giả cho biết ước lượng hiệu của hai hệ số.
c) Hệ số biến giả cho biết hiệu của hai hệ số R bình phương.
d) Tất cả các câu trên đều sai.

Phần II (6 điểm): Tự luận

Câu 17 (2 điểm): Một start-up nấu bia craft sản xuất 4 loại bia A, B, C và D. Công ty cho rằng số
lượng bán ra của 4 loại bia này là như nhau. Với mức ý nghĩa 0.05, kiểm định xem nhận định của
công ty start-up trên có phù hợp thực tế không ? Số liệu bán 4 loại bia được cho trong bảng sau
A B C D
75 40 45 40
a) (1 điểm) Hãy viết rõ giả thuyết cần kiểm định. Phương pháp thống kê nào được sử dụng
trong trường hợp này ? Tính thống kê đó.
b) (1 điểm) Kết luận là gì ? Công ty có nên thay đổi kế hoạch sản xuất sau kiểm định không ?

Câu 18 (2 điểm): Một người nông dân muốn kiểm tra xem ruộng bắp sử dụng loại phân bón mới có
sản lượng khác với sản lượng của ruộng bắp không sử dụng loại phân bón mới ? Bảng dưới đây là
số liệu sản lượng bắp của 5 khoảnh ruộng bắp có sử dụng phân bón mới và 5 khoảnh ruộng bắp
không dùng phân bón mới
Có sử dụng phân bón mới Không sử dụng phân bón mới
167 159
172 176
165 153
175 156
174 171
a) (1 điểm) Hãy viết rõ giả thuyết cần kiểm định. Phương pháp thống kê nào được sử dụng
trong trường hợp này ? Tính thống kê đó
b) (1 điểm) Kết luận là gì ? Người nông dân có nên cân nhắc áp dụng phân bón mới cho tất cả
ruộng bắp không ?

Câu 19 (2 điểm):
Bảng dưới đây thể hiện kết quả ước lượng thống kê cho một mô hình hồi quy tuyến tính bội. Trả lời
các câu hỏi dưới đây với mức ý nghĩa 𝛼 = 0.05.
a) (0.5 điểm)Viết phương trình hồi quy bội được ước lượng từ bảng.
b) (0.5 điểm) Mô hình hồi quy bội có ý nghĩa thống kê hay không ? Giải thích.
c) (0.5 điểm) Trong các biến giải thích, biến nào có ý nghĩa thống kê, biến nào không có ý nghĩa
thống kê ? Giải thích.
d) (0.5 điểm) Với các biến giải thích có ý nghĩa thống kê, viết khoảng tin cậy 95% cho từng hệ
số ước lượng.

6
HẾT
Chuẩn đầu ra của chương trình (kiến thức) Nội dung kiểm tra
PLO1 Câu
1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16
PLO2 Câu 16,17,18,19

TRƯỞNG BỘ MÔN DUYỆT GIẢNG VIÊN RA ĐỀ


(ký tên, ghi rõ họ tên) (ký tên, ghi rõ họ tên)

Lê Thanh Hoa Nguyễn Phúc Sơn

You might also like