You are on page 1of 18

ĐẠI HỌC BÁCH KHOA HÀ NỘI

VIỆN KINH TẾ VÀ QUẢN LÝ


--------*--------

BÀI TẬP LỚN


MÔN THỐNG KÊ ỨNG DỤNG
CHỦ ĐỀ: Khảo sát các yếu tố tác động tới điểm học tập GPA của sinh viên đại
học Bách Khoa kỳ 20222

GVHD: Cô Ngô Thu Giang

Sinh viên thực hiện:

Họ và tên MSSV
X X
X X
X X
X X
X X
X x

Hà Nội, tháng 11/2023


MỤC LỤC
1. Vấn đề nghiên cứu
Khảo sát các yếu tố tác động tới điểm học tập GPA của sinh viên đại học Bách Khoa
kỳ 20222

2. Dữ liệu nghiên cứu


Dữ liệu cần thu thập để tiến hành nghiên cứu:

1. Thông tin về sinh viên

- Giới tính Thang đo định danh

- Nhóm ngành đang học Thang đo định danh

2. Tình hình học tập của sinh viên

- Số tín chỉ bạn đăng ký kỳ 20222 Thang đo khoảng

- Điểm GPA kỳ 20222 Thang đo khoảng

3. Sự phân bổ thời gian của sinh viên

- Thời gian tự học mỗi ngày (giờ) của sinh viên Thang đo tỷ lệ

- Thời gian làm thêm mỗi ngày (giờ) của sinh viên Thang đo tỷ lệ

3. BẢNG CÂU HỎI KHẢO SÁT


1. Giới tính của bạn là?

- Nam

- Nữ

2. Điểm GPA kỳ gần nhất của bạn là bao nhiêu?

3. Nhóm ngành bạn học là?

- Kinh tế

- Kỹ thuật

4. Số tín chỉ bạn đăng ký kỳ 20222 vừa rồi là bao nhiêu tín
5. Thời gian tự học trung bình mỗi ngày (giờ) của bạn là?

6. Thời gian làm thêm trung bình mỗi ngày (giờ) của bạn là?

4. MẪU NGHIÊN CỨU


- Đối tượng nghiên cứu: Sinh viên đại học Bách Khoa Hà Nội

- Nguồn dữ liệu là dữ liệu sơ cấp

- Cách thức lấy mẫu: Mẫu được lấy mẫu qua điều tra sinh viên qua khảo sát bằng
cách sử dụng bảng hỏi

- Phương pháp chọn mẫu: Phương pháp chọn mẫu ngẫu nhiên

- Số lượng mẫu thu thập được: 53


5. BẢNG DỮ LIỆU THU THẬP ĐƯỢC

Giới Điểm GPA kỳ gần nhất Nhóm ngành Số tín chỉ bạn đăng Thời gian tự học mỗi Thời gian làm thêm mỗi
tính của bạn là bao nhiêu bạn học ký kỳ vừa rồi ngày (giờ) của bạn là? ngày (giờ) của bạn là?
Nữ 1.91 Kỹ thuật 18 0 8.0
Nữ 2.1 Kinh tế 16 0 8.0
Nam 2.22 Kỹ thuật 18 0 8.0
Nam 2.3 Kinh tế 21 0 7.0
Nam 2.31 Kinh tế 18 0 7.0
Nữ 2.36 Kinh tế 21 0 7.0
Nam 2.43 Kỹ thuật 21 1 6.0
Nam 2.53 Kỹ thuật 19 1 7.0
Nữ 2.68 Kinh tế 20 1 6.0
Nữ 2.69 Kinh tế 16 1 6.0
Nữ 2.72 Kinh tế 16 1 6.0
Nam 2.75 Kỹ thuật 14 1 5.0
Nữ 2.76 Kinh tế 23 1 5.0
Nam 2.77 Kỹ thuật 13 1 5.0
Nam 2.77 Kỹ thuật 20 1 5.0
Nữ 2.8 Kinh tế 14 1 4.0
Nam 2.80 Kỹ thuật 16 1 4.0
Nam 2.85 Kỹ thuật 13 1 4.0
Nữ 2.9 Kinh tế 19 1 3.0
Nam 2.9 Kỹ thuật 24 1 2.0
Nam 2.9 Kinh tế 22 1 2.0
Nam 2.93 Kinh tế 18 1 2.0
Nữ 3.00 Kinh tế 19 3 0.0
Nữ 3.05 Kỹ thuật 10 3 0.0
Nam 3.07 Kỹ thuật 22 4 0.0
Nam 3.11 Kỹ thuật 19 3 0.0
Nam 3.12 Kinh tế 19 3 0.0
Nam 3.15 Kỹ thuật 13 3 0.0
Nam 3.2 Kỹ thuật 20 2 0.0
Nữ 3.2 Kinh tế 21 4 0.0
Nam 3.26 Kinh tế 18 4 0.0
Nữ 3.30 Kinh tế 17 4 0.7
Nữ 3.34 Kinh tế 19 5 0.0
Nữ 3.38 Kinh tế 19 3 1.0
Nam 3.38 Kinh tế 17 5 1.0
Nam 3.39 Kỹ thuật 19 3 0.0
Nữ 3.4 Kinh tế 21 5 1.0
Nữ 3.4 Kỹ thuật 18 5 1.1
Nữ 3.44 Kỹ thuật 17 5 0.0
Nữ 3.47 Kinh tế 19 5 1.0
Nam 3.5 Kỹ thuật 18 6 0.9
Nam 3.5 Kỹ thuật 10 5 0.0
Nam 3.5 Kỹ thuật 13 5 0.0
Nam 3.6 Kỹ thuật 20 5 0.0
Nam 3.6 Kỹ thuật 18 6 0.0
Nam 3.62 Kinh tế 19 6 0.0
Nữ 3.66 Kinh tế 19 5 0.0
Nữ 3.68 Kinh tế 19 5 0.1
Nữ 3.7 Kỹ thuật 15 5 0.0
Nam 3.74 Kỹ thuật 14 6 0.0
Nữ 3.75 Kỹ thuật 20 5 0.0
Nữ 3.91 Kinh tế 17 6 0.0
Nữ 3.92 Kỹ thuật 18 5 0.0
6. BẢNG DỮ LIỆU THU THẬP ĐƯỢC (coding)
GENDE CREDIT_NU STUDY_TIM WORK_TIM
GPA R FIELD M E E
1.91 0 1 18 0 8.0
2.1 0 0 16 0 8.0
2.22 1 1 18 0 8.0
2.3 1 0 21 0 7.0
2.31 1 0 18 0 7.0
2.36 0 0 21 0 7.0
2.43 1 1 21 1 6.0
2.53 1 1 19 1 7.0
2.68 0 0 20 1 6.0
2.69 0 0 16 1 6.0
2.72 0 0 16 1 6.0
2.75 1 1 14 1 5.0
2.76 0 0 23 1 5.0
2.77 1 1 13 1 5.0
2.77 1 1 20 1 5.0
2.8 0 0 14 1 4.0
2.80 1 1 16 1 4.0
2.85 1 1 13 1 4.0
2.9 0 0 19 1 3.0
2.9 1 1 24 1 2.0
2.9 1 0 22 1 2.0
2.93 1 0 18 1 2.0
3.00 0 0 19 3 0.0
3.05 0 1 10 3 0.0
3.07 1 1 22 4 0.0
3.11 1 1 19 3 0.0
3.12 1 0 19 3 0.0
3.15 1 1 13 3 0.0
3.2 1 1 20 2 0.0
3.2 0 0 21 4 0.0
3.26 1 0 18 4 0.0
3.30 0 0 17 4 0.7
3.34 0 0 19 5 0.0
3.38 0 0 19 3 1.0
3.38 1 0 17 5 1.0
3.39 1 1 19 3 0.0
3.4 0 0 21 5 1.0
3.4 0 1 18 5 1.1
3.44 0 1 17 5 0.0
3.47 0 0 19 5 1.0
3.5 1 1 18 6 0.9
3.5 1 1 10 5 0.0
3.5 1 1 13 5 0.0
3.6 1 1 20 5 0.0
3.6 1 1 18 6 0.0
3.62 1 0 19 6 0.0
3.66 0 0 19 5 0.0
3.68 0 0 19 5 0.1
3.7 0 1 15 5 0.0
3.74 1 1 14 6 0.0
3.75 0 1 20 5 0.0
3.91 0 0 17 6 0.0
3.92 0 1 18 5 0.0

Mã hóa Câu hỏi Ký hiệu


Điểm GPA kỳ gần nhất của
Giới tính Nữ 0 bạn là bao nhiêu GPA
(GENDER) Nam 1 Nhóm ngành bạn học FIELD
Số tín chỉ bạn đăng ký kỳ
vừa rồi CREDIT_NUM
Thời gian tự học mỗi ngày
Khối ngành Kinh tế 0 (giờ) của bạn là? STUDY_TIME
Thời gian làm thêm mỗi
(FIELD) Kỹ thuật 1 ngày (giờ) của bạn là? WORK_TIME

7. THỐNG KÊ MÔ TẢ
7.1. Dữ liệu định tính

Qua tính toán ta có kết quả như sau:

GENDER Tần số Tần suất

Nam 25 47%

Nữ 28 53%

Nhận xét: chúng em thấy có sự phân phối đồng đều về giới tính với nữ có 28/53
mẫu chiếm 53% và nam gồm 25/53 mẫu chiếm 47%
GENDER

47%
53%

Nam Nữ

FIELD Tần số Tần suất

Kinh tế 26 49%

Kỹ thuật 27 51%

Nhận xét: Về nhóm ngành thì nhóm ngành kinh tế có 26/53 mẫu chiếm 49%, nhóm
ngành kỹ thuật có 27/53 mẫu chiếm 51%

FIELD

51% 49%

Kinh tế Kỹ thuật

7.2. Dữ liệu định lượng

Qua tính toán ta có kết quả như sau:


GPA:
Giá trị
Trung bình 3.089056604
Trung vị 3.12
Độ lệch chuẩn 0.487534078
Min 1.91
Max 3.92
Tứ phân vị
- Phân vị thứ nhất 2.77
- Phân vị thứ hai 3.12
- Phân vị thứ 3 3.47
- Phân vị thứ 4 3.92

Ta có biểu đồ Histogram:

Nhận xét:
- Điểm GPA cao nhất là 3.92 và thấp nhất là 1.91
- Trung bình điểm GPA của sinh viên ở mức khá là 3.08
- Ta thấy trung bình < trung vị nên dữ liệu lệch phải.
CREDIT_NUM:
Giá trị
Trung bình 17.86792453
Trung vị 18
Độ lệch chuẩn 3.019409875
Min 10
Max 24
Tứ phân vị
- Phân vị thứ nhất 16
- Phân vị thứ hai 18
- Phân vị thứ 3 20
- Phân vị thứ 4 24
Ta có biểu đồ Histogram:

Nhận xét:
- Số tín chỉ đăng ký cao nhất là 24 và thấp nhất là 10 (có thể là sinh viên năm
cuối)
- Số tín chỉ đăng ký của sinh viên trung bình là 17.8 ~ 18 tín/kỳ
- Ta thấy trung bình < trung vị nên dữ liệu lệch phải.
STUDY_TIME:
Giá trị
Trung bình 2.924528302
Trung vị 3
Độ lệch chuẩn 2.074099031
Min 0
Max 6
Tứ phân vị
- Phân vị thứ nhất 1
- Phân vị thứ hai 3
- Phân vị thứ 3 5
- Phân vị thứ 4 6

Ta có biểu đồ Histogram:
Nhận xét:
- Thời gian tự học cao nhất là 6 giờ/ngày và thấp nhất là 0 giờ
- Thời gian tự học của sinh viên trung bình là 2.92 giờ/ngày
- Dữ liệu phân bố không theo quy luật rõ ràng
WORK_TIME:
Giá trị
Trung bình 2.335579515
Trung vị 1
Độ lệch chuẩn 2.836241713
Min 0
Max 8
Tứ phân vị
- Phân vị thứ nhất 0
- Phân vị thứ hai 1
- Phân vị thứ 3 5
- Phân vị thứ 4 8

Ta có biểu đồ Histogram:

Nhận xét:
- Thời gian đi làm thêm cao nhất là 8 giờ/ngày và thấp nhất là 0 giờ
- Thời gian đi làm thêm của sinh viên trung bình là 2.33 giờ/ngày
- Dữ liệu lệch trái do trung bình lớn hơn trung vị.

8. THỐNG KÊ SUY DIỄN (ĐƠN BIẾN)


1. Giới tính có tác động tới điểm GPA
Gọi biến phụ thuộc Y là biến GPA; biến độc lập X là GENDER
Phương trình hồi quy có dạng: GPA = b0 + b1.GENDER với b0 là hệ số chặn, b1 là
hệ số hồi quy
Chạy hồi quy trong excel ta có kết quả như sau:
SUMMARY OUTPUT

Regression Statistics
Multiple R 0.101245844
R Square 0.010250721
Adjusted R Square -0.009156128
Standard Error 0.489760955
Observations 53

ANOVA
df SS MS F Significance F
Regression 1 0.126697402 0.126697 0.528201209 0.470686963
Residual 51 12.23315543 0.239866
Total 52 12.35985283

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept 3.1408 0.097952191 32.06462 1.80173E-35 2.944152771 3.337447229 2.944152771 3.337447229
GENDER -0.097942857 0.134763746 -0.72677 0.470686963 -0.368492366 0.172606652 -0.368492366 0.172606652

Ta được kết quả: GPA = 3.1408 - 0.09794.GENDER


Kiểm định giả thuyết: H0: giới tính có tác động tới điểm GPA
H1: giới tính không có tác động tới điểm GPA
Ta thấy rằng với độ tin cậy 95%, p-value = 0.47 > 0.05 nên bác bỏ giả thuyết H0,
chấp nhận giả thuyết H1
Vì vậy nên giới tính không có tác động tới điểm GPA. Phương trình hồi quy không
có ý nghĩa.
2. Nhóm ngành có tác động tới điểm GPA
Gọi biến phụ thuộc Y là biến GPA; biến độc lập X là FIELD
Phương trình hồi quy có dạng: GPA = b0 + b1.FIELD với b0 là hệ số chặn, b1 là hệ
số hồi quy
Chạy hồi quy trong excel ta có kết quả như sau:
SUMMARY OUTPUT

Regression Statistics
Multiple R 0.089525569
R Square 0.008014828
Adjusted R Square -0.011435862
Standard Error 0.49031384
Observations 53

ANOVA
df SS MS F Significance F
Regression 1 0.099062089 0.099062 0.412058787 0.523801319
Residual 51 12.26079074 0.240408
Total 52 12.35985283

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept 3.045 0.096158455 31.66648 3.30708E-35 2.851953846 3.238046154 2.851953846 3.238046154
FIELD 0.086481481 0.134723554 0.641918 0.523801319 -0.183987339 0.356950302 -0.183987339 0.356950302

Ta được kết quả: GPA = 3.045 - 0.0864.FIELD


Kiểm định giả thuyết: H0: nhóm ngành có tác động tới điểm GPA
H1: nhóm ngành không có tác động tới điểm GPA
Ta thấy rằng với độ tin cậy 95%, p-value = 0.52 > 0.05 nên bác bỏ giả thuyết H0,
chấp nhận giả thuyết H1
Vì vậy nên nhóm ngành không có tác động tới điểm GPA. Phương trình hồi quy
không có ý nghĩa.
3. Số lượng tín chỉ đăng ký có tác động tới điểm GPA
Gọi biến phụ thuộc Y là biến GPA; biến độc lập X là CREDIT_NUMBER
Phương trình hồi quy có dạng: GPA = b0 + b1.CREDIT_NUMBER với b0 là hệ số
chặn, b1 là hệ số hồi quy
Chạy hồi quy trong excel ta có kết quả như sau:
SUMMARY OUTPUT

Regression Statistics
Multiple R 0.100416274
R Square 0.010083428
Adjusted R Square -0.009326701
Standard Error 0.489802344
Observations 53

ANOVA
df SS MS F Significance F
Regression 1 0.124629687 0.12463 0.519493102 0.474348955
Residual 51 12.23522314 0.239906
Total 52 12.35985283

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept 3.378765024 0.407541086 8.290612 5.11836E-11 2.560592155 4.196937893 2.560592155 4.196937893
CREDIT_NUM -0.016213882 0.022495576 -0.72076 0.474348955 -0.061375635 0.028947871 -0.061375635 0.028947871

Ta được kết quả: GPA = 3.3787 - 0.0162.CREDIT_NUMBER


Kiểm định giả thuyết: H0: Số lượng tín chỉ đăng ký có tác động tới điểm GPA
H1: Số lượng tín chỉ đăng ký không có tác động tới điểm GPA
Ta thấy rằng với độ tin cậy 95%, p-value = 0.47 > 0.05 nên bác bỏ giả thuyết H0,
chấp nhận giả thuyết H1
Vì vậy nên Số lượng tín chỉ đăng ký không có tác động tới điểm GPA. Phương trình
hồi quy không có ý nghĩa.
4. Thời gian tự học có tác động tới điểm GPA
Gọi biến phụ thuộc Y là biến GPA; biến độc lập X là STUDY_TIME
Phương trình hồi quy có dạng: GPA = b0 + b1.STUDY_TIME với b0 là hệ số chặn,
b1 là hệ số hồi quy
Chạy hồi quy trong excel ta có kết quả như sau:
SUMMARY OUTPUT

Regression Statistics
Multiple R 0.924577745
R Square 0.854844007
Adjusted R Square 0.851997811
Standard Error 0.187559492
Observations 53

ANOVA
df SS MS F Significance F
Regression 1 10.56574612 10.56575 300.3461543 5.07567E-23
Residual 51 1.794106714 0.035179
Total 52 12.35985283

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept 2.453469973 0.044819219 54.74147 5.64363E-47 2.363491636 2.54344831 2.363491636 2.54344831
STUDY_TIME 0.217329622 0.012540299 17.3305 5.07567E-23 0.192153922 0.242505323 0.192153922 0.242505323

Ta được kết quả: GPA = 2.4534 + 0.2173.STUDY_TIME


Kiểm định giả thuyết: H0: Thời gian tự học có tác động tới điểm GPA
H1: Thời gian tự học không có tác động tới điểm GPA
Ta thấy rằng với độ tin cậy 95%, p-value = < 0.05 nên ta chấp nhận giả thuyết H0
Vì vậy nên thời gian tự học có tác động đồng biến tới điểm GPA (do hệ số =
0.21733 dương).
R Square = 0.8548 nên STUDY_TIME giải thích được 85.48% sự biến động của
GPA
5. Thời gian đi làm thêm có tác động tới điểm GPA
Gọi biến phụ thuộc Y là biến GPA; biến độc lập X là WORK_TIME
Phương trình hồi quy có dạng: GPA = b0 + b1.WORK_TIME với b0 là hệ số chặn,
b1 là hệ số hồi quy
Chạy hồi quy trong excel ta có kết quả như sau:
SUMMARY OUTPUT

Regression Statistics
Multiple R 0.89780242
R Square 0.806049186
Adjusted R Square 0.802246229
Standard Error 0.216804037
Observations 53

ANOVA
df SS MS F Significance F
Regression 1 9.962649315 9.962649 211.9532663 8.45339E-20
Residual 51 2.397203515 0.047004
Total 52 12.35985283

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept 3.449500078 0.038727648 89.07074 1.21047E-57 3.371751081 3.527249075 3.371751081 3.527249075
WORK_TIME -0.154327212 0.010600405 -14.5586 8.45339E-20 -0.175608413 -0.133046011 -0.175608413 -0.133046011

Ta được kết quả: GPA = 3.4495 - 0.1543.WORK_TIME


Kiểm định giả thuyết: H0: Thời gian đi làm thêm có tác động tới điểm GPA
H1: Thời gian đi làm thêm không có tác động tới điểm GPA
Ta thấy rằng với độ tin cậy 95%, p-value = < 0.05 nên ta chấp nhận giả thuyết H0.
Vì vậy nên thời gian đi làm thêm có tác động nghịch biến tới điểm GPA (do hệ số =
-0.15433 âm)
R Square = 0.8060 nên STUDY_TIME giải thích được 80.60% sự biến động của
GPA

9. THỐNG KÊ SUY DIỄN (ĐA BIẾN)


- Gọi biến phụ thuộc Y là biến GPA; biến độc lập X1 X2 X3 X4 X5 lần lượt là là
GENDER, FIELD, CREDIT_NUM, STUDY_TIME, WORK_TIME

- Phương trình hồi quy có dạng:

GPA = b0 + b1.GENDER + b2.FIELD + b3.CREDIT_NUM +


b4.STUDY_TIME + b5.WORK_TIME

với b0 là hệ số chặn, b1, b2, b3,b4,b5 là hệ số hồi quy

- Chạy hồi quy trong excel ta có kết quả như sau:


SUMMARY OUTPUT

Regression Statistics
Multiple R 0.95125533
R Square 0.904886703
Adjusted R Square0.894768268
Standard Error 0.158153329
Observations 53

ANOVA
df SS MS F Significance F
Regression 5 11.18426648 2.236853296 89.42950476 7.81669E-23
Residual 47 1.175586348 0.025012475
Total 52 12.35985283

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept 2.928161847 0.17849777 16.40447303 4.41781E-21 2.569070652 3.287253042 2.569070652 3.287253042
GENDER -0.042528527 0.049704509 -0.855627132 0.39654511 -0.142521101 0.057464048 -0.142521101 0.057464048
FIELD 0.011959152 0.050814341 0.235349934 0.814959604 -0.090266117 0.11418442 -0.090266117 0.11418442
CREDIT_NUM -0.002174139 0.007627351 -0.285045132 0.776861898 -0.017518391 0.013170112 -0.017518391 0.013170112
STUDY_TIME 0.131883442 0.020256904 6.510542905 4.52469E-08 0.091131808 0.172635076 0.091131808 0.172635076
WORK_TIME -0.072606923 0.014604922 -4.971401066 9.26569E-06 -0.101988235 -0.04322561 -0.101988235 -0.04322561

- Kiểm định hệ số hồi quy riêng tương tự như hồi quy đơn biến ta thấy

+ Với độ tin cậy 95%, ta thấy rằng P-value của STUDY_TIME và WORK_TIME
có giá trị nhỏ hơn 0.05, các biến còn lại lớn hơn 0.05

 Vậy nên thời gian tự học và thời gian đi làm thêm có tác động tới điểm GPA của
sinh viên.

+ Ta được phương trình hồi quy:

GPA = 2.9281 + 0.1318STUDY_TIME - 0.0726WORK_TIME

+ R Square = 0.9048 nên STUDY_TIME và WORK_TIME giải thích được 90.48%


sự biến động của GPA

+ Như vậy ta có thể thấy rằng hồi quy đa biến có thể giải thích được nhiều hơn sự
biến động của GPA so với hồi quy đơn biến.

You might also like