You are on page 1of 4

Môn học: Thống kê trong kinh tế và kinh doanh

Câu 1:
1. Định tính: vì các giá trị mang tính phân loại
- ID (mã hành khách)
- Survival (tình trạng sống/chết)
- Pclass (hạng khách)
- Name (tên hành khách)
- Sex (giới tính)
- Embarked (cảng lên tàu)
2. Định lượng: các giá trị có thể sử dụng để thực hiện các phép toán
- Age (tuổi)
- SibSp (số lượng người thân ở nước ngoài)
- Parch (số lượng bố mẹ/con cái ở nước ngoài)
- Fare (giá vé, đơn vị: bảng Anh)

Câu 2:
Bảng tần suất và tần số của Giới tính (Sex)
Giới tính
Male Female

Tần số 29 21

Tần suất % 58% 42%

 Nhận xét: Khách hàng chủ yếu là nam (chiếm đến 58%)

Câu 3: Thống kê mô tả cho biến SibSp


SibSp
Tham số đặc trưng Giá trị
Mean 0,38
Standard Error 0,1172
Median 0
Mode 0
Standard Deviation 0,8303
Sample Variance 0,6894
Kurtosis 19,3769
Skewness 3,8531
Range 5
Minimum 0
Maximum 5
Sum 19
Count 50
Các tham số đo độ trung tâm:
+ Số người thân ở nước ngoài trung bình (Mean) là 0,38 người
+ Trung vị (Median) của số người thân ở nước ngoài là 0.
+ Mốt (Mode) của số người thân ở nước ngoài: 0
Các tham số đo độ phân tán:
+ Phương sai (Sample Variance) số người thân ở nước ngoài: 0,6894 (người2)
+ Độ lệch chuẩn (Standard Deviation) số người thân ở nước ngoài: 0,8303 (người)
+ Hệ số biến thiên: CV = độ lệch chuẩn/ số người thân trung bình = 0,8303/0,38 =
2,185
Hình dạng phân phối:
+ Hệ số bất đối xứng (skewness) là 3,8531> 0 nên phân phối có hình dạng lệch phải.
+ Hệ số nhọn (kurtosis) là 19,3769> 0 nên phân phân phối nhọn hơn so với phân phối
chuẩn có cùng độ lệch.
+ Mean > Median = Mode: Phân phối lệch phải
Câu 4:
Bảng các đại lượng thống kê mô tả của biến định lượng (Fare) theo nhóm của
biến định tính (Survival)
Còn sống Không còn
Tham số
(1) sống (0)
Mean 46,010 23,348
Standard Error 7,292 6,037
Median 26,288 8,663
Mode 26 8,050
Standard Deviation 33,416 32,509
Sample Variance 1116,652 1056,845
Kurtosis -1,337 9,549
Skewness 0,460 3,014
Range 98,675 144,504
Minimum 7,750 7,046
Maximum 106,425 151,550
Sum 966,208 677,104
Count 21 29
 Nhận xét:
+ Giá vé trung bình của các hành khách còn sống cao hơn so với nhóm các
hành khách không còn sống (46,010 > 23,348)
+ Độ lệch chuẩn của giá vé của các hành khách còn sống cao hơn so với nhóm
các hành khách không còn sống (33,416 > 32,509)
Câu 5:
Tuổi (Age) là biến độc lập X và Giá vé (Fare) là biến phụ thuộc Y
a) Mô hình hồi quy mẫu có dạng: y = b0 + b1 x
Standard P-
Coefficients t Stat Lower 95% Upper 95%
Error value
Intercept 30,6706 11,1798 2,7434 0,0085 8,1922 53,149
Age 0,0709 0,3241 0,2187 0,8278 -0,5808 0,7226
Vậy mô hình hồi quy mẫu: y = 30,6706 + 0,0709x
Ý nghĩa các hệ số:
+ Hệ số chặn b0 = 30,6706 thể hiện sự tác động tổng hợp của các yếu tố khác
(không phải tuổi) đến giá vé. Khi không xem xét đến tuổi thì giá vé trung bình là
30,6706 bảng Anh.
+ Hệ số góc b1 = 0,0709 thể hiện sự tác động của tuổi đến giá vé. Khi tuổi tăng
lên 1 đơn vị thì giá vé tăng trung bình 0,0709 bảng (ngược lại).
b) Kiểm định
+ Giả thuyết Ho: Mô hình hồi quy không phù hợp (R2 = 0)
+ Giải thuyết đối H1: Mô hình hồi quy có phù hợp (R2 > 0)
ANOVA
df SS MS F Significance F
Regression 1 57,9283 57,9283 0,0478 0,8278
Residual 48 58121,7422 1210,8696
Total 49 58179,6704
p-value = 0,8278 > 0,05 nên với mức ý nghĩa 5% thì ta chưa đủ cơ sở bác bỏ Ho. Vậy
mô hình hồi quy là không phù hợp.

c)
Regression Statistics
Multiple R 0,03155
R Square 0,001
Adjusted R Square -0,01982
Standard Error 34,79755
Observations 50
- Giá trị R2 được gọi là hệ số xác định, giải thích được X ảnh hưởng bao nhiêu %
đến sự thay đổi của Y, còn lại là những yếu tố khác
- R2 = 0,001 do đó sự thay đổi của tuổi hành khách chỉ giải thích được 1% sự
thay đổi của giá vé.

You might also like