You are on page 1of 18

Bài 1 : Một hãng sản xuất ôtô tiến hành một nghiên cứu nhằm xác định xem

có sự khác nhau giữa tỷ lệ đàn ông v

Loại ô tô A B C
Phụ nữ 70 80 150
Nam giới 40 60 100

Với mức ý nghĩa ∝ =5%, ta cần phải đưa ra kết luận gì

Bài làm:
Dạng bài: Bài toán kiểm định giả thiết thống kê
Phương pháp giải: Gọi giả thiết H là tỉ lệ phụ nữ và nam giới chọn mua ô tô là như nhau
So sánh giải thiết H và ∝ =5% nếu tỉ lệ P > ∝ thì giả thiết H đúng
bằng cách dùng hàm CHITEST (Actual_range,Expected_range)
Công cụ giải: Excel
Bảng số liệu:

Loại ô tô A B C Tổng
Phụ nữ 70 80 150 300
Nam giới 40 60 100 200
Tổng 110 140 250 500

Tần số theo lí thuyết

Loại ô tô A B C
Phụ nữ 66 84 150
Nam giới 44 56 100

P= 0.58209271424
∝= 0,5

Kết luận: Vì P>∝ nên giả thiết H là đúng.Vậy tỉ lệ phụ nữ và nam giới chọn mua ô tô là như n
ự khác nhau giữa tỷ lệ đàn ông và đàn bà trong việc chọn mua các loại ôtô của hãng hay không. Kết quả thu được như sau

ua ô tô là như nhau
ả thiết H đúng
ected_range)

nam giới chọn mua ô tô là như nhau


u được như sau
Bài 2: Để xác định hiệu quả của một loại thức ăn phụ đối với sự tăng trọng của bò
người ta lấy ngẫu nhiên 8 con bò cùng trọng lượng chia thành hai nhóm, mỗ
một nhóm ăn bình thường, một nhóm cho ăn thêm thức ăn p

Nhóm ăn thêm thức ăn phụ (A)


330
360
400
350

Với mức ý nghĩa 5% hãy cho kết luận về tác dụng của loại thức ăn phụ đó,
biết rằng trọng lượng của bò là biến ngẫu nhiên phân phối chuẩn.
Với độ tin cậy 95% hãy ước lượng trọng lượng trung bình của

Bài làm:
Dạng bài: Kiểm định giả thiết về giá trị trung bình
Phương pháp giải: Bước 1: Tìm kết luận về tác dụng của loại thức ăn phụ
Gọi giả thiết H là trọng lượng trung bình của con bò ở nhóm A v
Sử dụng công thức t, phân phối Student qua bảng Date Analysis
Bước 2: Ước lượng trọng lượng trung bình của các con bò với m
Sử dụng công thức Tα và ε=(T_α.s)/√n qua bảng Descriptive Sta
Công cụ giải: Excel
Bảng số liệu:
Bước 1 Nhóm A 330 360
Nhóm B 290 320

t-Test: Two-Sample Assuming Equal Variances

Nhóm A Nhóm B
Mean 360 330
Variance 866.66666667 1133.3333333
Observations 4 4
Pooled Variance 1000
Hypothesized Mean Difference 0
df 6
t Stat 1.3416407865
P(T<=t) one-tail 0.1141290495
t Critical one-tail 1.9431802805
P(T<=t) two-tail 0.228258099
t Critical two-tail 2.4469118511

Kết luận: Vì t Stat < tα/2 (t Crititcal two-tail) nên giả thiết H là đúng
Vậy thức ăn phụ không có tác dụng lên trọng lượng của con bò
Bước 2

Nhóm A Nhóm B

Mean 360 Mean


Standard Error 14.719601444 Standard Error
Median 355 Median
Mode #N/A Mode
Standard Deviation 29.439202888 Standard Deviation
Sample Variance 866.66666667 Sample Variance
Kurtosis 1.5 Kurtosis
Skewness 0.9406609207 Skewness
Range 70 Range
Minimum 330 Minimum
Maximum 400 Maximum
Sum 1440 Sum
Count 4 Count
Confidence Level(95.0%) 46.84434123 Confidence Level(95.0%)

Kết luận: Trọng lượng trung bình của bò ở nhóm ăn thêm thức ăn phụ là
Trọng lượng trung bình của bò ở nhóm thức ăn bình thường là

Tổng kết: Vậy thức ăn phụ không có tác dụng lên trọng lượng của con bò
Trọng lượng trung bình của bò ở nhóm ăn thêm thức ăn phụ là
Trọng lượng trung bình của bò ở nhóm thức ăn bình thường là
chia thành hai nhóm, mỗi nhóm 4 con
m cho ăn thêm thức ăn phụ. Sau 6 tháng thu được kết quả sau:

Nhóm ăn thức ăn bình thường


290
320
340
370

n phối chuẩn.
ọng lượng trung bình của các con bò với mỗi loại thức ăn trên.

loại thức ăn phụ


nh của con bò ở nhóm A và B là như nhau
nt qua bảng Date Analysis, dùng t-Test Two-Sample Assuming Equal Variances
bình của các con bò với mỗi loại thứ ăn
n qua bảng Descriptive Statistics

400 350
340 370

n giả thiết H là đúng


n trọng lượng của con bò

Nhóm B

330
16.8325082306
330
#N/A
33.6650164612
1133.33333333
-0.160899654
0
80
290
370
1320
4
53.5685536271

m ăn thêm thức ăn phụ là 360±46,84434123


m thức ăn bình thường là 330±53,56855363

n trọng lượng của con bò


m ăn thêm thức ăn phụ là 360±46,84434123
m thức ăn bình thường là 330±53,56855363
Bài 3: Tính tỷ số tương quan của Y đối với X ,hệ số tương quan và hệ số xác định của tập số liệu sau đây.
Với mức ý nghĩa ∝= 5%, có kết luận gì về mối tương quan giữa X và Y (Có phi tuyến không ? Có tuyến
Tìm đường hồi quy của Y đối với X.
X 210 90 240 50 240
Y 255 115 255 35 275

Bài giải:
Dạng bài Bài toán kiểm định tương quan và hồi quy mẫu
Phương pháp giải: Bước 1: Phân tích tương quan tuyến tính
Dùng hộp thoại Data Analysis, chọn Corelation
Gọi giả thiết H: X và Y không có tương quan tuyến tính
Xác định hệ số tương quan r rồi tìm giá trị T theo công thức
T=

Sử dụng hàm TINV để tính c rồi so sánh |T| và c


Bước 2: Phân tích tương quan phi tuyến
Dùng hộp thoại Data Analysis, chọn Anova Single Factor
Gọi giả thiết H1: X và Y không có tương quan phi tuyến
Sử dụng công thức

So sánh F và c
Bước 3: Phân tích hồi quy (sử dụng bảng Regression)
Giả thiết H2: Hệ số không thích hợp
Công cụ giải: Excel
Bảng số liệu:

Bước 1 X Y
X 1
Y 0.974355760896983 1

Ta có n=15
Phân phối studen mức α=0,05 với bậc
c= 2.160369
Vì |T|>c nên bác bỏ H0
Kết luận: X và Y tương quan tuyến tính

Bước 2 X 50 90 130 170


Y 35 115 135 235
75 135 175 195
Anova: Single Factor

SUMMARY
Groups Count Sum Average Variance
50 2 110 55 800
90 2 250 125 200
130 2 310 155 800
170 2 430 215 800
210 3 785 261.6667 933.3333
240 2 530 265 200
270 2 670 335 800

ANOVA
Source of Variation SS df MS F
Between Groups 113626.666666667 6 18937.78 27.71382
Within Groups 5466.66666666667 8 683.3333

Total 119093.333333333 14

n=15, k=7, r^2 = 0,9493696147


Tổng bình phương giữa các nhóm SSF
Tổng bình phương nhân tố SST = 1190
(η^2)Y/X = SSF/SST = 0.963054187
F= 0.592653396
Phân bố Fisher mức α = 0,05 với bậc t
c= 3.687499
Vì F < C nên chấp nhận giả thuyết H 1
Kết luận: Vậy X và Y không có tương quan phi
Bước 3: X Y X
50 35 210
50 75 90
90 115 240
90 135 50
130 135 240
130 175 270
170 235 130
170 195 270
210 255 90
210 235 240
240 255 130
240 275 170
240 295 50
270 315 170
270 355 210
SUMMARY OUTPUT

Regression Statistics
Multiple R 0.974355760896983
R Square 0.949369148793139
Adjusted R Square 0.945474467931073
Standard Error 17.9461456238881
Observations 15

ANOVA
df SS MS
Regression 1 78506.5 78506.5
Residual 13 4186.834 322.0641
Total 14 82693.33

Coefficients Standard Error t Stat


Intercept 3.68338557993729 11.65588 0.316011
Y 0.811912225705329 0.052003 15.61283

RESIDUAL OUTPUT Y
400
Observation Predicted X Residuals
300
1 210.721003134796 -0.721003
200
2 97.0532915360502 -7.053292

X
3 210.721003134796 29.279 100
4 32.1003134796238 17.89969 0
0 50 100 1
5 226.959247648903 13.04075
6 259.435736677116 10.56426
7 113.291536050157 16.70846
8 291.912225705329 -21.91223
9 113.291536050157 -23.29154
10 243.197492163009 -3.197492
11 145.76802507837 -15.76803
12 194.48275862069 -24.48276
13 64.576802507837 -14.5768
14 162.006269592476 7.99373
15 194.48275862069 15.51724

Kết luận: Hệ số tự do không có ý nghĩa thống kê


Hệ số góc có ý nghĩa thống kê
Giá trị F < α => Bỏ giả thiết H
Phương trình đường hồi quy thích hợp
ập số liệu sau đây.
hi tuyến không ? Có tuyến tính không ?).

270 130 270 90 240 130 170 50


315 135 355 135 295 175 235 75

à hồi quy mẫu

ọn Corelation
ương quan tuyến tính
tìm giá trị T theo công thức

o sánh |T| và c
hi tuyến
ọn Anova Single Factor
tương quan phi tuyến

ng bảng Regression)
ợp

studen mức α=0,05 với bậc tự do n-2=13

nên bác bỏ H0
ơng quan tuyến tính

210 240 270


255 255 315
235 275 355
295
P-value F crit
6.18E-05 3.58058031976

, r^2 = 0,9493696147
phương giữa các nhóm SSF = 114693.33
phương nhân tố SST = 119093.33
= SSF/SST = 0.963054187

isher mức α = 0,05 với bậc tự do (k-2, n-k) = (5,8)

ên chấp nhận giả thuyết H 1


Y không có tương quan phi tuyến.
Y
255
115
255
35
275
315
135
355
135
295
175
235
75
195
235
F Significance F
243.76045 8.4153797E-10

P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%


0.7570106 -21.497612581 28.864383741 -21.497612581 28.864383741
8.415E-10 0.69956681669 0.9242576347 0.6995668167 0.9242576347

Y Line Fit Plot


400
300
200 X
X

Predicted X
100
0
0 50 100 150 200 250 300 350 400
Y
170 210
195 235
Bài 4: Hãy phân tích vai trò ngành nghề (chính, phụ) trong hoạt động kinh tế của các hộ gia đình ở một
vùng nông thôn trên cơ sở bảng số liệu về thu nhập của một số hộ tương ứng với các n

Nghề phụ
Nghề chính
Trồng lúa Trồng cây ăn quả Chăn nuôi Dịch vụ
Trồng lúa (1) 3.5:3.4:4.0 7.4:7.6:7.1 8.3:8.1:8.0 3.5:3.4:3.7
Trồng cây ăn quả (2) 5.6:5.2:5.8 4.1:4.4:3.9 6.1:6.4:5.8 9.6:9.7:9.2
Chăn nuôi (3) 4.1:4.4:3.8 2.5:2.5:2.7 1.8:1.6:1.4 2.1:2.3:2.0
Dịch vụ (4) 7.2:7.0:7.7 3.2:3.5:3.1 2.2:2.6:2.3 1.5:1.7:1.4

Bài làm:
Dạng bài: Bài toán phân tích phương sai hai yếu tố không lặp
Phương pháp giải: Giả thiết H: Các giá trị trung bình bằng nhau
Công cụ giải: Excel
Bảng số liệu:

Nghề phụ
Nghề chính
Trồng lúa Trồng cây ăn quả Chăn nuôi Dịch vụ
Trồng lúa (1) 3.63333333333 7.3666666666667 8.1333333333 3.53333333
Trồng cây ăn quả (2) 5.53333333333 4.1333333333333 6.1 9.5
Chăn nuôi (3) 4.1 2.5666666666667 1.6 2.13333333
Dịch vụ (4) 7.3 3.2666666666667 2.3666666667 1.53333333

Anova: Two-Factor Without Replication

SUMMARY Count Sum Average Variance


3.63333333333333 3 19.03333333333 6.34444444444445 6.0737037037
5.53333333333333 3 19.73333333333 6.57777777777778 7.37148148148
4.1 3 6.3 2.1 0.23444444444
7.3 3 7.166666666667 2.38888888888889 0.75148148148

Trồng cây ăn quả 4 17.33333333333 4.33333333333333 4.5


Chăn nuôi 4 18.2 4.55 9.57074074074
Dịch vụ 4 16.7 4.175 13.3047222222

ANOVA
Source of Variation SS df MS F P-value
Rows 53.54769 3 17.8492283950617 3.74738376802 0.07916186
Columns 0.283519 2 0.14175925925926 0.02976186619 0.97081903
Error 28.5787 6 4.76311728395061
Total 82.40991 11

Frows (Nghề chính)= < F0.05 nên chấp nhận giả thuyết H(nghề chính)
Fcol (Nghề phụ) < F0.05 nên chấp nhận giả thuyết H(Nghề phụ)

Kết luận : Vậy cả nghề chính và nghề phụ đều ảnh hưởng đến thu nhập
ia đình ở một
ố hộ tương ứng với các ngành nghề nói trên như sau(mức ý nghĩa 5 %):

F crit
4.757063
5.143253

You might also like