Professional Documents
Culture Documents
Nếu Eij ≥ 5 với mọi ij thì có thể sử dụng tiêu chuẩn χ2 và ngược lại.
Gỉa thuyết H: phân bố tỉ lệ chết vì ung thư của 3 nước là như nhau.
*Công cụ giải:
Dùng hàm SUM để tính tổng các hàng và các cột.
Áp dụng hàm CHITEST để tính tần số lý thuyết.
*Bảng số liêu nhập vào:
Nước
Chỗ ung thư
Mỹ Nhật Anh
Ruột 11 5 5
Ngực 15 3 7
Dạ dày 3 22 3
Bộ phận khác 41 30 15
Tính tổng các hàng va cột ta được:
Nước
Chỗ ung thư Tổng hàng
Mỹ Nhật Anh
Ruột 11 5 5 21
Ngực 15 3 7 25
Dạ dày 3 22 3 28
Bộ phận khác 41 30 15 86
Tổng cột 70 60 30 160
Dựa vào công thức tính tần số lý thuyết ta có bảng:
Nước
Chỗ ung thư
Mỹ Nhật Anh
Ruột 9.1875 7.875 3.9375
Ngực 10.9375 9.375 4.6875
Dạ dày 12.25 10.5 5.25
Bộ phận khác 37.625 32.25 16.125
Dùng ham CHITEST để tính tần số lý thuyết:
Gía trị P là 4.364013E-05
*Kết luận:
Không thể dùng tiêu chuẩn χ2 vì các tần số trên có số bé hơn 5.
Vì P(χ>χ2)= 4.364013E-05 <0.01 nên bác bỏ giả thiết H vì vậy phân bố tỉ lệ chết vì ung
thư của 3 nước là khác nhau.
Câu 2: Để thử nghiệm hiệu quả của một loại thuốc trừ sâu người ta áp dụng thử loại thuốc này đối
với 5 thửa ruộng đang bị sâu phá hoại. Số lượng sâu bắt được trước và sau khi dùng lại thuốc trừ
sâu nói trên được cho ở bảng sau:
Thửa ruộng Trước khi phun thuốc Sau khi phun thuốc
1 109 100
2 68 52
3 82 70
4 104 91
5 93 77
Với độ tin cậy 95% hãy ước lượng số sâu trung bình trước và sau khi dùng thuốc. Với mức ý nghĩa
5% hãy cho biết ý kiến về tác dụng của loại thuốc trừ sâu này. Gỉa sử số lượng sâu tại mỗi thửa
ruộng có phân phối chuẩn.
BÀI LÀM:
Phần 1: Với độ tin cậy 95% hãy ước lượng số sâu trung bình trước và sau khi dùng thuốc.
*Dạng bài: Ước lượng trung bình.
*Phương pháp giải: Tính số sâu trung bình trước và sâu khi dùng thuốc 𝑥 ̅ và độ chênh lệch ɛ.
Khoảng ước lượng lượng sâu: 𝑥 ̅±𝜀
*Công cụ giải: Mở Data Analysis chọn Descriptive Statistics.
Bảng số liệu:
Thửa ruộng Trước khi phun thuốc Sau khi phun thuốc
1 109 100
2 68 52
3 82 70
4 104 91
5 93 77
Hộp thoại Descriptive Statistics xuất hiện:
Input Ranger: Phạm vi đầu vào (từ ô C20 đến ô D25).
Grouped By: Nhóm dữ liệu theo hàng hoặc cột (chọn cột).
Labels in first row: Nhãn ở hàng đầu tin (Chọn).
Output Range: phạm vi dữ liệu đấu ra (ô B34);
Sumary statistics: chọn.
Confidence Level for Mean: chọn 95.
Ta có bảng kết qua:
Trước khi phun thuốc Sau khi phun thuốc
Dùng bảng phân phối Student mức α=0.05 với bậc tự do n-2=13 suy ra giá trị c.
Nếu |T|<c thì chấp nhận H.
Và |T|≥c thì bác bỏ H.
*Công cụ giải: Mở Data Analysis chọn Correlation.
Bảng số liệu:
X 5 8 10 15 22
Y 6 15 20 30 39
Hộp thoại Correlation xuất hiện.
Input Range: Phạm vi đầu vào (từ ô A22 đến ô P23).
Grouped By: Nhóm dử liệu theo hàng hoặc cột (Chọn hàng).
Lables in first column: Nhãn ở cột đầu tiên (chọn).
Output Range: Phạm vi dữ liệu xuất ra (ô A30).
Ta có bảng kết quả:
X Y
X 1
Y 0.951997054 1
*Kết luận:
Hệ số tương quan r = 0.95199705404
Hệ số xác định r2 = 0.9062983909
Giá trị T = 11.213308127
Phân phối Student mứa α = 0.05 với bậc tự do n-2=13: c= 2.1603686565
Vì |T| > c nên bác bỏ giả thuyết H1 suy ra X và Y có tương quan tuyến tính.
Phân tích tương quan phi tuyến:
*Phương pháp giải:
Đặt giả thuyết H2: X và Y không tương quan phi tuyến.
Tính giá trị F (giá trị quan sát theo công thức):
F=
Dùng bảng phân phố Fisher mức α = 0.05 với bậc tự do (k-2,n-k)=(3,10) suy ra c.
Nếu F>c thì bác bỏ giả thuyết H2.
Nếu F<c thì châp nhận giả thuyến H2.
*Công cụ giải: Mở Data Analysis chọn Anova Single Factor
Sắp xếp lại bảng giá trị:
X 5 8 10 15 22
Y 6 15 20 30 39
4 11 18 28 33
4 13 22 33 36
Hôp thoại Anova Single Factor xuất hiện:
Input Ranger: Phạm vi đầu vào (từ ô B52 đến ô F55).
Grouped By: Nhóm dữ liêu theo hàng hoặc cột (chọn cột).
Labels in first column: Nhãn ở cột đầu tiên (chọn).
Alpaha: Gía trị α (0.05).
Output Range: Phạm vi xuất hiện ra (ô A63).
Ta có bảng kết quả:
Anova: Single Factor
SUMMARY
Groups Count Sum Average Variance
5 3 14 4.666667 1.33333333
8 3 39 13 4
10 3 60 20 4
15 3 91 30.33333 6.33333333
22 3 108 36 9
ANOVA
Source of Variation SS df MS F P-value
Between Groups 1931.0666667 4 482.7667 97.8581081 5.6360983E-08
Within Groups 49.333333333 10 4.933333
Total 1980.4 14
*Kết luận:
n=15, k=5.
Tổng bình phương giữa các nhóm SSF = 1931.067
Tổng bính phương nhân tố SST= 1980.4
Tỷ số tương quan của Y đối với X: η2Y/X = SSF/SST = 0.97508921
Gía trị F = 9.204954955
Phân bố Fisher mức α = 0.05 với bậc tự do (k-2,n-k)=(3,10) c= 3.708264819
Vì F>c nên bác bỏ giả thuyết H2 suy ra có tương quan phi tuyến.
Phân tích đường hồi quy:
*Phương pháp giải:
Đặt giả thuyết H3: Hệ số không thích hợp.
*Công cụ giải: Mở Data Analysis chọn Regression.
Sắp xếp lại bảng giá trị:
X Y
5 6
8 15
10 20
15 30
22 39
5 4
8 11
10 18
15 28
22 33
5 4
8 13
10 22
15 33
22 36
Hộp thoại Analysis chọn Regression.
Input X Range: Phạm vi đầu vào (từ ô B94 đến ô B108).
Input Y Range: Phạm vi đầu ra (từ ô C94 đến ô C108).
Labels: nhãn (chọn).
Line Fit Plots: vẽ đồ thị (chọn).
Output Ranger: phạm vi dữ liệu xuất ra (ô A116).
Ta có bảng kết quả:
SUMMARY OUTPUT X Line Fit Plot
50
Regression Statistics 40
Multiple R 0.951997054 30 Y
20 Predi
Y
R Square 0.9062983909
10
Adjusted R Square 0.8990905748
0
Standard Error 3.778142265 4 6 8 10 12 14 16 18 20 22 24
Observations 15 X
ANOVA
df SS MS F Significance F
Regression 1 1794.83333333 1794.833 125.738279 4.6923966E-08
Residual 13 185.566666667 14.27436
Total 14 1980.4
Coefficients Standard Error t Stat P-value Lower 95%
Intercept -1.2 2.19109316849 -0.54767 0.59319636 -5.9335690046
X 1.8333333333 0.16349620581 11.21331 4.6924E-08 1.4801212548
RESIDUAL OUTPUT
5 8 10 15 22 5 8 10
4 11 18 28 33 4 13 22
thu (đơn vị là nghìn USD). Tính tỷ số
rên. Với mức ý nghĩa α = 5%, có kết luận
ìm đường hối quy tuyến tính của Y đối
5 8 10 15 22 5 8 10
4 11 18 28 33 4 13 22
F crit
3.4780496908
X Line Fit Plot
Y
Predicted Y
10 12 14 16 18 20 22 24
X
Upper 95% Lower 95.0% Upper 95.0%
3.5335690046 -5.9335690046 3.5335690046
2.1865454118 1.4801212548 2.1865454118
15 22
33 36
Câu 4: Sau đây là số liệu về số lượng một loại báo ngày bán được ở 5 quận nội thành:
Quận nội thành
Ngày khảo sát
Q1 Q2 Q3 Q4 Q5
Thứ hai 22 18 22 18 18
Thứ ba 21 18 22 18 19
Thứ tư 25 25 25 19 20
Thứ năm 24 24 18 20 22
Thứ sáu 28 19 15 22 25
Thứ bảy 30 22 28 25 25
Lượng báo bán ra được ở 5 quận có khác nhau thực sự không? Lượng báo bán ra có chịu tác đông của yếu tố ngày
trong tuần không? Chọn α = 15%.
BÀI LÀM:
*Dạng bài: kiềm định trung bình.
*Phương pháp giải: Phân tích phương sai hai yêu tố không lặp.
Đặt giả thuyết H: Các giá trị trung bình bằng nhau.
*Công cụ giải:
Sử dụng bảng số liệu:
Quận nội thành
Ngày khảo sát
Q1 Q2 Q3 Q4 Q5
Thứ hai 22 18 22 18 18
Thứ ba 21 18 22 18 19
Thứ tư 25 25 25 19 20
Thứ năm 24 24 18 20 22
Thứ sáu 28 19 15 22 25
Thứ bảy 30 22 28 25 25
Mở Data Analysis chọn Anova: Two-Factor Without Replication.
Hộp thoại Anova: Two-Factor Without Replication xuất hiện.
Input Range: Phạm vi đầu vào (từ ô B19 đến ô G25).
Lables: Nhãn (Chọn).
Alpha: Hệ số α = 0.15.
Output Range: Phạm vi dữ liệu xuât ra (ô B33).
Ta có bảng kết quả:
Anova: Two-Factor Without Replication
Q1 6 150 25 12
Q2 6 126 21 9.6
Q3 6 130 21.66667 21.86667
Q4 6 122 20.33333 7.466667
Q5 6 129 21.5 9.1
ANOVA
Source of Variation SS df MS F P-value F crit
Rows 141.5 5 28.3 3.567227 0.018135 1.843305
Columns 78.53333 4 19.63333 2.47479 0.077317 1.899151
Error 158.6667 20 7.933333
Total 378.7 29
*Kết luận:
FC = 2.47479 > Fα = 1.899151 nên ta bác bỏ giả thuyết H. Gía trị trung bình lượng báo bán ở 5 quận là khác nhau.
FR = 3.567227 > Fα = 1.843305 nên ta bác bỏ giả thuyết H. Vậy lượng báo bán ra chịu tác động của yếu tố ngày tron
Suy ra: Lượng báo bán được ở 5 quận là khác nhau.
Lượng báo bán ra chịu tác động của yếu tố ngày trong tuần.
đông của yếu tố ngày
ở 5 quận là khác nhau.
động của yếu tố ngày trong tuần.