Professional Documents
Culture Documents
BÀI TẬP LỚN SỐ 5
BÀI TẬP LỚN SỐ 5
CÂU 1A
1. Đề bài:
Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3 yếu tố: pH
(A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:
Yếu tố B
Yếu tố A
B1 B2 B3 B4
A1 C1 9 C2 14 C3 16 C4 12
A2 C2 12 C3 15 C4 12 C1 10
A3 C3 13 C4 14 C1 11 C2 14
A4 C4 10 C1 11 C2 13 C3 13
Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng
2. Dạng bài: Phân tích phương sai 3 yếu tố
3. Cơ sở lý thuyết:
- Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của 2 yếu tố trên các giá trị
quan sát G (i=1, 2, ….r: yếu tố A; j=1, 2, ….r: yếu tố B; k=1, 2, ….r: yếu tố C).
- Mô hình:
Khi nghiên cứu ảnh hưởng của hai yếu tố, mỗi yếu tố có n mức, thì người ta dùng mô
hình vuông la tinh n x m. Ví dụ mô hình vuông la tinh 4 x 4.
B C D A
C D A B
D A B C
A B C D
Yếu tố Yếu tố B
A B1 B2 B3 B4 Ti
A1 C1 Y 111 C2 Y 122 C3 Y 133 C4 Y 144 T1
A2 C2 Y 212 C3 Y 223 C4 Y 234 C1 Y 211 T2
A3 C3 Y 313 C4 Y 324 C1 Y 334 C2 Y 342 T3
A4 C4 Y 414 C1 Y 421 C2 Y 412 C3 Y 443 T4
Ti T1 T2 T3 T4
Bảng ANOVA
Nguồn Bình phương trung Giá trị
Bậc tự do Tổng số bình phương
sai số bình thống kê
Yếu tố Ti...2 T...2
r SSR MSR
A ( r 1) SSR 2 MSR FR
i 1 r r (r 1) MSE
(hàng)
Yếu tố r T j2... T...2 SSC MSC
B ( r 1) SSC MSC FC
j 1 r r2 ( r 1) MSE
(cột)
Yếu tố r
Tk2... T...2 SSF MSF
( r 1) SSF 2 MSF F
C k 1 r r (r 1) MSE
SSE
Sai số (r 1).(r 2) SSE SST ( SSF SSR SSC ) MSE
(r 1)(r 2)
Tổng T...2
(r 2 1) SST Yijk2
cộng i j k r2
Trắc nghiệm
- Giả thiết:
H 0 : 1 2 ....k “Các giá trị trung bình bằng nhau”
H1 : i j
“Có ít nhất hai giá trị trung bình khác nhau”
H 2 : Hiệu suất phản ứng trung bình của các phản ứng không phụ thuộc vào nhiệt độ (Yếu
tố nhiệt độ không ảnh hưởng đến hiệu suất phản ứng trung bình).
H 2 : Tồn tại 2 nhiệt độ có hiệu suất phản ứng trung bình khác nhau.
H 3 : Hiệu suất phản ứng trung bình của các phản ứng không phụ thuộc vào chất xúc tác
(Yếu tố chất xúc tác không ảnh hưởng đến hiệu suất phản ứng trung bình).
H 3 : Tồn tại 2 chất xúc tác có hiệu suất phản ứng trung bình khác nhau.
Bước 5: Đưa biến Hieusuatphanung vào khung Dependent Variable; đưa các biến pH,
Nhietdo và Chatxuctac vào khung Fixed Factor(s).
Bước 6: Chọn Model → Build terms → đưa các biến pH, Nhietdo và Chatxuctac vào
khung Model → Continue.
Bước 7: Chọn Options, nhập mức ý nghĩa ở ô Significance level = 0,05 → Continue.
Bước 8: Kết quả và biện luận.
r 1 ; r 1 r 2 3; 6
Dò bảng phân phối Fischer ở mức ý nghĩa 5% với bậc tự do
ta được F0.05 (3;6) 4, 76 ( dò bảng VIII trang 201 Giáo trình với n1 3; n2 6 )
Bảng Test of Between-Subjects Effects cho ta kết quả:
FR FpH 3,105
FC FNhietdo 11,947
F FChatxuctac 30, 053
CÂU 1B
1. Đề bài:
Người ta đã dùng ba mức nhiệt độ gồm 105, 120, 135℃ kết hợp với ba khoảng thời gian
là 15, 30 và 60 phút để thực hiện một phản ứng tổng hợp. Các hiệu suất của phản ứng (%)
được trình bày trong bảng sau đây:
Thời gian (phút) Nhiệt độ (℃) Hiệu suất (%)
X1 X2 Y
15 105 1.87
30 105 2.02
60 105 3.28
15 120 3.05
30 120 4.07
60 120 5.54
15 135 5.03
30 135 6.45
60 135 7.26
Hãy cho biết yếu tố nhiệt độ và/hoặc yếu tố thời gian có liên quan tuyến tính với hiệu
suất của phản ứng tổng hợp? Nếu có thì điển kiện nhiệt độ 115℃ trong vòng 50 phút thì
hiệu suất phản ứng sẽ là bao nhiêu?
X i (i = 1, 2,...k). Đồ thị phân tán giữa các biến là một gợi ý cho chúng ta loại hàm số
toán học thích hợp để mô tả và tóm tắt các dữ liệu quan sát.
Phương trình tổng quát: X0 ,X1 ,..., X k B0 B1 X 1 B1 X 1 ... Bk X k
Y
Bảng ANOVA:
n 2
MSR
Hồi quy k SSR Yi ' Y ' MSR SSR F
i 1 MSE
SSR Y Y
n 2
Sai số N k 1 i
'
MSE SSE / ( N 2)
i 1
Tổng cộng N 1
N k 1 ( N k 1)
2
( Rii sẽ trở nên âm hay không xác định nếu R hay N nhỏ )
2
Độ lệch chuẩn:
SSE
S
( N k 1) ( S 0,30 là khá tốt)
Trắc nghiệm thống kê:
Đối với một phương trình hồi quy YX B0 BX , ý nghĩa thống kê của các hệ số Bi ( B0
hay B ) được đánh giá bằng trắc nghiệm t (phân phối Student) trong khi tính chất thích
hợp của phương trình YX f ( X ) được đánh giá bằng trắc nghiệm F (phân bố Fischer).
Trắc nghiệm t:
- Giả thiết:
H 0 : i 0 “Các hệ số hồi quy không có ý nghĩa”
Phân bố Student N k 1
t t N k 1
- Biện luận: Nếu →Chấp nhận giả thiết H 0
Trắc nghiệm F
- Giả thiết:
H 0 : i 0 “Phương trình hồi quy không thích hợp”.
MSR
F
- Giá trị thống kê: MSE
Phân bố Fischer v1 k , v2 N k 1
- Biện luận:
+ Tìm phương trình YX 1 f ( X 1 ) , ta đưa biến phụ thuộc Y vào ô Dependent, biến độc lập
X1, vào ô Independent(s).
+ Tìm phương trình YX 2 f ( X 2 ) , ta đưa biến phụ thuộc Y vào ô Dependent, biến độc lập
X2, vào ô Independent(s).
Y f (X , X )
+ Tìm phương trình X , X 1 2 1 2
, ta đưa biến phụ thuộc Y vào ô Dependent, biến
độc lập X1, X2 vào ô Independent(s).
Bước 6: Chọn Statistics → click chọn R squared change và Descriptives…→Continue
Với mức ý nghãi mặc định là 0,05 chọn OK.
Bước 7: Vẽ đồ thị: trong cửa sổ Output chọn Graphs → Legacy Dialogs → Scatter/Dot...
→ Simple Scatter →Define
Bước 8: Chọn biến tương ứng hai trục X, Y→OK
Bước 9: Kết quả và biện luận:
F = 1,908 < F0,05 = 5,59 (Hay Sig. = 0,21 > 𝛼 = 0,05) → Chấp nhận giả thiết H 0
Kết luận:
- Vậy các hệ số 2,37(B0); 0,045(B1) của phương trình hồi quy YX 1 2, 73 0, 045 X 1 đều
không có ý nghĩa thống kê.
- Phương trình hồi quy không thích hợp.
- Yếu tố thời gian không có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp.
F = 22,598 > F0,05 = 5,59 (Hay Sig.= 0,002 < 𝛼 = 0,05) → Bác bỏ giả thiết H 0
Kết luận:
- Vậy các hệ số -11,14 (B0); 0,13 (B1) của phương trình hồi quy YX 2 11,14 0,13 X 2
đều có ý nghĩa thống kê.
- Phương trình hồi quy này thích hợp.
- Yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp.
YX1 , X 2 f ( X 1 , X 2 )
*Phương trình hồi quy:
Dựa vào bảng Coefficientsa, cột B ta xác định được các hệ số: B0 12, 70 và B1 0, 045
và B2 0,13
Suy ra phương trình hồi quy:
YX1 , X 2 12, 70 0,045 X 1 0,13 X 2 R 2 0,97; S 0,3299
Dò bảng phân phối Fischer ở mức ý nghĩa 5% với bậc tự do (2; N-k-1) = (2; 6) (N = 9 và
k = 2 là số biến độc lập), ta được F0.05(2;6) = 5,14
Dò bảng phân phối Student ở mức ý nghĩa 5% với bậc tự do (N-k-1) = 6 (N = 9 và k = 2
là số biến độc lập), ta được t0.025 = 2,447
t0 = 11,519 > t0,025 = 2,447 (Hay Sig.= 0,000026 < 𝛼 = 0,05) → Bác bỏ giả thiết H
t1 =7,582 > t0,025 = 2,447 (Hay Sig. = 0,000274 < 𝛼 = 0,05) → Bác bỏ giả thiết H
t2 =14,328 > t0,025 = 2,447 (Hay Sig. = 0,000007 < 𝛼 = 0,05) → Bác bỏ giả thiết H
F = 131,204 > F0,05 = 5,14 (Hay Sig.= 0,000011 < 𝛼 = 0,05) → Bác bỏ giả thiết H 0
Kết luận:
- Vậy các hệ số -12,70 (B0); 0,045 (B1); 0,13 (B2) của phương trình hồi quy
H1 : Tồn tại 2 giống bò có phân bố tỷ lệ không như nhau về phương diện sản lượng sữa.
Kết quả:
Bước 3: Lập bảng tần số lý thuyết:
doanh. H 1 : Tồn tại 2 ngành nghề kinh doanh có doanh thu trung bình của các cửa hàng
khác nhau.
H 2 : Doanh thu trung bình của các cửa hàng không phụ thuộc vào khu vực kinh doanh.
H 2 : Tồn tại 2 khu vực kinh doanh có doanh thu trung bình của các cửa hàng khác nhau.
H 3 : Không có sự tương tác giữa ngành nghề kinh doanh và khu vực kinh doanh lên
doanh thu trung bình.
H 3 : Có sự tương tác giữa ngành nghề kinh doanh và khu vực kinh doanh lên doanh thu
trung bình.
Bước 2: Nhập bảng số liệu:
Bước 3: Chọn Data → Data Analysis → Anova: Two-Factors With Replication
Bước 4: Input range: quét vùng số liệu, Row pers sample: nhập 4, Anpha: 0,05, Ouput
range: chọn địa chỉ ô cần xuất dữ liệu → OK
Bước 5: Kết quả và biện luận:
FSample = 2,8929 < Fcrit = 3,2594→ Chấp nhận giả thiết H1
FColumns = 0,8189 < Fcrit = 2,8663→ Chấp nhận giả thiết H2
FInteraction = 0,6498 < Fcrit = 3,3638→ Chấp nhận giả thiết H3
Bước 6: Kết luận:
- Doanh thu trung bình của các cửa hàng không phụ thuộc vào ngành nghề kinh doanh.
- Doanh thu trung bình của các cửa hàng không phụ thuộc vào khu vực kinh doanh.
- Không có sự tương tác giữa ngành nghề kinh doanh và khu vực kinh doanh lên doanh
thu trung bình.
CÂU 4
1. Đề bài:
Một nhóm gồm 105 nhà doanh nghiệp Mỹ được phân loại căn cứ theo thu nhập hàng năm và
tuổi của họ. Kết quả thu được như sau:
Thu nhập
Tuổi
Dưới 100 000 $ Từ 100 000 $ - 399 599 $ Trên 400 000 $
Dưới 40 6 9 5
Từ 40 đến 54 18 19 8
Trên 54 11 12 17
Với mức ý nghĩa 1%, kiểm định giả thiết cho rằng tuổi và mức thu nhập có quan hệ với
nhau hay không?
2. Dạng bài: Kiểm định tính độc lập.
3. Cơ sở lý thuyết:
4. Giải toán bằng phần mềm EXCEL
Bước 1: Đặt giả thiết:
H 0 : Tuổi và mức thu nhập độc lập với nhau.
Kết quả:
Bước 3: Lập bảng tần số lý thuyết:
H 1 : Tồn tại 2 ngày khải sát có lượng báo bán ra trung bình khác nhau.
H 2 : Lượng báo bán ra trung bình giữa các quận nội thành là bằng nhau.
H 2 : Tồn tại 2 quận nội thành có lượng báo bán ra trung bình khác nhau.
Bước 3: Input range: quét vùng số liệu, chọn Labels, Anpha: 0,01, Ouput range: chọn địa
chỉ ô cần xuất dữ liệu → OK
Bước 5: Kết quả và biện luận:
FRows = 3,5672 < Fcrit = 4,1027→ Chấp nhận giả thiết H1
FColumns = 2,4748 < Fcrit = 4,4307→ Chấp nhận giả thiết H2
Bước 6: Kết luận:
- Lượng báo bán ra trung bình không chịu tác động của yếu tốt các ngày trong tuần.
- Lượng báo bán ra trung bình giữa các quận nội thành là như nhau. (không khác nhau).