BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: GS.

TS NGUYỄN ĐÌNH HUY

THÁI QUANG THỊNH – G1003223 1
BÀI 1:
Câu 1:(Ví dụ 3.4/207/Giáo trình XSTK – GS-TS Nguyễn Đình Huy)
Hiệu suất phần trăm (%) của một phản ứng hoá học được nghiên cứu theo ba yếu tố pH
(A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau:

Yếu tố
A
Yếu tố B
B1 B2 B3 B4
A1 C1 9 C2 14 C3 16 C4 12
A2 C2 12 C3 15 C4 12 C1 10
A3 C3 13 C4 14 C1 11 C2 14
A4 C4 10 C1 11 C2 13 C3 13

Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng?
Giảis
DẠNG TOÁN:
Phân tích phương sai ba yếu tố.
CƠ SỞ LÝ THUYẾT:
Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của ba yếu tố trên các
giá trị quan sát G (i = 1, 2... r: yếu tố A; j = 1, 2... r: yếu tố B; k = 1, 2... r: yếu tố C)
Mô hình
Khi nghiên cứu ảnh hưởng của 2 yếu tố, mỗi yếu tố có n mức, thì người ta dùng
mô hình vuông latinh nn. Ví dụ như mô hình vuông latinh 44:

B C D A
C D A B
D A B C
A B C D

Mô hình vuông latinh 3 yếu tố được trình bày như sau:
Yếu tố C (T..k. ví dụ: T...1 = Y111 + Y421 + Y334 + Y241)

BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: GS.TS NGUYỄN ĐÌNH HUY

THÁI QUANG THỊNH – G1003223 2
Bảng ANOVA
Nguồn sai
số
Bậc tự do Tổng số bình phương
Bình phương trung
bình
Giá trị
thống kê
Yếu tố A
(hàng)
(r – 1) ∑

Yếu tố B
(cột)
(r – 1) ∑

Yếu tố C (r – 1) ∑

Sai số (r -1)(r -2)
SSE = SST - (SSF + SSR +
SSC)

Tổng cộng (r
2
– 1)
∑∑∑
ij

Trắc nghiệm
Giả thiết:
H
0
: µ
1
= µ
2
= ….= µ
k
“Các giá trị trung bình bằng nhau”
H
1
: µ
i
≠ µ
j
 “Có ít nhất hai giá trị trung bình khác nhau”
Giá trị thống kê: Ġ và Ġ
Biện luận:
- Nếu Ġ (chấp nhận H
0
(yếu tố A))
- Nếu Ġ (chấp nhận H
0
(yếu tố B))
- Nếu Ġ (chấp nhận H
0
(yếu tố C))
ÁP DỤNG MS-EXCEL
Nhập dữ liệu vào bảng tính

 Thiết lập một số biểu thức và tiến hành tính toán:
Tnh cc gi trị Titổng theo hng t B ến E
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: GS.TS NGUYỄN ĐÌNH HUY

THÁI QUANG THỊNH – G1003223 3
- Chọn ô B7 và nhập biểu thức=SUM(B2:E2)
- Chọn ô C7 và nhập biểu thức =SUM(B3:E3)
- Chọn ô D7 và nhập biểu thức =SUM(B4:E4)
- Chọn ô E7 và nhập biểu thức =SUM(B5:E5)
Tnh cc gi trị Tjtổng theo cột t hng thứ ến hng thứ
- Chọn ô B8 và nhập biểu thức =SUM(B2:B5)
- Dùng con tr ko kí hiệu tự điền t ô B8 đến ô E8
Tnh cc gi trị Tk
- Chọn ô B9 và nhập biểu thức =SUM(B2,C5,D4,E3)
- Chọn ô C9 và nhập biểu thức =SUM(B3,C2,D5,E4)
- Chọn ô D9 và nhập biểu thức =SUM(B4,C3,D2,E5)
- Chọn ô E9 và nhập biểu thức =SUM(B5,C4,D3,E2)
Tnh gi trị Ttổng cc phần t trong bảng
- Chọn ô B10 và nhập biểu thức=SUM(B2:E5)
Tnh cc gi trị Ġ v Ġ
o Cc gi trị Ġ v Ġ
- Chọn ô G7 và nhập biểu thức =SUMSQ(B7:E7)
- Dùng con tr ko kí hiệu tự điền t ô G7 đến ô G9
o Gi trị Ġ
- Chọn ô G10 và nhập biểu thức =POWER(B10,2)
o Gi trị Ġ
- Chọn ô G11 và nhập biểu thức =SUMSQ(B2:E5)
Tnh cc gi trị SSSSCSSFSST v SSE
o Cc gi trị SSSSC v SSF
o Giá trị SSR
- Chọn ô I7 và nhập biểu thức =G7/4-39601/POWER(4.2)
- Dùng con tr ko kí hiệu tự điền t ô I7 đến ô I9
o Gi trị SST
- Chọn ô I11 và nhập biểu thức =G11-G10/POWER(4.2)
o Gi trị SSE
- Chọn ô I10 và nhập biểu thức =I11-SUM(I7:I9)
Tnh cc gi trị SSCSF v SE
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: GS.TS NGUYỄN ĐÌNH HUY

THÁI QUANG THỊNH – G1003223 4
o Cc gi trị SSC v SF
- Chọn ô K7 và nhập biểu thức=I7/(4-1)
- Dùng con tr ko kí hiệu tự điền t ô K7 đến ô K9
o Gi trị SE
- Chọn ô K10 và nhập biểu thức =I10/((4-1)*(4-2))
o Tnh cc gi trị F FC v F
- Chọn ô M7 và nhập biểu thức =K7/K10
- Chọn ô M8 và nhập biểu thức =K8/K10
- Chọn ô M9 và nhập biểu thức =K9/K10
Ta được:

 ết quả v biện luận:
o F
R
=3.11<F
0.05
(3.)= 4. =chấp nhận H
0
(pH)
o F
C
=11.95> F
0.05
(3.) = 4. =bác b H
0
(nhiệt độ)
o F =30.05 > F
0.05
(3.6) = 4.76 =bác b H
0
(chất xúc tác)
Kết luận:Vậy ch c nhiệt độ và chất xúc tác ảnh hưởng đến hiệu suất.

Câu 2:(Ví dụ 4.2/216/Giáo trình XSTK – GS-TS Nguyễn Đình Huy)
Người ta đã dùng 3 mức nhiệt độ gồm 105, 120, 135
o
C kết hợp với 3 khoảng thời
gian là 15, 30 và 0 phút để thực hiện một phản ứng tổng hợp. Các hiệu suất phản
ứng(%) được trình bày trong bảng sau:


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: GS.TS NGUYỄN ĐÌNH HUY

THÁI QUANG THỊNH – G1003223 5

Thời gian(phút)
X
1
Nhiệt ộộ C)
X
2
Hiệu suất %
Y
15 105 1.87
30 105 2.02
60 105 3.28
15 120 3.05
30 120 4.07
60 120 5.54
15 135 5.03
30 135 6.45
60 135 7.26

Hãy cho biết yếu tố nhiệt độ và thời gian hoặc yếu tố thời gian có liên quan tuyến
tính với hiệu suất của phản úng tổng hợp? Nếu c thì điều kiện nhiệt độ 115
o
C trong
vòng 50 phút thì hiệu suất phản ứng là bao nhiêu?
Giải
DẠNG TOÁN:
Hồi quy tuyến tính đa tham số.
CƠ SỞ LÝ THUYẾT:
Trong phương trình hồi quy tuyến tính đa tham số, biến số phụ thuộc Y c liên
quan đến k biến số độc lập X
i
(i = 1, 2,..., k) thay vì ch c một như trong hồi quy tuyến
tính đơn giản.
Phương trình tổng quát:

̂

- Bảng ANOVA
Nguồn sai số Bậc tự do
Tổng số bình
phương
Bình phương trung
bình
Giá trị
thống kê
Hồi quy k SSR MSR = SSR/k

Sai số N – k – 1 SSE MSE = SSE/(N – k – 1)
Tổng cộng N – 1 SST = SSR + SSE
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: GS.TS NGUYỄN ĐÌNH HUY

THÁI QUANG THỊNH – G1003223 6
- Giá trị thống kê:
o Giá trị R – bình phương:
Giá trị

(

là khá tốt)
Giá trị

được hiệu chnh

(

sẽ trở nên âm hoặc không xác định nếu

hoặc N nh)
o Độ lệch chuẩn:

(S 0.30 là khá tốt)
- Trắc nghiệm thống kê:
o Trong trắc nghiệm t:

:

“Các hệ số hồi quy không c ý nghĩa”

:

“Có ít nhất một số hệ số hồi quy c ý nghĩa”
Bậc tự do của giá trị t:

|

|

;

̅

o Trong trắc nghiệm F:

:

“phương trình hồi quy không thích hợp”

:

“phương trình hồi quy thích hợp” với ít nhất vài

Bậc tự do của giá trị F:

;

ÁP DỤNG MS-EXCEL
Nhập dữ liệu vào bảng tính
Dữ liệu nhất thiết phải nhập theo cột

BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: GS.TS NGUYỄN ĐÌNH HUY

THÁI QUANG THỊNH – G1003223 7


Sử dụng chương trình “ egression” trong thẻ Data Data Analysis

Chọn OK hộp thoại Regression xuất hiện

Phương trình hồi quy
̂

= f(X
1
)
Kiểm ịnh giả thiết H
o
: thời gian không liên quan tuyến tính với hiệu suất của
phản ứng tổng hợp
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: GS.TS NGUYỄN ĐÌNH HUY

THÁI QUANG THỊNH – G1003223 8

Trong hộp thoại Regression,lần lượt chọn các chi tiết:
- Phạm vi của biến số Y (Input Y range)
- Phạm vi của biến số X (Input X range)
- Nhãn dữ liệu(Labels)
- Mức tin cậy(Confidence level)
- Tọa độ đầu ra(Output range)
- Đường hồi quy(line Fit Plots),…
Ta có kết quả:

BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: GS.TS NGUYỄN ĐÌNH HUY

THÁI QUANG THỊNH – G1003223 9


Phương trình hồi quy

̂

(R
2
= 0.21; S=1.81) (1)
t
o
= 2.129 <t
0.05
= 2.365 (hay P
v
2
= 0.0708 > = 0.05)
¬chấp nhận giả thiết H
o

t
1
= 1.380 <t
0.05
= 2.365 (P
v
= 0.2099 > = 0.05)
¬chấp nhận giả thiết H
o

F = 1.905 <F
0.05
(1,7)
= 5.59 (hay F
s
= 0.209 > = 0.05)
¬chấp nhận giả thiết H
o

Vậy cả 2 hệ số 2.73(B
0
) và 0.04(B
1
) của phương trình hồi quy (I) đều không có ý
nghĩa thống kê. Nói cách khác, phương trình hồi quy này không thích hợp.
Kết luận:Vậy yếu tố thời gian không liên quan tuyến tính với hiệu suất của phản ứng
tổng hợp.

Phương trình hồi quy
̂

= f(X
2
)
Kiểm ịnh giả thiết H
o
: nhiệt độ không liên quan tuyến tính với hiệu suất của
phản ứng tổng hợp.
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: GS.TS NGUYỄN ĐÌNH HUY

THÁI QUANG THỊNH – G1003223 10





Ta có kết quả:

BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: GS.TS NGUYỄN ĐÌNH HUY

THÁI QUANG THỊNH – G1003223 11


Phương trình hồi quy

̂

(R
2
= 0.76; S = 0.99) (II)
t
o
=3.418 > t
0.05
= 2.365 (P
v
2
= 0.0112 < = 0.05)
¬bác b giả thiết H
o

t
2
= 4.757> t
0.05
= 2.365 (P
v
= 0.0021< = 0.05)
¬bác b giả thiết H
o

F= 22.631>F
0.05
(1,7)
= 5.59 (F
s
=0.0021< = 0.05)
¬bác b giả thiết H
o

Vậy cả 2 hệ số -11.14 (B
0
) và 0.13 (B
2
) của phương trình hồi quy (II) đều có ý
nghĩa thống kê. Ni cách khác, phương trình hồi quy này thích hợp.
Kết luận: Vậy yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất của phản ứng
tổng hợp.

Phương trình hồi quy
̂

= f(X
1
, X
2
)
Kiểm ịnh giả thiết H
o
: thời gian và nhiệt độ không liên quan tuyến tính với hiệu suất
của phản ứng tổng hợp






BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: GS.TS NGUYỄN ĐÌNH HUY

THÁI QUANG THỊNH – G1003223 12





BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: GS.TS NGUYỄN ĐÌNH HUY

THÁI QUANG THỊNH – G1003223 13


Phương trình hồi quy

̂

(R
2
= 0.98; S = 0.33) (III)
t
o
= 11.528 > t
0.05
= 2.447 (P
v
= 2.56E-05 < = 0.05)
¬bác b giả thiết H
o

t
1
= 7.583 > t
0.05
= 2.447 (P
v
=0.00027 < = 0.05)
¬bác b giả thiết H
o

t
2
= 14.328 > t
0.05
= 2.447 (P
v
= 7.234E-06< = 0.05)
¬bác b giả thiết H
o

F= 131.392 >F
0.05
(2,6)
= 5.140 ( hay F
s
=1.112E-05 < = 0.05)
¬bác b giả thiết H
o

Vậy cả 3 hệ số -12.7 (B
0
), 0.04 (B
1
) và 0.13 (B
2
) của phương trình hồi quy (III)
đều c ý nghĩa thống kê. Ni cách khác, phương trình hồi quy này thích hợp.
Kết luận: Vậy hiệu suất của phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu
tố là thời gian và nhiệt độ.

Dự on hiệu suất phản ứng bằng phương trình hồi quy (III):
Hiệu suất dự on = B
0
+ B
1
*50 + B
2
*115
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: GS.TS NGUYỄN ĐÌNH HUY

THÁI QUANG THỊNH – G1003223 14
Với B
0
, B
1,
B
2
là hệ số phương trình hồi quy (III)
Kết quả thu ược như sau:


BÀI 2:
Bệnh đau mắt hột được chia làm 4 thời kỳ T
1
, T
2
, T
3
và T
4
. Kết quả kiểm tra mắt hột ở 3 tnh
A, B, C được cho trong bảng sau đây:

Địa
phương
Mức độ đau mắt hột
T
1
T
2
T
3
T
4

A 47 189 807 1768
B 53 746 1387 946
C 16 228 438 115

Hãy nhận định xem tình hình đau mắt hột (cơ cấu phân bố các mức độ T
1
, T
2
, T
3
, T
4
) ở
3 tnh trên c giống nhau hay không? Mức ý nghĩa 1%.
Giải:
DẠNG TOÁN:
So sánh tỷ số.
CƠ SỞ LÝ THUYẾT:
 Giả thiết
H
0
: P
1
= P
1,0
, P
2
= P
2,0
,…., P
k,0
 “Các cặp P
i
và P
i,0
giống nhau”.
H
1
: “Có ít nhất một cặp P
i
và P
i,0
khác nhau”.
Giá trị thống kê

∑[

]

O
i
: các tần số thực nghiệm (observed frequency).
E
i
: các tần số lý thuyết (expected frequency).
Biện luận
Nếu

 bác b giả thiết H
o
(DF = k-1)
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: GS.TS NGUYỄN ĐÌNH HUY

THÁI QUANG THỊNH – G1003223 15
Trong MS-Excel có hàm CHITEST có thể tính:
 Giá trị _
2
theo biểu thức:

∑∑
(

)

O
i j
: tần số thực nghiệm của ô thuộc hàng thứ i cột j.
E
i j
: tần số lý thuyết của ô thuộc hàng thứ i cột j; r là số hàng; c là số cột.
Xác suất P(X >
2
)với bậc tự do DF = (r-1)(c-1); trong đ r là số hàng; c là số cột
trong bảng ngẫu nhiên (contingency table).
Nếu P(X >

) ¬ chấp nhận giả thiết H
o
và ngược lại.
ÁP DỤNG MS-EXCEL
Nhập dữ liệu vào bảng tính

Sắp xếp dữ liệu theo bảng trắc nghiệm hai mẫu độc lập.
 Thiết lập một số biểu thức và tiến hành tính toán:
Tính các tổng số:
o Tổng hàng (Row totals): Chọn ô F3 và nhập vào biểu thức =SUM(B3:E3)
Dùng con tr để kéo nút tự điền t ô F3 đến F5
o Tổng cột (Column totals): Chọn ô B6 và nhập vào biểu thức=SUM(B3:B5)
Dùng con tr kéo nút tự điền t ô B6 đến E6
o Tổngcộng (Grand total): Chọn ô F6 và nhập biểu thức=SUM(F3:F5) hoặc
=SUM(B6:E6)
Tính các tần số lý thuyết:
Tần số lý thuyết = (tổng hàng tổng cột) / tổng cộng
o Các tần số tại tnh A:
- Mức độ đau mắt hột T
1
: chọn ô B9 và nhập vào biểu thức=F3*B6/F6
- Mức độ đau mắt hột T
2
: chọn ô C9 và nhập vào biểu thức=F3*C6/F6
- Mức độ đau mắt hột T
3
: chọn ô D9 và nhập vào biểu thức=F3*D6/F6
- Mức độ đau mắt hột T
4
:chọn ô E9 và nhập vào biểu thức=F3*E6/F6
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: GS.TS NGUYỄN ĐÌNH HUY

THÁI QUANG THỊNH – G1003223 16
o Các tần số tại tnh B:
- Mức độ đau mắt hột T
1
:chọn ô B10 và nhập vào biểu thức=F4*B6/F6
- Mức độ đau mắt hột T
2
: chọn ô C10 và nhập vào biểu thức=F4*C6/F6
- Mức độ đau mắt hột T
3
: chọn ô D10 và nhập vào biểu thức =F4*D6/F6
- Mức độ đau mắt hột T
4
: chọn ô E10 và nhập vào biểu thức =F4*E6/F6
o Các tần số tại tnh C:
- Mức độ đau mắt hột T
1
: chọn ô B11 và nhập vào biểu thức =F5*B6/F6
- Mức độ đau mắt hột T
2
: chọn ô C11 và nhập vào biểu thức =F5*C6/F6
- Mức độ đau mắt hột T
3
:chọn ô D11 và nhập vào biểu thức =F5*D6/F6
- Mức độ đau mắt hột T
4
: chọn ô E11 và nhập vào biểu thức =F5*E6/F6
Tính xác suất P(X >

) :
Chọn ô B13 và nhập vào biểu thức =CHITEST(B3:E5,B9:E11)
Ta được:

Hoặc chọn Formulas÷More Functions÷Statistical ÷CHITEST


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: GS.TS NGUYỄN ĐÌNH HUY

THÁI QUANG THỊNH – G1003223 17
Xuất hiện hộp thoại Function Agruments
 Nhập các giá trị tần số quan sát vào mục Actual_range
 Nhập các giá trị tần số lý thuyết vào mục Expected_range
 Chọn OK

Ta được P = 6.0949E-215 0.01 nên bác b giả thuyết

Kết luận:Như vậy tình hình đau mắt hột ở 3 tnh trên không giống nhau.

BÀI 3:
Bảng sau đây cho số liệu người chết về ung thư ở 3 nước Mỹ, Nhật và Anh. Người chết
được phân loại theo cơ quan bị ung thư.

Chỗ ung thư
Nước
Mỹ Nhật Anh
Ruột
Ngực
Dạ dày
Bộ phận khác
11
15
3
41
5
3
22
30
5
7
3
15

a) Hãy tính tần số lý thuyết của bảng số liệu trên.
b) C thể áp dụng tiêu chuẩn _
2
được không?
c) Với mức ý nghĩa o = 1% hãy so sánh phân bố t lệ chết vì ung thư của ba
nước ni trên.

BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: GS.TS NGUYỄN ĐÌNH HUY

THÁI QUANG THỊNH – G1003223 18
Giải:
DẠNG TOÁN:
So sánh tỷ số.
CƠ SỞ LÝ THUYẾT:
 Giả thiết
H
0
: P
1
= P
1,0
, P
2
= P
2,0
,…., P
k,0
 “Các cặp P
i
và P
i,0
giống nhau”.
H
1
: “C ít nhất một cặp P
i
và P
i,0
khác nhau”.
Giá trị thống kê

∑[

]

O
i
: các tần số thực nghiệm (observed frequency).
E
i
: các tần số lý thuyết (expected frequency).
Biện luận
Nếu

 bác b giả thiết H
o
(DF = k-1)
Trong MS-Excel có hàm CHITEST có thể tính:
 Giá trị _
2
theo biểu thức:

∑∑
(

)

O
i j
: tần số thực nghiệm của ô thuộc hàng thứ i cột j.
E
i j
: tần số lý thuyết của ô thuộc hàng thứ i cột j; r là số hàng; c là số cột.
 Xác suất P(X >
2
)với bậc tự do DF = (r-1)(c-1); trong đ r là số hàng; c là số cột
trong bảng ngẫu nhiên (contingency table).
Nếu P(X >

) ¬ chấp nhận giả thiết H
o
và ngược lại.
ÁP DỤNG MS-EXCEL
Nhập dữ liệu vào bảng tính

Sắp xếp dữ liệu theo bảng trắc nghiệm hai mẫu độc lập.
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: GS.TS NGUYỄN ĐÌNH HUY

THÁI QUANG THỊNH – G1003223 19
 Thiết lập một số biểu thức và tiến hành tính toán:
 Tính các tổng số:
o Tổng hàng (Row totals): Chọn ô E3 và nhập vào biểu thức =SUM(B3:D3)
Dùng con tr để kéo nút tự điền t ô E3 đến E6
o Tổng cột (Column totals): Chọn ô B7 và nhập vào biểu thức =SUM(B3:B6)
Dùng con tr kéo nút tự điền t ô B7 đến D7
o Tổngcộng (Grand total): Chọn ô E7 và nhập biểu thức =SUM(B7:D7) hoặc
=SUM(E3:E6)
 Tính các tần số lý thuyết:
Tần số lý thuyết = (tổng hàng tổng cột) / tổng cộng
o Các tần số ung thư ruột:
- Tại Mỹ: chọn ô B10 và nhập vào biểu thức =E3*B7/E7
- Tại Nhật: chọn ô C10 và nhập vào biểu thức =E3*C7/E7
- Tại Anh: chọn ô D10 và nhập vào biểu thức =E3*D7/E7
o Các tần số ung thư ngực:
- Tại Mỹ: chọn ô B11 và nhập vào biểu thức =E4*B7/E7
- Tại Nhật: chọn ô C11 và nhập vào biểu thức =E4*C7/E7
- Tại Anh: chọn ô D11 và nhập vào biểu thức =E4*D7/E7
o Các tần số ung thư dạ dày:
- Tại Mỹ: chọn ô B12 và nhập vào biểu thức =E5*B7/E7
- Tại Nhật: chọn ô C12 và nhập vào biểu thức =E5*C7/E7
- Tại Anh: chọn ô D12 và nhập vào biểu thức =E5*D7/E7
o Các tần số ung thư bộ phận khác:
- Tại Mỹ: chọn ô B13 và nhập vào biểu thức =E6*B7/E7
- Tại Nhật: chọn ô C13 và nhập vào biểu thức =E6*C7/E7
- Tại Anh: chọn ô D13 và nhập vào biểu thức =E6*D7/E7

- Vì tần số lý thuyết của ruột, ngực ở Anh 5 nên không thể áp dụng tiêu chuẩn
_
2
ta phải ghp ruột và ngực.
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: GS.TS NGUYỄN ĐÌNH HUY

THÁI QUANG THỊNH – G1003223 20

Nhập lại dữ liệu vào bảng tính

Có thể áp dụng tiêu chuẩn _
2
vì cc tần số lý thuyết ≥
 Tính xác suất P(X >

) :
Chọn ô B15 và nhập vào biểu thức =CHITEST(B3:D6;B10:D13)
Hoặc chọn Formulas÷More Functions÷Statistical ÷CHITEST
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: GS.TS NGUYỄN ĐÌNH HUY

THÁI QUANG THỊNH – G1003223 21

Xuất hiện hộp thoại Function Agruments
 Nhập các giá trị tần số quan sát vào mục Actual_range
 Nhập các giá trị tần số lý thuyết vào mục Expected_range
 Chọn OK

Ta được P = 7,5363E-06 0.01 nên bác b giả thuyết

Kết luận:Như vậy tình hình ung thư ở các nước là khác nhau.

BÀI 4:
Theo dõi doanh thu của 4 cửa hàng thuộc một Công ty (triệu đ/tháng) người ta được số
liệu như sau:
Tháng
kinh doanh
Ca hng
1 2 3 4
1
2
3
4
5
6
12,3
12,6
11,6
15,2
18,6
17,1
14,2
12,4
11,5
11,6
15,6
17,1
18,2
12,5
11,8
17,2
15,8
12,2

Hãy so sánh doanh thu trung bình/tháng của các cửa hàng thuộc Công ty nói trên. Mức ý
nghĩa o = 5%.
Giải:
DẠNG TOÁN:
Phân tích phương sai một yếu tố.
CƠ SỞ LÝ THUYẾT:
 Khái niệm thống kê
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: GS.TS NGUYỄN ĐÌNH HUY

THÁI QUANG THỊNH – G1003223 22
Php phân tích phương sai được dùng trong các trắc nghiệm để so sánh các giá trị
trung bình của hai hay nhiều mẫu được lấy t các phân số.
Đây c thể được xem nhưphần mở rộng các trắc nghiệm t hay z (so sánh hai giá trị
trung bình).
Mục đích của sự phân tích phương sai một yếu tố là đánh giá sự ảnh hưởng của
một yếu tố (nhân tạo hay tự nhiên) nào đ trên các giá trị quan sát, Y
i
(i=0,1,2,…,k).
Mô hình

Yếu tố thí nghiệm

1 2 ….. K

Y
11
Y
21
….. Y
k1

Y
12
Y
22
….. Y
k2
….. ….. ….. …..

Y
1N
Y
2N
….. Y
kN
Tổng cộng
trung bình
T
1
1
___
Y

T
2

2
___
Y

…..
…..
T
k

k
Y
___

T

̅


Bảng ANOVA
Nguồn sai
số
Bậc sai
số
Tổng số bình
phương
Bình phương trung
bình
Giá trị thống

Yếu tố
Sai số
k-1
N-k
SSF=
N
T
N
T
k
i
i
2
1
2
÷
¿
=

SSE=SST-SSF
MSF=
1 ÷ k
SSF

MSE=
k N
SSE
÷

F=
MSE
MSF

Tổng cộng N-1 SST=
N
T
Y
k
i
N
j
n
2
1 1
2
÷
¿¿
= =


Trắc nghiệm
Giả thiết:
H
0
: · = = =
k
µ µ µ .....
2 1
“Các giá trị trung bình bằng nhau”
H
1
: · =
j i
µ µ “Ít nhất có hai giá trị trung bình khác nhau”
Giá trị thống kê: F=
MSE
MSF

Biện luận: Nếu F < F

(k-1;N-k) => chấp nhận giả thiết H
0

ÁP DỤNG MS-EXCEL
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: GS.TS NGUYỄN ĐÌNH HUY

THÁI QUANG THỊNH – G1003223 23
Giả thiếtH
0
: µ
1
= µ
2
= µ
3
= µ
4
; tức doanh thu trung bình/thng của cc ca
hàng bằng nhau
Nhập dữ liệu vào bảng tính


Áp dụng Anova: Single Factor
Chọn Data÷Data Analysis
Chọn chương trình Anova: Single Factor trong hộp thoại Data Analysis rồi nhấn nút
OK


Trong hộp thoại Anova: Single Factor lần lượt ấn định
÷ Phạm vi đầu vào (Input range)
÷ Cách sắp xếp theo hàng hay cột (Group by)
÷ Nhãn dữ liệu (Labels in fisrt row/column)
÷ Phạm vi đầu ra (Output range)
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: GS.TS NGUYỄN ĐÌNH HUY

THÁI QUANG THỊNH – G1003223 24


Bảng Anova:

Anova: Single
Factor

SUMMARY
Groups Count Sum Average Variance
1 6 87.4 14.56667 8.178666667
2 4 49.7 12.425 1.5625
3 5 75.2 15.04 7.873
4 3 45.2 15.06667 6.653333333


ANOVA
Source of
Variation SS df MS F P-value F crit
Between Groups 18.98994 3 6.329981 0.980529221 0.429943 3.343889
Within Groups 90.3795 14 6.455679

Total 109.3694 17



BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: GS.TS NGUYỄN ĐÌNH HUY

THÁI QUANG THỊNH – G1003223 25
Kết quả và biện luận
T giá trị trong bảng Anova:
F= 0.980529221< F

= 3.343889
=> Chấp nhận H
0

= Lượng doanh thu trung bình/tháng của các cửa hàng thuộc Công ty là như nhau.

BÀI 5:
Với mức ý nghĩa 1%, Hãy phân tích tình hình kinh doanh một số ngành nghề ở 4 quận
nội thành trên cơ sở số liệu về doanh thu của một số cửa hàng như sau:
Ngnh ngh
kinh doanh
hu vực kinh doanh
Q1 Q2 Q3 Q4
Điện lạnh
Vật liệu
xậy dựng
Dịch vụ
tin học
2.5:2.7:2.0:3.0

0.6:10.4

1.2:1.0:9.8:1.8
3.1:3.5:2.7

15.0

2.0:2.2:1.8
2.0:2.4

9.5:9.3:9.1

1.2:1.3:1.2
5.0:5.4

19.5:17.5

5.0:4.8:5.2

Giải:
DẠNG TOÁN:
Phân tích phương sai hai yếu tố (c lặp).
CƠ SỞ LÝ THUYẾT:
 Khái niệm thống kê
Bài toán phân tích phương sai 2 yếu tố có lặp tương tự như bài toán phân tích
phương sai 2 yếu tố không lặp, ch khác mỗi mức (A
i
, B
j
) đều có sự lặp lại r lần thí
nghiệm và ta cần khảo sát thêm sự tương tác (interaction term) F
1
giữa 2 nhân tố A và
B.
Mẫu điều tra:






BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: GS.TS NGUYỄN ĐÌNH HUY

THÁI QUANG THỊNH – G1003223 26





Xử lý mẫu:
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: GS.TS NGUYỄN ĐÌNH HUY

THÁI QUANG THỊNH – G1003223 27


BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: GS.TS NGUYỄN ĐÌNH HUY

THÁI QUANG THỊNH – G1003223 28

ÁP DỤNG MS-EXCEL
Giả thuyết:
H
0
(yếu tố ngành nghề): tình hình kinh doanh một số ngành nghề ở bốn quận là như
nhau.
H
o
(yếu tố quận):tình hình kinh doanh ở 4 quận là như nhau
Nhập dữ liệu vào bảng tính

Áp dụng: Anova: two-factor with replication.
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: GS.TS NGUYỄN ĐÌNH HUY

THÁI QUANG THỊNH – G1003223 29

Hộp thoại: Anova: two-factor with replication. Hiện ra.




BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: GS.TS NGUYỄN ĐÌNH HUY

THÁI QUANG THỊNH – G1003223 30
Kết luận:
F
R
< F
0.01
=5.25 => chấp nhận giả thuyết H
0
(Tình hình kinh doanh giữa các ngành nghề
là như nhau).
F
C
= 0.8189 < F
0.01
= 4.38 => chấp nhận giả thuyết H
0
(Tình hình kinh doanh giữa các
quận là như nhau)
F
I
= 0.6498 < F
0.01
= 3.35 => chấp nhận giả thuyết H
0
(Tình hình kinh doanh giữa các
quận và ngành nghề như nhau)
Vậy tình hình kinh doanh là như nhau không những giữa các ngành nghề mà còn
giữa các quận. Ngoài ra, không có sự tương tác giữa hai yếu tố ngành nghề kinh doanh
và địa điểm kinh doanh (quận)

Sign up to vote on this title
UsefulNot useful