Professional Documents
Culture Documents
1
Ước lượng sự khác biệt giữa hai trung bình tổng
thể: Các mẫu độc lập
Kiểm định giả thuyết về sự khác biệt giữa hai trung
bình tổng thể: Các mẫu độc lập
Suy diễn về sự khác biệt giữa hai trung bình tổng
thể: Mẫu phối hợp từng cặp
2
Một công ty mở lớp huấn luyện nhân viên, và muốn
đánh giá hiệu quả của lớp huấn luyện đó. Nhà
nghiên cứu có thể:
So sánh điểm số trung bình của tất cả nhân viên
trước và sau khi huấn luyện (không quan tâm điểm
số từng người).
So sánh điểm số trung bình của tổng thể trước khi
và sau khi huấn luyện, nhưng bằng cách căn cứ
trên hiệu số điểm của từng người trước và sau khi
huấn luyện (quan tâm điểm số từng người).
3
Ước lượng sự khác biệt giữa hai
trung bình tổng thể: Các mẫu độc lập
4
Sự khác biệt giữa hai trung bình tổng thể: 1 - 2
Để ước lượng 1 - 2,chọn một mẫu ngẫu nhiên
x1 x2
5
x1 x2
Độ lệch chuẩn
12 22
x1 x2
n1 n2
6
Với giả định tổng thể có phân phối chuẩn hoặc
trường hợp mẫu lớn (n1 > 30 và n2 > 30)
x1 x2 z / 2 x1 x2
trong đó:
1 - α : hệ số tin cậy
7
Một cty n/c thị trường được thuê thực hiện một cuộc
khảo sát KH của một chuỗi cửa hàng thực phẩm lớn
để ước lượng sự khác biệt trong thời gian trung bình
mỗi lần ghé cửa hàng của KH nam và nữ. Các nghiên
cứu trước đó cho biết độ lệch chuẩn là 11 phút đối với
khách nam và 16 phút đối với khách nữ. Cty đã chọn
ngẫu nhiên 100 KH nam và 100 KH nữ vào những thời
điểm khác nhau ở các cửa hàng khác nhau trong chuỗi
cửa hàng này để khảo sát. Kết quả là thời gian trung
bình của khách nam tại cửa hàng này là 34,5 phút còn
thời gian trung bình của khách nữ là 42,4 phút.
Hãy xây dựng khoảng tin cậy 95% cho khác biệt giữa
hai trung bình tổng thể.
8
Phân phối của x1 x2 xấp xỉ phân phối chuẩn
Vì không biết phương sai tổng thể nên ước lượng
1 và 2 bằng s1 và s2
x1 x2 z / 2 sx1 x2
trong đó:
s12 s22
sx1 x2
n1 n2
9
Các số thống kê mẫu
Mẫu #1 Mẫu #2
Công ty A Công ty B
Kích thước mẫu n1 = 120 banh n2 = 80 banh
Trung bình x1 = 235 mét x2 = 218 mét
Độ lệch chuẩn s1 = 15 mét s2 = 20 mét
10
Ước lượng điểm sự khác biệt
giữa hai trung bình tổng thể
Tổng thể 1 Tổng thể 2
Các quả banh của A Các quả banh của B
x1 = khoảng cách trung bình mẫu x2 = khoảng cách trung bình mẫu
cho mẫu gồm quả banh của A cho mẫu gồm quả banh của B
11
Ước lượng khoảng với độ tin cậy 95% khác biệt
giữa hai trung bình tổng thể: Trường hợp không
biết phương sai tổng thể, mẫu lớn
s12 s22 (15) 2 (20) 2
x1 x2 z / 2 17 1,96
n1 n2 120 80
12
Hai tổng thể đều có phân phối chuẩn.
Phân phối t phải được sử dụng để xây dựng ước
(2) Phương sai của hai tổng thể không bằng nhau
( 12 22 )
13
Ước lượng khoảng của µ1 - µ2:
Trường hợp không biết phương sai tổng thể, mẫu nhỏ
Độ lệch chuẩn của x1 x2 khi 1 2
2
2
2
1 1
x x
1 2
2
n1 n2
Thống kê ước lượng gộp của 2
( n 1) s2
( n 1) s2
1 1
s2p 1 1 2 2
và sx1 x2 s
2
n1 n2 2 p
n1 n2
15
Ước lượng khoảng 95% khác biệt giữa hai trung bình
tổng thể: Trường hợp không biết phương sai tổng thể,
mẫu nhỏ
các giả định sau:
Số km/lít cho cả xe M và J có phân phối chuẩn.
nhau.
t0,025, 18 = 2,101. với n1 + n2 - 2 = 18 bậc tự do,
16
Ước lượng khoảng 95% khác biệt giữa hai trung bình
tổng thể: Trường hợp không biết phương sai tổng thể,
mẫu nhỏ
( n 1) s 2
( n 1) s 2
11(2,56) 2
7(1,81) 2
s 2p 1 1 2 2
5, 28
n1 n2 2 12 8 2
1 1 1 1
x1 x2 t0,025 s 2,5 2,101 5, 28
2
p
n1 n2 12 8
17
Không thể ước lượng phương sai tổng thể bằng
phương sai gộp được mà phải sử dụng công thức
sau:
x1 x2 t / 2,df sx1 x2
2
trong đó 1 n1 s s n2
2 2
s2
n s2
2
2 1 1 1 2 n2
df
2 2 2
2 2
1
2
s2 s1 2
s1 n1 s2 n2
2 2
n1 n1 1 n2 n2 1 n1 1 n2 1
18
Kiểm định giả thuyết về sự khác
biệt giữa hai trung bình tổng thể:
Các mẫu độc lập
19
Kiểm định giả thuyết về sự khác biệt
giữa hai trung bình tổng thể: Các mẫu độc lập
Đặt giả thuyết
H0: µ1 - µ2 < D H0: µ1 - µ2 > D H0: µ1 - µ2 = D
Ha: µ1 - µ2 > D Ha: µ1 - µ2 < D Ha: µ1 - µ2 ≠ D
( x1 x2 ) D ( x1 x2 ) D
z t
12 n1 22 n2 s2p (1 n1 1 n2 )
• Không biết phương sai • Không biết phương sai
tổng thể, mẫu lớn u nhoû ( 2 2 )
m aã
1 2
( x1 x2 ) D ( x1 x2 ) D
z t
s n1 s n2
2
1
2
2 s12 n1 s22 n2 20
Quy tắc bác bỏ:
Bên trái:
Bác bỏ H0 nếu z < zα Bác bỏ H0 nếu t < t α, df
Bên phải:
Bác bỏ H0 nếu z > z α Bác bỏ H0 nếu t > t α, df
Hai bên:
Bác bỏ H0 nếu |z|> zα/2 Bác bỏ H0 nếu |t|> tα/2, df
21
Kiểm định giả thuyết về sự khác biệt giữa hai trung bình tổng
thể: Trường hợp không biết phương sai tổng thể, mẫu lớn
22
Kiểm định giả thuyết về sự khác biệt giữa hai trung bình
tổng thể: Trường hợp không biết phương sai tổng thể,
mẫu lớn
µ1 = khoảng cách bay trung bình cho toàn bộ các banh gôn
của công ty A
µ2 = khoảng cách bay trung bình cho toàn bộ các banh gôn
của công ty B
giả thuyết H0: µ1 - µ2 < 0
Ha: µ1 - µ2 > 0
Thống kê kiểm định
( x1 x2 ) ( 1 2 ) (235 218) 0 17
z 6,49
s2
s 2 2
(15) (20) 2 2,62
1
2
n1 n2 120 80
23
Quy tắc bác bỏ: Bác bỏ H0 nếu z > 2,33
24
Kiểm định giả thuyết về sự khác biệt giữa hai trung bình
tổng thể: Trường hợp mẫu nhỏ
Với mức ý nghĩa 0,05, chúng ta có thể kết luận khả năng chạy
(tính bằng số km/lít) của xe M cao hơn khả năng chạy của xe
J hay không?
µ1 = số km trung bình chạy được với 1 lít xăng cho toàn
bộ các xe M
µ2 = số km trung bình chạy được với 1 lít xăng cho toàn
bộ các xe J
Giả thuyết H0: µ1 - µ2 < 0
Ha: µ1 - µ2 > 0
25
Kiểm định giả thuyết về sự khác biệt giữa hai trung
bình tổng thể: Trường hợp mẫu nhỏ
n1 n2 2
Quy tắc bác bỏ: Bác bỏ H0 nếu tα > 1,734
( α= 0,05, df = 18)
26
Trong một số trường hợp, muốn xác định liệu có một
sự khác biệt D0 không bằng 0 giữa các trung bình
tổng thể. Trị số cụ thể được chọn cho D0 tùy thuộc
vào ứng dụng đang nghiên cứu. Dù như thế nào,
trong trường hợp này giả thuyết không có thể có các
dạng sau đây:
H0: µ1 - µ2 = 0
H0: µ1 - µ2 < 0
H0: µ1 - µ2 ≥ 0
Những tính toán trong việc kiểm định giả thuyết vẫn
không thay đổi chỉ trừ D0 được sử dụng thay thế cho
trị số µ1 - µ2 trong thống kê kiểm định.
27
Suy diễn về sự khác biệt giữa
trung bình của hai tổng thể:
Mẫu phối hợp từng cặp
Kiểm định giả thuyết
Ước lượng khỏang
28
Với thiết kế mẫu phối hợp từng cặp mỗi hạng mục
lấy mẫu cho một cặp các giá trị dữ liệu.
Việc thiết kế mẫu phối hợp từng cặp có thể được
29
So sánh “trước” và “sau”, chẳng hạn mẫu thứ nhất:
doanh số bán trước khi thực hiện chiến dịch khuyến mãi;
mẫu thứ hai: doanh số bán sau khi thực hiện chiến dịch
khuyến mãi. Ở đây, mẫu phối hợp từng cặp theo nghĩa là
từng cặp doanh số trước và sau khi khuyến mãi được thu
thập ở cùng một cửa hàng.
So sánh giữa các đơn vị về một đặc điểm nào đó, chẳng
hạn mẫu thứ nhất: tiền lương của nhân viên nam ở công
ty Y; mẫu thứ hai: tiền lương của nhân viên nữ ở công ty
Y – hai nhân viên nam, nữ được xem là có năng lực và
kinh nghiệm như nhau. Ở đây mẫu phối hợp từng cặp
theo nghĩa là cả hai nhân viên nam, nữ được xem là có
năng lực và kinh nghiệm như nhau.
30
So sánh giữa các đơn vị phối hợp từng cặp theo
không gian, chẳng hạn mẫu thứ nhất: doanh số của
hai loại nước giải khát nhãn hiệu A ở n cửa hàng;
mẫu thứ hai: doanh số của hai loại nước giải khát
nhãn hiệu B ở n cửa hàng đó. Ở đây mẫu phối hợp
từng cặp theo nghĩa là cả hai doanh số của hai nhãn
hiệu A, B đều được thu thập từ cùng một cửa hàng.
So sánh giữa các đơn vị phối hợp từng cặp theo thời
gian, chẳng hạn mẫu thứ nhất: doanh số của nhà
hàng X ở một tuần lễ nào đó; mẫu thứ hai: doanh số
của nhà hàng Y trong cùng tuần lễ đó. Ở đây mẫu
phối hợp từng cặp theo nghĩa là từng cặp doanh số
được thu thập trong cùng một tuần lễ.
31
Suy diễn về sự khác biệt giữa hai trung bình tổng thể:
mẫu phối hợp từng cặp
Một công ty đặt tại Chicago có tài liệu phải chuyển
phát nhanh đến các văn phòng quận trên khắp nước
Mỹ. Công ty này phải lựa chọn giữa hai dịch vụ chuyển
phát nhanh, UPX (United Parcel Express) và INTEX
(International Express), để chuyển phát tài liệu. Để thử
nghiệm về thời gian chuyển phát của hai dịch vụ nói
trên, công ty gửi hai bản báo cáo đến một mẫu ngẫu
nhiên gồm có 10 văn phòng quận, với một báo cáo do
UPX chuyển đi và báo cáo kia do INTEX chuyển đi.
Dữ liệu sau đây có cho biết sự chênh lệch về thời
gian chuyển phát của hai dịch vụ nói trên không? 32
Thời gian chuyển phát (giờ)
District Office UPX INTEX Chênh lệch
Seattle 32 25 7
Los Angeles 30 24 6
Boston 19 15 4
Cleveland 16 15 1
New York 15 13 2
Houston 18 15 3
Atlanta 14 15 -1
St. Louis 10 8 2
Milwaukee 7 9 -2
Denver 16 11 5
33
Suy diễn về sự khác biệt giữa hai trung bình tổng
thể: mẫu phối hợp từng cặp
Gọi µd = trung bình các khác biệt về thời gian
chuyển phát giữa hai dịch vụ cho tất cả các văn
phòng quận.
d
d i
(7 6 ... 5)
2, 7
n 10
sd
i
( d d ) 2
76,1
2,9
n 1 9
34
Suy diễn về sự khác biệt giữa hai trung bình tổng thể:
mẫu phối hợp từng cặp
d d 2, 7 0
t 2,94
sd n 2,9 10
Quy tắc bác bỏ:
Giả định tổng thể các khác biệt có phân phối xấp
xỉ chuẩn, phân phối t với n - 1 bậc tự do. Với α = 0,05,
t0,025 = 2,262 (9 bậc tự do).
Bác bỏ H0 nếu t < -2,262 hay nếu t > 2,262
Như vậy, khoảng tin cậy 95% cho khác biệt giữa trung
bình của hai dịch vụ là từ 0,63 đến 4,77 giờ. (Lưu ý
rằng vì khoảng tin cậy không bao gồm trị số không
nên dữ liệu mẫu cung cấp đủ chứng cứ để bác bỏ H0.)
36