You are on page 1of 36

CHƯƠNG 2

PHÂN TÍCH SỰ KHÁC BIỆT


VỀ TRUNG BÌNH CỦA
HAI TỔNG THỂ
Th.S Hà văn Hiệp

1
 Ước lượng sự khác biệt giữa hai trung bình tổng
thể: Các mẫu độc lập
 Kiểm định giả thuyết về sự khác biệt giữa hai trung
bình tổng thể: Các mẫu độc lập
 Suy diễn về sự khác biệt giữa hai trung bình tổng
thể: Mẫu phối hợp từng cặp

2
Một công ty mở lớp huấn luyện nhân viên, và muốn
đánh giá hiệu quả của lớp huấn luyện đó. Nhà
nghiên cứu có thể:
 So sánh điểm số trung bình của tất cả nhân viên
trước và sau khi huấn luyện (không quan tâm điểm
số từng người).
 So sánh điểm số trung bình của tổng thể trước khi
và sau khi huấn luyện, nhưng bằng cách căn cứ
trên hiệu số điểm của từng người trước và sau khi
huấn luyện (quan tâm điểm số từng người).

3
Ước lượng sự khác biệt giữa hai
trung bình tổng thể: Các mẫu độc lập

 Thống kê ước lượng điểm sự khác biệt giữa hai


trung bình tổng thể
 Phân phối mẫu của x1  x2
 Ước lượng khoảng của Trường hợp biết
phương sai tổng thể
 Ước lượng khoảng của Trường hợp
không biết phương sai tổng thể

4
 Sự khác biệt giữa hai trung bình tổng thể: 1 - 2
 Để ước lượng 1 - 2,chọn một mẫu ngẫu nhiên

đơn giản có kích cỡ n1 từ tổng thể 1 và một mẫu


ngẫu nhiên đơn giản có kích cỡ n2 từ tổng thể 2. Hai
mẫu này được chọn theo cách thức hoàn toàn độc
lập với nhau và n1 với n2 không nhất thiết phải bằng
nhau.
 Từ hai mẫu tính được
x1 , s và x2 , s lần lượt là
1 2
trung bình, độ lệch chuẩn của các mẫu 1 và 2.
 Sự khác biệt giữa hai trung bình tổng thể 1 và 2 là

x1  x2
5
x1  x2

 Các tính chất của phân phối mẫu của x1  x2


 Giá trị kỳ vọng
E ( x1  x2 )  1   2

 Độ lệch chuẩn
12  22
 x1  x2  
n1 n2

trong đó: 1 = độ lệch chuẩn của tổng thể 1


2 = độ lệch chuẩn của tổng thể 2
 n1 = kích thước của mẫu chọn từ tổng thể 1
n2 = kích thước của mẫu chọn từ tổng thể 2

6
 Với giả định tổng thể có phân phối chuẩn hoặc
trường hợp mẫu lớn (n1 > 30 và n2 > 30)

x1  x2  z / 2  x1  x2
trong đó:
1 - α : hệ số tin cậy

7
 Một cty n/c thị trường được thuê thực hiện một cuộc
khảo sát KH của một chuỗi cửa hàng thực phẩm lớn
để ước lượng sự khác biệt trong thời gian trung bình
mỗi lần ghé cửa hàng của KH nam và nữ. Các nghiên
cứu trước đó cho biết độ lệch chuẩn là 11 phút đối với
khách nam và 16 phút đối với khách nữ. Cty đã chọn
ngẫu nhiên 100 KH nam và 100 KH nữ vào những thời
điểm khác nhau ở các cửa hàng khác nhau trong chuỗi
cửa hàng này để khảo sát. Kết quả là thời gian trung
bình của khách nam tại cửa hàng này là 34,5 phút còn
thời gian trung bình của khách nữ là 42,4 phút.
 Hãy xây dựng khoảng tin cậy 95% cho khác biệt giữa
hai trung bình tổng thể.

8
 Phân phối của x1  x2 xấp xỉ phân phối chuẩn
 Vì không biết phương sai tổng thể nên ước lượng

1 và 2 bằng s1 và s2
x1  x2  z / 2 sx1  x2
 trong đó:
s12 s22
sx1  x2  
n1 n2

9
 Các số thống kê mẫu
Mẫu #1 Mẫu #2
Công ty A Công ty B
Kích thước mẫu n1 = 120 banh n2 = 80 banh
Trung bình x1 = 235 mét x2 = 218 mét
Độ lệch chuẩn s1 = 15 mét s2 = 20 mét

10
Ước lượng điểm sự khác biệt
giữa hai trung bình tổng thể
Tổng thể 1 Tổng thể 2
Các quả banh của A Các quả banh của B

µ1 = khoảng cách bay µ2 = khoảng cách bay


trung bình của các trung bình của các
quả banh A quả banh B
µ1 – µ2 = khác biệt giữa
các khoảng cách trung bình
Mẫu ngẫu nhiên đơn giản Mẫu ngẫu nhiên đơn giản
gồm n1 quả banh A gồm n2 quả banh B

x1 = khoảng cách trung bình mẫu x2 = khoảng cách trung bình mẫu
cho mẫu gồm quả banh của A cho mẫu gồm quả banh của B

x1 - x2 = Ước lượng điểm của µ1 – µ2

11
 Ước lượng khoảng với độ tin cậy 95% khác biệt
giữa hai trung bình tổng thể: Trường hợp không
biết phương sai tổng thể, mẫu lớn
s12 s22 (15) 2 (20) 2
x1  x2  z / 2   17  1,96 
n1 n2 120 80

= 17 + 5,14 hay từ 11,86m đến 22,14m.

12
 Hai tổng thể đều có phân phối chuẩn.
 Phân phối t phải được sử dụng để xây dựng ước

lượng khoảng cho sự khác biệt giữa hai trung bình


tổng thể trường hợp mẫu nhỏ.
 Ước lượng khoảng của µ1 - µ2 tùy thuộc vào hai

trường hợp sau:


(1) Phương sai của hai tổng thể bằng nhau ( 2
1   2
2)

(2) Phương sai của hai tổng thể không bằng nhau

( 12   22 )

13
Ước lượng khoảng của µ1 - µ2:
Trường hợp không biết phương sai tổng thể, mẫu nhỏ
Độ lệch chuẩn của x1  x2 khi  1 2 
 2
  2
  2

1 1
 x x
1 2
    
2

 n1 n2 
Thống kê ước lượng gộp của 2
( n  1) s2
 ( n  1) s2
1 1
s2p  1 1 2 2
và sx1  x2  s   
2
n1  n2  2 p
 n1 n2 

Ước lượng khoảng với  1 và  2 được ước lượng


bằng s1 và s2
x1  x2  t / 2 sx1  x2
14
Specific Motors tại Detroit đã phát triển một loại xe ô tô
mới được đặt tên là M. 12 chiếc xe M và 8 chiếc xe J
(của Nhật) được cho chạy thử để so sánh khả năng
chạy tính bằng km với 1 lít nhiên liệu. Các số thống kê
mẫu là:
Mẫu #1 Mẫu #2
Xe M Xe J
Kích thước mẫu n1 = 12 chiếc n2 = 8 chiếc
Trung bình x1 = 29,8 km/lít x2 = 27,3 km/lít
Độ lệch chuẩn s1 = 2,56 km/lít s2 = 1,81 km/lít

15
Ước lượng khoảng 95% khác biệt giữa hai trung bình
tổng thể: Trường hợp không biết phương sai tổng thể,
mẫu nhỏ
các giả định sau:
 Số km/lít cho cả xe M và J có phân phối chuẩn.

 Phương sai về số km/lít cho cả xe M và xe J bằng

nhau.
 t0,025, 18 = 2,101. với n1 + n2 - 2 = 18 bậc tự do,

 sử dụng trung bình có trọng số của hai phương sai mẫu

làm thống kê ước lượng gộp của  2.

16
 Ước lượng khoảng 95% khác biệt giữa hai trung bình
tổng thể: Trường hợp không biết phương sai tổng thể,
mẫu nhỏ
( n  1) s 2
 ( n  1) s 2
11(2,56) 2
 7(1,81) 2
s 2p  1 1 2 2
  5, 28
n1  n2  2 12  8  2

1 1  1 1
x1  x2  t0,025 s     2,5  2,101 5, 28   
2
p
 n1 n2   12 8 

= 2,5 + 2,2 hay 0,3 đến 4,7 km/lít.

17
 Không thể ước lượng phương sai tổng thể bằng
phương sai gộp được mà phải sử dụng công thức
sau:

x1  x2  t / 2,df sx1  x2

   
2
trong đó 1 n1  s s n2 
2 2
s2
n  s2
2
 2 1  1 1 2 n2
df  
       
2 2 2
2 2
 1 
2
s2 s1 2
s1 n1 s2 n2
 2  2  
 n1  n1  1   n2  n2  1  n1  1 n2  1
18
Kiểm định giả thuyết về sự khác
biệt giữa hai trung bình tổng thể:
Các mẫu độc lập

 Trường hợp biết phương sai tổng thể


 Trường hợp không biết phương sai tổng thể

19
Kiểm định giả thuyết về sự khác biệt
giữa hai trung bình tổng thể: Các mẫu độc lập
 Đặt giả thuyết
H0: µ1 - µ2 < D H0: µ1 - µ2 > D H0: µ1 - µ2 = D
Ha: µ1 - µ2 > D Ha: µ1 - µ2 < D Ha: µ1 - µ2 ≠ D

 Thống kê kiểm định • Không biết phương sai tổng thể


• Biết phương sai tổng thể: mẫu nhỏ ( 2   2 ) 1 2

( x1  x2 )  D ( x1  x2 )  D
z t
 12 n1   22 n2 s2p (1 n1  1 n2 )
• Không biết phương sai • Không biết phương sai
tổng thể, mẫu lớn u nhoû ( 2   2 )
m aã
1 2

( x1  x2 )  D ( x1  x2 )  D
z t
s n1  s n2
2
1
2
2 s12 n1  s22 n2 20
Quy tắc bác bỏ:
Bên trái:
Bác bỏ H0 nếu z < zα Bác bỏ H0 nếu t < t α, df

Bên phải:
Bác bỏ H0 nếu z > z α Bác bỏ H0 nếu t > t α, df

Hai bên:
Bác bỏ H0 nếu |z|> zα/2 Bác bỏ H0 nếu |t|> tα/2, df

21
Kiểm định giả thuyết về sự khác biệt giữa hai trung bình tổng
thể: Trường hợp không biết phương sai tổng thể, mẫu lớn

Với dữ liệu trong ví dụ trước, với mức ý nghĩa 0,01, ta có thể


kết luận là khoảng cách bay trung bình cho toàn bộ các banh
gôn A xa hơn khoảng cách bay trung bình cho toàn bộ các
banh gôn B hay không?
Mẫu #1 Mẫu #2
Công ty A Công ty B
Kích cỡ mẫu n1 = 120 banh n2 = 80 banh
Trung bình = 235 mét = 218 mét
Độ lệch chuẩn s1 = 15 mét s2 = 20 mét

22
 Kiểm định giả thuyết về sự khác biệt giữa hai trung bình
tổng thể: Trường hợp không biết phương sai tổng thể,
mẫu lớn
µ1 = khoảng cách bay trung bình cho toàn bộ các banh gôn
của công ty A
µ2 = khoảng cách bay trung bình cho toàn bộ các banh gôn
của công ty B
giả thuyết H0: µ1 - µ2 < 0
Ha: µ1 - µ2 > 0
Thống kê kiểm định
( x1  x2 )  ( 1   2 ) (235  218)  0 17
z    6,49
s2
s 2 2
(15) (20) 2 2,62
1
 2

n1 n2 120 80
23
 Quy tắc bác bỏ: Bác bỏ H0 nếu z > 2,33

 Kết luận: Bác bỏ H0. Chúng ta tin chắc ít


nhất là 99% rằng khoảng cách bay trung bình
của banh gôn A xa hơn khoảng cách bay
trung bình của banh gôn B.

24
 Kiểm định giả thuyết về sự khác biệt giữa hai trung bình
tổng thể: Trường hợp mẫu nhỏ
Với mức ý nghĩa 0,05, chúng ta có thể kết luận khả năng chạy
(tính bằng số km/lít) của xe M cao hơn khả năng chạy của xe
J hay không?
µ1 = số km trung bình chạy được với 1 lít xăng cho toàn
bộ các xe M
µ2 = số km trung bình chạy được với 1 lít xăng cho toàn
bộ các xe J
Giả thuyết H0: µ1 - µ2 < 0
Ha: µ1 - µ2 > 0

25
 Kiểm định giả thuyết về sự khác biệt giữa hai trung
bình tổng thể: Trường hợp mẫu nhỏ

Thống kê kiểm định ( x1  x2 )  0


t
s2p (1 n1  1 n2 )

trong đó: ( n  1)s 2


 ( n  1)s 2
sp2  1 1 2 2

n1  n2  2
Quy tắc bác bỏ: Bác bỏ H0 nếu tα > 1,734
( α= 0,05, df = 18)

26
 Trong một số trường hợp, muốn xác định liệu có một
sự khác biệt D0 không bằng 0 giữa các trung bình
tổng thể. Trị số cụ thể được chọn cho D0 tùy thuộc
vào ứng dụng đang nghiên cứu. Dù như thế nào,
trong trường hợp này giả thuyết không có thể có các
dạng sau đây:
H0: µ1 - µ2 = 0
H0: µ1 - µ2 < 0
H0: µ1 - µ2 ≥ 0
 Những tính toán trong việc kiểm định giả thuyết vẫn
không thay đổi chỉ trừ D0 được sử dụng thay thế cho
trị số µ1 - µ2 trong thống kê kiểm định.
27
Suy diễn về sự khác biệt giữa
trung bình của hai tổng thể:
Mẫu phối hợp từng cặp
 Kiểm định giả thuyết
 Ước lượng khỏang

28
 Với thiết kế mẫu phối hợp từng cặp mỗi hạng mục
lấy mẫu cho một cặp các giá trị dữ liệu.
 Việc thiết kế mẫu phối hợp từng cặp có thể được

gọi là tạo khối (blocking).


 Việc thiết kế này thường đưa đến sai số lấy mẫu

nhỏ hơn so với thiết kế mẫu độc lập vì độ biến


thiên giữa các hạng mục lấy mẫu được loại bỏ
như là một nguồn của sai số lấy mẫu.

29
 So sánh “trước” và “sau”, chẳng hạn mẫu thứ nhất:
doanh số bán trước khi thực hiện chiến dịch khuyến mãi;
mẫu thứ hai: doanh số bán sau khi thực hiện chiến dịch
khuyến mãi. Ở đây, mẫu phối hợp từng cặp theo nghĩa là
từng cặp doanh số trước và sau khi khuyến mãi được thu
thập ở cùng một cửa hàng.
 So sánh giữa các đơn vị về một đặc điểm nào đó, chẳng
hạn mẫu thứ nhất: tiền lương của nhân viên nam ở công
ty Y; mẫu thứ hai: tiền lương của nhân viên nữ ở công ty
Y – hai nhân viên nam, nữ được xem là có năng lực và
kinh nghiệm như nhau. Ở đây mẫu phối hợp từng cặp
theo nghĩa là cả hai nhân viên nam, nữ được xem là có
năng lực và kinh nghiệm như nhau.

30
 So sánh giữa các đơn vị phối hợp từng cặp theo
không gian, chẳng hạn mẫu thứ nhất: doanh số của
hai loại nước giải khát nhãn hiệu A ở n cửa hàng;
mẫu thứ hai: doanh số của hai loại nước giải khát
nhãn hiệu B ở n cửa hàng đó. Ở đây mẫu phối hợp
từng cặp theo nghĩa là cả hai doanh số của hai nhãn
hiệu A, B đều được thu thập từ cùng một cửa hàng.
 So sánh giữa các đơn vị phối hợp từng cặp theo thời
gian, chẳng hạn mẫu thứ nhất: doanh số của nhà
hàng X ở một tuần lễ nào đó; mẫu thứ hai: doanh số
của nhà hàng Y trong cùng tuần lễ đó. Ở đây mẫu
phối hợp từng cặp theo nghĩa là từng cặp doanh số
được thu thập trong cùng một tuần lễ.

31
 Suy diễn về sự khác biệt giữa hai trung bình tổng thể:
mẫu phối hợp từng cặp
Một công ty đặt tại Chicago có tài liệu phải chuyển
phát nhanh đến các văn phòng quận trên khắp nước
Mỹ. Công ty này phải lựa chọn giữa hai dịch vụ chuyển
phát nhanh, UPX (United Parcel Express) và INTEX
(International Express), để chuyển phát tài liệu. Để thử
nghiệm về thời gian chuyển phát của hai dịch vụ nói
trên, công ty gửi hai bản báo cáo đến một mẫu ngẫu
nhiên gồm có 10 văn phòng quận, với một báo cáo do
UPX chuyển đi và báo cáo kia do INTEX chuyển đi.
Dữ liệu sau đây có cho biết sự chênh lệch về thời
gian chuyển phát của hai dịch vụ nói trên không? 32
Thời gian chuyển phát (giờ)
District Office UPX INTEX Chênh lệch
Seattle 32 25 7
Los Angeles 30 24 6
Boston 19 15 4
Cleveland 16 15 1
New York 15 13 2
Houston 18 15 3
Atlanta 14 15 -1
St. Louis 10 8 2
Milwaukee 7 9 -2
Denver 16 11 5

33
Suy diễn về sự khác biệt giữa hai trung bình tổng
thể: mẫu phối hợp từng cặp
Gọi µd = trung bình các khác biệt về thời gian
chuyển phát giữa hai dịch vụ cho tất cả các văn
phòng quận.

Giả thuyết: H0: µd = 0, Ha: µd ≠ 0


Tính giá trị thống kê kiểm định:

d
 d i

(7  6  ...  5)
 2, 7
n 10

sd 
 i
( d  d ) 2


76,1
 2,9
n 1 9
34
 Suy diễn về sự khác biệt giữa hai trung bình tổng thể:
mẫu phối hợp từng cặp
d  d 2, 7  0
t   2,94
sd n 2,9 10
Quy tắc bác bỏ:
Giả định tổng thể các khác biệt có phân phối xấp
xỉ chuẩn, phân phối t với n - 1 bậc tự do. Với α = 0,05,
t0,025 = 2,262 (9 bậc tự do).
Bác bỏ H0 nếu t < -2,262 hay nếu t > 2,262

Kết luận: Bác bỏ H0. Có sự khác biệt có ý nghĩa về


thời gian chuyển phát trung bình của hai dịch vụ.
35
 Ngoài ra, có thể có được ước lượng khoảng sự khác
biệt giữa hai trung bình tổng thể
sd
d  t 2
n
2,9
2, 7  2,262
10
2, 7  2, 07

 Như vậy, khoảng tin cậy 95% cho khác biệt giữa trung
bình của hai dịch vụ là từ 0,63 đến 4,77 giờ. (Lưu ý
rằng vì khoảng tin cậy không bao gồm trị số không
nên dữ liệu mẫu cung cấp đủ chứng cứ để bác bỏ H0.)
36

You might also like