You are on page 1of 80

CHƯƠNG 5

PHÂN PHỐI MẪU


và ƯỚC LƯỢNG
THAM SỐ THỐNG KÊ

1
NỘI DUNG CHÍNH

 Giới thiệu vấn đề lấy mẫu


 Lấy mẫu ngẫu nhiên đơn giản
 Ước lượng điểm
 Giới thiệu phân phối mẫu
 Phân phối mẫu của trung bình mẫu
 Phân phối mẫu của tỉ lệ mẫu
 Các tính chất của ước lượng điểm
 Các phương pháp lấy mẫu khác

2
GIỚI THIỆU VẤN ĐỀ LẤY MẪU

 Một Tổng thể là tập hợp tất cả các phần tử cần


quan tâm trong một nghiên cứu.
 Một Mẫu là một tập hợp con của tổng thể.

 Mục đích của thống kê suy diễn là thu thập


thông tin về tổng thể từ các thông tin có trong
mẫu.

3
GIỚI THIỆU VẤN ĐỀ LẤY MẪU

Lấy mẫu
ngẫu nhiên

Tổng thể
N (Cỡ) Mẫu
 (Trung bình) n
 (Độ lệch x
s
chuẩn)
p (Tỉ lệ)
p

Ước lượng
Kiểm định
Giả thuyết
4
GIỚI THIỆU VẤN ĐỀ LẤY MẪU

 Các trị thống kê mẫu:

 Trung bình mẫu x,


 Độ lệch chuẩn mẫu s,

 tỉ lệ mẫu p .

 Giá trị của trị thống kê mẫu được dùng để ước lượng

giá trị tham số của tổng thể

5
LẤY MẪU NGẪU NHIÊN ĐƠN GIẢN

 Định nghĩa của mẫu ngẫu nhiên đơn giản và quá


trình lựa chọn một mẫu ngẫu nhiên đơn giản tùy
thưộc vào tổng thể là hữu hạn hay vô hạn.
 Tổng thể hữu hạn thường được định nghĩa
bằng một danh sách.
 Tổng thể vô hạn thường được định nghĩa là
một quá trình đang diễn ra. Các phần tử của
tổng thể vô hạn có thể không liệt kê được
6
LẤY MẪU NGẪU NHIÊN ĐƠN GIẢN

 Lấy mẫu từ tổng thể hữu hạn


• Một mẫu ngẫu nhiên đơn giản cỡ mẫu n từ tổng thể
hữu hạn cỡ N là một mẫu được chọn sao cho mỗi
mẫu có thể với cỡ mẫu n đều có cùng xác suất được
chọn
• Số mẫu ngẫu nhiên đơn giản cỡ mẫu n khác nhau từ
tổng thể hữu hạn cỡ N là:

N!
n!( N  n )!
7
LẤY MẪU NGẪU NHIÊN ĐƠN GIẢN

 Lấy mẫu từ tổng thể hữu hạn


• Lấy mẫu không thay thế: Khi một phần tử được
chọn vào mẫu thì nó được lấy ra khỏi tổng thể và
không thể được chọn lần thứ hai

• Lấy mẫu có thay thế : Khi một phần tử được chọn


vào mẫu thì nó được bỏ trở lại tổng thể. Một phần tử
được lựa chọn lần trước thì nó có thể được lựa chọn
lần nữa và vì vậy phần tử đó có thể xuất hiện trong
mẫu hơn một lần

8
LẤY MẪU NGẪU NHIÊN ĐƠN GIẢN

 Lấy mẫu từ tổng thể vô hạn


Một mẫu ngẫu nhiên đơn giản từ một tổng thể
vô hạn là một một được chọn phải thỏa mãn
các điều kiện sau:
• Mỗi phần tử được chọn phải đến từ cùng một tổng
thể
• Mỗi phần tử được chọn một cách độc lập

9
ƯỚC LƯỢNG ĐIỂM

 Trong Ước lượng điểm chúng ta sử dụng dữ liệu từ


mẫu để tính một giá trị của trị thống kê mẫu và dựa
vào đó cung cấp một ước lượng về một tham số
của tổng thể
 Ước lượng điểm là một trị thống kê mẫu, như là x ,
s hay p cung cấp ước lượng điểm về tham số của
tổng thể, ,  và p.

10
GIỚI THIỆU PHÂN PHỐI MẪU
 Phân phối xác suất của bất kỳ trị thống kê mẫu cụ
thể được gọi là phân phối mẫu của trị thống kê.
 Phân phối xác suất của x được gọi là phân phối
mẫu của x .Kiến thức về phân phối mẫu này và
các tính chất của nó sẽ cho phép chúng ta phát
biểu về xác suất để cho trung bình của mẫu x gần
bằng với trung bình của tổng thể .
 Trong thực tế, chúng ta chỉ chọn một mẫu ngẫu
nhiên đơn giản từ tổng thể

11
PHÂN PHỐI MẪU CỦA x
 Phân phối mẫu của x
Phân phối mẫu của x là phân phối xác suất của
tất cả các giá trị có thể của trung bình mẫu x

 Giá trị kỳ vọng của x

E(x ) = 

12
Ví dụ:

 Một tổng thể gồm 7 nhân Tên nhân Mức lương


viên, mức lương của mỗi viên. ngày
nhân viên như sau: A 70
N B 70
X i
C 80
 i 1

N D 80
70  70  80  80  70  80  90 E 70

7 F 80
  77,1429 G 90

13
Nếu mẫu n=2 được chọn từ tổng thể 7
Nhân Mức Nhân Mức TB
Mẫu viên lương TB Mẫu Mẫu viên lương Mẫu
1 A,B 70, 70 70 12 C,D 80, 80 80
2 A,C 70, 80 75 13 C,E 80, 70 75
3 A,D 70, 80 75 14 C,F 80, 80 80
4 A,E 70, 70 70 15 C,G 80, 90 85
5 A,F 70, 80 75 16 D,E 80, 70 75
6 A,G 70, 90 80 17 D,F 80, 80 80
7 B,C 70, 80 75 18 D,G 80, 90 85
8 B,D 70, 80 75 19 E,F 70, 80 75
9 B,E 70, 70 70 20 E,G 70, 90 80
10 B,F 70, 80 75 21 F,G 80, 90 85
11 B,G 70, 90 80        
14
PHÂN PHỐI MẪU CỦA x

Một mẫu ngẫu nhiên


Tổng thể
đơn giản với n phần tử
với trung
được chọn từ tổng thể
bình µ = ?

Giá trị X được dùng Tổng kết của dữ liệu mẫu


để suy diễn về giá cung cấp một giá trị trung
trị µ bình mẫu X

15
PHÂN PHỐI MẪU CỦA x
 Độ lệch chuẩn của x 
 Tổng thể vô hạn hay không biết N X 
n

 Nn
 Tổng thể hữu hạn hay biết N x 
n N 1

Nn
 Với là nhân tố điều chỉnh tổng thể hữu hạn
N 1

16
PHÂN PHỐI MẪU CỦA x
 Độ lệch chuẩn của
• Bỏ qua nhân tố điều chỉnh tổng thể hữu hạn khi
n/N  0.05
• Sai số chuẩn là độ lệch chuẩn của một ước lượng
điểm
  được xem như sai số chuẩn của trung bình
x

17
PHÂN PHỐI MẪU CỦA x
 Phân phối của x
• Câu hỏi: Phân phối xác suất của x là gì?

 Định lý giới hạn trung tâm


• Phân phối của tổng thể được biết là phân phối
chuẩn
X  N (, 2) x N (, 2/n)

18
PHÂN PHỐI MẪU CỦA x
 Định lý giới hạn trung tâm
• Trong việc chọn các mẫu ngẫu nhiên đơn giản cỡ
mẫu n từ một tổng thể, phân phối mẫu của trung
bình mẫu x có thể gần đúng tuân theo phân phối
chuẩn khi cỡ mẫu đủ lớn.
• X ~ Bất kỳ phân phối nào
• Không biết phân phối
xác suất tổng thể X  N (, 2/n)
• Cỡ mẫu lớn
(N>30)
19
PHÂN PHỐI MẪU CỦA x
 X  N (, 2/n) Z  N (0,12)
với
x 
x 
/ n

20
3 kết luận từ định lý giới hạn trung tâm

 Nếu biến ngẫu nhiên X có phân phối chuẩn thì trung


bình mẫu x cũng có phân phối chuẩn, bất chấp cỡ
mẫu là bao nhiêu
 Với kích thước mẫu đủ lớn (n ≥ 30) thì phân phối của
trung bình mẫu sẽ xấp xỉ phân phối chuẩn bất chấp hình
dáng phân phối của tổng thể
 Nếu phân phối của tổng thể khá đối xứng, thì phân phối
của trung bình mẫu sẽ xấp xỉ phân phối chuẩn khi kích
thước mẫu ít nhất là 15

21
PHÂN PHỐI MẪU CỦA p
 Phân phối mẫu của p

Phân phối mẫu của p là phân phối xác suất


của tất cả các giá trị có thể của tỉ lệ mẫu p

 Giá trị kỳ vọng của p cũng có thuộc tính không


lệch

E( p ) = p

22
PHÂN PHỐI MẪU CỦA p

Tổng thể Một mẫu ngẫu nhiên


với tỉ lệ p đơn giản với n phần tử
=? được chọn từ tổng thể

Giá trị p được dùng Tổng kết của dữ liệu mẫu


để suy diễn về giá cung cấp một giá trị trung
trị p bình mẫu p

23
PHÂN PHỐI MẪU CỦA p
 Độ lệch chuẩn của p
p(1  p)
• Tổng thể vô hạn:  p 
n

p(1  p) N  n
• Tổng thể hữu hạn:  p 
n N 1
 Bỏ qua nhân tố điều chỉnh tổng thể hữu hạn
Nn
khi n/N < 0.05
N 1
24
PHÂN PHỐI MẪU CỦA p
 Dạng phân phối mẫu của p

Phân phối mẫu của p có thể gần đúng tuân


theo phân phối xác suất chuẩn khi cỡ mẫu lớn
• np  5
• n(1 – p)  5

25
Ví dụ:

 30% các hộ gia đình ở một địa bàn có hệ thống


điện không an toàn. Mẫu ngẫu nhiên 250 hộ
chọn từ địa bàn dân cư đó. Tính xác suất để tỉ
lệ các hộ có hệ thống điện không an toàn trong
khoảng từ 25% đến 35%

26
0,25  P P  P 0,35  P
 P(   )
P P P
0,25  0,30 0,35  0,30
 P( Z )
0,30(1  0,30) 0,30(1  0,30)
250 250
 P (1,72  Z  1,72)  2(0,4573)
 0,9164
27
TÍNH CHẤT CỦA ƯỚC LƯỢNG ĐIỂM

Gọi
 = tham số tổng thể được quan tâm
̂= trị thống kê mẫu hay ước lượng điểm của 
 Không thiên lệch
Trị thống kê mẫu ̂ là một ước lượng không thiên lệch
của tham số tổng thể  nếu
E( ) =  ̂
 Độ thiên lệch (Bias)
Bias ( ) = E( ̂) -  ̂

28
TÍNH CHẤT CỦA ƯỚC LƯỢNG ĐIỂM

 Độ hữu hiệu
Cho hai ước lượng điểm không thiên lệch của tham số
tổng thể, ước lượng điểm với độ lệch chuẩn nhỏ hơn ̂1
được xem là hiệu quả hơn ̂ 2 nếu:
Var̂(1 ) < Var̂ 2( )

 Độ nhất quán
Một tính chất của ước lượng điểm được trình bày khi các
cỡ mẫu lớn hơn sẽ cung cấp các ước lượng điểm gần
với tham số của tổng thể

29
CÁC PHƯƠNG PHÁP LẤY MẪU KHÁC

 Lấy mẫu hệ thống


Một phương pháp lấy mẫu xác suất theo đó chúng ta sẽ
chọn một cách ngẫu nhiên một trong k phần tử đầu tiên
và sau đó chọn mỗi phần tử thứ k kế tiếp

 Lấy mẫu thuận tiện


Một phương pháp lấy mẫu phi xác suất theo đó các
phần tử được chọn vào mẫu dựa trên cơ sở thuận tiện

30
CÁC PHƯƠNG PHÁP LẤY MẪU KHÁC

 Lấy mẫu phán đoán


Một phương pháp lấy mẫu phi xác suất theo đó các
phần tử được chọn vào mẫu dựa trên sự phán đoán của
người thực hiện nghiên cứu

31
ƯỚC LƯỢNG KHOẢNG CỦA
TRUNG BÌNH TỔNG THỂ: BIẾT 

 Ước lượng khoảng là một ước lượng của một

tham số của tổng thể theo đó cung cấp một

khoảng được tin là sẽ chứa giá trị của tham số

 Trường hợp cỡ mẫu lớn: n  30


 Trường hợp cỡ mẫu nhỏ: n < 30

32
ƯỚC LƯỢNG KHOẢNG CỦA
TRUNG BÌNH TỔNG THỂ: BIẾT 

 Một cách tổng quát ƯỚC LƯỢNG KHOẢNG là:

Ước lượng điểm  Biên của sai số


 Biên của sai số là giá trị cộng và trừ vào ước
lượng điểm để tạo ra một khoảng tin cậy
 Để tạo ra một khoảng tin cậy của , thì cả  và s
phải được sử dụng để tính biên của sai số

33
ƯỚC LƯỢNG KHOẢNG CỦA
TRUNG BÌNH TỔNG THỂ: BIẾT 

f(x)

1-
S /2

x
-z/2 z/2
P( Z > Z/2) = /2
P( Z < -Z/2) = /2
P( -Z/2 < Z < Z/2) = 1-
Z/2: là giá trị của biến phân phối chuẩn chuẩn hóa tương ứng với một
diện tích /2 ở dưới đuôi phía trên của phân phối
34
ƯỚC LƯỢNG KHOẢNG CỦA
TRUNG BÌNH TỔNG THỂ: BIẾT 

 x  
P  Z  2   Z 2   1  
 / n 
   
P x  Z  2    x  Z 2   1 
 n n

35
ƯỚC LƯỢNG KHOẢNG CỦA
TRUNG BÌNH TỔNG THỂ: BIẾT 

 Tính ước lượng khoảng: biết 


x  Z 2
Với: n
• (1-) là độ tin cậy
• x là ước lượng điểm của 

•  Z 2 là biên của sai số
n
• Cỡ mẫu lớn (n  30)  dùng công thức này
36
ƯỚC LƯỢNG KHOẢNG CỦA
TRUNG BÌNH TỔNG THỂ: BIẾT 

CÁC GIÁ TRỊ CỦA Z/2 ĐỐI VỚI CÁC MỨC


TIN CẬY ĐƯỢC SỬ DỤNG PHỔ BIẾN NHẤT

Mức tin cậy  /2 Z/2


90% .10 .050 1.645
95% .05 .0.25 1.960
99% .01 .005 2.576

37
ƯỚC LƯỢNG KHOẢNG CỦA
TRUNG BÌNH TỔNG THỂ: BIẾT 

 Tính ước lượng khoảng: biết 


 Biên của sai số là giá trị cộng và trừ vào ước lượng
điểm để tạo ra một khoảng tin cậy
• Khoảng tin cậy: Một khoảng tin cậy 100(1 - )% đối với
trung bình của phân phối chuẩn  là

      
x  Z 2  , x  Z  2  
  n  n 
38
ƯỚC LƯỢNG KHOẢNG CỦA
TRUNG BÌNH TỔNG THỂ: KHÔNG BIẾT 

 Nếu không biết , độ lệch chuẩn của mẫu s


được dùng để ước lượng độ lệch chuẩn của
tổng thể  và khoảng tin cậy thích hợp sẽ dựa
trên một phân phối xác suất được gọi là phân
phối t
 Trị thống kê t:
x 
t
s/ n
39
ƯỚC LƯỢNG KHOẢNG CỦA
TRUNG BÌNH TỔNG THỂ: KHÔNG BIẾT 

 Trị thống kê t sẽ tuân theo một Phân phối


Student’s t, với độ tự do df
df = n - 1
 Phân phối t thường được được dùng với phân
phối cỡ mẫu nhỏ của x

 Nếu n  N thì t # Z

40
ƯỚC LƯỢNG KHOẢNG CỦA
TRUNG BÌNH TỔNG THỂ: KHÔNG BIẾT 

Phân phối chuẩn chuẩn hóa


Z

Đường cong t với bậc tự


do là 20
Đường cong t với bậc tự
do là 10

t
Phân phối t

41
ƯỚC LƯỢNG KHOẢNG CỦA
TRUNG BÌNH TỔNG THỂ: KHÔNG BIẾT 

 Ước lượng khoảng của một trung bình tổng thể:


không biết 
s
x  t 2
n
 Cỡ mẫu nhỏ (n < 30) và tổng thể tuân theo một phân phối
chuẩn hoặc gần chuẩn  cũng dùng công thức này

42
TỔNG KẾT CÁC THỦ TỤC ƯỚC LƯỢNG KHOẢNG ĐỐI VỚI
TRUNG BÌNH TỔNG THỂ

Có thể giả sử độ Không


Có lệch chuẩn của tổng
thể  đã biết?

Dùng độ lệch chuẩn


của mẫu s để ước
lượng 

Dùng Dùng
 s
x  z /2 x  t / 2
n n
Trường hợp biết  Trường hợp không biết 
43
KHOẢNG TIN CẬY CỦA TỈ LỆ

 Khoảng ước lượng của tỷ lệ p tập hợp chính với độ


tin cậy 100(1– )%, Cỡ mẫu n lớn  chuẩn hóa:

P(1  P) P(1  P)
P  Z / 2  P  P  Z / 2
n n

44
KHOẢNG TIN CẬY CỦA PHƯƠNG SAI

 Mẫu n quan sát được chọn ngẫu nhiên từ tổng thể có


phân phối chuẩn

(n  1) S 2 2 ( n  1 ) S 2

2
   2
 n 1, / 2  n 1,1 / 2

 Với  n21 có phân phối  2 với n-1 bậc tự do

45
Ví dụ:

 Một nhà sản xuất quan tâm đến biến thiên của tỉ lệ tạp
chất trong một loại hương liệu được cung cấp. Chọn
ngẫu nhiên 15 mẫu hương liệu cho thấy S= 2,36%,
khoảng tin cậy 95% của độ lệch chuẩn là bao nhiêu.

Với n=15, S2=2,362 = 5,5696,


142 , 0, 025 =26,12, 142 , 0,975 = 5,63

1,7277 < δ < 3,7215

46
XÁC ĐỊNH CỠ MẪU
 Gọi ε = biên của sai số kỳ vọng

  Z 2
n
 Cỡ mẫu đối với ước lượng khoảng của một
trung bình của tổng thể
n
  2 2
Z 2 
2
 Cỡ mẫu đối với không biết  n 
  2
Z 2 s 2
2

 ε còn gọi là sai số ước lượng
47
ƯỚC LƯỢNG KHOẢNG CỦA
TỈ LỆ TỔNG THỂ

 ( p)  p
p  p(1  p ) / n

 Ước lượng khoảng của tỉ lệ tổng thể


p  Z 2  p
hay

p  Z  2 p (1  p ) / n
48
ƯỚC LƯỢNG KHOẢNG CỦA
TỈ LỆ TỔNG THỂ

 Xác định cỡ mẫu


Gọi ε = biên của sai số kỳ vọng

  Z 2 p(1  p ) / n

n
Z  p(1  p )

2
2

2

49
ƯỚC LƯỢNG KHOẢNG CỦA
CÁC THAM SỐ THỐNG KÊ

– HAI TỔNG THỂ


Nội dung

 Ước lượng sự khác biệt giữa hai trung bình


tổng thể: trường hợp hai mẫu độc lập
 Ước lượng sự khác biệt giữa hai trung bình
tổng thể: trường hợp hai mẫu phối hợp từng
cặp
 Ước lượng về sự khác biệt giữa tỷ lệ hai tổng
thể
Suy diễn về sự khác biệt giữa
hai trung bình tổng thể

Một công ty mở lớp huấn luyện nhân viên, và


muốn đánh giá hiệu quả của lớp huấn luyện đó.
Nhà nghiên cứu có thể:
Ghi lại điểm số đánh giá các nhân viên trước khi
và sau khi tham dự lớp nhưng không quan tâm
đến nhân viên nào đạt điểm số nào.
Ghi lại điểm số đánh giá từng nhân viên trước
khi và sau khi tham dự lớp.
Ước lượng sự khác biệt giữa hai
trung bình tổng thể: Các mẫu độc lập

 Thống kê ước lượng điểm sự khác biệt giữa hai


trung bình tổng thể
 Phân phối mẫu của x1  x2
 Ước lượng khoảng của µ1 - µ2 : Trường hợp
biết phương sai tổng thể
 Ước lượng khoảng của µ1 - µ2 : Trường hợp
không biết phương sai tổng thể
x1 x2
Ước lượng điểm sự khác biệt giữa
hai trung bình tổng thể
 Sự khác biệt giữa hai trung bình tổng thể là µ 1 - µ2.
 Từ tổng thể 1 chọn một mẫu ngẫu nhiên: n1 , x1 và
s1
x2
 Từ tổng thể 2 chọn một mẫu ngẫu nhiên: n2, và
s2
 Hai mẫu này được chọn theo phương thức hoàn
toàn độc lập với nhau và n1 với n2 không nhất thiết
phải bằng nhau.
 Sự khác biệt giữa hai trung bình tổng thể 1 và 2 là
x x
1 2
Phân phối mẫu của x1  x2

Các tính chất của phân phối mẫu của x1  x2


 Giá trị kỳ vọng E ( x1  x 2 )   1   2

12  22
 Độ lệch chuẩn  x1  x2  
n1 n2

trong đó: - 1, n1 : độ lệch chuẩn, kích thước của


mẫu của tổng thể 1
- 2 , n2 : độ lệch chuẩn kích thước của
mẫu của tổng thể 2
Ước lượng khoảng của 1 - 2:
Trường hợp biết phương sai tổng thể
 Với giả định tổng thể có phân phối chuẩn hoặc trường
hợp mẫu lớn (n1 > 30 và n2 > 30)

x1  x 2  z / 2  x1  x2
trong đó:
1 - : độ tin cậy
Ví dụ
Một công ty nghiên cứu thị trường được thuê thực hiện một
cuộc khảo sát khách hàng của một chuỗi cửa hàng thực
phẩm lớn để ước lượng sự khác biệt trong thời gian trung
bình mỗi lần ghé cửa hàng của khách hàng nam và khách
hàng nữ. Các nghiên cứu trước đó cho biết độ lệch chuẩn là
11 phút đối với khách nam và 16 phút đối với khách nữ. Công
ty đã chọn ngẫu nhiên 100 khách nam và 100 khách nữ vào
những thời điểm khác nhau ở các cửa hàng khác nhau trong
chuỗi cửa hàng này để khảo sát. Kết quả là thời gian trung
bình của khách nam tại cửa hàng này là 34,5 phút còn thời
gian trung bình của khách nữ là 42,4 phút.
Hãy xây dựng khoảng tin cậy 95% cho khác biệt giữa hai
trung bình tổng thể.
Ước lượng khoảng của 1 - 2:
Trường hợp không biết phương sai tổng
thể, mẫu lớn

 Áp dụng định lý giới hạn trung tâm nên phân phối


của x1  x2 xấp xỉ phân phối chuẩn
 Vì không biết phương sai tổng thể nên ước lượng
1 và  2 bằng s1 và s2
x 1  x 2  z  / 2 s x1  x 2

trong đó:
s12 s22
sx1  x2  
n1 n2
Ví dụ: Công ty Par

Par là một hãng sản xuất thiết bị đánh gôn và đã


phát triển một loại banh mới được thiết kế để bay xa
hơn. Trong một thử nghiệm về khoảng cách bay sử
dụng một thiết bị đánh chạy bằng máy, một mẫu các
quả banh của Par được so sánh với một mẫu các
quả banh do Công ty Rap, một đối thủ cạnh tranh,
chế tạo.
Ví dụ: Công ty Par
Các số thống kê mẫu
Mẫu #1 Mẫu #2
Công ty Par Công ty Rap
Kích thước mẫun1 = 120 banh n2 = 80 banh
Trung bình = 235 m = 218 m
x1 x2
Độ lệch chuẩn s1 = 15 m s2 = 20 m

s12 s 22 (15) 2 (20) 2


x1  x2  z / 2   17  1, 96 
n1 n2 120 80

= 17 + 5,14 hay từ 11,86m đến 22,14m.


Ước lượng khoảng của 1 - 2:
Trường hợp không biết phương sai tổng
thể, mẫu nhỏ (n1 < 30 và/hoặc n2 < 30)

 giả định là cả hai tổng thể đều có phân phối chuẩn.


 Sử dụng phân phối t, trường hợp mẫu nhỏ.
 Ước lượng khoảng của µ1 - µ2 tùy thuộc vào hai
trường hợp nhỏ sau:
(1) Phương sai của hai tổng thể bằng nhau (21 = 22)

(2) Phương sai của hai tổng thể không bằng nhau
(21 ≠ 22)
Ước lượng khoảng của 1 - 2:
Trường hợp không biết phương sai tổng
thể, mẫu nhỏ (n1 < 30 và/hoặc n2 < 30)
Độ lệch chuẩn của x1 khi
x 2 (21 = 22 = 2)

1 1
2
 x1  x2     
 n1 n2 

Thống kê ước lượng gộp của 2


2 ( n1  1) s12  ( n 2  1) s22 1 1 
s 
p s x1  x2 2
 s   
n1  n 2  2 p
 n1 n2 

x 1  x 2  t  / 2 s x1  x 2
Ước lượng khoảng
Sử dụng phân phối t với bậc tự do n1 + n2 - 2
Ví dụ: Specific Motors

 Specific Motors tại Detroit đã phát triển một loại


xe ô tô mới được đặt tên là M. 12 chiếc xe M và
8 chiếc xe J (của Nhật) được cho chạy thử để
so sánh khả năng chạy tính bằng km
 với 1 lít nhiên liệu. Các số thống kê mẫu là:
Mẫu #1 Mẫu #2
Xe M Xe J
Kích thước mẫu n1 = 12 chiếc n2 = 8 chiếc
Trung bình = 29,8
x1 km/lít = 27,3
x2 km/lít
Độ lệch chuẩn s1 = 2,56 km/lít s2 = 1,81 km/lít
Ví dụ: Specific Motors

Ước lượng điểm sự khác biệt giữa hai trung bình


tổng thể
1 = số km trung bình với một lít cho tất cả xe M
2 = số km trung bình với một lít cho tất cả xe
J x1  x 2
Ước lượng điểm của 1 - 2 =
= 29,8 - 27,3 = 2,5
km/lít.
Ví dụ: Specific Motors
 Ước lượng khoảng 95% khác biệt giữa hai trung bình
tổng thể: Trường hợp không biết phương sai tổng thể,
mẫu nhỏ
các giả định sau:
 Số km/lít cho cả xe M và xe J có phân phối chuẩn.
 Phương sai về số km/lít cho cả xe M và xe J bằng nhau.
 Sử dụng phân phối t với n1 + n2 - 2 = 18 bậc tự do, giá trị
t tương ứng là t0,025, 18 = 2,101.
Ví dụ: Specific Motors

Ước lượng khoảng 95% khác biệt giữa hai trung bình tổng
thể: Trường hợp không biết phương sai tổng thể, mẫu nhỏ

2 ( n1  1) s12  ( n2  1) s22 11(2, 56) 2  7(1,81) 2


s 
p   5, 28
n1  n2  2 12  8  2

21 1   1 1
x1  x2  t 0,025 s     2, 5  2,101 5, 28   
p
 n1 n2   12 8 

= 2,5 + 2,2 hay 0,3 đến 4,7 km/lít.


tin tưởng 95% rằng khác biệt giữa các mức đánh giá số km/lít
trung bình của hai loại xe được ước lượng trong khoảng từ
0,3 đến 4,7 km/lít (với xe M có số km/lít cao hơn).
Ước lượng khoảng của 1 - 2:
Trường hợp không biết phương sai tổng
thể, mẫu nhỏ (n1 < 30 và/hoặc n2 < 30)

không thể ước lượng phương sai tổng thể bằng


phương sai gộp được mà phải sử dụng công thức
sau :
x1  x 2  t / 2 ,df s x1  x 2

 
2
 
2
1 n1  s s n2 2 2
s 2
n  s 2
2 n2
trong đódf   2 1  
1 1

     
2 2
   2
s2 s1 2
2
 2
s1 n1 2
s2 n2
1
 2  2  
 n1  n1  1   n2  n2  1  n1  1 n2  1
Suy diễn về khác biệt giữa

hai trung bình tổng thể

Trường hợp: Mẫu phối hợp


từng cặp
Suy diễn về khác biệt giữa hai trung
bình tổng thể: Mẫu phối hợp từng cặp

 Với thiết kế mẫu phối hợp từng cặp mỗi hạng mục
lấy mẫu cho một cặp các giá trị dữ liệu.
 Việc thiết kế mẫu phối hợp từng cặp có thể được
gọi là tạo khối (blocking).
 Việc thiết kế này thường đưa đến sai số lấy mẫu
nhỏ hơn so với thiết kế mẫu độc lập vì độ biến
thiên giữa các hạng mục lấy mẫu được loại bỏ
như là một nguồn của sai số lấy mẫu.
Suy diễn về khác biệt giữa hai trung
bình tổng thể: Mẫu phối hợp từng cặp
 So sánh “trước” và “sau”, chẳng hạn mẫu thứ nhất: doanh
số bán trước khi thực hiện chiến dịch khuyến mãi; mẫu thứ
hai: doanh số bán sau khi thực hiện chiến dịch khuyến mãi.
Ở đây, mẫu phối hợp từng cặp theo nghĩa là từng cặp
doanh số trước và sau khi khuyến mãi được thu thập ở
cùng một cửa hàng.
 So sánh giữa các đơn vị về một đặc điểm nào đó, chẳng
hạn mẫu thứ nhất: tiền lương của nhân viên nam ở công ty
Y; mẫu thứ hai: tiền lương của nhân viên nữ ở công ty Y –
hai nhân viên nam, nữ được xem là có năng lực và kinh
nghiệm như nhau. Ở đây mẫu phối hợp từng cặp theo
nghĩa là cả hai nhân viên nam, nữ được xem là có năng lực
và kinh nghiệm như nhau.
Mẫu phối hợp từng cặp
 So sánh giữa các đơn vị phối hợp từng cặp theo không
gian, chẳng hạn mẫu thứ nhất: doanh số của hai loại nước
giải khát nhãn hiệu A ở n cửa hàng; mẫu thứ hai: doanh số
của hai loại nước giải khát nhãn hiệu B ở n cửa hàng đó. Ở
đây mẫu phối hợp từng cặp theo nghĩa là cả hai doanh số
của hai nhãn hiệu A, B đều được thu thập từ cùng một cửa
hàng.
 So sánh giữa các đơn vị phối hợp từng cặp theo thời gian,
chẳng hạn mẫu thứ nhất: doanh số của nhà hàng X ở một
tuần lễ nào đó; mẫu thứ hai: doanh số của nhà hàng Y trong
cùng tuần lễ đó. Ở đây mẫu phối hợp từng cặp theo nghĩa
là từng cặp doanh số được thu thập trong cùng một tuần lễ.
Ví dụ: Express Deliveries (chuyển
phát nhanh)

 Suy diễn về sự khác biệt giữa hai trung bình tổng thể:
mẫu phối hợp từng cặp
Một công ty đặt tại Chicago có tài liệu phải chuyển phát
nhanh đến các văn phòng quận trên khắp nước Mỹ. Công
ty này phải lựa chọn giữa hai dịch vụ chuyển phát nhanh,
UPX (United Parcel Express) và INTEX (International
Express), để chuyển phát tài liệu. Để thử nghiệm về thời
gian chuyển phát của hai dịch vụ nói trên, công ty gửi hai
bản báo cáo đến một mẫu ngẫu nhiên gồm có 10 văn
phòng quận, với một báo cáo do UPX chuyển đi và báo
cáo kia do INTEX chuyển đi.
Dữ liệu sau đây có cho biết sự chênh lệch về thời gian
chuyển phát của hai dịch vụ nói trên không?
Ví dụ: Express Deliveries

Thời gian chuyển phát (giờ)


Địa điểm UPX INTEX Chênh lệch
Seattle 32 25 7
Los Angeles 30 24 6
Boston 19 15 4
Cleveland 16 15 1
New York 15 13 2
Houston 18 15 3
Atlanta 14 15 -1
St. Louis 10 8 2
Milwaukee 7 9 -2
Denver 16 11 5
Ví dụ: Express Deliveries
Suy diễn về sự khác biệt giữa hai trung bình tổng thể:
mẫu phối hợp từng cặp
Gọi d = trung bình các khác biệt về thời gian chuyển phát
giữa hai dịch vụ cho tất cả các văn phòng quận.

d 
 d i

(7  6  ...  5)
 2, 7 sd 
 i
( d  d ) 2


76,1
 2, 9
n 10 n 1 9
sd
d  t 2
n
2,9
2, 7  2,262
10
2, 7  2, 07
khoảng tin cậy 95% cho khác biệt giữa trung bình của hai
dịch vụ là từ 0,63 đến 4,77 giờ.
Suy diễn về sự khác biệt giữa các tỷ lệ
của hai tổng thể

Phân phối mẫu của p1  p2


Ước lượng khoảng của p1 - p2
Phân phối mẫu của p1  p2
 Giá trị kỳ vọng
E ( p1  p 2 )  p1  p 2

 Độ lệch chuẩn
p1 (1  p1 ) p2 (1  p2 )
 p1  p2  
n1 n2
 Dạng phân phối
Nếu cỡ mẫu lớn (n1p1, n1(1 - p1), n2p2, và n2(1 - p2) đều lớn
hơn hoặc bằng 5), phân phối lấy mẫu củap1  p2 có thể
được xấp xỉ bằng phân phối xác suất chuẩn.
Ước lượng khoảng của p1 - p2

 Ước lượng khoảng


p1  p 2  z  / 2  p1  p2

 Ước lượng điểm của  p1  p2

p1 (1  p1 ) p2 (1  p2 )
s p1  p2  
n1 n2
Ví dụ: MRA
MRA (Những người cộng tác Nghiên cứu marketing) đang
thực hiện một nghiên cứu nhằm đánh giá tính hiệu lực của
chiến dịch quảng cáo mới của một khách hàng. Trước khi
chiến dịch mới bắt đầu, một cuộc điều tra qua điện thoại 150
hộ trong khu vực thị trường thử nghiệm cho thấy 60 hộ “biết”
sản phẩm của khách hàng này. Chiến dịch mới được bắt đầu
với việc quảng cáo trên truyền hình và báo chí trong ba tuần
liền. Một cuộc khảo sát được tiến hành ngay sau chiến dịch
mới cho thấy 120 trong số 250 hộ “biết” sản phẩm của khách
hàng này.
Dữ liệu nói trên có chứng minh quan điểm rằng chiến dịch
quảng cáo làm tăng sự nhận biết của khách hàng về sản
phẩm hay không?
Ví dụ: MRA

 Ước lượng điểm sự khác biệt giữa tỷ lệ của hai


tổng thể
120 60
p1  p 2  p1  p 2    0, 48  0, 40  0, 08
250 150

p1 = tỷ lệ tổng thể hộ “biết đến” sản phẩm sau chiến dịch mới
p2 = tỷ lệ tổng thể hộ “biết đến” sản phẩm trước chiến dịch mới
p1
= tỷ lệ mẫu hộ “biết đến” sản phẩm sau chiến dịch mới
p2 = tỷ lệ mẫu hộ “biết đến” sản phẩm trước chiến dịch mới
Ví dụ: MRA

 Ước lượng khoảng của p1 - p2: Trường hợp mẫu


lớn
0, 48(0, 52) 0, 40(0, 60)
0, 48  0, 40  1, 96 
250 150

0,08 + 0,10 hay từ -0,02 đến 0,18


 Kết luận
Với độ tin cậy 95%, khác biệt giữa tỷ lệ hộ biết đến sản
phẩm của khách hàng trước và sau chiến dịch quảng cáo
mới được ước lượng trong khoảng từ -2% đến 18%.

You might also like