BK C5 - TBP

CHƯƠNG 5
PHÂN PHỐI MẪU

và ƯỚC LƯỢNG
THAM SỐ THỐNG KÊ
1
NỘI DUNG CHÍNH
 Giới thiệu vấn đề lấy mẫu

 Lấy mẫu ngẫu nhiên đơn giản
 Ước lượng điểm
 Giới thiệu phân phối mẫu
 Phân phối mẫu của trung bình mẫu
 Phân phối mẫu của tỉ lệ mẫu
 Các tính chất của ước lượng điểm
 Các phương pháp lấy mẫu khác
2
GIỚI THIỆU VẤN ĐỀ LẤY MẪU
 Một Tổng thể là tập hợp tất cả các phần tử cần

quan tâm trong một nghiên cứu.
 Một Mẫu là một tập hợp con của tổng thể.
 Mục đích của thống kê suy diễn là thu thập

thông tin về tổng thể từ các thông tin có trong
mẫu.
3
Lấy mẫu
ngẫu nhiên
Tổng thể
N (Cỡ) Mẫu
 (Trung bình) n
 (Độ lệch x
s
chuẩn)
p (Tỉ lệ)
p
Ước lượng
Kiểm định
Giả thuyết
4
 Các trị thống kê mẫu:
 Trung bình mẫu x,

 Độ lệch chuẩn mẫu s,
 tỉ lệ mẫu p .
 Giá trị của trị thống kê mẫu được dùng để ước lượng
giá trị tham số của tổng thể
5
LẤY MẪU NGẪU NHIÊN ĐƠN GIẢN
 Định nghĩa của mẫu ngẫu nhiên đơn giản và quá

trình lựa chọn một mẫu ngẫu nhiên đơn giản tùy
thưộc vào tổng thể là hữu hạn hay vô hạn.
 Tổng thể hữu hạn thường được định nghĩa
bằng một danh sách.
 Tổng thể vô hạn thường được định nghĩa là
một quá trình đang diễn ra. Các phần tử của
tổng thể vô hạn có thể không liệt kê được
6
 Lấy mẫu từ tổng thể hữu hạn

• Một mẫu ngẫu nhiên đơn giản cỡ mẫu n từ tổng thể
hữu hạn cỡ N là một mẫu được chọn sao cho mỗi
mẫu có thể với cỡ mẫu n đều có cùng xác suất được
chọn
• Số mẫu ngẫu nhiên đơn giản cỡ mẫu n khác nhau từ
tổng thể hữu hạn cỡ N là:
N!
n!( N  n )!
7
 Lấy mẫu từ tổng thể hữu hạn

• Lấy mẫu không thay thế: Khi một phần tử được
chọn vào mẫu thì nó được lấy ra khỏi tổng thể và
không thể được chọn lần thứ hai
• Lấy mẫu có thay thế : Khi một phần tử được chọn

vào mẫu thì nó được bỏ trở lại tổng thể. Một phần tử
được lựa chọn lần trước thì nó có thể được lựa chọn
lần nữa và vì vậy phần tử đó có thể xuất hiện trong
mẫu hơn một lần
8
 Lấy mẫu từ tổng thể vô hạn

Một mẫu ngẫu nhiên đơn giản từ một tổng thể
vô hạn là một một được chọn phải thỏa mãn
các điều kiện sau:
• Mỗi phần tử được chọn phải đến từ cùng một tổng
thể
• Mỗi phần tử được chọn một cách độc lập
9
ƯỚC LƯỢNG ĐIỂM
 Trong Ước lượng điểm chúng ta sử dụng dữ liệu từ

mẫu để tính một giá trị của trị thống kê mẫu và dựa
vào đó cung cấp một ước lượng về một tham số
của tổng thể
 Ước lượng điểm là một trị thống kê mẫu, như là x ,
s hay p cung cấp ước lượng điểm về tham số của
tổng thể, ,  và p.
10
GIỚI THIỆU PHÂN PHỐI MẪU
 Phân phối xác suất của bất kỳ trị thống kê mẫu cụ
thể được gọi là phân phối mẫu của trị thống kê.
 Phân phối xác suất của x được gọi là phân phối
mẫu của x .Kiến thức về phân phối mẫu này và
các tính chất của nó sẽ cho phép chúng ta phát
biểu về xác suất để cho trung bình của mẫu x gần
bằng với trung bình của tổng thể .
 Trong thực tế, chúng ta chỉ chọn một mẫu ngẫu
nhiên đơn giản từ tổng thể
11
PHÂN PHỐI MẪU CỦA x
 Phân phối mẫu của x
Phân phối mẫu của x là phân phối xác suất của
tất cả các giá trị có thể của trung bình mẫu x
 Giá trị kỳ vọng của x
E(x ) = 
12
Ví dụ:
 Một tổng thể gồm 7 nhân Tên nhân Mức lương

viên, mức lương của mỗi viên. ngày
nhân viên như sau: A 70
N B 70
X i
C 80
 i 1

N D 80
70  70  80  80  70  80  90 E 70

7 F 80
  77,1429 G 90
13
Nếu mẫu n=2 được chọn từ tổng thể 7
Nhân Mức Nhân Mức TB
Mẫu viên lương TB Mẫu Mẫu viên lương Mẫu
1 A,B 70, 70 70 12 C,D 80, 80 80
2 A,C 70, 80 75 13 C,E 80, 70 75
3 A,D 70, 80 75 14 C,F 80, 80 80
4 A,E 70, 70 70 15 C,G 80, 90 85
5 A,F 70, 80 75 16 D,E 80, 70 75
6 A,G 70, 90 80 17 D,F 80, 80 80
7 B,C 70, 80 75 18 D,G 80, 90 85
8 B,D 70, 80 75 19 E,F 70, 80 75
9 B,E 70, 70 70 20 E,G 70, 90 80
10 B,F 70, 80 75 21 F,G 80, 90 85
11 B,G 70, 90 80
14
Một mẫu ngẫu nhiên

Tổng thể
đơn giản với n phần tử
với trung
được chọn từ tổng thể
bình µ = ?
Giá trị X được dùng Tổng kết của dữ liệu mẫu

để suy diễn về giá cung cấp một giá trị trung
trị µ bình mẫu X
15
 Độ lệch chuẩn của x 
 Tổng thể vô hạn hay không biết N X 
n
 Nn
 Tổng thể hữu hạn hay biết N x 
n N 1
Nn
 Với là nhân tố điều chỉnh tổng thể hữu hạn
N 1
16
 Độ lệch chuẩn của
• Bỏ qua nhân tố điều chỉnh tổng thể hữu hạn khi
n/N  0.05
• Sai số chuẩn là độ lệch chuẩn của một ước lượng
điểm
  được xem như sai số chuẩn của trung bình
x
17
 Phân phối của x
• Câu hỏi: Phân phối xác suất của x là gì?
 Định lý giới hạn trung tâm

• Phân phối của tổng thể được biết là phân phối
chuẩn
X  N (, 2) x N (, 2/n)
18
 Định lý giới hạn trung tâm
• Trong việc chọn các mẫu ngẫu nhiên đơn giản cỡ
mẫu n từ một tổng thể, phân phối mẫu của trung
bình mẫu x có thể gần đúng tuân theo phân phối
chuẩn khi cỡ mẫu đủ lớn.
• X ~ Bất kỳ phân phối nào
• Không biết phân phối
xác suất tổng thể X  N (, 2/n)
• Cỡ mẫu lớn
(N>30)
19
 X  N (, 2/n) Z  N (0,12)
với
x 
x 
/ n
20
3 kết luận từ định lý giới hạn trung tâm
 Nếu biến ngẫu nhiên X có phân phối chuẩn thì trung

bình mẫu x cũng có phân phối chuẩn, bất chấp cỡ
mẫu là bao nhiêu
 Với kích thước mẫu đủ lớn (n ≥ 30) thì phân phối của
trung bình mẫu sẽ xấp xỉ phân phối chuẩn bất chấp hình
dáng phân phối của tổng thể
 Nếu phân phối của tổng thể khá đối xứng, thì phân phối
của trung bình mẫu sẽ xấp xỉ phân phối chuẩn khi kích
thước mẫu ít nhất là 15
21
PHÂN PHỐI MẪU CỦA p
 Phân phối mẫu của p
Phân phối mẫu của p là phân phối xác suất

của tất cả các giá trị có thể của tỉ lệ mẫu p
 Giá trị kỳ vọng của p cũng có thuộc tính không

lệch
E( p ) = p
22
Tổng thể Một mẫu ngẫu nhiên

với tỉ lệ p đơn giản với n phần tử
=? được chọn từ tổng thể
Giá trị p được dùng Tổng kết của dữ liệu mẫu

để suy diễn về giá cung cấp một giá trị trung
trị p bình mẫu p
23
 Độ lệch chuẩn của p
p(1  p)
• Tổng thể vô hạn:  p 
n
p(1  p) N  n
• Tổng thể hữu hạn:  p 
n N 1
 Bỏ qua nhân tố điều chỉnh tổng thể hữu hạn
Nn
khi n/N < 0.05
N 1
24
 Dạng phân phối mẫu của p
Phân phối mẫu của p có thể gần đúng tuân

theo phân phối xác suất chuẩn khi cỡ mẫu lớn
• np  5
• n(1 – p)  5
25
Ví dụ:
 30% các hộ gia đình ở một địa bàn có hệ thống

điện không an toàn. Mẫu ngẫu nhiên 250 hộ
chọn từ địa bàn dân cư đó. Tính xác suất để tỉ
lệ các hộ có hệ thống điện không an toàn trong
khoảng từ 25% đến 35%
26
0,25  P P  P 0,35  P
 P(   )
P P P
0,25  0,30 0,35  0,30
 P( Z )
0,30(1  0,30) 0,30(1  0,30)
250 250
 P (1,72  Z  1,72)  2(0,4573)
 0,9164
27
TÍNH CHẤT CỦA ƯỚC LƯỢNG ĐIỂM
Gọi
 = tham số tổng thể được quan tâm
̂= trị thống kê mẫu hay ước lượng điểm của 
 Không thiên lệch
Trị thống kê mẫu ̂ là một ước lượng không thiên lệch
của tham số tổng thể  nếu
E( ) =  ̂
 Độ thiên lệch (Bias)
Bias ( ) = E( ̂) -  ̂
28
TÍNH CHẤT CỦA ƯỚC LƯỢNG ĐIỂM
 Độ hữu hiệu
Cho hai ước lượng điểm không thiên lệch của tham số
tổng thể, ước lượng điểm với độ lệch chuẩn nhỏ hơn ̂1
được xem là hiệu quả hơn ̂ 2 nếu:
Var̂(1 ) < Var̂ 2( )
 Độ nhất quán
Một tính chất của ước lượng điểm được trình bày khi các
cỡ mẫu lớn hơn sẽ cung cấp các ước lượng điểm gần
với tham số của tổng thể
29
CÁC PHƯƠNG PHÁP LẤY MẪU KHÁC
 Lấy mẫu hệ thống

Một phương pháp lấy mẫu xác suất theo đó chúng ta sẽ
chọn một cách ngẫu nhiên một trong k phần tử đầu tiên
và sau đó chọn mỗi phần tử thứ k kế tiếp
 Lấy mẫu thuận tiện

Một phương pháp lấy mẫu phi xác suất theo đó các
phần tử được chọn vào mẫu dựa trên cơ sở thuận tiện
30
CÁC PHƯƠNG PHÁP LẤY MẪU KHÁC
 Lấy mẫu phán đoán

Một phương pháp lấy mẫu phi xác suất theo đó các
phần tử được chọn vào mẫu dựa trên sự phán đoán của
người thực hiện nghiên cứu
31
ƯỚC LƯỢNG KHOẢNG CỦA
TRUNG BÌNH TỔNG THỂ: BIẾT 
 Ước lượng khoảng là một ước lượng của một
tham số của tổng thể theo đó cung cấp một
khoảng được tin là sẽ chứa giá trị của tham số
 Trường hợp cỡ mẫu lớn: n  30

 Trường hợp cỡ mẫu nhỏ: n < 30
32
 Một cách tổng quát ƯỚC LƯỢNG KHOẢNG là:
Ước lượng điểm  Biên của sai số

 Biên của sai số là giá trị cộng và trừ vào ước
lượng điểm để tạo ra một khoảng tin cậy
 Để tạo ra một khoảng tin cậy của , thì cả  và s
phải được sử dụng để tính biên của sai số
33
f(x)
1-
S /2
x
-z/2 z/2
P( Z > Z/2) = /2
P( Z < -Z/2) = /2
P( -Z/2 < Z < Z/2) = 1-
Z/2: là giá trị của biến phân phối chuẩn chuẩn hóa tương ứng với một
diện tích /2 ở dưới đuôi phía trên của phân phối
34
 x  
P  Z  2   Z 2   1  
 / n 
   
P x  Z  2    x  Z 2   1 
 n n
35
 Tính ước lượng khoảng: biết 

x  Z 2
Với: n
• (1-) là độ tin cậy
• x là ước lượng điểm của 

•  Z 2 là biên của sai số
n
• Cỡ mẫu lớn (n  30)  dùng công thức này
36
CÁC GIÁ TRỊ CỦA Z/2 ĐỐI VỚI CÁC MỨC

TIN CẬY ĐƯỢC SỬ DỤNG PHỔ BIẾN NHẤT
Mức tin cậy  /2 Z/2

90% .10 .050 1.645
95% .05 .0.25 1.960
99% .01 .005 2.576
37
 Tính ước lượng khoảng: biết 

 Biên của sai số là giá trị cộng và trừ vào ước lượng
điểm để tạo ra một khoảng tin cậy
• Khoảng tin cậy: Một khoảng tin cậy 100(1 - )% đối với
trung bình của phân phối chuẩn  là
      
x  Z 2  , x  Z  2  
  n  n 
38
TRUNG BÌNH TỔNG THỂ: KHÔNG BIẾT 
 Nếu không biết , độ lệch chuẩn của mẫu s

được dùng để ước lượng độ lệch chuẩn của
tổng thể  và khoảng tin cậy thích hợp sẽ dựa
trên một phân phối xác suất được gọi là phân
phối t
 Trị thống kê t:
x 
t
s/ n
39
 Trị thống kê t sẽ tuân theo một Phân phối

Student’s t, với độ tự do df
df = n - 1
 Phân phối t thường được được dùng với phân
phối cỡ mẫu nhỏ của x
 Nếu n  N thì t # Z
40
Phân phối chuẩn chuẩn hóa

Z
Đường cong t với bậc tự

do là 20
Đường cong t với bậc tự
do là 10
t
Phân phối t
41
 Ước lượng khoảng của một trung bình tổng thể:

không biết 
s
x  t 2
n
 Cỡ mẫu nhỏ (n < 30) và tổng thể tuân theo một phân phối
chuẩn hoặc gần chuẩn  cũng dùng công thức này
42
TỔNG KẾT CÁC THỦ TỤC ƯỚC LƯỢNG KHOẢNG ĐỐI VỚI
TRUNG BÌNH TỔNG THỂ
Có thể giả sử độ Không

Có lệch chuẩn của tổng
thể  đã biết?
Dùng độ lệch chuẩn

của mẫu s để ước
lượng 
Dùng Dùng
 s
x  z /2 x  t / 2
n n
Trường hợp biết  Trường hợp không biết 
43
KHOẢNG TIN CẬY CỦA TỈ LỆ
 Khoảng ước lượng của tỷ lệ p tập hợp chính với độ

tin cậy 100(1– )%, Cỡ mẫu n lớn  chuẩn hóa:
P(1  P) P(1  P)
P  Z / 2  P  P  Z / 2
n n
44
KHOẢNG TIN CẬY CỦA PHƯƠNG SAI
 Mẫu n quan sát được chọn ngẫu nhiên từ tổng thể có

phân phối chuẩn
(n  1) S 2 2 ( n  1 ) S 2
2
   2
 n 1, / 2  n 1,1 / 2
 Với  n21 có phân phối  2 với n-1 bậc tự do
45
Ví dụ:
 Một nhà sản xuất quan tâm đến biến thiên của tỉ lệ tạp
chất trong một loại hương liệu được cung cấp. Chọn
ngẫu nhiên 15 mẫu hương liệu cho thấy S= 2,36%,
khoảng tin cậy 95% của độ lệch chuẩn là bao nhiêu.
Với n=15, S2=2,362 = 5,5696,

142 , 0, 025 =26,12, 142 , 0,975 = 5,63
1,7277 < δ < 3,7215
46
XÁC ĐỊNH CỠ MẪU
 Gọi ε = biên của sai số kỳ vọng

  Z 2
n
 Cỡ mẫu đối với ước lượng khoảng của một
trung bình của tổng thể
n
  2 2
Z 2 
2
 Cỡ mẫu đối với không biết  n 
  2
Z 2 s 2
2

 ε còn gọi là sai số ước lượng
47
TỈ LỆ TỔNG THỂ
 ( p)  p
p  p(1  p ) / n
 Ước lượng khoảng của tỉ lệ tổng thể

p  Z 2  p
hay
p  Z  2 p (1  p ) / n
48
TỈ LỆ TỔNG THỂ
 Xác định cỡ mẫu

Gọi ε = biên của sai số kỳ vọng
  Z 2 p(1  p ) / n
n
Z  p(1  p )

2
2
2

49
CÁC THAM SỐ THỐNG KÊ
– HAI TỔNG THỂ

Nội dung
 Ước lượng sự khác biệt giữa hai trung bình

tổng thể: trường hợp hai mẫu độc lập
 Ước lượng sự khác biệt giữa hai trung bình
tổng thể: trường hợp hai mẫu phối hợp từng
cặp
 Ước lượng về sự khác biệt giữa tỷ lệ hai tổng
thể
Suy diễn về sự khác biệt giữa
hai trung bình tổng thể
Một công ty mở lớp huấn luyện nhân viên, và

muốn đánh giá hiệu quả của lớp huấn luyện đó.
Nhà nghiên cứu có thể:
Ghi lại điểm số đánh giá các nhân viên trước khi
và sau khi tham dự lớp nhưng không quan tâm
đến nhân viên nào đạt điểm số nào.
Ghi lại điểm số đánh giá từng nhân viên trước
khi và sau khi tham dự lớp.
Ước lượng sự khác biệt giữa hai
trung bình tổng thể: Các mẫu độc lập
 Thống kê ước lượng điểm sự khác biệt giữa hai

trung bình tổng thể
 Phân phối mẫu của x1  x2
 Ước lượng khoảng của µ1 - µ2 : Trường hợp
biết phương sai tổng thể
 Ước lượng khoảng của µ1 - µ2 : Trường hợp
không biết phương sai tổng thể
x1 x2
Ước lượng điểm sự khác biệt giữa
 Sự khác biệt giữa hai trung bình tổng thể là µ 1 - µ2.
 Từ tổng thể 1 chọn một mẫu ngẫu nhiên: n1 , x1 và
s1
x2
 Từ tổng thể 2 chọn một mẫu ngẫu nhiên: n2, và
s2
 Hai mẫu này được chọn theo phương thức hoàn
toàn độc lập với nhau và n1 với n2 không nhất thiết
phải bằng nhau.
 Sự khác biệt giữa hai trung bình tổng thể 1 và 2 là
x x
1 2
Phân phối mẫu của x1  x2
Các tính chất của phân phối mẫu của x1  x2

 Giá trị kỳ vọng E ( x1  x 2 )   1   2
12  22
 Độ lệch chuẩn  x1  x2  
n1 n2
trong đó: - 1, n1 : độ lệch chuẩn, kích thước của

mẫu của tổng thể 1
- 2 , n2 : độ lệch chuẩn kích thước của
mẫu của tổng thể 2
Ước lượng khoảng của 1 - 2:
Trường hợp biết phương sai tổng thể
 Với giả định tổng thể có phân phối chuẩn hoặc trường
hợp mẫu lớn (n1 > 30 và n2 > 30)
x1  x 2  z / 2  x1  x2
trong đó:
1 - : độ tin cậy
Ví dụ
Một công ty nghiên cứu thị trường được thuê thực hiện một
cuộc khảo sát khách hàng của một chuỗi cửa hàng thực
phẩm lớn để ước lượng sự khác biệt trong thời gian trung
bình mỗi lần ghé cửa hàng của khách hàng nam và khách
hàng nữ. Các nghiên cứu trước đó cho biết độ lệch chuẩn là
11 phút đối với khách nam và 16 phút đối với khách nữ. Công
ty đã chọn ngẫu nhiên 100 khách nam và 100 khách nữ vào
những thời điểm khác nhau ở các cửa hàng khác nhau trong
chuỗi cửa hàng này để khảo sát. Kết quả là thời gian trung
bình của khách nam tại cửa hàng này là 34,5 phút còn thời
gian trung bình của khách nữ là 42,4 phút.
Hãy xây dựng khoảng tin cậy 95% cho khác biệt giữa hai
trung bình tổng thể.
Trường hợp không biết phương sai tổng
thể, mẫu lớn
 Áp dụng định lý giới hạn trung tâm nên phân phối

của x1  x2 xấp xỉ phân phối chuẩn
 Vì không biết phương sai tổng thể nên ước lượng
1 và  2 bằng s1 và s2
x 1  x 2  z  / 2 s x1  x 2
trong đó:
s12 s22
sx1  x2  
n1 n2
Ví dụ: Công ty Par
Par là một hãng sản xuất thiết bị đánh gôn và đã

phát triển một loại banh mới được thiết kế để bay xa
hơn. Trong một thử nghiệm về khoảng cách bay sử
dụng một thiết bị đánh chạy bằng máy, một mẫu các
quả banh của Par được so sánh với một mẫu các
quả banh do Công ty Rap, một đối thủ cạnh tranh,
chế tạo.
Ví dụ: Công ty Par
Các số thống kê mẫu
Mẫu #1 Mẫu #2
Công ty Par Công ty Rap
Kích thước mẫun1 = 120 banh n2 = 80 banh
Trung bình = 235 m = 218 m
x1 x2
Độ lệch chuẩn s1 = 15 m s2 = 20 m
s12 s 22 (15) 2 (20) 2

x1  x2  z / 2   17  1, 96 
n1 n2 120 80
= 17 + 5,14 hay từ 11,86m đến 22,14m.

thể, mẫu nhỏ (n1 < 30 và/hoặc n2 < 30)
 giả định là cả hai tổng thể đều có phân phối chuẩn.

 Sử dụng phân phối t, trường hợp mẫu nhỏ.
 Ước lượng khoảng của µ1 - µ2 tùy thuộc vào hai
trường hợp nhỏ sau:
(1) Phương sai của hai tổng thể bằng nhau (21 = 22)
(2) Phương sai của hai tổng thể không bằng nhau
(21 ≠ 22)
Độ lệch chuẩn của x1 khi
x 2 (21 = 22 = 2)
1 1
2
 x1  x2     
 n1 n2 
Thống kê ước lượng gộp của 2

2 ( n1  1) s12  ( n 2  1) s22 1 1 
s 
p s x1  x2 2
 s   
n1  n 2  2 p
 n1 n2 
x 1  x 2  t  / 2 s x1  x 2
Ước lượng khoảng
Sử dụng phân phối t với bậc tự do n1 + n2 - 2
Ví dụ: Specific Motors
 Specific Motors tại Detroit đã phát triển một loại

xe ô tô mới được đặt tên là M. 12 chiếc xe M và
8 chiếc xe J (của Nhật) được cho chạy thử để
so sánh khả năng chạy tính bằng km
 với 1 lít nhiên liệu. Các số thống kê mẫu là:
Mẫu #1 Mẫu #2
Xe M Xe J
Kích thước mẫu n1 = 12 chiếc n2 = 8 chiếc
Trung bình = 29,8
x1 km/lít = 27,3
x2 km/lít
Độ lệch chuẩn s1 = 2,56 km/lít s2 = 1,81 km/lít
Ước lượng điểm sự khác biệt giữa hai trung bình

tổng thể
1 = số km trung bình với một lít cho tất cả xe M
2 = số km trung bình với một lít cho tất cả xe
J x1  x 2
Ước lượng điểm của 1 - 2 =
= 29,8 - 27,3 = 2,5
km/lít.
 Ước lượng khoảng 95% khác biệt giữa hai trung bình
tổng thể: Trường hợp không biết phương sai tổng thể,
mẫu nhỏ
các giả định sau:
 Số km/lít cho cả xe M và xe J có phân phối chuẩn.
 Phương sai về số km/lít cho cả xe M và xe J bằng nhau.
 Sử dụng phân phối t với n1 + n2 - 2 = 18 bậc tự do, giá trị
t tương ứng là t0,025, 18 = 2,101.
Ước lượng khoảng 95% khác biệt giữa hai trung bình tổng
thể: Trường hợp không biết phương sai tổng thể, mẫu nhỏ
2 ( n1  1) s12  ( n2  1) s22 11(2, 56) 2  7(1,81) 2

s 
p   5, 28
n1  n2  2 12  8  2
21 1   1 1
x1  x2  t 0,025 s     2, 5  2,101 5, 28   
p
 n1 n2   12 8 
= 2,5 + 2,2 hay 0,3 đến 4,7 km/lít.

tin tưởng 95% rằng khác biệt giữa các mức đánh giá số km/lít
trung bình của hai loại xe được ước lượng trong khoảng từ
0,3 đến 4,7 km/lít (với xe M có số km/lít cao hơn).
không thể ước lượng phương sai tổng thể bằng

phương sai gộp được mà phải sử dụng công thức
sau :
x1  x 2  t / 2 ,df s x1  x 2
 
2
 
2
1 n1  s s n2 2 2
s 2
n  s 2
2 n2
trong đódf   2 1  
1 1
     
2 2
   2
s2 s1 2
2
 2
s1 n1 2
s2 n2
1
 2  2  
 n1  n1  1   n2  n2  1  n1  1 n2  1
Suy diễn về khác biệt giữa
Trường hợp: Mẫu phối hợp

từng cặp
Suy diễn về khác biệt giữa hai trung
bình tổng thể: Mẫu phối hợp từng cặp
 Với thiết kế mẫu phối hợp từng cặp mỗi hạng mục
lấy mẫu cho một cặp các giá trị dữ liệu.
 Việc thiết kế mẫu phối hợp từng cặp có thể được
gọi là tạo khối (blocking).
 Việc thiết kế này thường đưa đến sai số lấy mẫu
nhỏ hơn so với thiết kế mẫu độc lập vì độ biến
thiên giữa các hạng mục lấy mẫu được loại bỏ
như là một nguồn của sai số lấy mẫu.
Suy diễn về khác biệt giữa hai trung
bình tổng thể: Mẫu phối hợp từng cặp
 So sánh “trước” và “sau”, chẳng hạn mẫu thứ nhất: doanh
số bán trước khi thực hiện chiến dịch khuyến mãi; mẫu thứ
hai: doanh số bán sau khi thực hiện chiến dịch khuyến mãi.
Ở đây, mẫu phối hợp từng cặp theo nghĩa là từng cặp
doanh số trước và sau khi khuyến mãi được thu thập ở
cùng một cửa hàng.
 So sánh giữa các đơn vị về một đặc điểm nào đó, chẳng
hạn mẫu thứ nhất: tiền lương của nhân viên nam ở công ty
Y; mẫu thứ hai: tiền lương của nhân viên nữ ở công ty Y –
hai nhân viên nam, nữ được xem là có năng lực và kinh
nghiệm như nhau. Ở đây mẫu phối hợp từng cặp theo
nghĩa là cả hai nhân viên nam, nữ được xem là có năng lực
và kinh nghiệm như nhau.
Mẫu phối hợp từng cặp
 So sánh giữa các đơn vị phối hợp từng cặp theo không
gian, chẳng hạn mẫu thứ nhất: doanh số của hai loại nước
giải khát nhãn hiệu A ở n cửa hàng; mẫu thứ hai: doanh số
của hai loại nước giải khát nhãn hiệu B ở n cửa hàng đó. Ở
đây mẫu phối hợp từng cặp theo nghĩa là cả hai doanh số
của hai nhãn hiệu A, B đều được thu thập từ cùng một cửa
hàng.
 So sánh giữa các đơn vị phối hợp từng cặp theo thời gian,
chẳng hạn mẫu thứ nhất: doanh số của nhà hàng X ở một
tuần lễ nào đó; mẫu thứ hai: doanh số của nhà hàng Y trong
cùng tuần lễ đó. Ở đây mẫu phối hợp từng cặp theo nghĩa
là từng cặp doanh số được thu thập trong cùng một tuần lễ.
Ví dụ: Express Deliveries (chuyển
phát nhanh)
 Suy diễn về sự khác biệt giữa hai trung bình tổng thể:
mẫu phối hợp từng cặp
Một công ty đặt tại Chicago có tài liệu phải chuyển phát
nhanh đến các văn phòng quận trên khắp nước Mỹ. Công
ty này phải lựa chọn giữa hai dịch vụ chuyển phát nhanh,
UPX (United Parcel Express) và INTEX (International
Express), để chuyển phát tài liệu. Để thử nghiệm về thời
gian chuyển phát của hai dịch vụ nói trên, công ty gửi hai
bản báo cáo đến một mẫu ngẫu nhiên gồm có 10 văn
phòng quận, với một báo cáo do UPX chuyển đi và báo
cáo kia do INTEX chuyển đi.
Dữ liệu sau đây có cho biết sự chênh lệch về thời gian
chuyển phát của hai dịch vụ nói trên không?
Ví dụ: Express Deliveries
Thời gian chuyển phát (giờ)

Địa điểm UPX INTEX Chênh lệch
Seattle 32 25 7
Los Angeles 30 24 6
Boston 19 15 4
Cleveland 16 15 1
New York 15 13 2
Houston 18 15 3
Atlanta 14 15 -1
St. Louis 10 8 2
Milwaukee 7 9 -2
Denver 16 11 5
Ví dụ: Express Deliveries
Suy diễn về sự khác biệt giữa hai trung bình tổng thể:
mẫu phối hợp từng cặp
Gọi d = trung bình các khác biệt về thời gian chuyển phát
giữa hai dịch vụ cho tất cả các văn phòng quận.
d 
 d i

(7  6  ...  5)
 2, 7 sd 
 i
( d  d ) 2

76,1
 2, 9
n 10 n 1 9
sd
d  t 2
n
2,9
2, 7  2,262
10
2, 7  2, 07
khoảng tin cậy 95% cho khác biệt giữa trung bình của hai
dịch vụ là từ 0,63 đến 4,77 giờ.
Suy diễn về sự khác biệt giữa các tỷ lệ
của hai tổng thể
Phân phối mẫu của p1  p2

Ước lượng khoảng của p1 - p2
Phân phối mẫu của p1  p2
 Giá trị kỳ vọng
E ( p1  p 2 )  p1  p 2
 Độ lệch chuẩn
p1 (1  p1 ) p2 (1  p2 )
 p1  p2  
n1 n2
 Dạng phân phối
Nếu cỡ mẫu lớn (n1p1, n1(1 - p1), n2p2, và n2(1 - p2) đều lớn
hơn hoặc bằng 5), phân phối lấy mẫu củap1  p2 có thể
được xấp xỉ bằng phân phối xác suất chuẩn.
Ước lượng khoảng của p1 - p2
 Ước lượng khoảng

p1  p 2  z  / 2  p1  p2
 Ước lượng điểm của  p1  p2
p1 (1  p1 ) p2 (1  p2 )
s p1  p2  
n1 n2
Ví dụ: MRA
MRA (Những người cộng tác Nghiên cứu marketing) đang
thực hiện một nghiên cứu nhằm đánh giá tính hiệu lực của
chiến dịch quảng cáo mới của một khách hàng. Trước khi
chiến dịch mới bắt đầu, một cuộc điều tra qua điện thoại 150
hộ trong khu vực thị trường thử nghiệm cho thấy 60 hộ “biết”
sản phẩm của khách hàng này. Chiến dịch mới được bắt đầu
với việc quảng cáo trên truyền hình và báo chí trong ba tuần
liền. Một cuộc khảo sát được tiến hành ngay sau chiến dịch
mới cho thấy 120 trong số 250 hộ “biết” sản phẩm của khách
hàng này.
Dữ liệu nói trên có chứng minh quan điểm rằng chiến dịch
quảng cáo làm tăng sự nhận biết của khách hàng về sản
phẩm hay không?
Ví dụ: MRA
 Ước lượng điểm sự khác biệt giữa tỷ lệ của hai

tổng thể
120 60
p1  p 2  p1  p 2    0, 48  0, 40  0, 08
250 150
p1 = tỷ lệ tổng thể hộ “biết đến” sản phẩm sau chiến dịch mới
p2 = tỷ lệ tổng thể hộ “biết đến” sản phẩm trước chiến dịch mới
p1
= tỷ lệ mẫu hộ “biết đến” sản phẩm sau chiến dịch mới
p2 = tỷ lệ mẫu hộ “biết đến” sản phẩm trước chiến dịch mới
Ví dụ: MRA
 Ước lượng khoảng của p1 - p2: Trường hợp mẫu

lớn
0, 48(0, 52) 0, 40(0, 60)
0, 48  0, 40  1, 96 
250 150
0,08 + 0,10 hay từ -0,02 đến 0,18

 Kết luận
Với độ tin cậy 95%, khác biệt giữa tỷ lệ hộ biết đến sản
phẩm của khách hàng trước và sau chiến dịch quảng cáo
mới được ước lượng trong khoảng từ -2% đến 18%.

BK C5 - TBP

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

BK C5 - TBP

Uploaded by

Copyright:

Available Formats

CHƯƠNG 5

PHÂN PHỐI MẪU

 Giới thiệu vấn đề lấy mẫu

 Một Tổng thể là tập hợp tất cả các phần tử cần

 Mục đích của thống kê suy diễn là thu thập

 Các trị thống kê mẫu:

 Trung bình mẫu x,

giá trị tham số của tổng thể

 Định nghĩa của mẫu ngẫu nhiên đơn giản và quá

 Lấy mẫu từ tổng thể hữu hạn

 Lấy mẫu từ tổng thể hữu hạn

• Lấy mẫu có thay thế : Khi một phần tử được chọn

 Lấy mẫu từ tổng thể vô hạn

 Trong Ước lượng điểm chúng ta sử dụng dữ liệu từ

 Giá trị kỳ vọng của x

 Một tổng thể gồm 7 nhân Tên nhân Mức lương

Một mẫu ngẫu nhiên

Giá trị X được dùng Tổng kết của dữ liệu mẫu

 Định lý giới hạn trung tâm

 Nếu biến ngẫu nhiên X có phân phối chuẩn thì trung

Phân phối mẫu của p là phân phối xác suất

 Giá trị kỳ vọng của p cũng có thuộc tính không

Tổng thể Một mẫu ngẫu nhiên

Giá trị p được dùng Tổng kết của dữ liệu mẫu

Phân phối mẫu của p có thể gần đúng tuân

 30% các hộ gia đình ở một địa bàn có hệ thống

 Lấy mẫu hệ thống

 Lấy mẫu thuận tiện

 Lấy mẫu phán đoán

 Ước lượng khoảng là một ước lượng của một

tham số của tổng thể theo đó cung cấp một

khoảng được tin là sẽ chứa giá trị của tham số

 Trường hợp cỡ mẫu lớn: n  30

 Một cách tổng quát ƯỚC LƯỢNG KHOẢNG là:

Ước lượng điểm  Biên của sai số

 Tính ước lượng khoảng: biết 

CÁC GIÁ TRỊ CỦA Z/2 ĐỐI VỚI CÁC MỨC

Mức tin cậy  /2 Z/2

 Tính ước lượng khoảng: biết 

 Nếu không biết , độ lệch chuẩn của mẫu s

 Trị thống kê t sẽ tuân theo một Phân phối

Phân phối chuẩn chuẩn hóa

Đường cong t với bậc tự

 Ước lượng khoảng của một trung bình tổng thể:

Có thể giả sử độ Không

Dùng độ lệch chuẩn

 Khoảng ước lượng của tỷ lệ p tập hợp chính với độ

 Mẫu n quan sát được chọn ngẫu nhiên từ tổng thể có

 Với  n21 có phân phối  2 với n-1 bậc tự do

Với n=15, S2=2,362 = 5,5696,

1,7277 < δ < 3,7215

 Ước lượng khoảng của tỉ lệ tổng thể

 Xác định cỡ mẫu

– HAI TỔNG THỂ

 Ước lượng sự khác biệt giữa hai trung bình

Một công ty mở lớp huấn luyện nhân viên, và

 Thống kê ước lượng điểm sự khác biệt giữa hai

Các tính chất của phân phối mẫu của x1  x2

trong đó: - 1, n1 : độ lệch chuẩn, kích thước của

 Áp dụng định lý giới hạn trung tâm nên phân phối

Par là một hãng sản xuất thiết bị đánh gôn và đã

s12 s 22 (15) 2 (20) 2

= 17 + 5,14 hay từ 11,86m đến 22,14m.