Professional Documents
Culture Documents
BK C5 - TBP
BK C5 - TBP
1
NỘI DUNG CHÍNH
2
GIỚI THIỆU VẤN ĐỀ LẤY MẪU
3
GIỚI THIỆU VẤN ĐỀ LẤY MẪU
Lấy mẫu
ngẫu nhiên
Tổng thể
N (Cỡ) Mẫu
(Trung bình) n
(Độ lệch x
s
chuẩn)
p (Tỉ lệ)
p
Ước lượng
Kiểm định
Giả thuyết
4
GIỚI THIỆU VẤN ĐỀ LẤY MẪU
tỉ lệ mẫu p .
Giá trị của trị thống kê mẫu được dùng để ước lượng
5
LẤY MẪU NGẪU NHIÊN ĐƠN GIẢN
N!
n!( N n )!
7
LẤY MẪU NGẪU NHIÊN ĐƠN GIẢN
8
LẤY MẪU NGẪU NHIÊN ĐƠN GIẢN
9
ƯỚC LƯỢNG ĐIỂM
10
GIỚI THIỆU PHÂN PHỐI MẪU
Phân phối xác suất của bất kỳ trị thống kê mẫu cụ
thể được gọi là phân phối mẫu của trị thống kê.
Phân phối xác suất của x được gọi là phân phối
mẫu của x .Kiến thức về phân phối mẫu này và
các tính chất của nó sẽ cho phép chúng ta phát
biểu về xác suất để cho trung bình của mẫu x gần
bằng với trung bình của tổng thể .
Trong thực tế, chúng ta chỉ chọn một mẫu ngẫu
nhiên đơn giản từ tổng thể
11
PHÂN PHỐI MẪU CỦA x
Phân phối mẫu của x
Phân phối mẫu của x là phân phối xác suất của
tất cả các giá trị có thể của trung bình mẫu x
E(x ) =
12
Ví dụ:
13
Nếu mẫu n=2 được chọn từ tổng thể 7
Nhân Mức Nhân Mức TB
Mẫu viên lương TB Mẫu Mẫu viên lương Mẫu
1 A,B 70, 70 70 12 C,D 80, 80 80
2 A,C 70, 80 75 13 C,E 80, 70 75
3 A,D 70, 80 75 14 C,F 80, 80 80
4 A,E 70, 70 70 15 C,G 80, 90 85
5 A,F 70, 80 75 16 D,E 80, 70 75
6 A,G 70, 90 80 17 D,F 80, 80 80
7 B,C 70, 80 75 18 D,G 80, 90 85
8 B,D 70, 80 75 19 E,F 70, 80 75
9 B,E 70, 70 70 20 E,G 70, 90 80
10 B,F 70, 80 75 21 F,G 80, 90 85
11 B,G 70, 90 80
14
PHÂN PHỐI MẪU CỦA x
15
PHÂN PHỐI MẪU CỦA x
Độ lệch chuẩn của x
Tổng thể vô hạn hay không biết N X
n
Nn
Tổng thể hữu hạn hay biết N x
n N 1
Nn
Với là nhân tố điều chỉnh tổng thể hữu hạn
N 1
16
PHÂN PHỐI MẪU CỦA x
Độ lệch chuẩn của
• Bỏ qua nhân tố điều chỉnh tổng thể hữu hạn khi
n/N 0.05
• Sai số chuẩn là độ lệch chuẩn của một ước lượng
điểm
được xem như sai số chuẩn của trung bình
x
17
PHÂN PHỐI MẪU CỦA x
Phân phối của x
• Câu hỏi: Phân phối xác suất của x là gì?
18
PHÂN PHỐI MẪU CỦA x
Định lý giới hạn trung tâm
• Trong việc chọn các mẫu ngẫu nhiên đơn giản cỡ
mẫu n từ một tổng thể, phân phối mẫu của trung
bình mẫu x có thể gần đúng tuân theo phân phối
chuẩn khi cỡ mẫu đủ lớn.
• X ~ Bất kỳ phân phối nào
• Không biết phân phối
xác suất tổng thể X N (, 2/n)
• Cỡ mẫu lớn
(N>30)
19
PHÂN PHỐI MẪU CỦA x
X N (, 2/n) Z N (0,12)
với
x
x
/ n
20
3 kết luận từ định lý giới hạn trung tâm
21
PHÂN PHỐI MẪU CỦA p
Phân phối mẫu của p
E( p ) = p
22
PHÂN PHỐI MẪU CỦA p
23
PHÂN PHỐI MẪU CỦA p
Độ lệch chuẩn của p
p(1 p)
• Tổng thể vô hạn: p
n
p(1 p) N n
• Tổng thể hữu hạn: p
n N 1
Bỏ qua nhân tố điều chỉnh tổng thể hữu hạn
Nn
khi n/N < 0.05
N 1
24
PHÂN PHỐI MẪU CỦA p
Dạng phân phối mẫu của p
25
Ví dụ:
26
0,25 P P P 0,35 P
P( )
P P P
0,25 0,30 0,35 0,30
P( Z )
0,30(1 0,30) 0,30(1 0,30)
250 250
P (1,72 Z 1,72) 2(0,4573)
0,9164
27
TÍNH CHẤT CỦA ƯỚC LƯỢNG ĐIỂM
Gọi
= tham số tổng thể được quan tâm
̂= trị thống kê mẫu hay ước lượng điểm của
Không thiên lệch
Trị thống kê mẫu ̂ là một ước lượng không thiên lệch
của tham số tổng thể nếu
E( ) = ̂
Độ thiên lệch (Bias)
Bias ( ) = E( ̂) - ̂
28
TÍNH CHẤT CỦA ƯỚC LƯỢNG ĐIỂM
Độ hữu hiệu
Cho hai ước lượng điểm không thiên lệch của tham số
tổng thể, ước lượng điểm với độ lệch chuẩn nhỏ hơn ̂1
được xem là hiệu quả hơn ̂ 2 nếu:
Var̂(1 ) < Var̂ 2( )
Độ nhất quán
Một tính chất của ước lượng điểm được trình bày khi các
cỡ mẫu lớn hơn sẽ cung cấp các ước lượng điểm gần
với tham số của tổng thể
29
CÁC PHƯƠNG PHÁP LẤY MẪU KHÁC
30
CÁC PHƯƠNG PHÁP LẤY MẪU KHÁC
31
ƯỚC LƯỢNG KHOẢNG CỦA
TRUNG BÌNH TỔNG THỂ: BIẾT
32
ƯỚC LƯỢNG KHOẢNG CỦA
TRUNG BÌNH TỔNG THỂ: BIẾT
33
ƯỚC LƯỢNG KHOẢNG CỦA
TRUNG BÌNH TỔNG THỂ: BIẾT
f(x)
1-
S /2
x
-z/2 z/2
P( Z > Z/2) = /2
P( Z < -Z/2) = /2
P( -Z/2 < Z < Z/2) = 1-
Z/2: là giá trị của biến phân phối chuẩn chuẩn hóa tương ứng với một
diện tích /2 ở dưới đuôi phía trên của phân phối
34
ƯỚC LƯỢNG KHOẢNG CỦA
TRUNG BÌNH TỔNG THỂ: BIẾT
x
P Z 2 Z 2 1
/ n
P x Z 2 x Z 2 1
n n
35
ƯỚC LƯỢNG KHOẢNG CỦA
TRUNG BÌNH TỔNG THỂ: BIẾT
x Z 2
Với: n
• (1-) là độ tin cậy
• x là ước lượng điểm của
• Z 2 là biên của sai số
n
• Cỡ mẫu lớn (n 30) dùng công thức này
36
ƯỚC LƯỢNG KHOẢNG CỦA
TRUNG BÌNH TỔNG THỂ: BIẾT
37
ƯỚC LƯỢNG KHOẢNG CỦA
TRUNG BÌNH TỔNG THỂ: BIẾT
x Z 2 , x Z 2
n n
38
ƯỚC LƯỢNG KHOẢNG CỦA
TRUNG BÌNH TỔNG THỂ: KHÔNG BIẾT
Nếu n N thì t # Z
40
ƯỚC LƯỢNG KHOẢNG CỦA
TRUNG BÌNH TỔNG THỂ: KHÔNG BIẾT
t
Phân phối t
41
ƯỚC LƯỢNG KHOẢNG CỦA
TRUNG BÌNH TỔNG THỂ: KHÔNG BIẾT
42
TỔNG KẾT CÁC THỦ TỤC ƯỚC LƯỢNG KHOẢNG ĐỐI VỚI
TRUNG BÌNH TỔNG THỂ
Dùng Dùng
s
x z /2 x t / 2
n n
Trường hợp biết Trường hợp không biết
43
KHOẢNG TIN CẬY CỦA TỈ LỆ
P(1 P) P(1 P)
P Z / 2 P P Z / 2
n n
44
KHOẢNG TIN CẬY CỦA PHƯƠNG SAI
(n 1) S 2 2 ( n 1 ) S 2
2
2
n 1, / 2 n 1,1 / 2
45
Ví dụ:
Một nhà sản xuất quan tâm đến biến thiên của tỉ lệ tạp
chất trong một loại hương liệu được cung cấp. Chọn
ngẫu nhiên 15 mẫu hương liệu cho thấy S= 2,36%,
khoảng tin cậy 95% của độ lệch chuẩn là bao nhiêu.
46
XÁC ĐỊNH CỠ MẪU
Gọi ε = biên của sai số kỳ vọng
Z 2
n
Cỡ mẫu đối với ước lượng khoảng của một
trung bình của tổng thể
n
2 2
Z 2
2
Cỡ mẫu đối với không biết n
2
Z 2 s 2
2
ε còn gọi là sai số ước lượng
47
ƯỚC LƯỢNG KHOẢNG CỦA
TỈ LỆ TỔNG THỂ
( p) p
p p(1 p ) / n
p Z 2 p (1 p ) / n
48
ƯỚC LƯỢNG KHOẢNG CỦA
TỈ LỆ TỔNG THỂ
Z 2 p(1 p ) / n
n
Z p(1 p )
2
2
2
49
ƯỚC LƯỢNG KHOẢNG CỦA
CÁC THAM SỐ THỐNG KÊ
12 22
Độ lệch chuẩn x1 x2
n1 n2
x1 x 2 z / 2 x1 x2
trong đó:
1 - : độ tin cậy
Ví dụ
Một công ty nghiên cứu thị trường được thuê thực hiện một
cuộc khảo sát khách hàng của một chuỗi cửa hàng thực
phẩm lớn để ước lượng sự khác biệt trong thời gian trung
bình mỗi lần ghé cửa hàng của khách hàng nam và khách
hàng nữ. Các nghiên cứu trước đó cho biết độ lệch chuẩn là
11 phút đối với khách nam và 16 phút đối với khách nữ. Công
ty đã chọn ngẫu nhiên 100 khách nam và 100 khách nữ vào
những thời điểm khác nhau ở các cửa hàng khác nhau trong
chuỗi cửa hàng này để khảo sát. Kết quả là thời gian trung
bình của khách nam tại cửa hàng này là 34,5 phút còn thời
gian trung bình của khách nữ là 42,4 phút.
Hãy xây dựng khoảng tin cậy 95% cho khác biệt giữa hai
trung bình tổng thể.
Ước lượng khoảng của 1 - 2:
Trường hợp không biết phương sai tổng
thể, mẫu lớn
trong đó:
s12 s22
sx1 x2
n1 n2
Ví dụ: Công ty Par
(2) Phương sai của hai tổng thể không bằng nhau
(21 ≠ 22)
Ước lượng khoảng của 1 - 2:
Trường hợp không biết phương sai tổng
thể, mẫu nhỏ (n1 < 30 và/hoặc n2 < 30)
Độ lệch chuẩn của x1 khi
x 2 (21 = 22 = 2)
1 1
2
x1 x2
n1 n2
x 1 x 2 t / 2 s x1 x 2
Ước lượng khoảng
Sử dụng phân phối t với bậc tự do n1 + n2 - 2
Ví dụ: Specific Motors
Ước lượng khoảng 95% khác biệt giữa hai trung bình tổng
thể: Trường hợp không biết phương sai tổng thể, mẫu nhỏ
21 1 1 1
x1 x2 t 0,025 s 2, 5 2,101 5, 28
p
n1 n2 12 8
2
2
1 n1 s s n2 2 2
s 2
n s 2
2 n2
trong đódf 2 1
1 1
2 2
2
s2 s1 2
2
2
s1 n1 2
s2 n2
1
2 2
n1 n1 1 n2 n2 1 n1 1 n2 1
Suy diễn về khác biệt giữa
Với thiết kế mẫu phối hợp từng cặp mỗi hạng mục
lấy mẫu cho một cặp các giá trị dữ liệu.
Việc thiết kế mẫu phối hợp từng cặp có thể được
gọi là tạo khối (blocking).
Việc thiết kế này thường đưa đến sai số lấy mẫu
nhỏ hơn so với thiết kế mẫu độc lập vì độ biến
thiên giữa các hạng mục lấy mẫu được loại bỏ
như là một nguồn của sai số lấy mẫu.
Suy diễn về khác biệt giữa hai trung
bình tổng thể: Mẫu phối hợp từng cặp
So sánh “trước” và “sau”, chẳng hạn mẫu thứ nhất: doanh
số bán trước khi thực hiện chiến dịch khuyến mãi; mẫu thứ
hai: doanh số bán sau khi thực hiện chiến dịch khuyến mãi.
Ở đây, mẫu phối hợp từng cặp theo nghĩa là từng cặp
doanh số trước và sau khi khuyến mãi được thu thập ở
cùng một cửa hàng.
So sánh giữa các đơn vị về một đặc điểm nào đó, chẳng
hạn mẫu thứ nhất: tiền lương của nhân viên nam ở công ty
Y; mẫu thứ hai: tiền lương của nhân viên nữ ở công ty Y –
hai nhân viên nam, nữ được xem là có năng lực và kinh
nghiệm như nhau. Ở đây mẫu phối hợp từng cặp theo
nghĩa là cả hai nhân viên nam, nữ được xem là có năng lực
và kinh nghiệm như nhau.
Mẫu phối hợp từng cặp
So sánh giữa các đơn vị phối hợp từng cặp theo không
gian, chẳng hạn mẫu thứ nhất: doanh số của hai loại nước
giải khát nhãn hiệu A ở n cửa hàng; mẫu thứ hai: doanh số
của hai loại nước giải khát nhãn hiệu B ở n cửa hàng đó. Ở
đây mẫu phối hợp từng cặp theo nghĩa là cả hai doanh số
của hai nhãn hiệu A, B đều được thu thập từ cùng một cửa
hàng.
So sánh giữa các đơn vị phối hợp từng cặp theo thời gian,
chẳng hạn mẫu thứ nhất: doanh số của nhà hàng X ở một
tuần lễ nào đó; mẫu thứ hai: doanh số của nhà hàng Y trong
cùng tuần lễ đó. Ở đây mẫu phối hợp từng cặp theo nghĩa
là từng cặp doanh số được thu thập trong cùng một tuần lễ.
Ví dụ: Express Deliveries (chuyển
phát nhanh)
Suy diễn về sự khác biệt giữa hai trung bình tổng thể:
mẫu phối hợp từng cặp
Một công ty đặt tại Chicago có tài liệu phải chuyển phát
nhanh đến các văn phòng quận trên khắp nước Mỹ. Công
ty này phải lựa chọn giữa hai dịch vụ chuyển phát nhanh,
UPX (United Parcel Express) và INTEX (International
Express), để chuyển phát tài liệu. Để thử nghiệm về thời
gian chuyển phát của hai dịch vụ nói trên, công ty gửi hai
bản báo cáo đến một mẫu ngẫu nhiên gồm có 10 văn
phòng quận, với một báo cáo do UPX chuyển đi và báo
cáo kia do INTEX chuyển đi.
Dữ liệu sau đây có cho biết sự chênh lệch về thời gian
chuyển phát của hai dịch vụ nói trên không?
Ví dụ: Express Deliveries
d
d i
(7 6 ... 5)
2, 7 sd
i
( d d ) 2
76,1
2, 9
n 10 n 1 9
sd
d t 2
n
2,9
2, 7 2,262
10
2, 7 2, 07
khoảng tin cậy 95% cho khác biệt giữa trung bình của hai
dịch vụ là từ 0,63 đến 4,77 giờ.
Suy diễn về sự khác biệt giữa các tỷ lệ
của hai tổng thể
Độ lệch chuẩn
p1 (1 p1 ) p2 (1 p2 )
p1 p2
n1 n2
Dạng phân phối
Nếu cỡ mẫu lớn (n1p1, n1(1 - p1), n2p2, và n2(1 - p2) đều lớn
hơn hoặc bằng 5), phân phối lấy mẫu củap1 p2 có thể
được xấp xỉ bằng phân phối xác suất chuẩn.
Ước lượng khoảng của p1 - p2
p1 (1 p1 ) p2 (1 p2 )
s p1 p2
n1 n2
Ví dụ: MRA
MRA (Những người cộng tác Nghiên cứu marketing) đang
thực hiện một nghiên cứu nhằm đánh giá tính hiệu lực của
chiến dịch quảng cáo mới của một khách hàng. Trước khi
chiến dịch mới bắt đầu, một cuộc điều tra qua điện thoại 150
hộ trong khu vực thị trường thử nghiệm cho thấy 60 hộ “biết”
sản phẩm của khách hàng này. Chiến dịch mới được bắt đầu
với việc quảng cáo trên truyền hình và báo chí trong ba tuần
liền. Một cuộc khảo sát được tiến hành ngay sau chiến dịch
mới cho thấy 120 trong số 250 hộ “biết” sản phẩm của khách
hàng này.
Dữ liệu nói trên có chứng minh quan điểm rằng chiến dịch
quảng cáo làm tăng sự nhận biết của khách hàng về sản
phẩm hay không?
Ví dụ: MRA
p1 = tỷ lệ tổng thể hộ “biết đến” sản phẩm sau chiến dịch mới
p2 = tỷ lệ tổng thể hộ “biết đến” sản phẩm trước chiến dịch mới
p1
= tỷ lệ mẫu hộ “biết đến” sản phẩm sau chiến dịch mới
p2 = tỷ lệ mẫu hộ “biết đến” sản phẩm trước chiến dịch mới
Ví dụ: MRA