Professional Documents
Culture Documents
Chuong 7 Chon Mau Du
Chuong 7 Chon Mau Du
CHỌN MẪU VÀ
PHÂN PHỐI XÁC SUẤT MẪU
■ Chọn một mẫu
Các kết quả mẫu chỉ cung cấp các ước lượng
về các tham số tổng thể. Lý do đơn giản mẫu
chỉ là một phần của tổng thể.
Với các phương pháp lấy mẫu thích hợp, các kết
quả mẫu có thể cung cấp các ước lượng “tốt”
các tham số tổng thể.
Chọn mẫu
Chọn mẫu phụ thuộc vào tổng thể là hữu
hạn hay vô hạn
Lấy mẫu từ một tổng thể hữu hạn
Tổng thể hữu hạn thường được định nghĩa bằng
các danh sách như:
– Bảng phân công các thành viên của tổ chức
– Các số tài khoản thẻ tín dụng
– Bảng kê số sản phẩm
Chọn mẫu từ một tổng thể hữu hạn
Bảng 7.2 dưới đây thể hiện mức lương hàng năm và
tình trạng hoàn thành chương trình đào tạo quản lý
của mẫu gồm 30 nhà quản lý
Lương /năm, usd Hoàn tất CTĐTQL Lương /năm, usd Hoàn tất CTĐTQL
x = 1.554.420 / 30 = 51.814
Mức lương trung bình mẫu
x
x
i1554420
51.814 USD
n 30
( x là ước lượng điểm của μ):
Độ lệch chuẩn của mẫu s là ước lượng điểm của σ
s
i
( x x ) 2
325009260
3348 USD
n 1 29
Tỷ lệ các nhà quản lý đã hoàn thành chương trình
đào tạo quản lý của mẫu là ước lượng điểm của p
x 19
p 0, 63
n 30
Nhắc lại: Khi tất cả dữ liệu của 2500 nhà quản lý có đầy
đủ trong cơ sở dữ liệu của công ty X, giá trị các tham số
tổng thể quan tâm được tính toán.
i
( x ) 2
4000
2500
Tỷ lệ tổng thể các nhà quản lý đã hoàn thành CT đào tạo qlý
1500
p 0.6
2500
Bảng tóm tắc các Ước Lượng Điểm có được từ
một mẫu ngẫu nhiên đơn giản
x
Giá trị của được Dữ liệu mẫu cung
sử dụng để suy diễn cấp một giá trị cho
về giá trị của m. trung bình mẫu x .
7.4 Phân phối mẫu của 𝑥
Phân phối mẫu của là𝑥 phân phối xác suất của tất
cả các giá trị có thể có của trung bình mẫu 𝑥
Bởi vì có nhiều giá trị khác nhau của biến ngẫu
nhiên 𝑥 . Chúng ta quan tâm đến giá trị trung bình của
tất cả giá trị có thể có của 𝑥
Giá trị trung bình của biến ngẫu nhiên là𝑥 giá trị kỳ
vọng của 𝑥
Đặt E( ) 𝑥- giá trị kỳ vọng của
μ – giá trị trung bình tổng thể.
Với cách chọn mẫu ngẫu nhiên đơn giản:
Giá trị kỳ vọng của 𝑥 : E( 𝑥 ) = 𝜇 𝑥 = μ
Khi giá trị kỳ vọng của tham số ước lượng
điểm bằng tham số tổng thể chúng ta nói
tham số ước lượng điểm là không chệch
(Trung bình của tất cả trung bình mẫu bằng
trung bình tổng thể).
Độ lệch chuẩn của 𝑥
Ký hiệu: - độ lệch chuẩn của 𝑥
x
σ - độ lệch chuẩn của tổng thể
n - cỡ mẫu
N - Quy mô tổng thể
Độ lệch chuẩn của 𝑥 phụ thuộc vào tổng
thể là hữu hạn hay vô hạn
Tổng thể hữu hạn Tổng thể vô hạn
N n x
x n
N 1 n
N n
Thừa số được gọi là hệ số điều chỉnh
N 1
tổng thể hữu hạn.
Vì vậy,
x trở thành một ước lượng tốt đối với độ lệch
n
chuẩn của mặ𝑥c dù tổng thể là hữu hạn.
Công thức: x n (Còn được xem như sai số
chuẩn của trung bình) khuyến nghị sử
dụng khi:
1. Tổng thể là vô hạn hoặc
2. Tổng thể là hữu hạn và cỡ mẫu nhỏ hơn
hoặc bằng 5% (n/N ≤ 0,05)
Dạng phân phối mẫu của 𝑥
Nếu tổng thể tuân theo phân phối chuẩn
(Normal Population) với trung bình bằng µ và
độ lệch tiêu chuẩn σ thì phân phối mẫu của 𝑥
cũng sẽ tuân theo phân phối chuẩn với trung
bình cũng bằng: x và
2
Độ lệch chuẩn: x x
n
Nghĩa là, khi tổng thể có phân phối chuẩn, thì phân
phối mẫu của 𝑥
được phân phối chuẩn với mọi cỡ
mẫu.
Nếu tổng thể không có phân phối chuẩn thì định
lý giới hạn trung tâm (Central limit theorem) cho
phép xác định hình dạng phân phối của 𝑥
Trước hết: Chuẩn hóa trung bình mẫu 𝑥
Đặt z x x x
x / n
x
4000
730,3 P(51.300 ≤ 𝑥 ≤ 52.300)
n 30
4000
x 730,3
Sampling n 30
distribution of 𝑥
𝑥
E( 𝑥 ) = 51.800
Probability of sample mean being within 500 usd of the
population mean for a sample random sample of 30
managers
52300 51800 P(51.300 ≤ x ≤ 52.300)
z 0,68 ≈ P(- 0,68 ≤ Z ≤ 0.68)
730,3
51300 51800
z 0,68
730,3
0.2483
x
51.300 52.300
51.800
Z
-0.68 0 +0.68
52300 51800
Từ giá trị x 52.300
, ta có z 0,68
730,3
𝑥
• E( ) = m bất chấp cỡ mẫu. Trong ví dụ của chúng ta,
𝑥
E( ) vẫn là 51800.
• Bất cứ khi nào cỡ mẫu tăng lên, sai số chuẩn của
trung bình 𝑥 giảm xuống. Với mẫu tăng lên thành
n = 100, sai số chuẩn của trung bình giảm xuống
từ 730,3 thành 400
4000
x 400
n 100
Mối Quan Hệ Giữa Cỡ Mẫu và Phân Phối Mẫu
của x
Với n = 100,
x 400
Với n = 30,
x 730, 3
E ( x) 51800
E (x ) 51800
51.300 − 51.800 52300 51800
𝑍= =−1,25 z 1, 25
400 400
-1,25 +1,25
Ví dụ 7.1:
p (1 p ) 0, 60(1 0, 60)
p 0, 0894
n 30
x
Dạng phân phối mẫu của p
n
Ký hiệu:
θ – Tham số tổng thể quan tâm (theta)
- Thống kê mẫu hay ước lượng điểm
(không chệch) của θ gọi là theta-hat.
Chệch
θ )
E(
θ
Tham số θ nằm tại giá trị Tham số θ không nằm tại giá
trung bình của phân phối trị trung bình của phân phối
mẫu E ( ) = θ mẫu E ( ) ≠ θ
Ước lượng không chệch Ước lượng chệch
Ví dụ: Mức năng suất lao động ngày của 5
công nhân (kg): 20, 22, 25, 30 và 32. Kích
thước mẫu bằng 2 và chọn không lặp:
n N! 5!
C 10
n! N n ! 2!5 2 !
N
Mẫu Trung
bình
Mẫu Trung
bình
Trung bình tổng
mẫu mẫu thể:
20 và 21,0 22 và 30 26,0 µ = (20 + 22+ 25 +
22
30 + 32)/5 = 25,8
20 và 25 22,5 22 và 32 27,0 kg
Trung bình cuûa
20 và 30 25,0 25 và 30 27,5 taát caû trung bình
maãu:
20 và 32 26,0 25 và 32 28,5
(21,0+22,5+25,0+…+
28,5+31,0)/10
= 25,8 kg
22 và 25 23,5 30 và 32 31,0
Tức là:
x
E ( ) = μ =25,8 kg
Tính hiệu quả
Giả sử cần lựa chọn hai tham số ước lượng
điểm không chệch của cùng tham số tổng thể.
Chúng ta sẽ thích sử dụng tham số ước lương
điểm có độ lệch chuẩn nhỏ hơn, vì nó có xu hướng
cho ra các ước lượng gần với tham số tổng thể hơn.
Tham số ước lương điểm có độ lệch chuẩn nhỏ
hơn được gọi là có tính hiệu quả tương đối lớn hơn
tham số còn lại.
Phân phối mẫu của 2 ước lượng điểm không chệch
𝜃 Theta-hat
Ước lượng vững
là ước lượng vững của θ nếu có xu
hướng ngày càng gần với θ khi kích thước
mẫu tăng lên.
(Cỡ mẫu lớn làm cho giá trị x nhỏ
n
→ ước lượng điểm gần với trung bình tổng
thể hơn).
CÁC PHƯƠNG PHÁP LẤY MẪU KHÁC
Các Phương Pháp Lấy Mẫu Khác
Lấy mẫu ngẫu nhiên phân tầng (lớp)
Lấy mẫu cụm (cả khối)
Lấy mẫu hệ thống
Lấy mẫu thuận tiện (thuận lợi)
Lấy mẫu phán đoán
Lấy Mẫu Ngẫu Nhiên Phân tầng
Đầu tiên tổng thể được chia thành các nhóm phần tử
gọi là các tầng.
Các kết quả tốt nhất đạt được khi các phần tử trong
mỗi tầng tương tự càng nhiều càng tốt (nghĩa là, phần
tử trong cùng nhóm thì thuần nhất).
Lấy mẫu ngẫu nhiên phân tầng
Một mẫu ngẫu nhiên đơn giản được lấy từ mỗi tầng.
Các công thức có sẵn kết hợp các kết quả mẫu tầng
thành một ước lượng tham số tổng thể.
Thuận lợi: Nếu các tầng thuần nhất, phương pháp này
“chính xác ” như lấy mẫu ngẫu nhiên đơn giản nhưng
với cỡ mẫu nhỏ hơn.
Bằng 25 25 25 25 n = 100
nhau
Theo tỷ 35 20 15 30 n=100
Lấy mẫu thuận tiện
- Chủ yếu bởi sự thuận tiện
- Các phần tử (kể cả trong mẫu) không có
khả năng được biết hay xác định trước về việc
chọn lựa.
Đầu tiên tổng thể được chia thành các nhóm riêng lẻ
gồm các phần tử gọi là các cụm.
Một mẫu nhiên đơn giản gồm các cụm được lấy.