Professional Documents
Culture Documents
KHÁI NIỆM
Ệ PHƯƠNG PHÁP MẪU
TS N
TS. Nguyễn
ễ MMạnh
h Thế
1
v1.0012107210
TÌNH HUỐNG KHỞI ĐỘNG
Tình
ì huống
ố
Điều tra mức thu nhập cá nhân trong một tháng (triệu đồng)
ở huyện Đông Anh,
Anh ta có bảng số liệu mẫu sau:
Thu nhập 1-2 2-3 3-4 4-5 5-6 6-7
Số người 10 8 5 7 3 2
Cần phải tính thu nhập bình quân đầu người và độ chênh
lệch thu nhập để xác định mức sống của người dân và mức
độ đồng đều về thu nhập trong vùng.
Kết luận
1. Thống
g kê:
1 n
X G(X1 , X 2 ,..., X n ) X i
n i1
được gọi là trung bình mẫu.
2. Thống kê:
1 n
S S 2
i
n i1
(X X) 2
3
v1.0012107210
MỤC TIÊU
• Cơ sở lý thuyết mẫu;
• Thống
Thố kê;
kê
• Quy
Q y luật
ậ pphân pphối xác suất
của một số thống kê.
4
v1.0012107210
1. CỞ SỞ LÝ THUYẾT MẪU
5
v1.0012107210
2. TỔNG THỂ NGHIÊN CỨU
Định nghĩa:
Tổng thể là tập hợp các phần tử cần nghiên cứu tính chất định tính hoặc định
lượng số phần tử trong tổng thể gọi là cỡ của tổng thể,
lượng, thể ký hiệu là N.
N
Mã hóa: Lấy giá trị của biến định Mã hoá: Gán tính chất định tính
lượng làm mã của biến. của biến ứng với các số nguyên.
Vậy khi nghiên cứu tổng thể ta luôn có thể giả sử là các các phần tử có dấu
hiệu định lượng.
6
v1.0012107210
2. TỔNG THỂ NGHIÊN CỨU (tiếp theo)
Mô tả tổng thể
Cho tổng thể với các phần tử { x1 , x 2 ,..., x n }. Với Ni là số lần giá trị xi
xuất hiện
ệ trong
g tổng
g thể, ta có: N1 N2 ... Nk N
Ni
Đặt fi (i 1...k), fi được gọi là tần suất của xi trong tổng thể:
N
xi x1 x2 … xk
fi f1 f2 … fk
Dễ thấy: f1 f2 ... fk 1
7
v1.0012107210
3. MẪU NGẪU NHIÊN
8
v1.0012107210
3.1. CÁC PHƯƠNG PHÁP LẤY MẪU
M đích
Mục đí h
• Ta không thể nghiên cứu cặn kẽ từng phần tử của tổng thể, do đó phải
nghiên cứu hạn chế trên một nhóm nhỏ rút ra từ tổng thể gọi là mẫu,
mẫu từ
đó rút ra kết luận cho tổng thể.
• Một mẫu được gọi là đại diện tốt nhất cho tổng thể nếu nó là mẫu ngẫu
nhiên (random sample).
Các phương pháp lấy mẫu
• Cách chọn mẫu ngẫu nhiên đơn giản:
Chọn mẫu ngẫu nhiên có hoàn lại;
Chọn mẫu ngẫu nhiên không hoàn lại.
• Chọn mẫu phân cấp: Chia tổng thể ra thành k tổng thể bộ phận và ta thực
hiện cách lấy mẫu ngẫu nhiên đơn giản trên mỗi tổng thể thành phần.
9
v1.0012107210
3.2. ĐỊNH NGHĨA MẪU NGẪU NHIÊN
Một
ộ mẫuẫ ngẫu
ẫ nhiên
h ê cỡ
ỡ n của
ủ biến
b ế ngẫu
ẫ nhiên
h ê X là một
ộ tập
ậ cácá biến
bế
ngẫu nhiên X1, X2,… Xn độc lập và có cùng phân phốí với biến ngẫu
nhiên X.
Trong đó mỗi Xk là một quan sát về biến ngẫu nhiên X.
Quan sát Xk nhận giá trị xk
Khi đó bộ giá trị x1 , x 2 ,..., x n gọi là giá trị cụ thể của mẫu ngẫu nhiên
X1 , X 2 ,..., X n ;
Ví dụ:
10
v1.0012107210
3.3. MÔ TẢ MẪU NGẪU NHIÊN
Biểu
iể đồ tần
ầ suất:
ấ
xi x1 x2 … xk
ni n1 n2 … nk
xi x1 x2 … xk
fi f1 f2 … fk
n1 n2 ... nk
trong đó: f1 f2 ... fk 1
n
11
v1.0012107210
3.3. MÔ TẢ MẪU NGẪU NHIÊN (tiếp theo)
Tổ
ổ chức
hứ đồ:
đồ
khoảng a0- a1 a1- a2 … ak-1- ak
ni n1 n2 … nk
ni là
à số g
giá
á ttrịị mẫu
ẫu rơi
ơ vào
ào khoảng
oả g (ai-1, ai]
n1 n2 ... nk n
hi ai ai1
12
v1.0012107210
PROPERTIES
Allow user to leave interaction: Anytime
Show ‘Next Slide’ Button: Don't show
Completion Button Label: Next Slide
4. THỐNG KÊ
Cách
á h tính
í h các
á giá
iá trịị thống
hố kê đặc
đặ trưng mẫu
ẫ cho
h mẫu
ẫ thu
h gọn
Nếu mẫu cho dưới dạng khoảng ta chọn mỗi khoảng điểm đại diện
ai1 ai
xi , i 1,2,...,k lúc đó ta có mẫu thu gọn.
2
Khoảng xi ni ni .xi ni .x i2 A
giá trị x
mẫu n
a0 – a1 x1 n1 n1x1 n1x12
B
s2 (x)2
a 1 – a2 x2 n2 n2x2 n2x22 n
. . . . .
ai-1 – ai xi ni nixi nixi2 n 2
. . . . . s '2 s
ak-1 – ak xk nk nkxk nkxk2 n 1
n A B
15
v1.0012107210
4. THỐNG KÊ (tiếp theo)
Ví dụ:
Điều tra mức thu nhập cá nhân trong một tháng (triệu đồng), ta có bảng số
l ệ mẫu
liệu ẫ sau:
Số người 10 8 5 7 3 2
x s 2 , s '2 , s,
x, s s'
16
v1.0012107210
4. THỐNG KÊ (tiếp theo)
Bài giải:
Ta lập
lậ bả
bảng tính
í h sau
Khoảng xi ni n i .x i n i .x i2
thu
nhập
1-2 1,5 10 15 22,5
2-3 25
2,5 8 20 50
3-4 3,5 5 17,5 61,25
4-5 4,5 7 31,5 141,75
5-6 5,5
, 3 ,
16,5 90,75
,
6-7 6,5 2 13 84,5
x 113.5 / 35 3,243
s 2 450,75
0 3 (3
/ 35 2 3)2 2,363
(3,243) 2 363
s 2,363 1,573 s ' 2, 43 1,559
n 2 35
s '2 s 2,363 2, 43
n 1 34 17
v1.0012107210
5. MẪU NGẪU NHIÊN HAI CHIỀU
Khái niệm:
Một mẫu ngẫu nhiên cỡ n của véc tơ ngẫu nhiên (X, Y) là
một tập các véc tơ ngẫu nhiên (X1, Y1), (X2, Y2)… (Xn, Yn)
độc lập và có cùng phân phốí với biến ngẫu nhiên (X, Y).
Trong đó mỗi véc tơ (Xi, Yi) là một quan sát thứ i về véc tơ
ngẫu nhiên (X,
(X Y).
Y)
Ký hiệu (xi, yi) là giá trị của mẫu (Xi, Yi) ( i = 1, 2,.., n)
Bộ giá trị {(x1, y1), (x2, y2)… (xn, yn)} gọi là giá trị cụ thể của
(X1, Y1), (X2, Y2)… (Xn, Yn).
Ví dụ:
Lấy mẫu điều tra thu nhập và tiêu
dùng (triệu đồng/tháng) của 10 hộ
gia
i đình
đì h ta
t thu
th được
đượ giáiá trị
t ị mẫu:
ẫ
(2; 1.4), (2, 1.5), (3; 1.8), (4; 1.8),
(2; 1.5), (4; 3.5), (7; 5.5), (3; 1.4),
(4; 3.5), (5; 3.7).
18
v1.0012107210
5.1. PHƯƠNG PHÁP MÔ TẢ MẪU
Dạng 2: Ta thu gọn mẫu và biểu diễn dưới dạng bảng chữ nhật như sau:
yi y1 y2 … yj … yh ai
xi
x1 n11 n12 ... n1j ... n1h a1
x2 n21 n22 ... n2j ... n2h a2
… … … ... ... …
xi ni1 ni2 nij nih ai
… … … ... ... ....
xk nk1 nk2 ... nkjj ... nkh ak
bj b1 b2 bj bh
n
Ta có: h k k h
ai nij b j nij à
và
j 1
n ij n
i 1 i 1 j 1 19
v1.0012107210
5.2. THỐNG KÊ ĐẶC TRƯNG MẪU HAI CHIỀU
20
v1.0012107210
5.2. THỐNG KÊ ĐẶC TRƯNG MẪU HAI CHIỀU (tiếp theo)
Hệ
ệ số
ố tương quan mẫu
ẫ
Định nghĩa. Hệ số tương quan mẫu của mẫu ngẫu nhiên
hai chiều ký hiệu là R được xác định bởi:
XY (X)(Y) 1 n
R trong đó thống kê XY X k Yk
SXS Y n k 1
Giá trị của hệ số tương quan mẫu đối với mẫu cụ thể:
{(x1 , y1 ),(x 2 , y 2 ),...,(x n , y n )} là r
xyy ((x)(y)
)(y) 1 n 1 k h
r xy x l y l nij x i y j
sXsY n l1 n i1 j1
1 n 1 n 2
x xl
n l1
sX
n l1
( )2
x l (x)
1 n 1 n 2
y yl
n l1
sY
n l1
y l (y)2
21
v1.0012107210
6. QUY LUẬT PHÂN PHỐI XÁC SUẤT CỦA MỘT SỐ THỐNG KÊ
Định nghĩa
Phân phối xác suất của một thống kê được
gọi là
à phân
â phối
ố mẫu.
ẫ
Ví dụ:
d
Phân phối xác suất của X được gọi là phân
phối mẫu của thống kê trung bình mẫu.
23
v1.0012107210
6.1. BIẾN NGẪU NHIÊN GỐC CÓ PHÂN PHỐI 0-1
Cho X~A(p)
Xét mẫu ngẫu nhiên (X1 , X 2 ,..., X n ) rút ra từ X.
X p
Định lý 1: Thống kê U n có quy luật phân phối N(0,1)
p(p 1)
khi n đủ lớn.
lớ
24
v1.0012107210
6.2. HAI BIẾN NGẪU NHIÊN GỐC CÓ PHÂN PHỐI 0-1
X Y (p1 p2 )
Định lý 2: Thống kê U có quy luật phân phối N(0,1)
N(0 1)
p1 (1 p1 ) p2 (1 p2 )
n m
25
v1.0012107210
6.3. BIẾN NGẪU NHIÊN GỐC CÓ PHÂN PHỐI CHUẨN
Cho mẫu ngẫu nhiên (X1, X2, …Xn) được rút ra từ biến ngẫu nhiên
X có quy luật phân phối chuẩn N , 2 .
Định lý 3: Thống kê trung bình mẫu X có phân phối chuẩn N X , 2X
...
X
n X
U n ~ N(0,1)
2 2
... 2
2
2
X
n 2 n
Định
ị lý
ý 4:
• Thống kê T X n có quy luật phân bố student với n-1 bậc tự do.
S'
(n 1)S'2
• Thống kê X 2
2
có quy luật phân phối khi bình phương với n-1 bậc
tự do.
26
v1.0012107210
6.4. HAI BIẾN NGẪU NHIÊN GỐC CÓ PHÂN PHỐI CHUẨN
Cho hai
Ch h i biến
biế ngẫu ẫ nhiên
hiê độcđộ lập
lậ X và
àY
X ~ N(1 , 12 ), Y ~ N(2 , 22 )
Xét mẫu ngẫu nhiên (X1 , X 2 ,..., X n ) rút ra từ X
và mẫu ngẫu nhiên (Y1 , Y2 ,..., Ym ) rút ra từ Y.
Định lý 5: Thống kê U
X Y (1 2 )
12 22
n m
4 Quy luật phân phối xác suất của một số thống kê.
4. kê
28
v1.0012107210
PROPERTIES
Allow user to leave interaction: Anytime
Show ‘Next Slide’ Button: Don't show
Completion Button Label: Next Slide