You are on page 1of 29

BÀI 5

KHÁI NIỆM
Ệ PHƯƠNG PHÁP MẪU

TS N
TS. Nguyễn
ễ MMạnh
h Thế

1
v1.0012107210
TÌNH HUỐNG KHỞI ĐỘNG

Tình
ì huống

Điều tra mức thu nhập cá nhân trong một tháng (triệu đồng)
ở huyện Đông Anh,
Anh ta có bảng số liệu mẫu sau:
Thu nhập 1-2 2-3 3-4 4-5 5-6 6-7

Số người 10 8 5 7 3 2

Cần phải tính thu nhập bình quân đầu người và độ chênh
lệch thu nhập để xác định mức sống của người dân và mức
độ đồng đều về thu nhập trong vùng.

Câu hỏi gợi mở

Câu 1: Thu nhập bình quân đầu người là bao nhiêu?


Câu 2: Độ chênh lệch thu nhập là bao nhiêu?
Câu 3: Độ chênh lệch bình quân hiệu chỉnh? 2
v1.0012107210
TÌNH HUỐNG KHỞI ĐỘNG

Kết luận
1. Thống
g kê:
1 n
X  G(X1 , X 2 ,..., X n )   X i
n i1
được gọi là trung bình mẫu.
2. Thống kê:
1 n
S S  2
 i
n i1
(X  X) 2

được gọi là độ lệch chuẩn mẫu


mẫu.
3. Thống kê:
1 n
2
S'  S'   (X
n  1 i1 i
 X) 2

được gọi là độ lệch chuẩn mẫu hiệu chỉnh.

3
v1.0012107210
MỤC TIÊU

• Cơ sở lý thuyết mẫu;

• Tổng thể nghiên cứu;

• Mẫu ngẫu nhiên;

• Thống
Thố kê;

• Mẫu ngẫu nhiên hai chiều;

• Quy
Q y luật
ậ pphân pphối xác suất
của một số thống kê.

4
v1.0012107210
1. CỞ SỞ LÝ THUYẾT MẪU

Khái niệm phương pháp mẫu:


Bài toán: Cần nghiên cứu tính chất định tính hoặc định lượng của các phần tử
trong một
ộ tập
ậ hợp
h nàoà đó.
đó
Ta có hai phương pháp thực hiện nghiên cứu:

Nghiên cứu toàn bộ Nghiên cứu bộ phận


• Chi phí lớn về kinh tế,
tế có • Ta lấy ra một tập con và
thể phá hủy toàn bộ tập nghiên cứu toàn bộ các phần
hợp cần nghiên cứu. tử trong tập con đó.
• Không thể nghiên cứu được • Đưa ra kết luận cho các phần
toàn bộ. tử trong tập hợp nghiên cứu.
Vậy ta thấy nghiên cứu toàn bộ Đây là phương pháp nghiên cứu
tập hợp là không khả thi. mẫu (Sampling).

5
v1.0012107210
2. TỔNG THỂ NGHIÊN CỨU

Định nghĩa:
Tổng thể là tập hợp các phần tử cần nghiên cứu tính chất định tính hoặc định
lượng số phần tử trong tổng thể gọi là cỡ của tổng thể,
lượng, thể ký hiệu là N.
N

a) Biến định lượng b) Biến định tính

Mã hóa: Lấy giá trị của biến định Mã hoá: Gán tính chất định tính
lượng làm mã của biến. của biến ứng với các số nguyên.

Vậy khi nghiên cứu tổng thể ta luôn có thể giả sử là các các phần tử có dấu
hiệu định lượng.

6
v1.0012107210
2. TỔNG THỂ NGHIÊN CỨU (tiếp theo)

Mô tả tổng thể
Cho tổng thể với các phần tử { x1 , x 2 ,..., x n }. Với Ni là số lần giá trị xi
xuất hiện
ệ trong
g tổng
g thể, ta có: N1  N2  ...  Nk  N

Ni
Đặt fi  (i  1...k), fi được gọi là tần suất của xi trong tổng thể:
N
xi x1 x2 … xk
fi f1 f2 … fk

Dễ thấy: f1  f2  ...  fk  1

Trung bình tổng thể: Phương sai tổng thể:


1 k k 1 N k
m   Ni x i   fi x i s   (x i  m)   fi x i2  (m)2
2
N i1 i 1 N i1 i 1

7
v1.0012107210
3. MẪU NGẪU NHIÊN

• Các phương pháp lấy mẫu;

• Định nghĩa mẫu ngẫu nhiên;

• Mô tả mẫu ngẫu nhiên:


 Theo biều đồ tần suất;
 Theo tổ chức đồ.

8
v1.0012107210
3.1. CÁC PHƯƠNG PHÁP LẤY MẪU

M đích
Mục đí h
• Ta không thể nghiên cứu cặn kẽ từng phần tử của tổng thể, do đó phải
nghiên cứu hạn chế trên một nhóm nhỏ rút ra từ tổng thể gọi là mẫu,
mẫu từ
đó rút ra kết luận cho tổng thể.
• Một mẫu được gọi là đại diện tốt nhất cho tổng thể nếu nó là mẫu ngẫu
nhiên (random sample).
Các phương pháp lấy mẫu
• Cách chọn mẫu ngẫu nhiên đơn giản:
 Chọn mẫu ngẫu nhiên có hoàn lại;
 Chọn mẫu ngẫu nhiên không hoàn lại.
• Chọn mẫu phân cấp: Chia tổng thể ra thành k tổng thể bộ phận và ta thực
hiện cách lấy mẫu ngẫu nhiên đơn giản trên mỗi tổng thể thành phần.

9
v1.0012107210
3.2. ĐỊNH NGHĨA MẪU NGẪU NHIÊN

Một
ộ mẫuẫ ngẫu
ẫ nhiên
h ê cỡ
ỡ n của
ủ biến
b ế ngẫu
ẫ nhiên
h ê X là một
ộ tập
ậ cácá biến
bế
ngẫu nhiên X1, X2,… Xn độc lập và có cùng phân phốí với biến ngẫu
nhiên X.
Trong đó mỗi Xk là một quan sát về biến ngẫu nhiên X.
Quan sát Xk nhận giá trị xk
Khi đó bộ giá trị x1 , x 2 ,..., x n gọi là giá trị cụ thể của mẫu ngẫu nhiên
X1 , X 2 ,..., X n ;
Ví dụ:

Khi gieo con xúc xắc 5 lần ta được một mẫu


ngẫu nhiên (X1, X2, X3, X4, X5) với các giá trị
của mỗi
ỗ lần gieo là (3, 5, 2, 3, 1).

10
v1.0012107210
3.3. MÔ TẢ MẪU NGẪU NHIÊN

Biểu
iể đồ tần
ầ suất:

xi x1 x2 … xk

ni n1 n2 … nk

Với ni là số lần giá trị xi xuất hiện trong mẫu.


mẫu
Ta có n1  n2  ...  nk  n
n
Đặt f  i , f gọi là tần suất của xi trong mẫu.

i n i
Ta
a có bả
bảng
gbbiểu
ểu d
diễn
ễ tầ
tần suất mẫu:
ẫu

xi x1 x2 … xk
fi f1 f2 … fk

n1  n2  ...  nk
trong đó: f1  f2  ...  fk  1
n
11
v1.0012107210
3.3. MÔ TẢ MẪU NGẪU NHIÊN (tiếp theo)

Tổ
ổ chức
hứ đồ:
đồ
khoảng a0- a1 a1- a2 … ak-1- ak

ni n1 n2 … nk

ni là
à số g
giá
á ttrịị mẫu
ẫu rơi
ơ vào
ào khoảng
oả g (ai-1, ai]

n1  n2  ...  nk  n

Mỗi khối chữ nhật có:


• Chiều cao:
ni
yi 
n.hi
• Độ dài:

hi  ai  ai1

12
v1.0012107210
PROPERTIES
Allow user to leave interaction: Anytime
Show ‘Next Slide’ Button: Don't show
Completion Button Label: Next Slide
4. THỐNG KÊ

Cách
á h tính
í h các
á giá
iá trịị thống
hố kê đặc
đặ trưng mẫu
ẫ cho
h mẫu
ẫ thu
h gọn
Nếu mẫu cho dưới dạng khoảng ta chọn mỗi khoảng điểm đại diện

ai1  ai
xi  , i  1,2,...,k lúc đó ta có mẫu thu gọn.
2

Lập một bảng tính như sau:

Khoảng xi ni ni .xi ni .x i2 A
giá trị x
mẫu n
a0 – a1 x1 n1 n1x1 n1x12
B
s2   (x)2
a 1 – a2 x2 n2 n2x2 n2x22 n
. . . . .
ai-1 – ai xi ni nixi nixi2 n 2
. . . . . s '2  s
ak-1 – ak xk nk nkxk nkxk2 n 1
 n A B
15
v1.0012107210
4. THỐNG KÊ (tiếp theo)

Ví dụ:
Điều tra mức thu nhập cá nhân trong một tháng (triệu đồng), ta có bảng số
l ệ mẫu
liệu ẫ sau:

Thu nhập 1-2 2-3 3-4 4-5 5-6 6-7

Số người 10 8 5 7 3 2

Tính các giá trị đặc trưng mẫu.

x s 2 , s '2 , s,
x, s s'

16
v1.0012107210
4. THỐNG KÊ (tiếp theo)
Bài giải:
Ta lập
lậ bả
bảng tính
í h sau
Khoảng xi ni n i .x i n i .x i2
thu
nhập
1-2 1,5 10 15 22,5
2-3 25
2,5 8 20 50
3-4 3,5 5 17,5 61,25
4-5 4,5 7 31,5 141,75
5-6 5,5
, 3 ,
16,5 90,75
,
6-7 6,5 2 13 84,5

 n =35 113,5 450,75

x  113.5 / 35  3,243
s 2  450,75
0 3  (3
/ 35 2 3)2  2,363
(3,243) 2 363
s  2,363  1,573 s '  2, 43  1,559
n 2 35
s '2  s  2,363  2, 43
n 1 34 17
v1.0012107210
5. MẪU NGẪU NHIÊN HAI CHIỀU

Khái niệm:
Một mẫu ngẫu nhiên cỡ n của véc tơ ngẫu nhiên (X, Y) là
một tập các véc tơ ngẫu nhiên (X1, Y1), (X2, Y2)… (Xn, Yn)
độc lập và có cùng phân phốí với biến ngẫu nhiên (X, Y).
Trong đó mỗi véc tơ (Xi, Yi) là một quan sát thứ i về véc tơ
ngẫu nhiên (X,
(X Y).
Y)
Ký hiệu (xi, yi) là giá trị của mẫu (Xi, Yi) ( i = 1, 2,.., n)
Bộ giá trị {(x1, y1), (x2, y2)… (xn, yn)} gọi là giá trị cụ thể của
(X1, Y1), (X2, Y2)… (Xn, Yn).
Ví dụ:
Lấy mẫu điều tra thu nhập và tiêu
dùng (triệu đồng/tháng) của 10 hộ
gia
i đình
đì h ta
t thu
th được
đượ giáiá trị
t ị mẫu:

(2; 1.4), (2, 1.5), (3; 1.8), (4; 1.8),
(2; 1.5), (4; 3.5), (7; 5.5), (3; 1.4),
(4; 3.5), (5; 3.7).
18
v1.0012107210
5.1. PHƯƠNG PHÁP MÔ TẢ MẪU

Dạng 1: Lập một bảng hai dòng như sau:


xi x1 x2 … xn
yi y1 y2 … yn

Dạng 2: Ta thu gọn mẫu và biểu diễn dưới dạng bảng chữ nhật như sau:
yi y1 y2 … yj … yh ai
xi
x1 n11 n12 ... n1j ... n1h a1
x2 n21 n22 ... n2j ... n2h a2
… … … ... ... …
xi ni1 ni2 nij nih ai
… … … ... ... ....
xk nk1 nk2 ... nkjj ... nkh ak
bj b1 b2 bj bh
  n
Ta có: h k k h
ai   nij b j   nij à

j 1
 n ij n
i 1 i 1 j 1 19
v1.0012107210
5.2. THỐNG KÊ ĐẶC TRƯNG MẪU HAI CHIỀU

Trung bình mẫu:

• Véc tơ ngẫu nhiên hai chiều (X,


(X Y) gọi
là trung bình mẫu của véc tơ ngẫu
nhiên (X,
(X Y),
Y) trong đó X và Y là các
trung bình mẫu của biến ngẫu nhiên
thà h phần
thành hầ X và
à Y.
Y

• Giá trị thống kê mẫu của mẫu ngẫu


nhiên hai chiều là (x, y).

20
v1.0012107210
5.2. THỐNG KÊ ĐẶC TRƯNG MẪU HAI CHIỀU (tiếp theo)

Hệ
ệ số
ố tương quan mẫu

Định nghĩa. Hệ số tương quan mẫu của mẫu ngẫu nhiên
hai chiều ký hiệu là R được xác định bởi:

XY  (X)(Y) 1 n
R trong đó thống kê XY   X k Yk
SXS Y n k 1

Giá trị của hệ số tương quan mẫu đối với mẫu cụ thể:
{(x1 , y1 ),(x 2 , y 2 ),...,(x n , y n )} là r

xyy  ((x)(y)
)(y) 1 n 1 k h
r xy   x l y l   nij x i y j
sXsY n l1 n i1 j1

1 n 1 n 2
x   xl
n l1
sX  
n l1
( )2
x l  (x)

1 n 1 n 2
y   yl
n l1
sY  
n l1
y l  (y)2
21
v1.0012107210
6. QUY LUẬT PHÂN PHỐI XÁC SUẤT CỦA MỘT SỐ THỐNG KÊ

Định nghĩa
Phân phối xác suất của một thống kê được
gọi là
à phân
â phối
ố mẫu.

Ví dụ:
d
Phân phối xác suất của X được gọi là phân
phối mẫu của thống kê trung bình mẫu.

23
v1.0012107210
6.1. BIẾN NGẪU NHIÊN GỐC CÓ PHÂN PHỐI 0-1

Cho X~A(p)
Xét mẫu ngẫu nhiên (X1 , X 2 ,..., X n ) rút ra từ X.

X p
Định lý 1: Thống kê U  n có quy luật phân phối N(0,1)
p(p  1)
khi n đủ lớn.
lớ

Chú ý: Thống kê U cũng có thể viết lại dưới dạng U  f p


n
p(p  1)
k
trong đó f  , với k là số lần mẫu nhận giá trị 1.
n

24
v1.0012107210
6.2. HAI BIẾN NGẪU NHIÊN GỐC CÓ PHÂN PHỐI 0-1

Cho X~A(p1) và Y~A(p2)


Xét hai mẫu ngẫu nhiên (X1 , X 2 ,..., X n ) và (Y1 , Y2 ,..., Ym )
rút ra từ X và Y.

X  Y  (p1  p2 )
Định lý 2: Thống kê U  có quy luật phân phối N(0,1)
N(0 1)
p1 (1  p1 ) p2 (1  p2 )

n m

Chú ý: X và Y có thể được thay bằng f1 và f2


k1 k
trong đó f1  ; f2  2 ,
n m
với k1 là số lần mẫu ngẫu nhiên của X nhận giá trị 1,
k2 là số lần mẫu ngẫu nhiên của Y nhận giá trị 1.

25
v1.0012107210
6.3. BIẾN NGẪU NHIÊN GỐC CÓ PHÂN PHỐI CHUẨN

Cho mẫu ngẫu nhiên (X1, X2, …Xn) được rút ra từ biến ngẫu nhiên
 
X có quy luật phân phối chuẩn N , 2 .


Định lý 3: Thống kê trung bình mẫu X có phân phối chuẩn N X , 2X 
    ...  
X  
n X
 U  n ~ N(0,1)
2 2
    ...   2
2 
2
X   
n 2 n

Định
ị lý
ý 4:
• Thống kê T  X   n có quy luật phân bố student với n-1 bậc tự do.
S'
(n  1)S'2
• Thống kê X  2
2
có quy luật phân phối khi bình phương với n-1 bậc
tự do. 

26
v1.0012107210
6.4. HAI BIẾN NGẪU NHIÊN GỐC CÓ PHÂN PHỐI CHUẨN

Cho hai
Ch h i biến
biế ngẫu ẫ nhiên
hiê độcđộ lập
lậ X và
àY
X ~ N(1 , 12 ), Y ~ N(2 , 22 )
Xét mẫu ngẫu nhiên (X1 , X 2 ,..., X n ) rút ra từ X
và mẫu ngẫu nhiên (Y1 , Y2 ,..., Ym ) rút ra từ Y.

Định lý 5: Thống kê U 
X  Y  (1  2 )
12 22

n m

có quy lụât phân phối chuẩn N(0,1).


X  Y  (1  2 ) nm(n  m  2)
Định lý 6: Thống kê T 
nS2  mS2 nm
X Y

có quy luật phân phối student với n + m – 2 bậc tự do.


Các thống kê U và T sẽ được sử dụng trong phần ước
lượ và
lượng à kiểm
kiể định
đị h tiếp
tiế theo.
th
27
v1.0012107210
TÓM TẮT CUỐI BÀI

Nội dung chính

1. Khái niệm mẫu ngẫu nhiên và tổng thể nghiên cứu.

2. Các phương pháp lấy mẫu.


3 Thống kê và các thống kê đặc trưng của mẫu.


3. mẫu

4 Quy luật phân phối xác suất của một số thống kê.
4. kê

28
v1.0012107210
PROPERTIES
Allow user to leave interaction: Anytime
Show ‘Next Slide’ Button: Don't show
Completion Button Label: Next Slide

You might also like