You are on page 1of 36

XÁC SUẤT THỐNG KÊ

ỨNG DỤNG
TRONG Y SINH HỌC

PHÂN PHỐI LẤY MẪU


Nội dung

Phần này cung cấp:


◼ Phân phối lấy mẫu
◼ Phân phối của trung bình mẫu và tỷ lệ mẫu
◼ Định lý giới hạn trung tâm
Phân phối lấy mẫu
Đ4T
◼ Phân phối lấy mẫu là phân phối của tất cả giá trị của một
thống kê với cỡ mẫu cho trước.

◼ Ví dụ, lấy mẫu 50 sinh viên và xem điểm môn Xác suất
thống kê. Mỗi mẫu cho một điểm trung bình. Giả sử lấy
mẫu cỡ 50 thật nhiều lần và mỗi lần như vậy đều ghi lại
trung bình mẫu. Ta quan tâm đến phân phối của điểm
trung bình từ tất cả các mẫu cùng cỡ 50 sinh viên.
Phân phối lấy mẫu
Đ-4T

◼ Giả sử tổng thể có cỡ N=4


D
◼ Biến ngẫu nhiên X, A B C
là tuổi của các cá thể
◼ Giá trị của X: 18, 20,
22, 24 (năm)
Phân phối lấy mẫu
(tiếp theo)
Đ-4T
Tham số của phân phối tổng thể:

μ =
 X
i
P(x)
N .3
18 + 20 + 22 + 24 .2
= = 21
4 .1
0

2
(X i − μ) 18 20 22 24 x
σ = = 2.236
N A B C D
Phân phối đều
Phân phối lấy mẫu
(tiếp theo)
Bây giờ lấy tất cả các mẫu có cỡ n=2 Đ-4T

16 trung bình
Quan Quan sát thứ 2
sát mẫu
18 20 22 24
thứ 1
QS Quan sát thứ 2
18 18,18 18,20 18,22 18,24 thứ
20 20,18 20,20 20,22 20,24 1
22 22,18 22,20 22,22 22,24 18 20 22 24
24 24,18 24,20 24,22 24,24 18 18 19 20 21
20 19 20 21 22
16 mẫu (có hoàn lại) 22 20 21 22 23
24 21 22 23 24
Phân phối lấy mẫu Đ-4T
(tiếp theo)

Phân phối của tất cả các trung bình mẫu

16 trung bình mẫu Phân phối


trung bình mẫu
Qs Quan sát thứ 2 _
1 18 20 22 24 P(X)
.3
18 18 19 20 21
.2
20 19 20 21 22
.1
22 20 21 22 23
0 _
24 21 22 23 24 18 19 20 21 22 23 24 X
(không còn đều nữa)
Phân phối lấy mẫu Đ-4T
(tiếp theo)

Tham số của phân phối lấy mẫu:

18 + 19 + 19 +  + 24
μX = = 21
16

+ (19 - 21) +  + (24 - 21)


2 2 2
(18 - 21)
σX = = 1.58
16

Chú ý: Có tất cả 16 mẫu đồng cỡ khác nhau.


Trong độ lệch chuẩn của phân phối có chia cho 16.
So sánh phân phối
của tổng thể và của trung bình mẫu
Đ-4T
Tổng thể Phân phối của trung bình
N=4 mẫu
μ = 21 σ = 2.236 μ X = 21 n = σ
2 X = 1.58
_
P(X) P(X)
.3 .3

.2 .2

.1 .1
0 X 0
18 19 20 21 22 23 24
_
18 20 22 24 X
A B C D
Phân phối lấy mẫu của trung bình:
độ lệch chuẩn của trung bình mẫu
Đ-4T
◼ Mẫu đồng cỡ khác nhau từ cùng một tổng thể sẽ cho
các trung bình mẫu có giá trị khác nhau
◼ Số đo sự biến động của các trung bình từ mẫu này
sang mẫu khác là Sai số chuẩn của trung bình:

σ
σ X
=
n
◼ Chú ý:
◼ Sai số chuẩn của trung bình giảm khi cỡ mẫu tăng
◼ Lấy mẫu có hoàn lại với tổng thể hữu hạn, không hoàn lại với
tổng thể vô hạn
Phân phối lấy mẫu của trung bình:
khi tổng thể có phân phối chuẩn
Đ-4T

◼ Nếu tổng thể có phân phối chuẩn với trung bình


μ và độ lệch chuẩn σ, phân phối lấy mẫu của X
cũng có phân phối chuẩn với

σ
μ X
= μ VÀ σ =
X
n
Phân phối lấy mẫu của trung bình:
giá trị Z
Đ-4T
◼ Giá trị Z của phân phối lấy mẫu của X :

(X − μX ) ( X − μ)
Z = =
σ σ
X

Trong đó: X = trung bình mẫu


μ = trung bình tổng thể
σ = độ lệch chuẩn tổng thể
n = cỡ mẫu
Phân phối lấy mẫu của trung bình
Đ-4T

Phân phối chuẩn


μx = μ của tổng thể

μ x
( x không bị lệch) Phân phối chuẩn của
trung bình mẫu

μx
x
Phân phối lấy mẫu
(tiếp theo)
Đ-4T

Khi n tăng lên, Cỡ mẫu lớn


giảm xuống hơn
σ x

Cỡ mẫu nhỏ
hơn

μ x
Khoảng chứa 95% các trung bình mẫu
Đ-4T
Tìm một khoảng giá trị đối xứng xung quanh µ
chứa 95% các giá trị trung bình mẫu khi µ = 368,
σ = 15 và n = 25.
◼ Vì khoảng chứa 95% các trung bình mẫu nên 5%
các giá trị trung bình mẫu sẽ nằm ngoài khoảng này.
◼ Vì khoảng đối xứng nên 2,5% sẽ trên mức giới hạn
trên và 2,5% sẽ nằm dưới mức giới hạn dưới.
◼ Tra bảng:
◼ giá trị Z với 2.5% (0.0250) nằm dưới nó là -1,96.
◼ giá trị Z với 2.5% (0.0250) nằm trên nó là 1,96.
Tìm khoảng chứa 95% các trung bình mẫu
(tiếp theo)

Đ-4T
◼ Tính giới hạn dưới của khoảng tin cậy
σ 15
X L = μ + Z = 368 + ( − 1 . 96 ) = 362 . 12
n 25

◼ Tính giới hạn trên của khoảng tin cậy


σ 15
XU = μ + Z = 368 + (1 . 96 ) = 373 . 88
n 25
◼ 95% các giá trị của trung bình mẫu với cỡ mẫu
25 nằm giữa 362,12 và 373,88
Phân phối lấy mẫu của trung bình:
khi phân phối tổng thể không chuẩn
Đ-4T
◼ Có thể áp dụng Định lý giới hạn trung tâm
◼ Ngay cả khi phân phối tổng thể là không chuẩn,
◼ …các giá trị trung bình mẫu sẽ xấp xỉ phân phối
chuẩn nếu cỡ mẫu đủ lớn.

Các tham số của phân phối trung bình mẫu:

VÀ σ
μx = μ σ x
=
n
Phân phối của trung bình mẫu:
Khi phân phối tổng thể không chuẩn
(tiếp theo)

Phân phối tổng thể Đ-4T


Tham số của phân
phối lấy mẫu:
Trung bình
μx = μ
μ x
Phương sai Phân phối lấy mẫu
σ
σ x
= Cỡ mẫu
n Cỡ mẫu
lớn
nhỏ

μx x
Cỡ mẫu bao nhiêu là đủ lớn?
Đ-4T

◼ Với hầu hết phân phối tổng thể, n ≥ 30 cho


phân phối lấy mẫu xấp xỉ chuẩn
◼ Tổng thể có phân phối đối xứng, n ≥ 15
◼ Tổng thể có phân phối chuẩn: phân phối lấy
mẫu của trung bình luôn luôn là chuẩn.
Ví dụ
Đ-4T

◼ Giả sử tổng thể có trung bình μ = 8 và độ lệch


chuẩn σ = 3. Chọn một mẫu có cỡ n = 36.

◼ Xác suất trung bình mẫu nằm trong khoảng


giữa 7,8 và 8,2 là bao nhiêu?
Ví dụ
(tiếp theo)

Giải: Đ-4T

◼ Ngay cả khi tổng thể không có phân phối


chuẩn, định lý giới hạn trung tâm vẫn có thể
được áp dụng (n ≥ 30)
◼ …nên phân phối x xấp xỉ chuẩn
◼ … với trung bình μx = 8
σ 3
◼ …và độ lệch chuẩn σ x
= = = 0.5
n 36
Ví dụ
(tiếp theo)
Giải (tiếp theo): Đ-4T
 
 7.8 - 8 X -μ 8.2 - 8 
P(7.8  X  8.2) = P   
3 σ 3
 
 36 n 36 
= P(-0.4  Z  0.4) = 0.6554 - 0.3446 = 0.3108

Phân phối Phân phối lấy Phân phối chuẩn tắc


tổng thể mẫu
???
? ??
? ? Mẫu Chuẩn hóa
?? ?
?
7.8 8.2 -0.4 0.4
μ = 8 X μX = 8 x μz = 0 Z
Tỷ lệ tổng thể
Đ-4T
π = tỷ lệ tổng thể của tính chất được chú ý
◼ Tỷ lệ mẫu (p) là một ước lượng của
tỷ lệ tổng thể π:

X Số phần tử của mẫu có tính chất được chú ý


p= =
n Cỡ 𝑚ẫ𝑢

◼ 0≤ p≤1
◼ p có phân phối xấp xỉ chuẩn khi n lớn
(Giả sử lấy mẫu có hoàn lại từ tổng thể hữu hạn và không hoàn lại
từ tổng thể vô hạn)
Phân phối lấy mẫu của p
Đ-4T
◼ Xấp xỉ phân phối chuẩn
Phân phối lấy mẫu
Với điều kiện: P( ps)
0,3

n𝜋 ≥ 5 0,2
𝑣à 0,1
0
n(1 − 𝜋) ≥ 5 0 0,2 0,4 0,6 0,8 1 p

π (1 − π )
μp = π và
σp =
n
(π = tỷ lệ tổng thể)
Giá trị Z của tỷ lệ mẫu
Đ-4T
Biến đổi chuẩn hóa p, thu được giá trị Z:

p− p−
Z = =
σp  (1 −  )
n
Ví dụ
Đ-4T

◼ Nếu tỷ lệ tổng thể là π = 0,40, xác suất một


mẫu cỡ 200 cho tỷ lệ mẫu trong khoảng 0,40 và
0,45 là bao nhiêu?

◼ Nếu π = 0,4 và n = 200,


P(0.40 ≤ p ≤ 0.45) = ?
Ví dụ
(tiếp theo)

◼ Nếu π = 0,4 và n = 200, Đ-4T

P(0.40 ≤ p ≤ 0.45) = ?

 (1 −  ) 0.4(1 − 0.4)
Tính σ p : σp = = = 0.03464
n 200

Chuẩn hóa:  0.40 − 0.40 0.45 − 0.40 


P(0.40  p  0.45) = P  Z  
 0.03464 0.03464 

= P(0  Z  1.44)
Ví dụ
(tiếp theo)

◼ Nếu π = 0,4 và n = 200, Đ-4T

P(0.40 ≤ p ≤ 0.45) = ?
Tra bảng:
P(0 ≤ Z ≤ 1,44) = 0,9251 – 0,5000 = 0,4251
Phân phối chuẩn tắc
Phân phối lấy mẫu

0,4251

Chuẩn hóa

0,40 0,45 p 0 1,44 Z


Tóm tắt

◼ Phân phối lấy mẫu là gì


◼ Phân phối của trung bình mẫu
◼ Tổng thể có phân phối chuẩn
◼ Dùng định lý giới hạn trung tâm

◼ Phân phối của tỷ lệ mẫu


◼ Tính xác suất bằng phân phối lấy mẫu
Thống kê cơ bản và ứng dụng
trong y sinh học

Chủ đề

Lấy mẫu từ tổng thể hữu hạn


Nội dung

Phần này cung cấp:


◼ Cách dùng hệ số hiệu chỉnh cho tổng thể hữu
hạn.
◼ Cách dùng hệ số hiệu chỉnh để tính sai số
chuẩn.
Hệ số hiệu chỉnh
cho tổng thể hữu hạn
Đ-4T

◼ Dùng để tính toán sai số chuẩn của trung bình


mẫu và tỷ lệ mẫu.
◼ Cần dùng khi cỡ mẫu n lớn hơn 5% của cỡ
tổng thể N, nghĩa là n / N > 0,05.

◼ Hệ số hiệu chỉnh là:

N − n
fpc =
N −1
Hiệu chỉnh sai số chuẩn
Đ-4T
Sai số chuẩn của trung bình mẫu

 N − n
 X
=
n N −1

Sai số chuẩn của tỷ lệ

 (1 −  ) N − n
 p
=
n N −1
Hệ số hiệu chỉnh làm giảm sai
số chuẩn
Đ-4T

◼ Hệ số hiệu chỉnh luôn nhỏ hơn 1.

◼ Khi sử dụng sẽ làm sai số chuẩn nhỏ đi.

◼ Vì vậy cho kết quả ước lượng chính xác hơn.


Dùng hệ số hiệu chỉnh
Ví dụ với trung bình
Đ-4T
Giả sử một mẫu ngẫu nhiên cỡ 100 được lấy từ một tổng thể
Cỡ tổng thể là 1000, độ lệch chuẩn 40.
Vậy n = 100, N = 1000, tỷ lệ 100/1000 = 0,10 > 0,05.
Dùng cho sai số chuẩn của trung bình mẫu:

40 1000 − 100
 X
= = 3, 8
100 1000 − 1
Tóm lược

◼ Dùng hệ số hiệu chỉnh khi nào

◼ Dùng hệ số hiệu chỉnh như thế nào.

You might also like