You are on page 1of 48

Xác suất thống kê

Ước lượng khoảng tin cậy


trung bình và tỷ lệ
Mục đích

Bài này cung cấp:

• Tính và diễn giải khoảng tin cậy của trung bình và tỷ lệ


• Xác định cỡ mẫu cần thiết cho khoảng tin cậy
• Sử dụng khoảng tin cậy
Ước lượng điểm và khoảng
Đ-4T

• Ước lượng điểm là phỏng đoán một trị số,


• Khoảng tin cậy cho thêm thông tin về tính biến động của ước lượng

Giới hạn tin Giới hạn tin


cậy dưới cậy trên
Điểm ước lượng

Độ rộng khoảng tin cậy


Ước lượng điểm
Đ-4T

Ước lượng Bằng


một tham số một thống kê
tổng thể mẫu

Trung bình μ X
Tỷ lệ π p
Ước lượng khoảng
Đ-4T

• Một ước lượng điểm của một tham số chính xác đến đâu và chắc
chắn đến đâu?

• Một ước lượng khoảng cho biết thêm thông tin về tham số ngoài
ước lượng điểm.

• Ước lượng khoảng đó là khoảng tin cậy.


Ước lượng khoảng tin cậy
Là một khoảng gồm các trị số:
• Nói lên sự biến thiên của thống kê từ mẫu này qua mẫu khác
• Dựa vào quan sát trên 1 mẫu
• Cho biết kết quả ước lượng gần tham số đến đâu
• Là phỏng đoán có mức độ tin cậy
- Ví dụ: 95% tin cậy, 99% tin cậy
- Không bao giờ đạt 100% tin cậy
Ví dụ

• Tổng thể có µ = 360 và σ = 25.


• Lấy mẫu có n = 36
Khoảng 360 ± 1,96*25 /6 = [351,83; 368,17] chứa 95% các trị số X.
Khi không biết µ, dùng X để ước lượng µ
• Nếu X = 360,5 thì KTC95% là 360,5 ± 1,96*25 /6 = [352,33; 368,67]
• Vì 352,33 ≤ µ ≤ 368,67, KTC95% dựa trên mẫu cho ước lượng đúng của µ.

CÂU HỎI:
Kết quả dựa trên các MẪU cùng cỡ KHÁC sẽ như thế nào?
Ví dụ

Giới hạn Giới hạn Khoảng


Mẫu X tin cậy tin cậy có chứa
dưới trên µ
1 362,30 356,13 370,47

2 369,50 363,33 375,37 KHÔNG

3 360,00 354,33 368,17

4 362,12 353,95 370,20

5 373,88 365,71 382,05 KHÔNG


Ví dụ

• Trên lý thuyết, có tất cả kết quả với cỡ mẫu n

• Trên thực nghiệm, chỉ có 1 kết quả với cỡ mẫu n

• Trên thực nghiệm, không có sẵn µ nên không thể biết KTC nào chứa µ

• Chỉ biết rằng nếu thực hiện theo cách này, có 95% các KTC sẽ chứa µ

• Vì vậy, dựa vào 1 mẫu quan sát được, có thể tin cậy ở mức độ 95%
KTC sẽ chứa µ. Do đó gọi là KTC95%.
Ước lượng
Đ-4T

Mẫu ngẫu nhiên Tin cậy 95%


rằng μ trong
khoảng giữa
Tổng thể Trung bình 40 và 60.
(trung bình μ X = 50
không biết
rõ)

Mẫu
Công thức chung

Ước lượng điểm ± (Trị số ngưỡng)(Sai số chuẩn)

• Ước lượng điểm là thống kê của tham số được quan tâm

• Trị ngưỡng là trị số được lập bảng, phụ thuộc vào phân phối
mẫu của ước lượng điểm và độ tin cậy

• Sai số chuẩn là độ lệch chuẩn của ước lượng điểm


Độ tin cậy

• Tin cậy rằng ước lượng khoảng sẽ


chứa trị tham số tổng thể
• Là một trị số phần trăm nhỏ hơn 100%
Độ tin cậy, (1-)

• Giả sử độ tin cậy = 95%

• Ký hiệu γ = (1 - ) = 0,95, với  = 0,05

• Quan niệm “tần suất”:


• 95% tất cả các KTC có thể được lập ra sẽ chứa trị số đúng của tham số
cần ước lượng

• Một ước lượng khoảng cụ thể nào đó có thể chứa hoặc không
chứa trị tham số
• Không có xác suất đánh giá một ước lượng khoảng cụ thể
Khoảng tin cậy

Khoảng
tin cậy

Trung bình Tỷ lệ
tổng thể tổng thể

Biết Không biết


σ σ
Khoảng tin cậy của μ:
Biết σ

• Giả thiết
• Biết trước độ lệch chuẩn tổng thể σ
• Tổng thể có phân phối chuẩn
• Nếu tổng thể không có phân phối chuẩn, lấy mẫu cỡ lớn

Công thức khoảng tin cậy:

σ
X  Z α /2
n

X là ước lượng điểm


Zα/2 là trị số ngưỡng, tra bảng phân phối chuẩn, xác suất mỗi đuôi là /2
σ/ n là sai số chuẩn
Trị số ngưỡng, Zα/2

Z α /2 =  1.96
• Đối với KTC 95%:
1 −  = 0,95  = 0,05

α α
= 0,025 = 0,025
2 2

Z: Zα/2 = -1.96 0 Zα/2 = 1.96


X: Giới hạn Ước lượng điểm Giới hạn
tin cậy tin cậy
dưới trên
Độ tin cậy thường gặp

90%, 95% và 99%

Độ tin cậy Hệ số tin cậy,


Zα/2
1− 
80% 0,80 1,28
90% 0,90 1,65
95% 0,95 1,96
98% 0,98 2,33
99% 0,99 2,58
99.8% 0,998 3,08
99.9% 0,999 3,27
Khoảng tin cậy và Độ tin cậy
Phân phối của trung bình mẫu

 /2 1−   /2

x
σ μx = μ
X − Zα /2 x1 (1-)x100%
n các KTC chứa μ
x2

()x100% các
σ KTC không chứa
X + Zα /2
n μ
Khoảng tin cậy
Ví dụ

• Một mẫu ngẫu nhiên n = 16, trung bình 1,50. Theo các kết quả
khảo sát về độ chính xác đã thực hiện trước, độ lệch chuẩn tổng
thể là 0,25.
σ
X  Z  /2
n

= 1,50  1,96 (0,25/ 16 )


= 1,50  0,1225
1 , 3775    1,6225
Diễn giải kết quả về KTC

Tin cậy ở mức độ 95% rằng trung bình tổng thể


là trị số nằm đâu đó giữa 1,3775 và 1,6225
• KTC được tính ra có chứa trị trung bình tổng
thể hay không, đó là điều không thể biết.
• Chỉ có thể nói, 95% các KTC được tính theo
cách này sẽ chứa trị trung bình tổng thể
Ước lượng khoảng tin cậy

KHOẢNG
Tin cậy

Trung bình Tỷ lệ
Tổng thể Tổng thể

Biết Không biết


σ σ
Chú ý

• Nếu biết σ, có thể tính ra µ.

• Mặt khác, để tính ra σ cần biết µ.

• Trong thực tế, thường thì không biết cả σ và µ.

• Vì vậy mới cần ước lượng.


Khoảng tin cậy của μ:
Không biết σ

• Khi không biết σ, phải làm việc với đại diện


của σ: độ lệch chuẩn S.
• Vì S là biến ngẫu nhiên, mức độ bất định tăng
lên.
• Do đó, không thể dùng phân phối chuẩn
• Phải dùng phân phối Student t
Khoảng tin cậy của μ:
Không biết σ

• Giả thiết
• Không biết độ lệch chuẩn tổng thể
• Tổng thể có phân phối chuẩn
• Nếu tổng thể không có phân phối chuẩn, lấy mẫu cỡ lớn

• Làm việc với phân phối Student


Công thức khoảng tin cậy:

S
X  tα / 2
n

tα/2 là trị số ngưỡng của phân phối t độ tự do n -1, xác suất mỗi đuôi α/2
Họ các phân phối Student

• Mỗi phân phối cụ thể có một độ tự do xác định


• Trị số ngưỡng tα/2 phụ thuộc vào độ tự do
• Độ tự do = Số các trị số có thể biến thiên tự do,
sau khi tính trung bình mẫu
= Số biến số - số phương trình dùng để tính trung
bình mẫu
• Độ tự do = n - 1
Độ tự do

Giả sử trung bình của 3 trị số là 8,0.

Nếu X1 = 7 và X2 = 8 thì X3 = ?

Trị số X3 phải là 9
(được xác định duy nhất,
không được tự do biến thiên)

Số trị số ban đầu là n = 3, độ tự do là n – 1 = 3 – 1 = 2


Nên có thể có 2 trị số bất kỳ, còn trị số thứ 3 bị ràng buộc với trị
số trung bình đã cho.
Phân phối Student
t Z khi n tăng

Phân phối
chuẩn
t(∞)

t(13)
Hình chuông đối xứng,
nhưng có “đuôi” dày hơn
phân phối chuẩn t(5)

0 t
Bảng phân phối Student

Diện tích đuôi phải


n=3
Đ. .10 .05 .025
t.d n-1=2
 = 0,10
1 3.078 6.314 12.706
/2 = 0,05
2 1.886 2.920 4.303
3 1.638 2.353 3.182 /2 = 0,05

Đây không phải xác


suất, mà là các trị số 0
ngưỡng t
2,920 t
So sánh với trị số ngưỡng Z

Mức độ t t t t =Z
tin cậy (10) (20) (30) (∞)

0.80 1.372 1.325 1.310 1.28


0.90 1.812 1.725 1.697 1.65
0.95 2.228 2.086 2.042 1.96
0.99 3.169 2.845 2.750 2.58

t Z khi n tăng
Ví dụ
Mẫu ngẫu nhiên có cỡ n = 25, trung bình X = 50, độ lệch
chuẩn S = 8. KTC 95% của μ

• Vì n – 1 = 24, t  /2 ( 24 ) = 2,0639

S 8
X  t  /2 = 50  (2,0639)
n 25

46,698 ≤ μ ≤ 53,302
Ví dụ

• Giả thiết quan trọng là tổng thể phải có phân phối chuẩn, hoặc xấp xỉ
phân phối chuẩn.

• Trường hợp cỡ mẫu nhỏ, n = 25, giả thiết càng quan trọng. Nếu
không được thỏa, công thức áp dụng sai.

• Kiểm tra điều kiện trên bằng:


• Q-Q plot
• Normal probability plot
• Biểu đồ hộp
Ước lượng khoảng tin cậy của tỷ lệ

KHOẢNG
Tin cậy

Trung bình Tỷ lệ tổng


tổng thể thể

Biết Không biết


σ σ
Khoảng tin cậy của tỷ lệ tổng thể π

• Là khoảng trị số ước lượng cho tỷ lệ π


• Tạo nên từ
• Ước lượng điểm = tỷ lệ mẫu p = X/n
• Sai số chuẩn của ước lượng điểm
• Độ tin cậy cho trước
Ước lượng khoảng tin cậy cho tỷ lệ π

• Khi cỡ mẫu lớn, phân phối của tỷ lệ mẫu xấp xỉ


phân phối chuẩn, với độ lệch chuẩn

 (1 −  )
σp =
n

Được ước lượng bằng

p(1 − p)
n
Khoảng tin cậy của tỷ lệ

Công thức Wald

p(1 − p)
p  Z α /2
n
• Zα/2 là trị ngưỡng trong bảng phân phối chuẩn
• p là tỷ lệ mẫu
• n là cỡ mẫu

• Chú ý: Phải có Min(X, n –X) > 5


Ví dụ

Một mẫu ngẫu nhiên 100 người có 25 thuận tay trái. Tính KTC
95% của tủy lệ tổng thể nhưng người thuận tay trái.

Min(np, n-np) = 100 * 0,25 = 25 > 5

Mẫu đủ lớn p  Z  /2 p(1 − p)/n

= 25/100  1,96 0,25(1 - 0,25)/100

= 0,25  1,96 (0,0433)


0,1651    0,3349
Diễn giải

• Phỏng đoán ở mức tin cậy 95% rằng trị số đúng của tỷ lệ nằm trong khoảng
từ 16,51% đến 33,49%.

• KTC từ 0,1651 đến 0,3349 có khả năng chứa hoặc không chứa trị số tỷ lệ

• 95% các KTC được tính theo cách đó từ các mẫu có cỡ 100 sẽ chứa trị số
đúng của tỷ lệ.
Xác định cỡ mẫu tối thiểu

Tính cỡ mẫu
Tối thiểu

Ước lượng Ước lượng


trung bình tỷ lệ
Cỡ mẫu ước lượng trung bình

Tính cỡ mẫu
Tối thiểu

Ước lượng
trung bình Sai số lớn nhất
cho trước
σ σ
X  Zα /2 e = Zα /2
n n
Xác định cỡ mẫu

Tính cỡ mẫu
Tối thiểu

Ước lượng
Trung bình

2
σ Phương Z σ
2

e = Z /2 n =
/2
trình, tìm n 2
n e
Xác định cỡ mẫu

• Để tính cỡ mẫu tối thiểu, cần biết:

• Độ tin cậy (1 - ), trị ngưỡng tương ứng Zα/2


• Sai số lớn nhất cho phép, e
• Độ lệch chuẩn, σ
Ví dụ

Cho biết  = 45, mẫu phải lớn đến cỡ nào để ước lượng KTC
90% có sai số trong khoảng ± 5?

2 2 2 2
Z σ (1,65) (45)
n = 2
= 2
= 220,5225
e 5

Cỡ mẫu tối thiểu cần thiết là n = 221


(luôn làm tròn lên)
Thông thường, không biết σ

• Có thể ước lượng σ trước


• Dùng trị số được kỳ vọng ít nhất cũng không
nhỏ hơn trị số σ thực sự

• Chọn 1 mẫu thăm dò, ước lượng σ xấp xỉ S


Xác định cỡ mẫu tối thiểu

Tính cỡ mẫu
tối thiểu

Cho ước
lượng tỷ lệ

π (1 − π )
2
Phương Z π (1 − π )
e = Z n =
n trình 2
e
nghiệm n
Xác định cỡ mẫu tối thiểu

• Để tính cỡ mẫu tối thiểu, cần biết:

• Độ tin cậy (1 - ), trị số ngưỡng tương ứng Zα/2


• Sai số lớn nhất chấp nhận được, e
• Tỷ lệ tổng thể, π
• π có thể được ước lượng nhờ nghiên cứu thăm dò, nếu cần.

• Hoặc dùng nguyên lý “lý do không đầy đủ”: π xấp xỉ 0,5


Ví dụ

Cỡ mẫu cần phải lớn đến mức nào để ước


lượng khoảng tin cậy 95% của tỷ lệ tổng thể
trong một dân số tổng thể rất lớn, với sai số
cho phép ±3%?
Một nghiên cứu thăm dò cho biết p = 0,12
Ví dụ

Giải:
Độ tin cậy 95% cho tương ứng Zα/2 = 1,96
e = 0,03
p = 0,12 xấp xỉ π

2
π (1 − π ) (0.12)(1 − 0.12)
2
Z  /2 (1.96)
n = 2
= 2
= 450.74
e (0.03)

Cỡ Min(n) = 451
Tổng kết
• Khái niệm ước lượng điểm, ước lượng khoảng, độ tin cậy,
độ tự do

• Khoảng tin cậy của trung bình, khi biết/không biết σ

• Khoảng tin cậy của tỷ lệ

• Xác định có mẫu tối thiểu với sai số ước lượng cho sẵn

You might also like