Professional Documents
Culture Documents
CHƯƠNG 3-LÝ THUYẾT MẪU VÀ BÀI TOÁN ỨƠC LƯỢNG THAM SỐ
CHƯƠNG 3-LÝ THUYẾT MẪU VÀ BÀI TOÁN ỨƠC LƯỢNG THAM SỐ
𝑿(𝐜𝐦) 5 6 7 8 9 10 11 12
Bảng phân phối tần suất: 𝒑𝒊 𝟐 𝟔 𝟏𝟐 𝟏𝟎 𝟏𝟎 𝟒 𝟓 𝟏
𝟓𝟎 𝟓𝟎 𝟓𝟎 𝟓𝟎 𝟓𝟎 𝟓𝟎 𝟓𝟎 𝟓𝟎
Biểu đồ tần số
Biểu đồ tần suất
𝟏𝟐Τ𝟓𝟎
𝟔Τ𝟓𝟎
b) Bảng phân bố ghép lớp (khoảng)
Khi mẫu có kích thước lớn hoặc các giá trị tương đối nhiều và gần
nhau ta thường phân hoạch miền giá trị của biến X thành nhiều lớp
(khoảng) sao cho mỗi số liệu mẫu rơi vào đúng một lớp. Có nhiều
cách chia lớp khác nhau với độ rộng của mỗi lớp không nhất thiết
phải bằng nhau nhưng thông thường người ta hay lấy bằng nhau để
dễ so sánh.
Ví dụ: Một mẫu điều tra về thời hạn sử dụng an toàn 𝑋 (đơn
vị: tháng) một loại dược phẩm được có thể biểu diễn bởi một
bảng phân phối tần số ghép lớp như sau:
Bước 3:
• InputRange: chọn vùng dữ liệu (dữ liệu dạng cột, cột giá trị đứng
trước, tần số đứng sau)
• Chọn Raw data nếu dữ liệu thô, Frequency Table nếu dữ liệu dạng
bảng tần số.
• Chọn Descriptive stats (thống kê mô tả)
• OutputRange : Chọn vị trí chứa kết quả
Đọc thêm
❖ Kết quả như bảng sau:
Descriptive Statistics
1
Mean 814 ᪄
Trung bình 𝑋 = σ𝑛𝑖 𝑥𝑖
𝑛
𝑆𝑥
Standard Error 0,023906 Sai số chuẩn:
𝑛
Median 8 Trung vị
Mode 7 Mốt
Standard Deviation 0,169043 Độ lệch chuẩn 𝑠𝑥 = 𝑠𝑥2
Phương sai mẫu (hiệu chỉnh)
Sample Variance 0,028576 2
𝑠𝑥 =
1
σ𝑘𝑖=1 𝑛
𝑛−1
Kurtosis −0,507937 Độ nhọn
Skewness 0,299501 Độ nghiêng
Đọc thêm
AAD 0,1368
MAD 0,1
IQR 0,2
Đọc thêm
❖ Ví dụ
Một hãng sản xuất một loại sản phẩm công bố rằng thời gian
hoạt động tốt 𝑋 (đơn vị: tháng) của sản phẩm của họ trong
điều kiện bình thường trung bình phải tới 26,3 tháng. Một
mẫu điều tra về thời gian hoạt động tốt của một số sản phẩm
đã qua sử dụng của hãng này được cho trong bảng sau:
X [23-24) [24-25) [25-26) [26-27) [27-28) [28-29) [29-30]
Số sản phẩm 7 25 45 60 43 16 4
Hãy tính các đặt trưng mẫu cho 𝑋.
𝑎𝑖 +𝑎𝑖+1
Giải. Đặt 𝑥𝑖 = . Ta có mẫu thu gọn sau :
2
Chứng minh:
❑Trường hợp phương sai 𝝈𝟐 đã biết:
Giả sử 𝑋 = 𝑋1 , … , 𝑋𝑛 là một mẫu ngẫu nhiên và 𝑋 ∼ 𝑁 𝜇, 𝜎 2 .
Khi đó:
• 𝑋𝑖 ∼ 𝑁 𝜇, 𝜎 2 , 𝑖 = 1, … , 𝑛
1 𝑛 1 𝑛 1
᪄
• 𝐸 𝑋 = 𝐸 σ𝑖=1 𝑋𝑖 = σ𝑖=1 𝐸 𝑋𝑖 = . 𝑛 𝜇 = 𝜇.
𝑛 𝑛 𝑛
1 𝑛 1 1 𝜎2
• 𝐷 𝑋᪄ = 𝐷 σ 𝑋𝑖 = 2. σ𝑛𝑖=1 𝐷 𝑋𝑖 = . 𝑛. 𝜎 2 = .
𝑛 𝑖=1 𝑛 𝑛2 𝑛
Áp dụng 2 tính chất sau đây của phân phối chuẩn:
• Nếu 𝑋 ∼ 𝑁 𝜇, 𝜎 2 và 𝑘 là số thực, thì k𝑋 ∼ 𝑁 𝑘𝜇, (𝑘𝜎)2
• Nếu các biến ngẫu nhiên độc lập 𝑋, 𝑌 độc lập và 𝑋 ∼ 𝑁 𝜇𝑋 , 𝜎𝑋2 và
𝑌 ∼ 𝑁 𝜇𝑌 , 𝜎𝑌2 thì 𝑋 + 𝑌 và 𝑋 − 𝑌 là độc lập nhau, hơn nữa:
𝑋 ± 𝑌 ∼ 𝑁 𝜇𝑋 ± 𝜇𝑌 , 𝜎𝑋2 + 𝜎𝑌2 .
Ta có: σ𝑛𝑖=1 𝑋𝑖 ∼ 𝑁 𝑛𝜇; 𝑛𝜎 2
1 𝑛 1 1 𝜎2
⇒ 𝑋᪄ = σ 𝑋𝑖 ∼ 𝑁 𝑛𝜇; 𝑛( 𝜎)2 =𝑁 𝜇; .
𝑛 𝑖=1 𝑛 𝑛 𝑛
𝜎2 𝜎
Suy ra 𝑋᪄ ∼ 𝑁 𝜇; hay 𝑋᪄ ∼ 𝑁 𝜇; ( )2 .
𝑛 𝑛
Ta cần tìm độ chính xác 𝜀 sao cho 𝑋᪄ là ước lượng cho 𝜇 với độ tin cậy
1 − 𝛼 cho trước với, nghĩa là tìm 𝜀 thỏa:
𝑃(𝑋᪄ − 𝜀 < 𝜇 < 𝑋᪄ + 𝜀) = 1 − 𝛼 hay 𝑃(|𝑋᪄ − 𝜇| < 𝜀) = 1 − 𝛼 (*)
Áp dụng công thức xác suất phân phối chuẩn:
𝜀
Nếu Y∼ 𝑁 𝜇𝑌 , 𝜎𝑌2 thì 𝑃 𝑌 − 𝜇𝑌 < 𝜀 = 2𝜑 .
𝜎𝑌
𝜀
ta có: ∗ ⇔ 𝑃 𝑋᪄ − 𝜇 < 𝜀 = 2𝜑 𝜎 = 1 − 𝛼.
𝑛
𝜀 𝑛 1−𝛼 𝛼
⇔ 𝜑 = = 0,5 − .
𝜎 2 2
𝜀 𝑛 𝜎
Đặt = 𝑍𝛼/2 ⇔ 𝜀 = 𝑍𝛼/2 .
𝜎 𝑛
Vậy, ước lượng của 𝜇 với độ tin cậy 1 − 𝛼 có dạng: (𝑋᪄ − 𝜀; 𝑋᪄ + 𝜀).
𝜎
Đối với mẫu cụ thể là 𝑥᪄ − 𝜀; 𝑥᪄ + 𝜀 , độ chính xác là 𝜀 = 𝑢𝛼/2 và
𝑛
𝛼
𝑍𝛼/2 được tìm từ điều kiện 𝜑 𝑍𝛼/2 = 0,5 − .
2
᪄ 2
𝑋−𝜇 𝜎 2 𝜎
Đặt 𝑇 = . Do 𝑋᪄ ∼ 𝑁 𝜇; ( ) ⇒ 𝑋᪄ − 𝜇 ∼ 𝑁 0;
𝜎/ 𝑛 𝑛 𝑛
1 𝜎 2
⇒ 𝑇 ∼ 𝑁 0; 𝜎 . = 𝑁 0,1 .
𝑛
𝑛
𝑏−𝜇𝑌
ADCT: Nếu Y∼ 𝑁 𝜇𝑌 , 𝜎𝑌2 thì 𝑃 Y ≤ 𝑏 = 0,5 + 𝜑( ).
𝜎𝑌
ta có: 𝑃(T ≤ 𝑍𝛼 ) = 0,5 + 𝜑(𝑍𝛼 ).
᪄
𝑋−𝜇
Mặt khác: 𝑃(𝑇 ≤ 𝑍𝛼 ) = 1 − 𝛼 ⇔ 𝑃 𝜎 ≤ 𝑍𝛼 = 1 − 𝛼
𝑛
𝜎 𝜎
⇔ 𝑃 𝑋᪄ − 𝜇 ≤ 𝑍𝛼 . = 1 − 𝛼 ⇔ 𝑃 𝑋᪄ − 𝑍𝛼 . ≤ 𝜇 = 1 − 𝛼.
𝑛 𝑛
Vậy với độ tin cậy 1 − 𝛼, khoảng tin cậy bên trái của 𝜇 là 𝑥ഥ − 𝜀 < 𝜇
𝜎
Với 𝜀 = 𝑍𝛼 và 𝑍𝛼 được tìm từ điều kiện 0,5 + 𝜑 𝑍𝛼 = 1 − 𝛼
𝑛
hay 𝜑 𝑍𝛼 = 0,5 − 𝛼.
❑Trường hợp phương sai 𝝈𝟐 chưa biết ta dung phương sai hiệu chỉnh 𝑆𝑥2
của mẫu để thay thế:
᪄
𝑋−𝜇
Đặt 𝑇 = thì T có phân phối Student với (n-1) bậc tự do.
𝑠𝑥 / 𝑛
Theo phân phối Student, ta tìm được 𝑡𝛼/2 (𝑛 − 1) thỏa mãn:
𝑃 |𝑇| ≥ 𝑡𝛼/2 (𝑛 − 1) = 𝛼 ⇔ 𝑃 |𝑇| < 𝑡𝛼/2 (𝑛 − 1) = 1 − 𝛼.
Khoảng ước lượng cho kỳ vọng 𝜇 là:
𝑠𝑥 𝑠𝑥
𝑋᪄ − 𝑡𝛼/2 (𝑛 − 1) ᪄
; 𝑋 + 𝑡𝛼/2 (𝑛 − 1)
𝑛 𝑛
𝑠𝑥
với độ chính xác 𝜀 = 𝑡𝛼/2 (𝑛 − 1) .
𝑛
Trong đó 𝑡𝛼/2 (𝑛 − 1) tra từ bảng phân phối Student với (n-1) bậc tự do, mức
ý nghĩa 𝛼/2.
❖ Chú ý: Khi cỡ mẫu 𝑛 > 30, phân phối Student tiệm cận phân phối chuẩn nên
có thể sử dụng 𝑢𝛼/2 thay cho 𝑡𝛼/2 (𝑛 − 1).
❖ Ví dụ
Trọng lượng 𝑋 (kg) của một bao xi măng trong một nhà máy là
biến ngẫu nhiên có phân phối chuẩn. Kiểm tra 100 bao ở phân
xưởng này, có kết quả sau:
a) Với độ tin cậy 97%, hãy ước lượng khoảng tin cậy đối xứng
cho trọng lượng trung bình một bao xi măng ở phân xưởng
này.
b) Với độ tin cậy 98%, hãy cho biết trọng lượng trung bình tối
đa, tối thiểu của một bao xi măng ở phân xưởng này là bao
nhiêu?
❑ Hướng dẫn dùng máy tính CASIO fx 580 VN X:
Bước 1. Bật cột tần số:
▪ Bấm lần lượt các phím SHIFT, MENU và ▼
▪ Bấm phím 3 để chọn Statistics
▪ Bấm phím 1 để chọn On / Bật cột tần số.
Bước 2. Bấm phím MENU rồi bấm phím 6 để chọn Statistics
Bước 3. Bấm phím 1 để chọn 1-Variable (Hiện bảng phân phối tần số)
Bước 4. Nhập giá trị vào Bảng phân phối.
Bước 6. Bấm phím OPTN rồi bấm phím 3 để chọn 1-Variable Calc
để đọc kết quả (Để xem hết được các kết quả thống kê có thể dùng
phím mũi tên ▼và ▲ để dịch chuyển)
❖ Chú ý:
• Để quay lại chỉnh sửa Bảng phân phối thì bấm OPTN.
• Để lấy dữ liệu thống kê cho phép tính liên quan bấm OPTN ▼ 2
a) Với độ tin cậy 97%, hãy ước lượng khoảng tin cậy đối xứng
cho trọng lượng trung bình một bao xi măng ở phân xưởng này.
Giải
Ta có: 𝑛 = 100; 𝑥᪄ = 49,704; 𝑠𝑥 = 0,28353
a) Gọi 𝜇 là trọng lượng trung bình (thực tế) một bao xi măng ở
phân xưởng này.
• Cỡ mẫu 𝑛 = 100 > 30, 𝜎 2 chưa biết.
• Độ tin cậy 1 − 𝛼 = 97% ⇒ 𝛼 = 0,03 ⇒ 𝛼/2 = 0,015
• 𝜑 𝑧𝛼/2 = 0,5 − 𝛼Τ2 = 0,5 − 0,015 = 0,485 ⇒ 𝑧𝛼/2 = 2,170
𝑺𝒙
• Độ chính xác: 𝜺 = 𝒛𝜶/𝟐 . = 0,062
𝒏
• Vậy khoảng tin cậy đối xứng cho 𝜇 là:
(𝑥᪄ − 𝜀; 𝑥᪄ + 𝜀) = (49,642; 49,766).
b) Với độ tin cậy 98%, hãy cho biết trọng lượng trung bình tối đa,
tối thiểu của một bao xi măng ở phân xưởng này là bao nhiêu?
Giải
Ta có: 𝑛 = 100; 𝑥᪄ = 49,704; 𝑠𝑥 = 0,28353
b) Độ tin cậy 1 − 𝛼 = 98% = 0,98 ⇒ 𝛼 = 0,02
⇒ 𝜑 𝑧𝛼 = 0,5 − 𝛼 = 0,50 − 0,02 = 0,48
⇒ 𝑧𝛼 = 2,054
𝑆𝑥
• Độ chính xác: 𝜀 = 𝑧𝛼 = 0,058.
𝑛
• Giá trị trung bình tối đa là: 𝑥᪄ + 𝜀2 = 49,762.
• Giá trị trung bình tối thiểu là: 𝑥᪄ − 𝜀2 = 49,646.
❖ Chú ý: Tra Bảng giá trị hàm Laplace:
𝜑 𝑧𝛼/2 = 0,485 ⇒ 𝑧𝛼/2 = 2,170.
𝜑 𝑧𝛼/2 = 0,495 ⇒ 𝑧𝛼/2 = 2,576.
𝑥 1,645 1,751 1,881 1,960 2,054 2,170 2,326 2,576
𝜑(𝑥) 0,450 0,460 0,470 0,475 0,480 0,485 0,489 0,495
c) Các bài toán ngược:
❑ Bài toán 1: Xác định cỡ mẫu của biến quan sát 𝑿 ∼ 𝑵 𝝁, 𝝈𝟐 .
Mẫu sơ lược hiện tại kích thước 𝑛
Cho biết: ൞Độ tin cậy cần đạt: 1 − 𝛼 . Tìm kích thước mẫu
Độ chính xác mong muốn: 𝜀
cần điều tra 𝑚 (kích thước mẫu cần điều tra thêm là 𝑚 − 𝑛) để đạt
được độ chính xác 𝜀 với mức độ tin cậy 1 − 𝛼.
Cách giải:
• Tính độ lệch hiệu chỉnh 𝑆𝑥 và phân vị chuẩn 𝑍𝛼/2 .
• Với mong muốn tăng kích cỡ mẫu đủ lớn nên ta lấy công thức
𝑆𝑥
tính độ chính xác là: 𝜀 = 𝑍𝛼/2 .
𝑚
• Bình phương hai vế ta rút được công thức xác định 𝑚 như sau:
𝑍𝛼/2 ⋅𝑆𝑥 2
𝑚= + 1 (với 𝑥 là phần nguyên của 𝑥 ).
𝜀
❑ Bài toán 2: Tìm độ tin cậy (Khi lấy 𝑥᪄ ước lượng cho 𝜇) của
biến quan sát 𝑿 ∼ 𝑵 𝝁, 𝝈𝟐 .
Mẫu có kích thước 𝑛
Cho biết: ቊ .
Độ chính xác của ước lượng 𝜇 = 𝑥᪄ ± 𝜀 là 𝜀 đã biết
Tìm độ tin cậy 1 − 𝛼.
Cách giải:
𝑆
• Từ công thức 𝜀 = 𝑍𝛼/2 𝑥 suy ra công thức tính phân vị:
𝑛
𝜀 𝑛
𝑍𝛼/2 = .
𝑆𝑥
𝛼
• Áp dụng công thức 𝜑 𝑍𝛼/2 = 0,5 − ta suy ra công thức
2
tính độ tin cậy:
1 − 𝛼 = 2. 𝜑 𝑍𝛼/2
1 𝑥 −𝑡 2 /2
trong đó 𝜑(𝑥) = ⅇ 𝑑𝑡 là hàm Laplace.
2𝜋 0
❖ Ví dụ
Trọng lượng 𝑋 (kg) của một bao xi măng trong một nhà máy là
biến ngẫu nhiên có phân phối chuẩn. Kiểm tra 100 bao ở phân
xưởng này, có kết quả sau:
𝑿(𝒌𝒈) 49 49,2 49,4 49,6 49,8 50 50,2 50,4
Số bao 3 7 10 23 37 14 4 2
a) Để ước lượng khoảng tin cậy đối xứng cho trọng lượng trung
bình một bao xi măng đảm bảo độ tin cậy 99% và độ chính xác
0,02 kg thì cần điều tra thêm bao nhiêu bao xi măng nữa?
b) Để ước lượng khoảng tin cậy đối xứng cho trọng lượng trung
bình một bao xi măng với độ chính xác 0,05 kg thì đảm bảo độ
tin cậy là bao nhiêu?
c) Những bao xi măng có trọng lượng từ 50 kg trở lên được gọi
là đạt chuẩn. Với độ tin cậy 96%, hãy cho biết trọng lượng trung
bình tối đa của những bao xi măng đạt chuẩn là bao nhiêu?
a) Để ước lượng khoảng tin cậy đối xứng cho trọng lượng trung
bình một bao xi măng đảm bảo độ tin cậy 99% và độ chính xác
0,02 kg thì cần điều tra thêm bao nhiêu bao xi măng nữa?
Giải
a) Ta có:
• Kích thước mẫu ban đầu: 𝑛 = 100;
• Độ lệch hiệu chỉnh của mẫu ban đầu 𝑠𝑥 = 0,28353
• Độ chính xác cần đạt 𝜀 = 0,02.
• Độ tin cậy 1 − 𝛼 = 99% ⇒ 𝛼 = 0,01 ⇒ 𝛼/2 = 0,005
⇒ 𝜑 𝑍𝛼/2 = 0,5 − 𝛼Τ2 = 0,5 − 0,005 = 0,495 ⇒ 𝑍𝛼/2 = 2,576
• Kích thước mẫu cần điều tra là:
2
𝑍𝛼/2 ⋅ 𝑠𝑥
𝑚= + 1 = 1333,61 + 1 = 1333 + 1 = 1334.
𝜀
Vậy cần phải điều tra thêm là: 𝑚 − 𝑛 = 1234 bao.
b) Để ước lượng khoảng tin cậy đối xứng cho trọng lượng trung
bình một bao xi măng với độ chính xác 0,05 kg thì đảm bảo độ
tin cậy là bao nhiêu?
Giải
b) Ta có:
• Kích thước mẫu ban đầu: 𝑛 = 100;
• Độ lệch hiệu chỉnh của mẫu ban đầu 𝑠𝑥 = 0,28353.
• Độ chính xác cần đạt 𝜀 = 0,05.
𝜀 𝑛
• ADCT tính phân vị: 𝑍𝛼/2 = = 1,76348.
𝑠𝑥
• ADCT tính độ tin cậy: 1 − 𝛼 = 2𝜑 𝑍𝛼/2 ≈ 0,9222.
Vậy độ tin cậy là: 1 − 𝛼 = 92,22%.
c) Những bao xi măng có trọng lượng từ 50 kg trở lên được gọi
là đạt chuẩn. Với độ tin cậy 96%, hãy cho biết trọng lượng trung
bình tối đa của những bao xi măng đạt chuẩn là bao nhiêu?
Giải
𝑿 (kg) 50 50,2 50,4
Số bao 14 4 2
c) Các đặc trưng mẫu của bao xi măng đạt chuẩn;
• 𝑛 = 20 < 30; 𝑥᪄ = 50,08; 𝑠𝑥 = 0,13611.
• Cỡ mẫu 𝑛 = 20 < 30, 𝜎 2 chưa biết.
• Độ tin cậy 1 − 𝛼 = 96% = 0,96 ⇒ 𝛼 = 0,04
• 𝑡𝛼 𝑛 − 1 = 𝑡0,04 20 − 1 = 𝑡0,04 (19) = 1,850.
𝑆𝑥
• Độ chính xác: 𝜀 = 𝑡𝛼 (𝑛 − 1) = 0,056
𝑛
• Giá trị trung bình tối đa của những bao xi măng đạt chuẩn
là: 𝑥᪄ + 𝜀 = 50,136.
❖ Chú ý: Tra Bảng phân phối Student để tính 𝑡𝛼 𝑛 − 1
Với 𝛼 = 0,04 và 𝑛 = 20. Ta có 𝑡𝛼 𝑛 − 1 = 𝑡0,04 (19) = 1,850.
Chọn dòng 19 và cột 𝛼 = 0,04 .
2.3. Bài toán ước lượng khoảng tin cậy cho tỉ lệ 𝑝
a) Đặt bài toán:
Giả sử trong một tổng thể, mỗi cá thể mang hoặc không mang dấu hiệu A
nào đó. Gọi p (chưa biết) là tỷ lệ cá thể có dấu hiệu A trong tổng thể. Lấy
một mẫu quan sát ngẫu nhiên cỡ n từ tổng thể. Hãy ước lượng giá trị của p.
b) Giải quyết bài toán:
Gọi X là số lượng cá thể có dấu hiệu A trong mẫu n cá thể lấy ra. Ta có ước
𝑋
lượng không chệch cho 𝑝 là tần suất chính là tần suất 𝑓𝑛 = .
𝑛
Ta thấy X~𝐵 𝑛, 𝑝 -phân phối nhị thức nên 𝑓𝑛 ~𝐵 𝑛, 𝑝 . Khi 𝑛 lớn thì 𝑓𝑛 có
𝑝𝑞
phân phối xấp xỉ phân phối chuẩn 𝑁 𝑝,
với 𝑞 = 1 − 𝑝.
𝑛
Vì 𝑝 chưa biết nên phương sai 𝐷(𝑓) cũng chưa biết. Mặt khác, tần suất mẫu
𝑓 là ước lượng vững, không chệch và hiệu quả cho tần suất 𝑝 của tổng thể
nên với 𝑛 đủ lớn, thỏa mãn điều kiện 𝑛𝑓𝑛 > 10 và 𝑛(1 − 𝑓𝑛 ) > 10 ta có thể
𝑝(1−𝑝) 𝑓𝑛 (1−𝑓𝑛 )
xấp xỉ 𝐷(𝑓𝑛 ) = ≈ .
𝑛 𝑛
Ta cần tìm độ chính xác 𝜀 của ước lượng để đạt độ tin cậy 1 − 𝛼,
nghĩa là: 𝑃 𝑓𝑛 − 𝑝 < 𝜀 = 1 − 𝛼. (1)
Áp dụng công thức xác suất phân phối chuẩn:
𝜀
Nếu X∼ 𝑁 𝜇𝑋 , 𝜎𝑋2 thì 𝑃 𝑋 − 𝜇𝑋 < 𝜀 = 2𝜑 .
𝜎𝑋
𝜀
Ta có: 𝑃 𝑓𝑛 − 𝑝 < 𝜀 = 2𝜑 (2)
𝑓𝑛 (1−𝑓𝑛 )
𝑛
𝜀 𝜀 𝛼
Từ (1) và (2): 2𝜑 =1−𝛼⇔𝜑 = 0,5 − .
𝑓𝑛 1−𝑓𝑛 𝑓𝑛 1−𝑓𝑛 2
𝑛 𝑛
𝜀 𝑓𝑛 (1−𝑓𝑛 )
Đặt 𝑍𝛼/2 = ⇔ 𝜀 = 𝑍𝛼/2 .
𝑓𝑛 (1−𝑓𝑛 ) 𝑛
𝑛
𝛼
Với 𝑍𝛼/2 được xác định từ điều kiện 𝜑 𝑍𝛼/2 = 0,5 − . Từ đó ta có:
2
c) Các bước thực hành giải:
▪ Lập mẫu kích thước 𝑛 về tính chất 𝐴, tính được tỉ lệ mẫu 𝑓𝑛 .
𝛼
▪ Tính 𝑍𝛼/2 từ công thức 𝜑 𝑍𝛼/2 = 0,5 − .
2
▪ Kết luận khoảng tin cậy:
𝑓𝑛 1−𝑓𝑛
• Khoảng tin cậy đối xứng: 𝑓𝑛 − 𝜀 < 𝑝 < 𝑓𝑛 + 𝜀 với 𝜀 = 𝑍𝛼/2 . .
𝑛
𝑓𝑛 1−𝑓𝑛
• Khoảng tin cậy bên trái: 𝑝 < 𝑓𝑛 + 𝜀 với 𝜀 = 𝑧𝛼 ⋅ .
𝑛
𝑓𝑛 1−𝑓𝑛
• Khoảng tin cậy bên phải: 𝑓𝑛 − 𝜀 < 𝑝 với 𝜀 = 𝑧𝛼 ⋅ .
𝑛
❖ Lưu ý:
• Bài toán ước lượng khoảng tin cậy bên trái (bên phải) của 𝑝 thường
là bài toán ước lượng giá trị tỉ lệ tối đa (tối thiểu) của tỉ lệ 𝑝
𝑛. 𝑓𝑛 > 5
• Điều kiện cho bài toán ước lượng tỉ lệ là: ቈ .
𝑛 1 − 𝑓𝑛 > 5
❖ Ví dụ
Để điều tra tỷ lệ sinh viên nghiện TikTok (dùng nhiều hơn 2h mỗi
ngày) trong tổng thể 16000 sinh viên ĐHGT. Người ta phỏng vấn
ngẫu nhiên 160 sinh viên và thấy trong số đó có 96 con nghiện.
a) Với độ tin cậy 99%, hãy ước lượng khoảng tin cậy đối xứng
cho tỷ lệ SV nghiện TikTok ở ĐHGT.
b) Với độ tin cậy 96%, hãy cho biết số lượng tối đa, tối thiểu SV
nghiện TikTok trong toàn trường là bao nhiêu?
Giải. a) Gọi p là tỷ lệ sinh viên nghiện TikTok ở ĐHGT.
𝑋 96
Với mẫu cụ thể cho ở trên, ta có: 𝑓𝑛 = = = 0,6.
𝑛 160
Kiểm tra ĐK 𝑛𝑓𝑛 = 96 > 10 và 𝑛 1 − 𝑓𝑛 = 64 > 10 thấy thỏa mãn.
𝛼 1−𝛼 99%
Ta có: 𝜑 𝑍𝛼/2 = 0,5 − = = = 0,495 ⇒ 𝑍𝛼/2 = 2,576.
2 2 2
𝑓𝑛 1−𝑓𝑛
Độ chính xác của ước lượng là: 𝜀 = 𝑍𝛼/2 . = 0,031.
𝑛
Vậy khoảng tin cậy cho ước lượng là: 𝑓𝑛 − 𝜀; 𝑓𝑛 + 𝜀 = 0,569; 0,631 .
b) Gọi 𝑁0 là số lượng sinh viên nghiện TikTok trong tổng thể
16000 sinh viên ĐHGT.
Độ tin cậy 1 − 𝛼 = 96% ⇒ 𝛼 = 0,04 ⇒ 𝑧𝛼 = 1,751
𝑓𝑛 1−𝑓𝑛
Độ chính xác: 𝜀 = 𝑧𝛼 ⋅ = 0,0678
𝑛
𝑁0
Tỉ lệ tối đa là: 𝑝 = = 𝑓𝑛 + 𝜀 = 0,6678 ⇒ max 𝑁0 = 10685
1085
16000
𝑁
Tỉ lệ tối thiểu là: 𝑝 = 0 = 𝑓𝑛 − 𝜀 = 0,5322 ⇒ min 𝑁0 = 8515.
16000
Vậy với độ tin cậy 96% thì số lượng sinh viên nghiện TikTok tối
đa 1085 SV, tối thiểu 8515 SV.
d) Các bài toán ngược:
Bài toán 1: Xác định cỡ mẫu
Biết 1 − 𝛼, 𝜀 tìm kích thước mẫu cần điều tra 𝑚, kích thước mẫu cần
điều tra thêm là 𝑚 − 𝑛 (với 𝑛 là kích thước mẫu hiện tại).
Từ công thức độ chính xác, suy ra công thức xác định 𝑚:
𝑍𝛼/2 2
𝑚= 𝑓𝑛 1 − 𝑓𝑛 + 1.
𝜀
(𝑛−1)⋅𝑠𝑥2
• Khoảng tin cậy bên trái : 0; 2 .
𝜒1−𝛼 (𝑛−1)
(𝑛−1)⋅𝑠𝑥2
• Khoảng tin cậy bên phải: 2 ;∞ .
𝜒𝛼 (𝑛−1)
❑ Trường hợp 2: Đã biết 𝜇 = 𝐸(𝑋)
𝑛 𝑛
𝑖=1 𝑛𝑖 𝑥𝑖 −𝜇 2 𝑖=1 𝑛𝑖 𝑥𝑖 −𝜇 2
• Khoảng tin cậy hai phía: 2 ; 2 .
𝜒𝛼/2 𝑛 𝜒1−𝛼/2 𝑛
σ𝑛
𝑖=1 𝑛𝑖 𝑥𝑖 −𝜇
2
• Khoảng tin cậy bên trái : 0; 2 (𝑛) .
𝜒1−𝛼
σ𝑛
𝑖=1 𝑛𝑖 𝑥𝑖 −𝜇
2
• Khoảng tin cậy bên phải: 2 (𝑛) ;∞ .
𝜒𝛼
• Trong đó: 𝜒𝛼2 (𝑛) là phân vị của phân phối khi bình phương với 𝑛
bậc tự do thỏa mãn: 𝑃 𝜒 2 > 𝜒𝛼2 (𝑛) = 𝛼. Giá trị 𝜒𝛼2 (𝑛) được tính
bởi tra Bảng phân phối Khi bình phương hoặc hàm Chiinv trong
Excel: 𝜒𝛼2 (𝑛) = 𝐶ℎ𝑖𝑖𝑛𝑣(𝛼, 𝑛).
• Chẳng hạn: 𝑛 = 9, 𝛼 = 5%, 𝜒𝛼2 (𝑛) = 16,91898.
❖ Ví dụ
Trọng lượng 𝑋 (kg) của một bao xi măng trong một nhà máy là
biến ngẫu nhiên có phân phối chuẩn. Kiểm tra 100 bao ở phân
xưởng này, có kết quả sau:
𝑿 49 49,2 49,4 49,6 49,8 50 50,2 50,4
Số bao 3 7 10 23 37 14 4 2
a) Với độ tin cậy 94%, hãy tìm khoảng tin cậy hai phía cho độ
lệch tiêu chuẩn của trọng lượng bao xi măng.
b) Với độ tin cậy 95%, hãy cho biết độ lệch tiêu chuẩn của
trọng lượng bao xi măng tối đa, tối thiểu là bao nhiêu?
Giải
Theo bài, ta chưa biết trọng lượng trung bình thực tế của bao xi
măng 𝜇 = 𝐸(𝑋).
Từ mẫu, tính được: 𝑛 = 100; 𝑠𝑥 = 0,28353.
Từ mẫu, tính được: 𝑛 = 100; 𝑠𝑥 = 0,28353.
a) Độ tin cậy 1 − 𝛼 = 94% ⇒ 𝛼/2 = 0,02; 1 − 𝛼/2 = 0,98.
𝜒𝛼2 (𝑛 − 1) = 𝜒0.02
2
(99) = Chiinv(0.02,99) = 129,9958.
2
2 2
𝜒1−𝛼/2 (𝑛 − 1) = 𝜒0.98 (99) = chiinv(0.98,99) = 72,2880.
Khoảng tin cậy hai phía của 𝜎 2 là:
𝑛−1 ⋅𝑠𝑥2 𝑛−1 ⋅𝑠𝑥2
2 ; 2 = (0,06122; 0,11010).
𝜒𝛼/2 𝑛−1 𝜒1−𝛼/2 𝑛−1
(𝑛 − 1) ⋅ 𝑠𝑥2
2 = 0,3214 kg .
𝜒1−𝛼 (𝑛 − 1)
Độ lệch tiêu chuẩn của trọng lượng bao xi măng tối thiểu là:
(𝑛 − 1) ⋅ 𝑠𝑥2
2 = 0,2541 kg .
𝜒𝛼 (𝑛 − 1)