You are on page 1of 39

CHƯƠNG 5

Uớc lượng tham số tổng thể

Hồ Phi Tứ

KHOA TOÁN CƠ TIN HỌC


TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 1 / 26


5.1 Ước lượng điểm cho kỳ vọng, phương sai và
xác suất

Cho ĐLNN X (thường là một dấu hiệu nào đó trên tập chính ma ta
đang quan tâm) có các tham số đặc trưng gồm: Kỳ vọng, Phương
sai và Xác suất đều chưa biết và lần lượt được ký hiệu là µ, σ 2 , p.

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 2 / 26


5.1 Ước lượng điểm cho kỳ vọng, phương sai và
xác suất

Cho ĐLNN X (thường là một dấu hiệu nào đó trên tập chính ma ta
đang quan tâm) có các tham số đặc trưng gồm: Kỳ vọng, Phương
sai và Xác suất đều chưa biết và lần lượt được ký hiệu là µ, σ 2 , p.
Giả sử có một mẫu số liệu kích thước n về X. Khi đó, người ta chọn
Trung bình mẫu x là ước lượng điểm (xấp xỉ) cho giá trị Kỳ vọng µ
Phương sai hiệu chỉnh mẫu s 2 là ước lượng điểm (xấp xỉ) cho giá trị
Phương sai σ 2
Tỷ lệ mẫuf là ước lượng điểm (xấp xỉ) cho giá trị xác suất.

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 2 / 26


5.1 Ước lượng điểm cho kỳ vọng, phương sai và
xác suất

Cho ĐLNN X (thường là một dấu hiệu nào đó trên tập chính ma ta
đang quan tâm) có các tham số đặc trưng gồm: Kỳ vọng, Phương
sai và Xác suất đều chưa biết và lần lượt được ký hiệu là µ, σ 2 , p.
Giả sử có một mẫu số liệu kích thước n về X. Khi đó, người ta chọn
Trung bình mẫu x là ước lượng điểm (xấp xỉ) cho giá trị Kỳ vọng µ
Phương sai hiệu chỉnh mẫu s 2 là ước lượng điểm (xấp xỉ) cho giá trị
Phương sai σ 2
Tỷ lệ mẫuf là ước lượng điểm (xấp xỉ) cho giá trị xác suất.
Người ta đã chứng minh được rằng các ước lượng trên đều là không
chệch, vững và hiệu quả.

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 2 / 26


5.2 Khoảng tin cậy cho kỳ vọng, phương sai và
tỷ lệ tổng thể

Định nghĩa khoảng tin cậy: Gọi θ là một tham số chưa biết của
ĐLNN X. Khi đó, khoảng (θ1 ; θ2 ) được gọi là khoảng tin cậy với độ
tin cậy (1 − α) cho tham số θ nếu

P(θ1 < θ < θ2 ) = 1 − α.

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 3 / 26


5.2 Khoảng tin cậy cho kỳ vọng, phương sai và
tỷ lệ tổng thể

Định nghĩa khoảng tin cậy: Gọi θ là một tham số chưa biết của
ĐLNN X. Khi đó, khoảng (θ1 ; θ2 ) được gọi là khoảng tin cậy với độ
tin cậy (1 − α) cho tham số θ nếu

P(θ1 < θ < θ2 ) = 1 − α.

Khoảng tin cậy được gọi là đối xứng nếu P(θ ⩽ θ1 ) = P(θ ⩾ θ2 ).
Độ tin cậy 1 − α thường được lấy từ 95% đến 99%.

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 3 / 26


Khoảng tin cậy cho kỳ vọng µ

Trường hợp ĐLNN X có phân bố chuẩn N(µ, σ 2 ) và đã biết phương sai


σ 2 . Khi đó, ta thu được các khoảng tin cậy như sau
Khoảng tin cậy đối xứng
σ σ
x − uα/2 . √ ≤ µ ≤ x + uα/2 . √
n n

Khoảng tin cậy tối đa


σ
−∞ < µ ≤ x + uα . √
n

Khoảng tin cậy tối thiểu


σ
x − uα . √ ≤ µ < +∞
n

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 4 / 26


Khoảng tin cậy cho kỳ vọng µ
Trường hợp ĐLNN X có phân bố chuẩn N(µ, σ 2 ) chưa biết phương sai
và kích thước mẫu nhỏ hơn 30. Khi đó, ta thu được các khoảng tin cậy
như sau
Khoảng tin cậy đối xứng
(n−1) s (n−1) s
x − tα/2 . √ ≤ µ ≤ x + tα/2 . √
n n

Khoảng tin cậy tối đa


s
−∞ < µ ≤ x + tα(n−1) . √
n

Khoảng tin cậy tối thiểu


s
x − tα(n−1) . √ ≤ µ < +∞
n

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 5 / 26


Khoảng tin cậy cho kỳ vọng µ
Trường hợp ĐLNN X có phân bố chuẩn N(µ, σ 2 ) nhưng chưa biết
phương sai và kích thước mẫu lớn hơn 30. Khi đó, ta thu được các khoảng
tin cậy như sau
Khoảng tin cậy đối xứng
s s
x − uα/2 . √ ≤ µ ≤ x + uα/2 . √
n n

Khoảng tin cậy tối đa


s
−∞ < µ ≤ x + uα . √
n

Khoảng tin cậy tối thiểu


s
x − uα . √ ≤ µ < +∞
n

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 6 / 26


Khoảng tin cậy cho kỳ vọng µ
Chú ý: Trong trường hợp chưa biết phân bố của ĐLNN X nhưng kích
thước mẫu lớn hơn 30. Người ta cũng sử các khoảng tin cậy như sau cho
µ
Khoảng tin cậy đối xứng
s s
x − uα/2 . √ ≤ µ ≤ x + uα/2 . √
n n

Khoảng tin cậy tối đa


s
−∞ < µ ≤ x + uα . √
n

Khoảng tin cậy tối thiểu


s
x − uα . √ ≤ µ < +∞
n

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 7 / 26


Các ví dụ minh họa

Ví dụ 1. Điều tra thu nhập X (triệu đồng/ tháng) của một số hộ gia đình
ở một vùng dân cư, thu được số liệu sau:

X 4 4,5 5 5,5 6 6,5 7 7,5 8


Số hộ 1 3 4 6 8 7 6 3 2

a) Hãy ước lượng khoảng tin cậy đối xứng cho mức thu nhập trung bình
mỗi tháng của hộ dân ở vùng đó với độ tin cậy 95%. Độ dài khoảng tin
cậy đối xứng trong trường hợp này bằng bao nhiêu?
b) Muốn độ chính xác của ước lượng ở câu a) tăng gấp đôi thì cần điều
tra thêm bao nhiêu hộ nữa?
c) Hãy ước lượng giá trị bé nhất của thu nhập trung bình mỗi tháng của
hộ dân vùng đó với độ tin cậy 90%.

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 8 / 26


Giải.

a) Đây là bài toán ước lượng trong trường hợp chưa biết phương sai, dù
không có giả thiết phân bố của X là chuẩn nhưng kích thước mẫu n > 30,
nên ta có khoảng tin cậy cho trung bình EX = µ là
s s
µ ∈ (x − uα/2 . √ ; x + uα/2 . √ ).
n n

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 9 / 26


Giải.

a) Đây là bài toán ước lượng trong trường hợp chưa biết phương sai, dù
không có giả thiết phân bố của X là chuẩn nhưng kích thước mẫu n > 30,
nên ta có khoảng tin cậy cho trung bình EX = µ là
s s
µ ∈ (x − uα/2 . √ ; x + uα/2 . √ ).
n n

Từ giả thiết ta có 1 − α = 0, 95 nên uα/2 = u0,025 = 1, 96 và n=40,


Trung bình mẫu: x = 6, 1125.
Độ lệch tiêu chuẩn mẫu: s = 0, 9903.

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 9 / 26


Giải.

a) Đây là bài toán ước lượng trong trường hợp chưa biết phương sai, dù
không có giả thiết phân bố của X là chuẩn nhưng kích thước mẫu n > 30,
nên ta có khoảng tin cậy cho trung bình EX = µ là
s s
µ ∈ (x − uα/2 . √ ; x + uα/2 . √ ).
n n

Từ giả thiết ta có 1 − α = 0, 95 nên uα/2 = u0,025 = 1, 96 và n=40,


Trung bình mẫu: x = 6, 1125.
Độ lệch tiêu chuẩn mẫu: s = 0, 9903.
Thay số ta được: µ ∈ (5, 8056; 6, 4194).

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 9 / 26


Giải.

s
b) Với ước lượng ở câu a), sai số ban đầu là uα/2 . √ . Giả sử mẫu mới
n
′ s
cần điều tra n thì sai số khi đó là uα/2 . √ .
n′
Muốn độ chính xác tăng lên gấp đôi thì sai số giảm đi một nửa, tức là

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 10 / 26


Giải.

s
b) Với ước lượng ở câu a), sai số ban đầu là uα/2 . √ . Giả sử mẫu mới
n
′ s
cần điều tra n thì sai số khi đó là uα/2 . √ .
n′
Muốn độ chính xác tăng lên gấp đôi thì sai số giảm đi một nửa, tức là
s 1 s
uα/2 . √ = uα/2 . √ ⇐⇒ n′ = 4n = 160.
n ′ 2 n

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 10 / 26


Giải.

s
b) Với ước lượng ở câu a), sai số ban đầu là uα/2 . √ . Giả sử mẫu mới
n
′ s
cần điều tra n thì sai số khi đó là uα/2 . √ .
n′
Muốn độ chính xác tăng lên gấp đôi thì sai số giảm đi một nửa, tức là
s 1 s
uα/2 . √ = uα/2 . √ ⇐⇒ n′ = 4n = 160.
n ′ 2 n

Vậy mẫu cần điều tra thêm là n′ − n = 160 − 40 = 120.

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 10 / 26


Giải.

c) Giá trị bé nhất của thu nhập trung bình mỗi tháng được ước lượng
s
µmin = x − uα . √ .
n
Với 1 − α = 0, 9 ta có uα = u0,1 = 1, 28, thay số ta được µmin = 5, 912.

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 11 / 26


Khoảng tin cậy cho phương sai σ 2
Cho ĐLNN gốc X ∼ N(µ, σ 2 ). Với độ tin cậy 1 − α, ta ước lượng giá trị
σ2.
Trường hợp biết giá trị trung bình µ
Khoảng tin cậy đối xứng:
nŝ 2 nŝ 2
2(n)
≤ σ2 ≤ 2(n)
.
χα/2 χ1−α/2

Khoảng tin cậy bên trái:


nŝ 2
0 ≤ σ2 ≤ 2(n)
χ1−α

Khoảng tin cậy bên phải:


nŝ 2
2(n)
≤ σ 2 < +∞
χα
Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 12 / 26
Khoảng tin cậy cho phương sai σ 2
Trường hợp chưa biết giá trị trung bình µ
Khoảng tin cậy đối xứng:

(n − 1)s 2 (n − 1)s 2
2(n−1)
≤ σ2 ≤ 2(n−1)
.
χα/2 χ1−α/2

Khoảng tin cậy bên trái:

(n − 1)s 2
0 ≤ σ2 ≤ 2(n−1)
χ1−α

Khoảng tin cậy bên phải:

(n − 1)s 2
2(n−1)
≤ σ 2 < +∞
χα

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 13 / 26


Khoảng tin cậy cho tỷ lệ tổng thể p
Gọi p là tỷ lệ theo dấu hiệu ta quan tâm trên tổng thể. Dưới các điều kiện
nf > 10 và n(1 − f ) > 10, thì p được ước lượng như sau
Khoảng tin cậy đối xứng:
r r
f (1 − f ) f (1 − f )
p ∈ (f − uα/2 . ; f + uα/2 . ).
n n
r
f (1 − f )
Khoảng tin cậy bên trái: p ∈ (0; f + uα . ), từ đó
n
r
f (1 − f )
pmax = f + uα . .
n
r
f (1 − f )
Khoảng tin cậy bên phải: p ∈ (f − uα . ; 1), từ đó
n
r
f (1 − f )
pmin = f − uα . .
n
Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 14 / 26
Các ví dụ minh họa

Ví dụ 2. Nghiên cứu về nhu cầu một loại hàng hóa (kg/tháng) ở một khu
vực, người ta tiến hành khảo sát về nhu cầu mặt hàng này ở 400 hộ gia
đình và thu được kết quả như sau:

Nhu cầu X 0–1 1–2 2–3 3–4 4–5 5–6 6–7 7–8
Số hộ 10 35 86 132 78 31 18 10

a) Với độ tin cậy 95%, hãy ước lượng tỷ lệ hộ có nhu cầu lớn hơn
6kg/tháng.
b) Với độ tin cậy 95%, tỷ lệ hộ có nhu cầu từ 2 đến 6kg/tháng đạt ít nhất
là bao nhiêu phần trăm.
c) Giả sử khu vực này có 20000 hộ gia đình, hãy ước lượng số lượng
những hộ có nhu cầu 6kg/tháng trở lên với độ tin cậy 90%?

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 15 / 26


Giải

a) Khoảng tin cậy cho p: tỷ lệ hộ có nhu cầu lớn hơn 6kg/tháng là


r r
f (1 − f ) f (1 − f )
p ∈ (f − uα/2 . ; f + uα/2 . ).
n n
18 + 10
Với n = 400, f = = 0, 07, 1 − α = 0, 9 nên uα/2 = 1, 96, thay số
400
ta được
p ∈ (0, 045; 0, 095).

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 16 / 26


Giải

b) Tỷ lệ hộ có nhu cầu từ 2 đến 6kg/tháng đạt giá trị nhỏ nhất là


r
f (1 − f )
ptt = f − uα . .
n
86 + 132 + 78 + 31
Với n = 400, f = = 0, 8175, uα = 1, 64, thay số ta
400
được ptt = 0, 7858.
Vậy tỷ lệ đó thấp nhất là 78,58%.

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 17 / 26


Giải

c) Gọi M là số hộ có nhu cầu từ 6kg/tháng trở lên thì tỉ lệ hộ có nhu cầu


M
từ 6kg/tháng trở lên là p = . Để ước lượng M, ta sẽ ước lượng p bởi
20000
r r
f (1 − f ) f (1 − f )
p ∈ (f − uα/2 . ; f + uα/2 . ).
n n

Với mẫu quan sát ở trên


18 + 10
n = 400, f = = 0, 07, uα/2 = 1, 64
400
ta được p ∈ (0, 0491; 0, 0909).
Từ đó, suy ra M = 20000.p ∈ (982; 1818).

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 18 / 26


5.3 Độ chính xác của ước lượng và số quan sát
cần thiết

Với độ tin củy 1 − α đã cho, ta thấy có mối quan hệ giữa kích thước
mẫu n và độ dài khoảng tin cậy.

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 19 / 26


5.3 Độ chính xác của ước lượng và số quan sát
cần thiết

Với độ tin củy 1 − α đã cho, ta thấy có mối quan hệ giữa kích thước
mẫu n và độ dài khoảng tin cậy.
Cụ thể, kích thước mẫu càng lớn thỉ khoảng tin cậy càng hẹp, nghĩa là
độ chính xác của ước lượng của ta càng cao, sai số của ta càng nhỏ.

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 19 / 26


5.3 Độ chính xác của ước lượng và số quan sát
cần thiết

Với độ tin củy 1 − α đã cho, ta thấy có mối quan hệ giữa kích thước
mẫu n và độ dài khoảng tin cậy.
Cụ thể, kích thước mẫu càng lớn thỉ khoảng tin cậy càng hẹp, nghĩa là
độ chính xác của ước lượng của ta càng cao, sai số của ta càng nhỏ.
Tuy nhiên kích thước mẫu càng lớn thì đòi hỏi ở nhà nghiên cứu càng
nhiều thời gian, tiền của và công sức.

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 19 / 26


5.3 Độ chính xác của ước lượng và số quan sát
cần thiết

Với độ tin củy 1 − α đã cho, ta thấy có mối quan hệ giữa kích thước
mẫu n và độ dài khoảng tin cậy.
Cụ thể, kích thước mẫu càng lớn thỉ khoảng tin cậy càng hẹp, nghĩa là
độ chính xác của ước lượng của ta càng cao, sai số của ta càng nhỏ.
Tuy nhiên kích thước mẫu càng lớn thì đòi hỏi ở nhà nghiên cứu càng
nhiều thời gian, tiền của và công sức.
Vậy bài toán đặt ra là : Cần chọn kích thước mẫu tối thiểu là bao
nhiêu để đạt được độ chính xác mong muốn.

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 19 / 26


Đối với ước lượng giá trị Trung bình µ:

Giả sử muốn có ước lượng cho giá trị trung bình µ với sai số không
quá ϵ cho trước với độ tin cậy 1 − α.
Khi đó kích thước mẫu n cần phải thỏa mãn bất đẳng thức:
 σu 2
α/2
n≥
ϵ

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 20 / 26


Đối với ước lượng giá trị Trung bình µ:

Giả sử muốn có ước lượng cho giá trị trung bình µ với sai số không
quá ϵ cho trước với độ tin cậy 1 − α.
Khi đó kích thước mẫu n cần phải thỏa mãn bất đẳng thức:
 σu 2
α/2
n≥
ϵ

Chọn một mẫu sơ bộ kích thức m (thường phải lớn hơn 30) để tính s,
sau đó xấp xỉ σ bằng s như sau
 su 2
α/2
n≥
ϵ

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 20 / 26


Đối với ước lượng Tỷ lệ tổng thể p

Giả sử muốn có ước lượng cho Tỷ lệ tổng thể p với sai số không
quá ϵ cho trước với độ tin cậy 1 − α.
Khi đó kích thước mẫu n cần phải thỏa mãn bất đẳng thức:
2 p(1 − p)
uα/2
n≥
ϵ2

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 21 / 26


Đối với ước lượng Tỷ lệ tổng thể p

Giả sử muốn có ước lượng cho Tỷ lệ tổng thể p với sai số không
quá ϵ cho trước với độ tin cậy 1 − α.
Khi đó kích thước mẫu n cần phải thỏa mãn bất đẳng thức:
2 p(1 − p)
uα/2
n≥
ϵ2

Chọn một mẫu sơ bộ để tính f, sau đó xấp xỉ p bằng f như sau


2 f (1 − f )
uα/2
n≥
ϵ2
(
nf > 10
với điều kiện
n(1 − f ) > 10

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 21 / 26


Các ví dụ minh họa

Ví dụ 3. Để đánh giá số lượng cá trong hồ người ta đánh bắt 2000 con


cá, đánh dấu rồi thả xuống hồ. Sau đó họ đánh bắt lại 400 con thì thấy 80
con có dấu.
a) Với độ tin cậy 95% hãy ước lượng trữ lượng cá hiện có trong hồ.
b) Nếu muốn sai số của ước lượng giảm đi một nửa thì lần sau cần đánh
bắt bao nhiêu con cá?

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 22 / 26


Giải

a) Ở bài này, trước hết ta phải nhận thấy rằng mẫu điều tra ở đây là 400
con, còn 2000 con là số cá có đặc điểm (có dấu) trong hồ.

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 23 / 26


Giải

a) Ở bài này, trước hết ta phải nhận thấy rằng mẫu điều tra ở đây là 400
con, còn 2000 con là số cá có đặc điểm (có dấu) trong hồ.
Để ước lượng được số cá trong hồ N, ta cần ước lượng tỉ lệ cá có dấu
2000
p= .
N
80
Ta có n = 400, f = = 0, 2, uα/2 = 1, 96 nên p ∈ (0, 1608; 0, 2392).
400
2000
Từ đó, số lượng cá trong hồ được ước lượng N = ∈ (8326; 12437).
p

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 23 / 26


Giải

b) Gọi mẫu mới cần điều tra kích thước n′ , để sai số ước lượng giảm đi
một nửa thì sai số ước lượng tỉ lệ p tương ứng cũng phải giảm đi một nửa,
hay ta có
r r
f (1 − f ) 1 f (1 − f )
uα/2 ′
= .uα/2 ⇐⇒ n′ = 4n = 1600.
n 2 n

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 24 / 26


BÀI TẬP

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 25 / 26


CẢM ƠN CÁC BẠN ĐÃ CHÚ Ý LẮNG NGHE

Hồ Phi Tứ CHƯƠNG 5. Ngày 29 tháng 11 năm 2023 26 / 26

You might also like