You are on page 1of 54

Chương 2.

ƯỚC LƯỢNG THAM SỐ


(Môn học: Thống kê ứng dụng)

Lê Phương

Khoa Toán Kinh tế


Trường Đại học Kinh tế - Luật
Đại học Quốc gia Thành phố Hồ Chí Minh
Nội dung

1 Lý thuyết mẫu
Phương pháp mẫu
Các đặc trưng mẫu

2 Ước lượng điểm


Bài toán ước lượng điểm
Các tiêu chuẩn ước lượng
Các phương pháp ước lượng điểm

3 Ước lượng khoảng


Bài toán ước lượng khoảng
Ước lượng tỉ lệ
Ước lượng trung bình
Ước lượng phương sai
Phương pháp mẫu
Tổng thể C là một tập hợp các đơn vị có một đặc điểm (định tính hoặc
định lượng) cần nghiên cứu. Đặc điểm thay đổi qua các đơn vị của
tổng thể được biểu diễn bằng một biến ngẫu nhiên X : C → R.

Ví dụ.
1 Nếu muốn nghiên cứu chất lượng sản phẩm của một lô hàng thì
tổng thể C là các tất cả sản phẩm của lô hàng, đặc điểm nghiên
cứu có thể là sản phẩm có đạt tiêu chuẩn hay không. Biến ngẫu
nhiên X : C → R được định nghĩa:
(
1 nếu sản phẩm u đạt tiêu chuẩn,
X (u) =
0 nếu sản phẩm u không đạt tiêu chuẩn.

2 Nếu muốn nghiên cứu thu nhập của người Việt Nam thì tổng thể
là toàn bộ người dân Việt Nam, đặc điểm nghiên cứu là thu nhập
của người dân. Biến ngẫu nhiên X : C → R được định nghĩa:

X (u) = thu nhập của cư dân u.


Phương pháp mẫu
Bài toán đặt ra trong thống kê là: xác định luật phân phối xác suất
của X . Đối với các đặc điểm định lượng, còn có thể xác định các số
đặc trưng của X .
Ví dụ. Với các tổng thể trong ví dụ trước, có thể đặt ra các câu hỏi:
1 Xác định tỉ lệ sản phẩm đạt tiêu chuẩn của lô hàng? Cần tính
P(X = 1).
2 Xác định thu nhập trung bình và độ lệch chuẩn về thu nhập? Cần
tính E(X ) và σ(X ).

Chúng ta cũng có thể nghiên cứu cùng lúc nhiều đặc điểm của một
hoặc nhiều tổng thể để xác định mối quan hệ giữa các biến ngẫu
nhiên tương ứng với các đặc điểm đó.
Ví dụ.
1 Tỉ lệ người giàu (có tài sản trên 1 triệu USD) ở Mỹ có cao hơn
Việt Nam không? (hai đặc điểm cùng loại của hai tổng thể khác
nhau).
2 Trình độ học vấn có ảnh hưởng đến thu nhập của một người ở
thành phố HCM không? (hai đặc điểm của cùng một tổng thể).
Phương pháp mẫu

Nếu có được dữ liệu về toàn bộ tổng thể thì các câu hỏi trên sẽ được
trả lời một cách chính xác.

Trên thực tế, việc thu thập dữ liệu về toàn bộ tổng thể gặp nhiều khó
khăn do:
• Số đơn vị của tổng thể lớn đòi hỏi nhiều chi phí và thời gian điều
tra.
• Trong nhiều trường hợp không thể biết chính xác tất cả các đơn
vị của tổng thể dù có cố gắng điều tra toàn bộ tổng thể.
Phương pháp mẫu

Phương pháp mẫu là phương pháp chọn ra n đơn vị đại diện cho tổng
thể bằng kỹ thuật chọn mẫu xác suất. Các đơn vị được chọn tạo
thành một mẫu kích thước n. Thống kê suy diễn sử dụng các công cụ
xác suất nghiên cứu mẫu này và dựa vào đó cho kết luận về tổng thể
với một độ tin cậy hoặc mức ý nghĩa nào đó.

Gọi Xi là giá trị của đơn vị thứ i trong mẫu (1, . . . , n), thì các Xi độc
lập và có cùng luật phân phối xác suất với đặc trưng X của tổng thể.
• Tập hợp các biến ngẫu nhiên X1 , X2 , . . . , Xn được gọi là một mẫu
tổng quát.
• Khi thực hiện lấy mẫu thực tế, ta được
X1 = x1 , X2 = x2 , . . . , Xn = xn . Tập hợp các số thực x1 , x2 , . . . , xn
được gọi là một mẫu cụ thể.
• Cho T là một hàm n biến, biến ngẫu nhiên T = T (X1 , X2 , ..., Xn )
được gọi là một thống kê.
Phương pháp mẫu

Ví dụ. Gọi X là chiều cao của một cư dân bất kì trong thành phố.
• Gọi X1 , X2 , X3 , X4 lần lượt là chiều cao của 4 người bất kỳ trong
thành phố thì X1 , X2 , X3 , X4 là các biến ngẫu nhiên độc lập và có
cùng phân phối với X . Tập hợp {X1 , X2 , X3 , X4 } là một mẫu tổng
quát.
• Tiến hành lấy mẫu thực tế bằng phương pháp chọn mẫu xác
suất được chiều cao của 4 người lần lượt là 1,6m, 1,7m, 1,57m,
1,64m. Tập hợp {1, 6; 1, 7; 1, 57; 1, 64} là một mẫu cụ thể.
• Lập công thức tính chiều cao trung bình của 4 người trong mẫu:

X1 + X2 + X3 + X4
T = .
4

Biến ngẫu nhiên T là một ví dụ về thống kê.


Phương pháp mẫu
Xét một mẫu cụ thể kích thước n, trong đó giá trị xi xuất hiện fi lần với
x1 < x2 < . . . < xk và f1 + f2 + · · · + fk = n. Khi đó
• fi : tần số của xi ,
• di = nfi : tần suất của xi .
Bảng phân phối tần số thực nghiệm:

x x1 x2 ... xk
f f1 f2 ... fk

Bảng phân phối tần suất thực nghiệm:

x x1 x2 ... xk
d d1 d2 ... dk

Ví dụ. Khảo sát số nhân khẩu trong 10 hộ gia đình được kết quả: 2,
4, 6, 1, 6, 4, 5, 2, 6, 5 (nhân khẩu). Lập bảng phân phối tần số thực
nghiệm của mẫu 10 hộ gia đình trên.
Các đặc trưng mẫu
Để có thể nghiên cứu về các tham số của tổng thể bao gồm:
• Tỉ lệ tổng thể p (là tỉ lệ số đơn vị XA có tính chất A trong tổng thể,
áp dụng với cả đặc điểm định tính và định lượng),
• Trung bình tổng thể µ (áp dụng với đặc điểm định lượng),
• Phương sai tổng thể σ 2 (áp dụng với đặc điểm định lượng),
chúng ta cần nghiên cứu các thống kê đặc biệt sau:

Các đặc trưng mẫu tổng quát


X1 + X2 + · · · + Xn
Trung bình Xn =
n
XA
Tỉ lệ Fn = n
n 2
1
Ŝn2 =
P
Phương sai chưa hiệu chỉnh n Xi − X n
i=1
n 2
1
Sn2
P
Phương sai (hiệu chỉnh) = n−1 Xi − X n
p i=1
Độ lệch chuẩn (hiệu chỉnh) Sn = Sn2
Các đặc trưng mẫu

Các đặc trưng mẫu cụ thể


x1 + x2 + · · · + xn
Trung bình xn =
n
xA
Tỉ lệ fn = n
n
1 2
ŝn2 =
P
Phương sai chưa hiệu chỉnh n (xi − x n )
i=1
n
1 2
sn2
P
Phương sai (hiệu chỉnh) = n−1 (xi − x n )
i=1
p
Độ lệch chuẩn (hiệu chỉnh) sn = sn2

Để ngắn gọn, có thể bỏ chỉ số dưới n trong các ký hiệu đặc trưng
mẫu. Ví dụ: X , x, F , f , S 2 , s2 .
Các đặc trưng mẫu

Kỳ vọng và phương sai của các đặc trưng mẫu


Cho tổng thể X có E(X ) = µ, V (X ) = σ 2 và tỉ lệ p. Kì vọng và
phương sai của các đặc trưng mẫu:
• Với trung bình mẫu: E(X ) = µ, V (X ) = σ2
n .
p(1−p)
• Với tỉ lệ mẫu: E(F ) = p, V (F ) = n .
• Với phương sai mẫu chưa hiệu chỉnh: E(Ŝ 2 ) = n−1 2
n σ .
• Với phương sai mẫu (hiệu chỉnh): E(S 2 ) = σ 2 .
Các đặc trưng mẫu

Một số luật phân phối xác suất của các đặc trưng mẫu
Trường hợp tổng thể X có phân phối chuẩn: X ∼ N(µ, σ 2 )
√ 2
• X −µ
σ n ∼ N(0, 1) ⇒ X ∼ N(µ, σn ).

• X −µ
S n ∼ t(n − 1).

(F −p) n
• √ ∼ N(0, 1).
F (1−F )
(n−1)S 2
• σ2
∼ χ2 (n − 1).
Trường hợp không biết phân phối của X nhưng kích thước mẫu đủ
lớn (n ≥ 30): áp dụng định lý giới hạn trung tâm
√ 2
• X −µ
σ n ' N(0, 1) ⇒ X ' N(µ, σn ).

• X −µ
S n ' N(0, 1).

(F −p) n
• √ ' N(0, 1).
F (1−F )
Các đặc trưng mẫu
Tính các đặc trưng mẫu cụ thể
Sử dụng công thức định nghĩa hoặc máy tính bỏ túi.

Ví dụ 1. Cho bảng phân phối thực nghiệm:

xi -2 1 2 3 4 5
ni 2 1 2 2 2 1

Tính trung bình và độ lệch chuẩn (hiệu chỉnh) của mẫu.

Ví dụ 2. Lượng xăng hao phí của một ôtô đi từ địa điểm A đến địa
điểm B sau 30 lần chạy được kết quả cho trong bảng:

Lít 9,6–9,8 9,8–10 10–10,2 10,2–10,4 10,4–10,8


Số lần 3 5 10 8 4

1 Tỉnh tỉ lệ số lần có lượng xăng hao phí từ 10 lít trở lên.


2 Tính trung bình và độ lệch chuẩn (hiệu chỉnh) về lượng xăng hao
phí.
Bài toán ước lượng tham số

Bài toán: Tìm ước lượng cho tham số θ của một tổng thể. Trong đó θ

1 µ (trung bình tổng thể),
2 p (tỉ lệ tổng thể),
3 σ 2 (phương sai tổng thể).
Ta có thể dùng một con số nào đó để ước lượng θ. Ước lượng như
vậy được gọi là ước lượng điểm.

Ngoài ra ta có thể chỉ ra một khoảng (θ1 , θ2 ) có thể chứa θ. Ước


lượng như vậy được gọi là ước lượng khoảng.

Ví dụ. Cho một mẫu khảo sát gồm 10000 người của một quốc gia
được chọn ngẫu nhiên có độ tuổi trung bình là 27 và độ lệch chuẩn là
3 tuổi. Ước lượng tuổi trung bình của toàn bộ dân số thuộc quốc gia
đó.
Bài toán ước lượng điểm

Bài toán ước lượng điểm


Tìm một thống kê θ̂(X1 , X2 , ..., Xn ) để ước lượng tham số θ chưa biết.
Khi đó θ̂ được gọi là hàm ước lượng cho θ.
Từ mẫu cụ thể (x1 , ..., xn ), ta tính được giá trị θ̂∗ = θ̂(x1 , ..., xn ). Khi đó
θ̂∗ được gọi là ước lượng điểm của θ.

Có vô số cách chọn thống kê θ̂ để ước lượng cho tham số θ cho


trước. Vì vậy người ta đưa ra các tiêu chuẩn để đánh giá chất lượng
của ước lượng. Từ đó tìm được hàm ước lượng tốt.
Các tiêu chuẩn ước lượng

Ước lượng không chệch


Thống kê θ̂ được gọi là ước lượng không chệch của θ nếu E θ̂ = θ.

Ý nghĩa
Ước lượng không chệch là ước lượng có sai số trung bình bằng 0 (vì
E θ̂ − θ = 0).
(Sai số trung bình bằng 0 được gọi là sai số ngẫu nhiên, ngược lại là
sai số hệ thống).
Ví dụ. Tỉ lệ mẫu F , trung bình mẫu X , phương sai mẫu (hiệu chỉnh)
S 2 tương ứng là ước lượng không chệch của p, µ, σ 2 . Còn Ŝ 2 là ước
lượng chệch của σ 2 .
Các tiêu chuẩn ước lượng

Ước lượng vững


P
Thống kê θ̂ được gọi là ước lượng vững của θ nếu θ̂(X1 , ..., Xn ) −→ θ.
Do đó với n đủ lớn thì với xác suất gần 1 ta có: θ̂ ' θ.
Ví dụ. F , X , S 2 , Ŝ 2 tương ứng là các ước lượng vững cho p, µ, σ 2 , σ 2 .

Ước lượng hiệu quả


Thống kê θ̂ được gọi là ước lượng hiệu quả của θ nếu nó là ước lượng
không chệch và có phương sai bé nhất trong các ước lượng không
chệch của θ.
Ví dụ. Nếu X ∼ N(µ, σ 2 ) thì X là ước lượng hiệu quả của µ.
Nếu X ∼ B(1, p) thì F là ước lượng hiệu quả của p.
Các phương pháp ước lượng điểm

Sử dụng các đặc trưng mẫu


• F , X , S 2 tương ứng là ước lượng không chệch, vững cho p, µ, σ 2 .
• Ŝ 2 là ước lượng chệch, vững cho σ 2 .
• Nếu X ∼ N(µ, σ 2 ) thì X là ước lượng hiệu quả cho µ.
Nếu X ∼ B(1, p) thì F là ước lượng hiệu quả cho p.

Kết luận
Chúng ta sử dụng f , x, s2 lần lượt làm các ước lượng điểm cho
p, µ, σ 2 .

Hạn chế của phương pháp ước lượng điểm


• Khi kích thước mẫu nhỏ thì phương pháp ước lượng điểm có thể
cho sai số lớn.
• Không đánh giá được độ chính xác và độ tin cậy của ước lượng.
Bài toán ước lượng khoảng

Cho xác suất 1 − α, từ mẫu tổng quát (X1 , ..., Xn ) tìm các thống kê
θ̂1 , θ̂2 sao cho
P(θ̂1 < θ < θ̂2 ) = 1 − α.
Với mẫu cụ thể (x1 , x2 , ..., xn ), ta có θ̂1 nhận giá trị θ1 và θ̂2 nhận giá trị
θ2 . Khi đó (θ1 , θ2 ) được gọi là ước lượng khoảng của θ trong đó
• 1 − α: độ tin cậy của ước lượng,
• (θ1 , θ2 ): khoảng tin cậy của ước lượng,
• ε = θ2 −θ2 : độ chính xác (sai số) của ước lượng.
1

Bài toán ước lượng khoảng với độ tin cậy 1 − α còn được gọi là bài
toán tìm khoảng tin cậy 1 − α.
Bài toán ước lượng khoảng
Giá trị tới hạn
Cho X là một biến ngẫu nhiên liên tục có hàm mật độ f và α ∈ (0, 1).
Số thực qα được gọi là giá trị tới hạn mức α của X nếu
Z +∞
P(X > qα ) = α, nghĩa là f (x)dx = α.

Bài toán ước lượng khoảng
Xác định giá trị tới hạn mức α của các luật phân phối
Luật phân phối Ký hiệu Cách xác định
Chuẩn tắc N(0, 1) zα ϕ(zα ) = 0, 5 − α.
Tra bảng thống kê
Student t(n) t(n, α) Tra bảng thống kê
2 2
Chi bình phương χ (n) χ (n, α) Tra bảng thống kê
Fisher F (m, n) F (m, n, α) Tra bảng thống kê

Lưu ý:
• ϕ là hàm số tăng,
• ϕ là hàm số lẻ, nghĩa là ϕ(−x) = −ϕ(x),
• ϕ(x) ≈ 0, 5 nếu x ≥ 4,
• ϕ(x) ≈ −0, 5 nếu x ≤ −4,
• Nếu φ là hàm phân phối của phân phối chuẩn tắc thì
φ(x) = ϕ(x) + 0, 5.
Ước lượng tỉ lệ

Ước lượng tỉ lệ 1 tổng thể


Gọi tỉ lệ phần tử có tính chất A của một tổng thể là p. Với độ tin cậy
1 − α cho trước, tìm ước lượng khoảng cho p.

(F −p) n
Cơ sở lý thuyết: √ ' N(0, 1) với n đủ lớn.
F (1−F )
Phương pháp: Lấy mẫu ngẫu nhiên với kích thước mẫu tối thiểu là
30 phần tử.
Công thức khoảng tin cậy (đối xứng):
r
f (1 − f )
(f − ε, f + ε), với ε = z α2 .
n
Ước lượng tỉ lệ

Ví dụ 1. Để đánh giá tỉ lệ phế phẩm của một dây chuyền sản xuất,
người ta khảo sát ngẫu nhiên 500 sản phẩm thì thấy có 30 phế phẩm.
Với độ tin cậy 95%, hãy ước lượng tỉ lệ phế phẩm của dây chuyền sản
xuất.

Giải.
30
Các đặc trưng mẫu: n = 500, f = 500 = 0, 06.
Độ tin cậy: 1 − α = 0, 95 ⇒ ϕ(z α2 ) = 1−α 2 = 0, 475 ⇒ z 2 = 1, 96.
α
q
f (1−f )
Độ chính xác (sai số): ε = z α2 n = 0, 0208.
Khoảng ước lượng: (f − ε, f + ε) = (0, 0392; 0, 0808).
Ước lượng tỉ lệ
Ví dụ 2. Giám đốc một ngân hàng muốn ước lượng tỉ lệ khách hàng
gửi tiền tại ngân hàng được chi trả theo tháng. Một mẫu ngẫu nhiên
100 khách hàng có 30 người được chi trả theo tháng. Với độ tin cậy
90%, hãy ước lượng số khách hàng được chi trả theo tháng, cho biết
ngân hàng đó có 2000 khách hàng.

Giải.
30
Các đặc trưng mẫu: n = 100, f = 100 = 0, 3.
Độ tin cậy: 1 − α = 0, 9 ⇒ ϕ(z α2 ) = 1−α 2 = 0, 45 ⇒ z 2 = 1, 65.
α
q
f (1−f )
Độ chính xác (sai số): ε = z α2 n = 0, 0756.
Khoảng ước lượng cho tỉ lệ: p ∈ (f − ε, f + ε) = (0, 2244; 0, 3756).
Gọi NA là số khách hàng được chi trả theo tháng thì p = NNA = 2000 NA
.
Ta có
NA
0, 2244 < < 0, 3756 ⇔ 448, 8 < NA < 751, 2.
2000

Với độ tin cậy 90%, số khách hàng nằm trong khoảng 449 đến 751.
Ước lượng tỉ lệ
Bài tập 1. Trước ngày bầu cử tổng thống, người ta phỏng vấn ngẫu
nhiên 2000 cử tri thì thấy có 1200 người sẽ bầu cho ứng viên A. Với
độ tin cậy 90%, hãy ước lượng tỉ lệ cử tri sẽ bầu cho ứng viên A.
Bài tập 2. Khảo sát ngẫu nhiên thu nhập (triệu đồng/năm) của một số
hộ dân ở một địa phương thì được thông tin sau:

Thu nhập Số hộ Những hộ có thu nhập từ 200


triệu đồng/năm trở lên được gọi là
Dưới 50 5
có thu nhập cao. Với độ tin cậy
50–100 16 95%, hãy ước lượng tỉ lệ hộ có
100–200 50 thu nhập cao ở địa phương đó.
200–500 25
Từ 500 trở lên 4

Bài tập 3. Để đánh giá trữ lượng cá trong hồ người ta đánh bắt 2000
con cá, đánh dấu rồi thả trở lại hồ. Sau đó bắt lại 400 con thì thấy có
80 con đã được đánh dấu. Với độ tin cậy 95%, hãy ước lượng trữ
lượng cá có trong hồ.
Ước lượng tỉ lệ

Xác định các chỉ tiêu của ước lượng tỉ lệ


Trong bài toán tìm khoảng tin cậy, ta có các bài toán tìm các chỉ tiêu
của ước lượng như sau:
Bài toán 1. Cho 1 − α và n, tìm độ chính xác ε.
r
f (1 − f )
ε = z2α .
n

Bài toán 2. Cho ε và n, tìm độ tin cậy 1 − α.


Ta có r
n
z α2 = ε
f (1 − f )
 r 
n
⇒ 1 − α = 2ϕ(z α2 ) = 2ϕ ε .
f (1 − f )
Ước lượng tỉ lệ

Bài toán 3. Cho 1 − α và ε0 (sai số tối đa), tìm kích thước mẫu n.
Ta có r
f (1 − f )
z α2 = ε ≤ ε0
n
p
√ z α2 f (1 − f )
⇔ n≥
ε0

z 2α f (1 − f )
⇔n≥ 2
.
ε20
Ước lượng tỉ lệ
Ví dụ. Giám đốc một ngân hàng muốn ước lượng tỉ lệ khách hàng gửi
tiền tại ngân hàng được chi trả theo tháng. Một mẫu ngẫu nhiên 100
khách hàng có 30 người được chi trả theo tháng.
1 Sử dụng mẫu trên, nếu muốn ước lượng tỉ lệ khách hàng được
chi trả theo tháng với độ chính xác 0,08 thì độ tin cậy đạt được là
bao nhiêu?
2 Nếu muốn ước lượng tỉ lệ khách hàng được chi trả theo tháng với
độ tin cậy 95% và sai số tối đa 5% thì cần kích thước mẫu khảo
sát là bao nhiêu?
Giải.
30
1 n = 100, f = 100 = 0, 3, ε = 0, 08.
Độ tin cậy  q 
n
1 − α = 2ϕ ε f (1−f ) = 2ϕ(1, 75) = 2 · 0, 4599 = 91, 98%.
2 1 − α = 0, 95 ⇒ z α2 = 1, 96; ε ≤ ε0 = 0, 05.
Kích thước mẫu
z 2α f (1 − f )
n≥ 2
= 322, 7 ⇒ n ≥ 323.
ε20
Ước lượng tỉ lệ

Bài tập. Một nông dân muốn ước lượng tỉ lệ nảy mầm của một giống
lúa mới. Anh ấy lấy ngẫu nhiên 1000 hạt lúa loại này đem gieo thì
thấy có 640 hạt nảy mầm.
1 Sử dụng mẫu trên, nếu muốn ước lượng đạt độ chính xác (sai
số) 0,02 thì độ tin cậy đạt được là bao nhiêu?
2 Nếu muốn sai số của ước lượng không vượt quá 0,02 và độ tin
cậy là 95% thì người nông dân cần gieo thêm tối thiểu bao nhiêu
hạt?
Đáp số: 1) 81,32%. 2) 1213.
Ước lượng tỉ lệ
Ước lượng tỉ lệ 2 tổng thể (hiệu 2 tỉ lệ)
Gọi tỉ lệ phần tử có tính chất A của hai tổng thể lần lượt là p1 và p2 .
Với độ tin cậy 1 − α cho trước, tìm ước lượng khoảng cho p1 − p2 .
Phương pháp. Lấy mẫu ngẫu nhiên từ 2 tổng thể với kích thước tối
thiểu 30 mỗi mẫu. Gọi n1 , f1 lần lượt là kích thước mẫu và tỉ lệ mẫu từ
tổng thể thứ nhất; n2 , f2 lần lượt là kích thước mẫu và tỉ lệ mẫu từ tổng
thể thứ hai.
Công thức khoảng tin cậy:
s
f1 (1 − f1 ) f2 (1 − f2 )
(f1 − f2 − ε, f1 − f2 + ε), với ε = z α2 + .
n1 n2

Ý nghĩa. Với độ tin cậy 1 − α,


• Nếu 0 < f1 − f2 − ε thì p1 > p2 .
• Nếu f1 − f2 + ε < 0 thì p1 < p2 .
• Nếu f1 − f2 − ε ≤ 0 ≤ f1 − f2 + ε thì p1 = p2 .
Có thể xác định các chỉ tiêu của ước lượng tương tự như với trường
hợp 1 mẫu.
Ước lượng tỉ lệ
Ví dụ. Điều tra ngẫu nhiên 1000 người ở thành phố A thì thấy có 75
người thất nghiệp. Điều tra ngẫu nhiên 500 người ở thành phố B thì
thấy có 36 người thất nghiệp. Hãy ước lượng khoảng tin cậy 99% cho
sự khác biệt về tỉ lệ thất nghiệp giữa thành phố A và thành phố B.

Giải.
Các đặc trưng mẫu: n1 = 1000, f1 = 0, 075, n2 = 500, f2 = 0, 072.
Độ tin cậy: 1 − α = 0, 99 ⇒ ϕ(z α2 ) = 1−α 2 = 0, 495 ⇒ z 2 = 2, 58.
α
q
f1 (1−f1 ) f2 (1−f2 )
Độ chính xác (sai số): ε = z α2 n1 + n2 = 0, 0368.
Khoảng ước lượng 99% cho sự khác biệt về tỉ lệ thất nghiệp giữa
thành phố A và thành phố B:

(f1 − f2 − ε, f1 − f2 + ε) = (−0, 0338; 0, 0398).

Với độ tin cậy 99%, tỉ lệ thất nghiệp giữa thành phố A và thành phố B
có thể coi là bằng nhau.
Ước lượng tỉ lệ

Bài tập. Một doanh nghiệp dự định ra mắt sản phẩm của mình ở hai
thị trường khác nhau. Bán thử sản phẩm cho 100 khách hàng tiềm
năng của thị trường thứ nhất thì có 50 người mua. Còn với thị trường
thứ hai, khi bán thử sản phẩm cho 50 khách hàng tiềm năng thì có 20
người mua.
1 Với độ tin cậy 95% hãy ước lượng mức độ chênh lệch về thị phần
mà doanh nghiệp có thể đạt được tại hai thị trường đó.
2 Sử dụng 2 mẫu trên, nếu muốn ước lượng mức độ chênh lệch về
thị phần đạt độ chính xác 10% thì độ tin cậy đạt được là bao
nhiêu?
3 Sử dụng mẫu 1, nếu muốn ước lượng mức độ chênh lệch về thị
phần đạt độ tin cậy 95% và sai số tối đa 10% thì kích thước mẫu
2 cần phải điều tra là bao nhiêu?
Đáp số: 1) (-0,0675; 0,2675). 2) 75,8%. 3) 2329.
Ước lượng trung bình
Ước lượng trung bình 1 tổng thể
Gọi µ là trung bình của một tổng thể X (µ = EX ). Với độ tin cậy 1 − α
cho trước, tìm ước lượng khoảng cho µ.
Công thức khoảng tin cậy (đối xứng):

(x − ε, x + ε),

với ε được cho trong bảng sau

n ≥ 30 n < 30 và
Trường hợp
X có phân phối chuẩn
chưa biết σ 2 z α2 √s t(n − 1, α2 ) √sn
n
đã biết σ 2 z α2 √σn

Lưu ý: Phân phối t(n) hội tụ đến phân phối N(0, 1) khi n → ∞. Do đó

lim t(n, α) = zα .
n→∞
Ước lượng trung bình
Ví dụ 1. Chủ một kho sơn muốn đánh giá lượng sơn chứa trong các
thùng 1 lít được sản xuất từ một dây chuyền công nghệ quốc gia.
Khảo sát một mẫu 50 thùng được lượng sơn trung bình là 0,97 lít và
độ lệch chuẩn là 0,08 lít.
a. Với độ tin cậy 95% hãy ước lượng lượng sơn trung bình chứa
trong một thùng của dây chuyền sản xuất.
b. Cũng câu hỏi trên trong trường hợp cho biết độ lệch chuẩn của
dây chuyền sản xuất là 0,05 lít.

Giải.
Các đặc trưng mẫu: n = 50, x = 0, 97, s = 0, 08.
Độ tin cậy: 1 − α = 0, 95 ⇒ ϕ(z α2 ) = 1−α
2 = 0, 475 ⇒ z 2 = 1, 96.
α

a. Độ chính xác (sai số): ε = z α2 √sn = 0, 0222.


Khoảng ước lượng: (x − ε, x + ε) = (0, 9478; 0, 9922).
b. Với σ = 0, 05, độ chính xác (sai số): ε = z α2 √σn = 0, 0139.
Khoảng ước lượng: (x − ε, x + ε) = (0, 9561; 0, 9839).
Ước lượng trung bình
Ví dụ 2. Một lô hàng gồm các linh kiện điện tử cùng loại có tổng khối
lượng 1 tấn. Kiểm tra ngẫu nhiên 20 linh kiện từ lô hàng thì thấy khối
lượng trung bình của các linh kiện này là 10,1 gam và độ lệch chuẩn
là 1 gam. Với độ tin cậy 95% hãy ước lượng số lượng linh kiện có
trong lô hàng, cho biết khối lượng của linh kiện có phân phối chuẩn.

Giải.
Các đặc trưng mẫu: n = 20, x = 10, 1, s = 1.
Độ tin cậy: 1 − α = 0, 95 ⇒ t(n − 1, α2 ) = t(19; 0, 025) = 2, 093.
Độ chính xác (sai số): ε = t(n − 1, α2 ) √sn = 0, 468.
Khoảng ước lượng cho khối lượng trung bình các linh kiện:
µ ∈ (x − ε, x + ε) = (9, 632; 10, 568).
6
Gọi N là số lượng linh liện trong lô hàng thì µ = 10
N .
Với độ tin cậy 95%,
106
9, 632 < < 10, 568 ⇔ 94625, 3 < N < 103820, 6.
N
Với độ tin cậy 95%, số linh kiện nằm trong khoảng từ 94626 đến
103820.
Ước lượng trung bình

Bài tập. Để ước lượng lợi nhuận của một tổng công ty có 380 cửa
hàng trên toàn quốc trong tháng 1, người ta chọn ngẫu nhiên 10% số
cửa hàng của tổng công ty, tiến hành điều tra doanh thu được kết quả
cho trong bảng

Doanh thu (triệu đồng) 20 40 60 80


Số cửa hàng 8 16 12 2

1 Với độ tin cậy 95%, hãy ước lượng doanh thu trung bình mỗi cửa
hàng của tổng công ty trong tháng 1.
2 Với độ tin cậy 95%, hãy ước lượng lợi nhuận của tổng công ty
trong tháng 1, cho biết lợi nhuận của tổng công ty bằng 25%
doanh thu.
Đáp số. 1) (38,8477; 49,5733). 2) (3690,5; 4709,5).
Ước lượng trung bình

Xác định các chỉ tiêu của ước lượng trung bình
Trong bài toán tìm khoảng tin cậy cho trường hợp n ≥ 30 và chưa biết
σ 2 , ta có các bài toán tìm các chỉ tiêu của ước lượng như sau:
Bài toán 1. Cho 1 − α và n, tìm độ chính xác ε.
s
ε = z α2 √ .
n

Bài toán 2. Cho ε và n, tìm độ tin cậy 1 − α.


Ta có √
ε n
z2 =
α
s
 √ 
ε n
⇒ 1 − α = 2ϕ(z α2 ) = 2ϕ .
s
Ước lượng trung bình

Bài toán 3. Cho 1 − α và ε ≤ ε0 , tìm kích thước mẫu n.


Ta có
s
z α2 √ = ε ≤ ε0
n
√ z α2 s
n≥
ε0
2
z α2 s

n≥ .
ε0
Các bài toán chỉ tiêu trong trường hợp đã biết σ 2 cũng được thiết lập
và giải tương tự (thay s bằng σ).
Ước lượng trung bình
Ví dụ. Chủ một kho sơn muốn đánh giá lượng sơn chứa trong các
thùng 1 lít được sản xuất từ một dây chuyền công nghệ quốc gia.
Khảo sát một mẫu 50 thùng được lượng sơn trung bình là 0,97 lít và
độ lệch chuẩn của lượng sơn là 0,08 lít.
1 Nếu sử dụng mẫu này và muốn ước lượng lượng sơn trung bình
trong thùng với độ chính xác 0,02 lít thì đảm bảo độ tin cậy là
bao nhiêu?
2 Nếu chủ kho muốn ước lượng lượng sơn trung bình trong thùng
đảm bảo độ tin cậy 95% và độ chính xác (sai số không quá) 0,02
lít thì cần khảo sát thêm bao nhiêu thùng nữa?
Giải.
1 n = 50, x = 0, 97, s =0, 08, ε = 0, 02.
√ 
ε n
Độ tin cậy 1 − α = 2ϕ s = 2ϕ(1, 77) = 2 · 0, 4616 = 92, 32%.
2 1 − α = 0, 95 ⇒ z = 1, 96; ε ≤ ε0 = 0, 02.
α
2

Kích thước mẫu


z α2 s 2
 
n≥ = 61, 5 ⇒ n ≥ 62.
ε0
Cần khảo sát thêm ít nhất 12 thùng nữa.
Ước lượng trung bình

Bài tập. Giám đốc chi nhánh của một ngân hàng muốn ước lượng
lượng tiền gửi trung bình của mỗi khách hàng tại ngân hàng. Chọn
ngẫu nhiên 50 khách hàng gửi tiền tại ngân hàng, tính được lượng
tiền gửi trung bình của một người là 475 triệu đồng và độ lệch tiêu
chuẩn là 12 triệu đồng.
1 Nếu sử dụng mẫu trên để ước lượng lượng tiền gửi trung bình
của một khách hàng tại ngân hàng đạt độ chính xác tới 2,5 triệu
đồng thì độ tin cậy đạt được là bao nhiêu?
2 Nếu muốn ước lượng lượng tiền gửi trung bình của một khách
hàng tại ngân hàng với độ tin cậy là 99% và độ chính xác đến 3
triệu đồng thì cần điều tra thêm bao nhiêu khách hàng nữa?
Đáp số: 1) 85,84%, 2) 57.
Ước lượng trung bình

Ước lượng trung bình 2 tổng thể (hiệu 2 trung bình)


Gọi µ1 và µ2 lần lượt là trung bình của tổng thể X1 và tổng thể X2
(µ1 = EX1 , µ2 = EX2 ). Với độ tin cậy 1 − α cho trước, tìm ước lượng
khoảng cho µ1 − µ2 .

Phân biệt 2 mẫu đại diện là độc lập hay phụ thuộc:
• Phụ thuộc: mẫu được chọn theo cách một quan sát ở mẫu 1
tương xứng với 1 quan sát ở mẫu 2. Mục đích : kiểm tra sự tác
động của các nhân tố bên ngoài.
Ví dụ: doanh số bán hàng của 10 cửa hàng thuộc một doanh
nghiệp trước và sau khi thực hiện khuyến mãi.
• Độc lập: 2 mẫu được chọn từ 2 tổng thể độc lập, sao cho một
quan sát được chọn vào mẫu 1 không ảnh hưởng xác suất chọn
được một quan sát khác vào mẫu 2.
Ví dụ: năng suất cây trồng khi dùng 2 loại phân bón khác nhau.
Ước lượng trung bình

Trường hợp 2 mẫu là phụ thuộc: công thức khoảng tin cậy

(d − ε, d + ε),

với
n
P
di
i=1
di = x1i − x2i , d= ,
n
v
u n
uP
u (di − d)2
t i=1 α sd
sd = , ε = t(n − 1, )√ .
n−1 2 n
Điều kiện vận dụng: X1 − X2 có phân phối chuẩn.
Ước lượng trung bình
Trường hợp 2 mẫu là độc lập: công thức khoảng tin cậy
(x 1 − x 2 − ε, x 1 − x 2 + ε),
với ε được cho trong bảng sau

n1 < 30 và X1 có phân phối chuẩn


TH n1 , n2 ≥ 30 hoặc n2 < 30 và X2 có phân phối chuẩn
biết σ12 = σ22 σ12 có thể khác σ22
q q q 2
s12 s22 s s2
chưa biết z α2 n1 + n2 t(k, α2 )s n11 + 1
n2 , t(k, α2 ) n11 + n22 ,
σ12 , σ22 k = n1 + n2 − 2,  
2
s2 s2
q 
1 2
(n1 −1)s12 +(n2 −1)s22 n1 + n2
s= n1 +n2 −2

k = 2

2 
 s 2
 1

s
 2
2 
n1 n2
n1 −1 + n2 −1

q
σ12 σ22
đã biết z α2 n1 + n2
σ12 , σ22
Ước lượng trung bình

Ví dụ 1. Công ty cấp nước áp Hộ gia đình Trước Sau


dụng các biện pháp tiết kiệm
1 7 7
nước. Lượng nước sử dụng hàng
tháng (m3 ) ở 10 hộ gia đình trước 2 20 16
và sau khi áp dụng biện pháp tiết 3 40 32
kiệm nước được cho trong bảng
4 15 16
bên cạnh. Giả sử lượng nước tiêu
thụ chênh lệch có phân phối 5 33 30
chuẩn, hãy ước lượng sự khác 6 4 5
biệt giữa lượng nước tiêu thụ
7 25 22
trung bình trước và sau khi áp
dụng biện pháp tiết kiệm với độ 8 16 12
tin cậy 95%. 9 14 10
10 22 18
Ước lượng trung bình
Giải. Hai mẫu là phụ thuộc.
n
Hộ Trước Sau di
P
di
i=1
d= n = 2, 8,
GĐ (x1i ) (x2i ) (x1i − x2i ) s
n
P
(di −d)2
1 7 7 0
sd = i=1 n−1 = 2, 7809,
2 20 16 4
t(n − 1, α2 ) = t(9; 0, 025) =
3 40 32 8 2, 262.
4 15 16 -1 ε = t(n − 1, α2 ) √sdn = 1, 9892.
5 33 30 3 Khoảng tin cậy 95% cho chênh
lệch giữa lượng nước tiêu thụ
6 4 5 -1 trung bình trước và sau khi áp
7 25 22 3 dụng biện pháp tiết kiệm
8 16 12 4
(d − ε, d + ε) = (0, 8108; 4, 7892).
9 14 10 4
10 22 18 4 Vậy có thể nói biện pháp tiết kiệm
nước đã làm giảm lượng nước
tiêu thụ.
Ước lượng trung bình
Ví dụ 2. Từ một chuồng nuôi lợn, chọn cân ngẫu nhiên 4 con lợn thu
được khối lượng là 64, 66, 89 và 77 (kg). Từ một chuồng khác lấy ra 3
con đem cân thu được khối lượng là 56, 71 và 73 (kg). Với độ tin cậy
95%, hãy ước lượng sự khác biệt về khối lượng trung bình của lợn
trong hai chuồng đó, giả thiết khối lượng của lợn có phân phối chuẩn,
cả hai chuồng cùng nuôi một giống lợn và được chăm sóc như nhau.

Giải. Các đặc trưng mẫu:


n1 = 4, x 1 = 74, s12 = 132, 6667;
n2 = 3, x 2 = 66, 67, s22 = 86, 3333;
σ12 = σ22 (cùng một giống lợn
q và được chăm sóc như nhau);
(n −1)s2 +(n −1)s2
1 2
k = n1 + n2 − 2 = 5, s = 1
n1 +n2 −2
2
= 10, 6833.
α
Độ tin cậy: 1 − α = 0, 95 ⇒ t(k, 2 ) = t(5; 0, 025) = 2, 5706.
q
Độ chính xác (sai số): ε = t(k, α2 )s n11 + n12 = 20, 9748.
Khoảng ước lượng 95% cho khác biệt về khối lượng trung bình của
lợn
(x 1 − x 2 − ε, x 1 − x 2 + ε) = (−13, 64; 28, 3).
Với độ tin cậy 95%, không sự khác biệt về khối lượng trung bình.
Ước lượng trung bình
Ví dụ 3. Câu hỏi tương tự như ví dụ 3 nhưng không cho biết cả hai
chuồng cùng nuôi một giống lợn hay không và có được chăm sóc như
nhau hay không.

Giải. Các đặc trưng mẫu:


n1 = 4, x 1 = 74, s12 = 132, 6667;
n2 = 3, x 2 = 66, 67, s22 = 86, 3333;
(không biếtσ12 có bằng σ22hay không).
2
s2 s2

1 2
 n1 + n2 
Ta có: k =   2
  s12   s22 
 2  = [4, 9146] = 4.


n1 n2
n1 −1 + n2 −1

Độ tin cậy: 1 − α = 0, 95 ⇒ t(k, α2 ) = t(4; 0, 025) = 2, 7764.


q 2
s s2
Độ chính xác (sai số): ε = t(k, α2 ) n11 + n22 = 21, 85.
Khoảng ước lượng 95% cho khác biệt về khối lượng trung bình của
lợn
(x 1 − x 2 − ε, x 1 − x 2 + ε) = (−14, 52; 29, 18).
Với độ tin cậy 95%, không sự khác biệt về khối lượng trung bình.
Ước lượng trung bình
Bài tập 1. Người ta muốn so 8 sinh viên trước và sau khi tham
sánh chất lượng đào tạo ở hai cơ gia một lớp ôn luyện được cho
sở căn cứ trên điểm trung bình trong bảng bên dưới. Với độ tin
trong kì thi quốc gia. Một mẫu cậy 95%, hãy ước lượng chênh
ngẫu nhiên 100 thí sinh được đào lệch điểm số ở 2 lần thi, biết rằng
tạo tại cơ sở A có điểm trung bình nó có phân phối chuẩn.
9,4 và độ lệch chuẩn 0,8. Một Sinh viên Trước Sau
mẫu 80 thí sinh được đào tạo tại
1 7 6
cơ sở B có điểm trung bình 9 với
độ lệch chuẩn 1. Với độ tin cậy 2 4 6
95%, hãy ước lượng sự khác biệt 3 5 7
về điểm trung bình của các thí
4 8 6
sinh ở cơ sở A và cơ sở B. Sử
dụng mẫu này, nếu muốn ước 5 6 7
lượng đạt sai số 0,1 điểm thì độ 6 4 5
tin cậy đạt được là bao nhiêu?
7 3 6
Bài tập 2. Điểm thi tiếng Anh của 8 9 10
Ước lượng phương sai

Ước lượng phương sai 1 tổng thể


Cho tổng thể X ∼ N(µ, σ 2 ) với σ 2 chưa biết. Với độ tin cậy 1 − α cho
trước, tìm ước lượng khoảng cho σ 2 .

Công thức khoảng tin cậy:


• Trường hợp đã biết trung bình tổng thể µ:
!
P 2 P 2
ni (xi − µ) ni (xi − µ)
, 2 .
χ2 (n, α2 ) χ (n, 1 − α2 )

• Trường hợp chưa biết trung bình tổng thể µ:

(n − 1)s2 (n − 1)s2
 
, .
χ2 (n − 1, α2 ) χ2 (n − 1, 1 − α2 )
Ước lượng phương sai

Ví dụ. Cho biết khối lượng của một loại sản phẩm có phân phối
chuẩn. Người ta cân thử một mẫu 25 sản phẩm loại này thì nhận
được kết quả cho trong bảng

Khối lượng (g) 18–20 20-22 22-24


Số sản phẩm 5 18 2

Với độ tin cậy 95%,


1 Ước lượng phương sai của khối lượng sản phẩm.
2 Ước lượng độ lệch chuẩn của khối lượng sản phẩm, cho biết khối
lượng trung bình của các sản phẩm là 20 g.
Ước lượng phương sai
Giải. Các đặc trưng mẫu: n = 25, s2 = 1, 1067.
1 Độ tin cậy: 1 − α = 0, 95 ⇒ α = 0, 05.
χ2 (n − 1, α2 ) = χ2 (24; 0, 025) = 39, 3641.
χ2 (n − 1, 1 − α2 ) = χ2 (24; 0, 975) = 12, 4011.
Khoảng ước lượng cho phương sai:
(n − 1)s2 (n − 1)s2
 
, = (0, 6747; 2, 1418).
χ2 (24; 0, 025) χ2 (24; 0, 975)
2
ni (xi − µ) = 5·(19−20)2 +18·(21−20)2 +2·(23−20)2 = 41.
P
2
Độ tin cậy: 1 − α = 0, 95 ⇒ α = 0, 05.
χ2 (n, α2 ) = χ2 (25; 0, 025) = 40, 6465.
χ2 (n, 1 − α2 ) = χ2 (25; 0, 975) = 13, 1197.
Khoảng ước lượng cho phương sai:
!
P 2 P 2
ni (xi − µ) ni (xi − µ)
, = (1, 0087; 3, 1251).
χ2 (25; 0, 025) χ2 (25; 0, 975)

Khoảng
√ ước
√lượng cho độ lệch chuẩn:
( 1, 0087; 3, 1251) = (1; 1, 77).
Ước lượng phương sai

Ước lượng phương sai 2 tổng thể (tỉ số 2 phương sai)


Cho 2 tổng thể X1 ∼ N(µ1 , σ12 ) và X2 ∼ N(µ2 , σ22 ) với σ12 , σ22 chưa biết.
σ2
Với độ tin cậy 1 − α cho trước, tìm ước lượng khoảng cho 12 .
σ2
Công thức khoảng tin cậy:
 2
α s12

s1 α
F (n2 − 1, n1 − 1, 1 − ), 2 F (n2 − 1, n1 − 1, ) .
s22 2 s2 2

Chú ý:
1
F (m, n, α) = .
F (n, m, 1 − α)
Ước lượng phương sai
Ví dụ. Giá cổ phiếu của hai công ty A và B là các biến ngẫu nhiên có
phân phối chuẩn. Theo dõi giá cổ phiếu của công ty A trong 10 ngày
tìm được phương sai mẫu 0,51 và cổ phiếu của công ty B trong 15
ngày tìm được phương sai mẫu 0,2. Với độ tin cậy 90% hãy ước lượng
tỷ số của hai phương sai giá cổ phiếu của hai công ty đó.

Giải.
Các đặc trưng mẫu: n1 = 10, s12 = 0, 51, n2 = 15, s22 = 0, 2.
Các giá trị tới hạn:
F (n2 − 1, n1 − 1, α2 ) = F (14; 9; 0, 05) = 3, 03,
1 1
F (n2 − 1, n1 − 1, 1 − α2 ) = F (14; 9; 0, 95) = = =
F (9; 14; 0, 05) 2, 65
0, 38.
Khoảng tin cậy:
 2
s12

s1
F (9; 14; 0, 05), F (14; 9; 0, 05) = (0, 97; 7, 73).
s22 s22
Ước lượng phương sai

Bài tập 1. Để nghiên cứu tuổi thọ (tính bằng tháng) của một loại thiết
bị, người ta điều tra ngẫu nhiên 15 thiết bị loại này được kết quả như
sau: 114, 78, 96, 137, 78, 103, 126, 86, 99, 114, 72, 104, 73, 86, 117.
Hãy ước lượng phương sai của tuổi thọ thiết bị với độ tin cậy 95%,
cho biết tuổi thọ của thiết bị có phân phối chuẩn.

Bài tập 2. Các nhà phân tích tài chính thường dùng độ lệch chuẩn
hoặc phương sai làm thước đo về rủi ro đầu tư. Mẫu ngẫu nhiên 20
số liệu về tốc độ tăng lợi nhuận hàng năm của hai công ty chứng
khoán A và B có độ lệch chuẩn tương ứng là 8,89% và 13,03%. Với
độ tin cậy 95%, hãy ước lượng tỉ số của 2 độ lệch chuẩn về tốc độ
tăng lợi nhuận của 2 công ty đó. Từ kết quả tính toán, liệu có thể cho
rằng rủi ro của A thấp hơn B hay không?

You might also like