You are on page 1of 122

PHÂN PHỐI MẪU

VÀ ƯỚC LƯỢNG
Phân phối mẫu
• Phân phối cho trung bình mẫu
• Phân phối cho tỷ lệ mẫu
1. Phân phối cho trung bình mẫu
• Mô tả phân phối của trung bình mẫu: mẫu tuân theo phân phối chuẩn.
• Mô tả phân phối của trung bình mẫu: mẫu không tuân theo phân phối
chuẩn.
• Thống kê 𝑥ҧ là một đại lượng ngẫu nhiên bởi vì giá trị của nó biến thiên
theo từng mẫu xác định. Vì vậy, nó có phân phối xác suất tương ứng.
Trong chương này, ta sẽ tập trung nghiên cứu về hình dạng, độ đo tập
trung và độ đo phân tán của đại lượng ngẫu nhiên này.
• Phân phối mẫu của thống kê là phân phối xác suất cho tất cả các giá trị
có được của thống kê, được tính từ mẫu có cỡ mẫu là n.
• Phân phối mẫu của trung bình mẫu là phân phối xác suất của tất cả giá
trị có được của đại lượng ngẫu nhiên được tính từ mẫu có cỡ mẫu là n.
Mẫu này được lấy từ tổng thể có phân phối chuẩn với trung bình là 𝜇
và độ lệch chuẩn 𝜎.
Minh hoạ phân phối mẫu
• Bước 1: Xác định mẫu ngẫu nhiên có cỡ mẫu là n.
• Bước 2: Tính trung bình mẫu.
• Bước 3: Giả sử ta lấy hữu hạn mẫu từ tổng thể, lặp lại các bước 1, 2
cho đến khi tất cả mẫu nhiên đã được xác định.
Ví dụ 1: Phân phối mẫu cho trung bình mẫu
(Phân phối tổng thể là phân phối chuẩn)
• Trọng lượng của những đồng xu đúc sau năm 1982 tuân theo phân
phối chuẩn với trung bình là 2.46 gam và độ lệch chuẩn là 0.02 gam.
• Xấp xỉ phân phối mẫu của trung bình mẫu, phân phối mẫu được xác
định bởi 200 mẫu ngẫu nhiên có cỡ mẫu n = 5 được lấy từ tổng thể.
• Dữ liệu ở trang kế tiếp đại diện cho trung bình mẫu của 200 mẫu ngẫu
nhiên có cỡ mẫu n = 5.
• Ví dụ: Mẫu đầu tiên (n = 5) có dữ liệu như sau:
2.493 2.466 2.473 2.492 2.471

Trung bình mẫu của dữ liệu trên là 𝑥ҧ = 2.479


Trung bình mẫu có cỡ mẫu n = 5
Cỡ mẫu (n) đóng vai trò gì đối với sự phân
tán của phân phối mẫu?
• Khi cỡ mẫu càng lớn, chúng ta sẽ không kỳ vọng quá nhiều vào độ
phân tán của các trung bình mẫu bởi vì các quan sát có giá trị lớn hơn
sẽ bù lại cho các quan sát có giá trị nhỏ hơn.
Ví dụ 2: Ảnh hưởng của kích cỡ mẫu lên sự
biến thiên của phân phối mẫu
• Xấp xỉ phân phối mẫu của trung bình mẫu bằng 200 mẫu ngẫu nhiên
có cỡ mẫu n = 20 từ tổng thể của trọng lượng đồng xu được đúc sau
năm 1982 (𝜇 = 2.46 𝑔𝑎𝑚, 𝜎 = 0.02 gam)
• Trung bình của 200 mẫu ngẫu nhiên có cỡ mẫu là 20 vẫn là 2.46, trong khi
đó, độ lệch chuẩn đã bị thay đổi (𝜎 = 0.0045) khi n = 5, độ lệch chuẩn
bằng 0.0086.
• Như kỳ vọng ban đầu, có ít sự biến thiên trong phân phối của trung bình
mẫu ở cỡ mẫu 20 hơn là cỡ mẫu 5.
Trung bình và độ lệch chuẩn của phân phối
mẫu
• Giả sử rằng một mẫu ngẫu nhiên có cỡ mẫu n được rút từ phân phối
tổng thể có trung bình 𝜇 và phương sai 𝜎 2 .
• Phân phối mẫu của 𝑥ҧ có trung bình là 𝜇𝑥ҧ = 𝜇 và độ lệch chuẩn là
𝜎
𝜎𝑥ҧ = .
𝑛
• Độ lệch chuẩn của phân phối mẫu 𝑥ҧ được gọi là sai số chuẩn cho
trung bình và được ký hiệu là 𝜎𝑥ҧ .
Hình dạng của phân phối mẫu 𝑥ҧ nếu X có
phân phối chuẩn
• Nếu một đại lượng ngẫu nhiên X có phân phối chuẩn thì phân phối của
trung bình mẫu 𝑥ҧ cũng sẽ là phân phối chuẩn.
Ví dụ 3: Mô tả phân phối của trung bình mẫu
• Trọng lượng của những đồng xu đúc sau năm 1982 tuân theo phân
phối chuẩn với trung bình là 2.46 gam và độ lệch chuẩn là 0.02 gam.
• Tìm xác suất để trong một mẫu ngẫu nhiên gồm 10 đồng xu được đúc
sau năm 1982, chúng ta thu được giá trị trung bình của mẫu ít nhất là
2.465 gam?

0.2146
Ví dụ 4: Mẫu được lấy từ tổng thể không tuân
theo phân phối chuẩn
• Khi tung một đồng xu cân đối, ta có bảng tần số tương đối và đồ thị
histogram của phân phối xác suất như sau:

Số
Tần số tương đối
chấm
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6
• 𝜇 = 3.5, 𝜎 = 1.708 Phân phối tổng thể không phải là phân phối chuẩn
• Ước lượng phân phối mẫu của 𝑥ҧ được xác định bởi 200 mẫu ngẫu
nhiên có cỡ mẫu n = 4 và tính giá trị trung bình mẫu cho mỗi mẫu
ngẫu nhiên.
• Lặp lại đối với n = 10 và n = 30.
• Đồ thị histogram cho phân phối mẫu của trung bình mẫu đối với từng
cỡ mẫu được trình bày ở trang sau.
Nhận xét
• Trung bình của phân phối mẫu bằng với trung bình tổng thể.
𝜎
• Độ lệch chuẩn của phân phối mẫu là .
𝑛
• Trung bình của phân phối mẫu không phụ thuộc vào cỡ mẫu.
Định lý giới hạn trung tâm
• Khi n càng lớn, hình dạng phân phối của trung bình mẫu sẽ tiến gần
đến phân phối chuẩn và không phụ thuộc vào hình dạng của tổng thể.
Ví dụ 5: Định lý giới hạn trung tâm
• Giả sử, trung bình thời gian cho mỗi lần thay dầu nhớt là 11.4 phút và
độ lệch chuẩn là 3.2 phút.
a. Chọn một ngẫu nhiên có cỡ mẫu n = 35, hãy mô tả phân phối mẫu
của trung bình mẫu.

b. Chọn một ngẫu nhiên có cỡ mẫu n = 35, tính xác suất của trung bình
thời gian thay dầu nhớt nhỏ hơn 11 phút.
2. Phân phối cho tỷ lệ mẫu
• Mô tả phân phối cho tỷ lệ mẫu
• Tính xác suất suất cho tỷ lệ mẫu
Ước lượng điểm cho tỷ lệ tổng thể
• Giả sử rằng mỗi người trong một tổng thể chỉ có 2 sự lựa chọn “Có”
hoặc “Không”, một mẫu ngẫu nhiên có cỡ mẫu n được xác định từ
tổng thể.
• Tỷ lệ mẫu được ký hiệu 𝑝Ƹ được xác định như sau:
𝑥
𝑝Ƹ =
𝑛
Trong đó, x là số người trả lời ”Có” trong n người.
• Tỷ lệ mẫu là một thống kê dùng để ước lượng tỷ lệ tổng thể, p
Ví dụ 1: Tính tỷ lệ mẫu.
• Trong một cuộc khảo sát được tiến hành vào tháng 5 năm 2008, tại đại
học Quinnipiac, có 1745 người tham gia được hỏi về vấn đề có đồng ý
với đường lối kinh tế mà tổng thống George W.Bush đang thực hiện.
Có 349 người đồng ý. Xác định ước lượng điểm cho tỷ lệ được chấp
thuận đường lối kinh tế này.
Ví dụ 2: Sử dụng mô phỏng để mô tả phân
phối của tỷ lệ mẫu
• Một cuộc khảo sát của tạp chí Times được tiến hành vào tháng 6 năm
2008. 42% số người đồng ý về việc kết hôn đồng giới.
• Mô tả phân phối của tỷ lệ mẫu cho từng cỡ mẫu n = 10, n = 50,
n = 100.
Nhận xét:
• Hình dáng phân phối: Khi n càng lớn, hình dáng phân phối càng tiến
gần về phân phối chuẩn.
• Độ đo tập trung: trung bình của phân phối tỷ lệ mẫu bằng với tỷ lệ của
tổng thể, p.
• Độ đo phân tán: độ lệch chuẩn của phân phối tỷ lệ mẫu tỷ lệ nghịch
với cỡ mẫu n, nghĩa là khi cỡ mẫu càng tăng thì độ lệch chuẩn càng
giảm và ngược lại.
Phân phối mẫu của 𝑝Ƹ
Với một mẫu ngẫu nhiên có n phần tử và tỷ lệ tổng thể là p:
• Hình dạng phân phối mẫu của 𝑝Ƹ xấp xỉ phân phối chuẩn khi
𝑛𝑝 1 − 𝑝 ≥ 10.
• Trung bình của phân phối mẫu 𝑝Ƹ là 𝜇𝑝ො = 𝑝.
• Độ lệch chuẩn của phân phối mẫu 𝑝Ƹ là
𝑝(1 − 𝑝)
𝜎𝑝ො =
𝑛
Phân phối mẫu của 𝑝Ƹ
• Mô hình trên trang trước đó yêu cầu các giá trị được lấy mẫu là độc
lập. Khi lấy mẫu từ các tổng thể có số lượng hữu hạn, giả định này
được xác minh bằng cách kiểm tra rằng cỡ mẫu n không quá 5% cỡ
quần thể N (𝑛 ≤ 0.05𝑁).
• Cho dù 𝑛𝑝 1 − 𝑝 ≥ 10 có xảy ra hay không thì trung bình của phân
𝑝(1−𝑝)
phối mẫu cho tỷ lệ vẫn là p, độ lệch chuẩn là 𝜎𝑝ො = .
𝑛
Ví dụ 3: Mô tả phân phối mẫu của tỷ lệ
• Một cuộc khảo sát của tạp chí Times được tiến hành vào tháng 6 năm
2008. 42% số người đồng ý về việc kết hôn đồng giới. Giả sử rằng
mẫu ngẫu nhiên có 50 người và xác định tỷ lệ phần trăm về việc kết
hôn đồng giới. Mô tả phân phối tỷ lệ mẫu của mẫu có 50 người này.
Ví dụ 4: Tính xác suất của tỷ lệ mẫu
• Theo trung tâm Kiểm soát và Phòng chống bệnh tật, có 18.8% trẻ em
đến trường có độ tuổi từ 6 đến 11 đang bị thừa cân vào năm 2004.
a. Lấy mẫu ngẫu nhiên gồm 90 em có độ tuổi từ 6 đến 11 đang đi học,
tính xác suất có ít nhất 19% trẻ bị thừa cân?
b. Lấy mẫu ngẫu nhiên gồm 90 em có độ tuổi từ 6 đến 11 đang đi học,
và kết quả nhận được có 24 trẻ bị thừa cân. Bạn có nhận xét gì?
ƯỚC LƯỢNG THAM SỐ
Ước lượng tham số
1. Ước lượng điểm:
2. Tiêu chuẩn lựa chọn ước lượng:
3. Lý thuyết ước lượng khoảng:
4. Ước lượng khoảng tham số tổng thể phân phối chuẩn
1. Ước lượng điểm
• Ước lượng điểm là giá trị của thống kê mà có thể ước lượng cho giá
trị của tham số.
• Ví dụ, trung bình mẫu, 𝑥,ҧ là một ước lượng điểm cho trung bình tổng
thể, 𝜇.
1. Ước lượng điểm
• Ví dụ 1: Tìm một ước lượng điểm
Đồng xu được đúc sau năm 1982 được làm từ 97,5% kẽm và 2,5%
đồng. Dữ liệu sau đây đại diện cho trọng lượng (tính bằng gam) của 17
đồng xu được chọn ngẫu nhiên được đúc sau năm 1982.
2.46 2.47 2.49 2.48 2.50 2.44 2.46 2.45 2.49
2.47 2.54 2.46 2.45 2.46 2.47 2.44 2.45
Xem dữ liệu như một mẫu ngẫu nhiên đơn giản. Ước tính trọng lượng
trung bình tổng thể của đồng xu được đúc sau năm 1982.
1. Ước lượng điểm
• Ví dụ 1: Tìm một ước lượng điểm
Đồng xu được đúc sau năm 1982 được làm từ 97,5% kẽm và 2,5%
đồng. Dữ liệu sau đây đại diện cho trọng lượng (tính bằng gam) của 17
đồng xu được chọn ngẫu nhiên được đúc sau năm 1982.
2.46 2.47 2.49 2.48 2.50 2.44 2.46 2.45 2.49
2.47 2.54 2.46 2.45 2.46 2.47 2.44 2.45
Xem dữ liệu như một mẫu ngẫu nhiên đơn giản. Ước tính trọng lượng
trung bình tổng thể của đồng xu được đúc sau năm 1982.

Một ước lượng điểm cho 𝜇 là 𝑋ത = 2.469


1. Ước lượng điểm
• Ví dụ 2: Nghiên cứu điểm số môn Thống kê ứng dụng của sinh viên
một trường đại học, với 100 sinh viên được hỏi, trung bình cộng của
100 người là 7.1 và có 20 người có điểm giỏi (từ 8 trở lên).
Khi đó ta nói
Ước lượng điểm cho điểm trung bình trong tổng thể căn cứ trên mẫu
này 7.1 điểm.
Ước lượng điểm cho tần suất sinh viên đạt điểm giỏi là 0.18 hay 18%.
2. Tiêu chuẩn lựa chọn ước lượng (ĐỌC
THÊM)
• Ước lượng không chệch
• Ước lượng hiệu quả
• Ước lượng vững
2. Tiêu chuẩn lựa chọn ước lượng
• Ước lượng không chệch
Thống kê 𝜃መ của mẫu là ước lượng không chệch của tham số 𝜃 của
tổng thể nếu
𝐸 𝜃መ = 𝜃.
 Thống kê 𝜃መ của mẫu là ước lượng chệch của tham số 𝜃 của tổng thể
nếu
𝐸 𝜃መ ≠ 𝜃
=> Những sai lệch mang tính hệ thống, ước lượng quá cao hoặc quá
thấp, kết quả sẽ dẫn đến những sai lầm đáng tiếc.
2. Tiêu chuẩn lựa chọn ước lượng
• Ước lượng hiệu quả:
Với một tham số 𝜃, có thể có nhiều hàm ước lượng là ước lượng
không chệch. Mỗi ước lượng không chệch sẽ có độ sai lệch và được đo
bằng phương sai.
Ước lượng không chệch 𝜃መ ∗ được gọi là hiệu quả nhất nếu có phương
sai nhỏ nhất trong tất cả các ước lượng không chệch được xây dựng
trên cùng một mẫu, nghĩa là
𝑉 𝜃መ ∗ ≤ 𝑉 𝜃መ , với mọi 𝜃መ là ước lượng không chệch.
Ước lượng không chệch và hiệu quả nhất là ước lượng tốt nhất.
2. Tiêu chuẩn lựa chọn ước lượng
• Ước lượng vững:
Thống kê 𝜃መ của mẫu được gọi là ước lượng vững của tham số 𝜃 nếu 𝜃መ
hội tụ theo xác suất đến 𝜃 khi kích thước mẫu tăng đến vô hạn.
lim 𝑃 𝜃መ − 𝜃 < 𝜀 = 1
𝑛→∞
3. Lý thuyết ước lượng khoảng:
• Ước lượng khoảng cho tham số 𝜃 chưa biết với độ tin cậy cho trước là
một khoảng ngẫu nhiên sao cho xác suất để tham số 𝜃 thuộc khoảng
đó bằng độ tin cậy.
• Yêu cầu là tìm một khoảng 𝜃1 , 𝜃2 để ước lượng cho 𝜃 với một mức
xác suất cho trước.
𝑃 𝜃1 < 𝜃 < 𝜃2 = 1 − 𝛼
3. Lý thuyết ước lượng khoảng:
• Khi ước lượng, cần có một độ tin cậy đủ lớn, hay 𝛼 đủ nhỏ.
Ví dụ, độ tin cậy 90% thì 𝛼 = 0.1, độ tin cậy 95% thì 𝛼 = 0.05.
• Khoảng tin cậy có dạng:
 −∞, 𝜃2 : khoảng tin cậy trái hay khoảng tin cậy tối đa.
 𝜃1 , ∞ : khoảng tin cậy phải hay khoảng tin cậy tối thiểu.
 𝜃1 , 𝜃2 : khoảng tin cậy hai phía (𝜃1 , 𝜃2 hữu hạn). Khi đó,
Độ dài khoảng tin cậy: 𝐼 = 𝜃2 − 𝜃1
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng trung bình tổng thể 𝝁
• Ước lượng phương sai tổng thể 𝝈𝟐
• Ước lượng tần suất (tỷ lệ) tổng thể (p)
• Ước lượng sự khác biệt hai trung bình của hai mẫu độc lập
• Ước lượng sự khác biệt giữa hai tỷ lệ tổng thể
• Ước lượng tỉ số hai phương sai
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng trung bình tổng thể (𝝁)
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng trung bình tổng thể (𝝁)
• Trường hợp đã biết phương sai tổng thể (𝝈𝟐 )
• Cần tìm một khoảng (𝜇1 , 𝜇2 ) sao cho P(𝜇1 < 𝜇 < 𝜇2 ) = 1 − 𝛼.
𝜎2

• 𝑋~𝑁 𝜇,
𝑛
• Với 𝛼1 + 𝛼2 = 𝛼, ta có:
𝑋ത − 𝜇 𝑛
𝑃 𝑧1−𝛼1 < < 𝑧𝛼2 = 1 − 𝛼1 − 𝛼2
𝜎
𝜎 𝜎
↔ 𝑃 𝑋ത − 𝑧𝛼2 < 𝜇 < 𝑋ത − 𝑧1−𝛼1 = 1 − 𝛼 (1)
𝑛 𝑛
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng trung bình tổng thể (𝝁)
• Theo tính chất của phân phối chuẩn:
𝑧1−𝛼1 = −𝑧𝛼1
• Thay vào (1), ta có
𝜎 𝜎
𝑃 𝑋ത − 𝑧𝛼2 < 𝜇 < 𝑋ത + 𝑧𝛼1 = 1 − 𝛼
𝑛 𝑛
• Khoảng tin cậy ngẫu nhiên cho tham số 𝜇 với độ tin cậy 1 − 𝛼 . 100%:
𝜎 𝜎
𝑋ത − 𝑧𝛼2 , 𝑋ത + 𝑧𝛼1
𝑛 𝑛
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng trung bình tổng thể (𝝁)
𝛼
• Khoảng tin cậy hai phía hay khoảng tin cậy đối xứng, khi đó 𝛼1 = 𝛼2 = :
2
𝜎 𝜎
𝑋ത − 𝑧𝛼/2 < 𝜇 < 𝑋ത + 𝑧𝛼/2
𝑛 𝑛
• Độ dài khoảng tin cậy:
2𝜎
𝐼= 𝑧𝛼/2
𝑛
• Sai số ước lượng hay độ chính xác của ước lượng:
𝐼 𝜎
𝜀= = 𝑧𝛼/2
2 𝑛
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng trung bình tổng thể (𝝁)
• Giữ nguyên độ tin cậy và độ dài khoảng tin cậy không vượt quá một số
𝐼0 , hoặc sai số của ước lượng không vượt quá một số 𝜀0 thì kích thước
mẫu mới (ký hiệu 𝑛′ ) phải thoả mãn:
2
4𝜎 2
𝐼 ≤ 𝐼0 ⟺ 𝑛′ ≥ 2 𝑧𝛼/2
𝐼0
Hoặc
𝜎2 2
𝜀 ≤ 𝜀0 ⟺ 𝑛′ ≥ 𝑧
2 𝛼/2
𝜀0
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng trung bình tổng thể (𝝁)
• Khoảng tin cậy phía trái hoặc khoảng tin cậy tối đa, khi đó 𝛼1 = 0, 𝛼2 = 𝛼:
𝜎
𝜇 < 𝑋ത + 𝑧𝛼
𝑛
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng trung bình tổng thể (𝝁)
• Khoảng tin cậy phía phải hoặc khoảng tin cậy tối thiểu, khi đó
𝛼1 = 𝛼, 𝛼2 = 0:
𝜎
𝑋ത − 𝑧𝛼 < 𝜇
𝑛
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng trung bình tổng thể (𝝁)
• Tính chất: Muốn độ dài khoảng tin cậy giảm đi k lần thì kích thước mẫu
tăng 𝑘 2 lần.
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng trung bình tổng thể (𝝁)
• Trường hợp chưa biết phương sai tổng thể (𝝈𝟐 )
• Khi không có thông tin về phương sai tổng thể và cỡ mẫu 𝑛 < 30 :
• Ước lượng điểm cho phương sai tổng thể là phương sai mẫu 𝑆 2 .
• Thống kê tương ứng:
𝑋ത − 𝜇 𝑛
𝑇= ~𝑇 𝑛 − 1
𝑆
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng trung bình tổng thể (𝝁)
𝛼
• Khoảng tin cậy hai phía hay khoảng tin cậy đối xứng, khi đó 𝛼1 = 𝛼2 = :
2
𝑆 𝑛−1 𝑆 𝑛−1
𝑋ത − 𝑡𝛼 < 𝜇 < 𝑋ത + 𝑡𝛼
𝑛 2 𝑛 2
• Độ dài khoảng tin cậy:
2𝑆 𝑛−1
𝐼= 𝑡𝛼
𝑛 2
• Sai số ước lượng hay độ chính xác của ước lượng:
𝐼 𝑆 𝑛−1
𝜀= = 𝑡𝛼
2 𝑛 2
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng trung bình tổng thể (𝝁)
• Giữ nguyên độ tin cậy và độ dài khoảng tin cậy không vượt quá một số
𝐼0 , hoặc sai số của ước lượng không vượt quá một số 𝜀0 thì kích thước
mẫu mới (ký hiệu 𝑛′ ) phải thoả mãn:
2

4𝑆 𝑛−1 2
𝐼 ≤ 𝐼0 ⟺ 𝑛 ≥ 2 𝑡𝛼
𝐼0 2
Hoặc
2
𝑆2
𝜀 ≤ 𝜀0 ⟺ 𝑛′ ≥ 𝑡𝛼𝑛−1
𝜀02 2
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng trung bình tổng thể (𝝁)
• Khoảng tin cậy phía trái hay khoảng tin cậy tối đa, khi đó 𝛼1 = 0, 𝛼2 =
𝛼:
𝑆 𝑛−1
𝜇 < 𝑋ത + 𝑡𝛼
𝑛
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng trung bình tổng thể (𝝁)
• Khoảng tin cậy phía phải hay khoảng tin cậy tối thiểu, khi đó 𝛼1 =
𝛼, 𝛼2 = 0:
𝑆 𝑛−1
𝑋ത − 𝑡𝛼 < 𝜇
𝑛
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng phương sai tổng thể 𝝈𝟐
• Biết trung bình tổng thể 𝝁
• Thống kê: 𝑛 2
2
𝑋𝑖 − 𝜇 𝑛𝑆 ∗2
𝜒 = ෍ = 2 ~𝜒 2 𝑛
𝜎2 𝜎
𝑖=1
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng phương sai tổng thể 𝝈𝟐
• Biết trung bình tổng thể 𝝁
• Khoảng tin cậy hai phía:
𝑛𝑆 ∗2 2 𝑛𝑆 ∗2
2 𝑛 <𝜎 < 2 𝑛
𝜒𝛼/2 𝜒1−𝛼/2
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng phương sai tổng thể 𝝈𝟐
• Biết trung bình tổng thể 𝝁
• Khoảng tin cậy phía trái hay khoảng tin cậy tối đa:
2 𝑛𝑆 ∗2
𝜎 < 2 𝑛
𝜒1−𝛼
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng phương sai tổng thể 𝝈𝟐
• Biết trung bình tổng thể 𝝁
• Khoảng tin cậy phía phải hoặc khoảng tin cậy tối thiểu:
𝑛𝑆 ∗2 2
2 𝑛
< 𝜎
𝜒𝛼
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng phương sai tổng thể 𝝈𝟐
• Không biết trung bình tổng thể 𝝁
• Thống kê:
2
𝑛 − 1 𝑆
𝜒2 = 2
~𝜒 2
𝑛−1
𝜎
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng phương sai tổng thể 𝝈𝟐
• Không biết trung bình tổng thể 𝝁
• Khoảng tin cậy hai phía:
𝑛−1 𝑆 2 2 𝑛−1 𝑆 2
2 𝑛−1 <𝜎 < 2 𝑛−1
𝜒𝛼/2 𝜒1−𝛼/2
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng phương sai tổng thể 𝝈𝟐
• Không biết trung bình tổng thể 𝝁
• Khoảng tin cậy phía trái hay khoảng tin cậy tối đa:
2 𝑛−1 𝑆 2
𝜎 < 2 𝑛−1
𝜒1−𝛼
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng phương sai tổng thể 𝝈𝟐
• Không biết trung bình tổng thể 𝝁
• Khoảng tin cậy phía phải hoặc khoảng tin cậy tối thiểu:
𝑛 − 1 𝑆2 2
2 𝑛−1
< 𝜎
𝜒𝛼
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng tần suất (tỷ lệ) tổng thể (p)
• Xét một tổng thể kích thước N, có M phần tử chứa dấu hiệu A, p =
M/N là tần suất tổng thể, hay tỉ lệ tổng thể của dấu hiệu A.
• Cần ước lượng tần suất tổng thể p với độ tin cậy 1 − 𝛼 . 100% dựa
trên một mẫu ngẫu nhiên kích thước n.
• Tần suất mẫu (với 𝑋𝐴 tần số ngẫu nhiên):
𝑋𝐴
𝑓=
𝑛
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng tần suất (tỷ lệ) tổng thể (p)
• Với n đủ lớn,
𝑓−𝑝 𝑛
~𝑁 0,1
𝑝 1−𝑝
• Thống kê
𝑓−𝑝 𝑛
𝑍= ~𝑁 0,1
𝑓 1−𝑓
=> Thuận tiện cho việc tính toán.
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng tần suất (tỷ lệ) tổng thể (p)
𝛼
• Khoảng tin cậy hai phía hay khoảng tin cậy đối xứng, khi đó 𝛼1 = 𝛼2 = :
2
𝑓 1−𝑓 𝑓 1−𝑓
𝑓− 𝑧𝛼 < 𝑝 < 𝑓 + 𝑧𝛼/2
𝑛 2 𝑛
• Độ dài khoảng tin cậy:
2 𝑓 1−𝑓
𝐼= 𝑧𝛼/2
𝑛
• Sai số ước lượng hay độ chính xác của ước lượng:
𝐼 𝑓 1−𝑓
𝜀= = 𝑧𝛼/2
2 𝑛
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng tần suất (tỷ lệ) tổng thể (p)
• Giữ nguyên độ tin cậy và độ dài khoảng tin cậy không vượt quá một
số 𝐼0 , hoặc sai số của ước lượng không vượt quá một số 𝜀0 thì kích
thước mẫu mới (ký hiệu 𝑛′ ) phải thoả mãn:

4𝑓 1 − 𝑓 2
𝐼 ≤ 𝐼0 ⟺ 𝑛 ≥ 2 𝑧𝛼/2
𝐼0
Hoặc
′ 𝑓 1−𝑓 2
𝜀 ≤ 𝜀0 ⟺ 𝑛 ≥ 𝑧𝛼/2
𝜀02
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng tần suất (tỷ lệ) tổng thể (p)
• Khoảng tin cậy phía trái hay khoảng tin cậy tối đa, khi đó 𝛼1 =
0, 𝛼2 = 𝛼:
𝑓 1−𝑓
𝑝<𝑓+ 𝑧𝛼
𝑛
• Khoảng tin cậy phía phải hay khoảng tin cậy tối thiểu, khi đó 𝛼1 =
𝛼, 𝛼2 = 0:
𝑓 1−𝑓
𝑓− 𝑧𝛼 < 𝑝
𝑛
Ví dụ 3: Biết rằng sản phẩm do máy sản xuất ra có trọng lượng là biến ngẫu nhiên
phân phối chuẩn và có độ lệch chuẩn là 1.2 gam. Để ước lượng trọng lượng sản
phẩm, một người kiểm tra thứ nhất lấy thử 16 sản phẩm ra để cân thì thấy tổng
trọng lượng của 16 sản phẩm này là 1614 gr.
a) Hãy ước lượng trọng lượng trung bình của sản phẩm bằng khoảng tin cậy đối
xứng với độ tin cậy 95%. Với khoảng tin cậy đó, độ dài khoảng tin cậy và sai số của
ước lượng bằng bao nhiêu?
b) Hãy ước lượng trọng lượng trung bình tối đa và tối thiểu của các sản phẩm, độ tin
cậy 95%.
c) Nếu người đó lấy thêm 9 sản phẩn nữa bỏ thêm vào 16 sản phẩm kia nữa để kiểm
tra và tổng trọng lượng của 25 sản phẩn bằng 2510 gam. Khi đó, ước lượng trọng
lượng trung bình tối thiểu với độ tin cậy 90%.
d) Theo câu a, nếu muốn ước lượng trọng lượng trung bình đạt độ sai số không quá
0.4 gam thì cần điều tra ít nhất bao nhiêu sản phẩm? Nếu phải điều tra thêm thì điều
tra thêm bao nhiêu sản phẩm nữa?
Gọi X là trong lượng sản phẩm do máy sản xuất, 𝑋~𝑁 𝜇, 1.44
16
1614
𝑛 = 16, ෍ 𝑥𝑖 = 1614 ⟹ 𝑋ത = = 100.875, 𝛼 = 0.05 ⟹ 𝑧𝛼 = 1.96
16 2
𝑖=1
a) Khoảng tin cậy đối xứng:
1.2 1.2
100.875 − × 1.96 < 𝜇 < 100.875 + × 1.96
16 16
Hay
100.287 < 𝜇 < 101.463
Khoảng tin cậy đối xứng 95% của trọng lượng trung bình các sản phẩm
100.287, 101.463
Độ dài khoảng tin cậy: 𝐼 = 101.463 − 100.287 = 1.176 (g)
1.176
Sai số của ước lượng: 𝜀 = = 0.588(g)
2
Gọi X là trong lượng sản phẩm do máy sản xuất, 𝑋~𝑁 𝜇, 1.44
16
1614
𝑛 = 16, ෍ 𝑥𝑖 = 1614 ⟹ 𝑋ത = = 100.875, 𝛼 = 0.05 ⟹ 𝑧𝛼 = 1.645
16
𝑖=1
b) Ước lượng trọng lượng trung bình tối đa:
1.2
𝜇 < 100.875 + × 1.645 hay 𝜇 < 101.3685(g)
16
Trọng lượng trung bình tối đa của các sản phẩm là 101.3685(g)

Ước lượng trọng lượng trung bình tối thiểu:


1.2
100.875 − × 1.645 < 𝜇 hay 100.3815 < 𝜇
16
Trọng lượng trung bình tối thiểu của các sản phẩm là 100.3815(g)
Gọi X là trong lượng sản phẩm do máy sản xuất, 𝑋~𝑁 𝜇, 1.44
c) Khi thêm 9 sản phẩm nữa,
25
2510
𝑛𝑛𝑒𝑤 = 16 + 9 = 25, ෍ 𝑥𝑖 = 2510 ⟹ 𝑋ത𝑛𝑒𝑤 = = 100.4
25
𝑖=1
𝛼𝑛𝑒𝑤 = 0.1, 𝑧𝛼𝑛𝑒𝑤 = 1.282
Ước lượng trọng lượng trung bình tối thiểu:
1.2
100.4 − × 1.282 < 𝜇 hay 100.09232 < 𝜇
25
Trọng lượng trung bình tối thiểu của các sản phẩm là 100.09232(g)
Gọi X là trong lượng sản phẩm do máy sản xuất, 𝑋~𝑁 𝜇, 1.44
16
1614
𝑛 = 16, ෍ 𝑥𝑖 = 1614 ⟹ 𝑋ത = = 100.875, 𝛼 = 0.05 ⟹ 𝑧𝛼 = 1.96
16 2
𝑖=1
𝜎 1.2
d) 𝜀0 = 0.4 ⇒ 𝑧𝛼/2 ≤ 0.4 ⟺ 1.96 × ≤ 0.4 ⟺ n ≥ 34.57 ≈ 35
𝑛 𝑛
Cần điều tra ít nhất 35 sản phẩm, số sản phẩm điều tra thêm là 35-16=9(sản phẩm)
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng trung bình tổng thể (𝝁)
• Ví dụ 4: Trọng lượng của một loại quả tuân theo phân phối chuẩn. Để
ước lượng trọng lượng trung bình của loại quả đó, cân ngẫu nhiên 25 quả
thì thấy trọng lượng trung bình của 25 quả đó là 30.48 gam và phương
sai mẫu hiệu chỉnh là 8.4267 𝑔𝑎𝑚2 .
a) Với độ tin cậy 95%, hãy ước lượng trọng lượng trung bình của loại quả
này bằng khoảng tin cậy đối xứng.
b) Nếu muốn giữ nguyên độ tin cậy nhưng muốn sai số của ước lượng
2
giảm đi thì cần cân thêm ít nhất bao nhiêu quả nữa?
3
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng trung bình tổng thể (𝝁)
• Ví dụ 4: Trọng lượng của một loại quả tuân theo phân phối chuẩn. Để
ước lượng trọng lượng trung bình của loại quả đó, cân ngẫu nhiên 25 quả
thì thấy trọng lượng trung bình của 25 quả đó là 30.48 gam và phương
sai mẫu hiệu chỉnh là 8.4267 𝑔𝑎𝑚2 .
c) Nếu độ tin cậy là 90% thì trọng lượng trung bình của loại quả này nằm
trong khoảng nào?
d) Nếu muốn giữ nguyên độ tin cậy nhưng độ dài khoảng tin cậy ở câu a)
giảm đi một nửa thì cần cân thử bao nhiêu sản phẩm?
e) Trong vụ mùa vừa qua người ta 10,000 quả, vậy trọng lượng trung bình
của vụ mùa vừa qua là bao nhiêu, với độ tin cậy 95%.
Ví dụ 4:
Gọi X là trọng lượng của loại quả, 𝑋~𝑁 𝜇, 𝜎 2 , 𝜎 2 chưa biết.
𝑛 = 25, 𝑋ത = 30.48, 𝑆 2 = 8.4267 ⇒ 𝑆 = 2.9029
𝑛−1 24
a) 𝛼 = 0.05 ⇒ 𝑡𝛼 = 𝑡0.025 = 2.064
2
Khoảng tin cậy đối xứng:
2.9029 2.9029
30.48 − × 2.064 < 𝜇 < 30.48 + × 2.064
25 25
Hay
29.2817 < 𝜇 < 31.6783
Khoảng tin cậy đối xứng cho trung bình loại quả này là (29.2817,
31.6783)
Ví dụ 4:
Gọi X là trọng lượng của loại quả, 𝑋~𝑁 𝜇, 𝜎 2 , 𝜎 2 chưa biết.
𝑛 = 25, 𝑋ത = 30.48, 𝑆 2 = 8.4267 ⇒ 𝑆 = 2.9029
b) Khoảng tin cậy đối xứng cho trung bình loại quả này là (29.2817, 31.6783)
31.6783−29.2817
Sai số ước lượng: 𝜀 = = 1.1983
2
2 1 1.1983
Sai số ước lượng giảm đi : 𝜀0 = 𝜀 = = 0.3994
3 3 3
Áp dụng công thức ta có:
2

𝑆 𝑛−1 2 ′
8.4267 2 ′ ′
𝑛 ≥ 2 𝑡𝛼 ⟺𝑛 ≥ 2
× 2.064 ⟺ n ≥ 225.0406 ≈ 𝑛 = 226
𝜀0 2 0.3994
Cần phải cân ít nhất 226 quả.
Cần phải cân thêm 226 – 25 = 201 quả.
Ví dụ 4:

Gọi X là trọng lượng của loại quả, 𝑋~𝑁 𝜇, 𝜎 2 , 𝜎 2 chưa biết.


𝑛 = 25, 𝑋ത = 30.48, 𝑆 2 = 8.4267 ⇒ 𝑆 = 2.9029
c) 𝛼 = 0.1 ⇒ 𝑡𝛼𝑛−1 = 𝑡0.05
24
= 1.712
2
Khoảng tin cậy đối xứng:
2.9029 2.9029
30.48 − × 1.712 < 𝜇 < 30.48 + × 1.712
25 25
Hay
29.4860 < 𝜇 < 31.4740
Khoảng tin cậy đối xứng cho trung bình loại quả này là (29.4860, 31.4740)
Ví dụ 4:
Gọi X là trọng lượng của loại quả, 𝑋~𝑁 𝜇, 𝜎 2 , 𝜎 2 chưa biết.
𝑛 = 25, 𝑋ത = 30.48, 𝑆 2 = 8.4267 ⇒ 𝑆 = 2.9029
d) 𝛼 = 0.05 ⇒ 𝑡𝛼𝑛−1 = 𝑡0.025
24
= 2.064
2
Khoảng tin cậy đối xứng cho trung bình loại quả này là (29.2817,
31.6783)
Độ dài khoảng tin cậy: 𝐼 = 31.6783 − 29.2817 = 2.3966
1
Độ dài khoảng tin cậy giảm đi một nửa: 𝐼0 = 𝐼 = 1.1983
2
Áp dụng công thức, ta có
2
′ 4𝑆 2 𝑛−1 ′ 4×8.4267
𝑛 ≥ 𝑡𝛼 ⟺𝑛 ≥ × 2.0642 ⟺ 𝑛′ ≥ 100.001 ≈ 101
𝐼02 2
1.19832
Vậy cần cân thử 101 quả.
Ví dụ 4:
Gọi X là trọng lượng của loại quả, 𝑋~𝑁 𝜇, 𝜎 2 , 𝜎 2 chưa biết.
𝑛 = 25, 𝑋ത = 30.48, 𝑆 2 = 8.4267 ⇒ 𝑆 = 2.9029
e) 𝛼 = 0.05 ⇒ 𝑡𝛼𝑛−1 = 𝑡0.025
24
= 2.064
2
Khoảng tin cậy đối xứng cho trung bình loại quả này là (29.2817,
31.6783)
Vậy trọng lượng trung bình của toàn vụ mùa với 10,000 quả là:
(292817, 316783)
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng phương sai tổng thể 𝝈𝟐
• Không biết trung bình tổng thể 𝝁
• Ví dụ 5: Giả sử mức hao phí nguyên liệu cho một đơn vị sản phẩm là
đại lượng ngẫu nhiên tuân theo phân phối chuẩn. Quan sát 25 sản
phẩm, ta có số liệu sau:
Khối lượng nguyên liệu hao phí (gam) 19.5 20.0 20.5
Số sản phẩm 5 18 2
Với độ tin cậy 90%, hãy ước lượng độ phân tán (phương sai và độ lệch
chuẩn) của mức hao phí nguyên liệu trong 2 trường hợp:
a. Mức hao phí nguyên liệu trung bình của một sản phẩm trên tổng thể
là 𝜇 = 20 gam.
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng phương sai tổng thể 𝝈𝟐
• Không biết trung bình tổng thể 𝝁
• Ví dụ 5: Giả sử mức hao phí nguyên lieu cho một đơn vị sản phẩm là
đại lượng ngẫu nhiên tuân theo phân phối chuẩn. Quan sát 25 sản
phẩm, ta có số liệu sau:

Khối lượng nguyên liệu hao phí (gam) 19.5 20.0 20.5
Số sản phẩm 5 18 2

Với độ tin cậy 90%, hãy ước lượng độ phân tán (phương sai và độ lệch
chuẩn) của mức hao phí nguyên liệu trong 2 trường hợp:
b. Không biết mức hao phí nguyên liệu trung bình trên tổng thể.
Khối lượng nguyên liệu hao phí (gam) 19.5 20.0 20.5
Ví dụ 5: Số sản phẩm 5 18 2
a) Mức hao phí nguyên liệu trung bình của một sản phẩm trên tổng thể là
𝜇 = 20 gam.
3

𝑛 = 25, 𝑛𝑆 ∗2 = ෍ 𝑋𝑖 − 𝜇 2 . 𝑓𝑖 = 1.75, 𝛼 = 0.1


𝑖=1
2 25 2 25
𝜒0.05 = 37.6525, 𝜒0.95 = 14.6114
𝑛𝑆 ∗2 2 𝑛𝑆 ∗2 1.75 2 1.75
2 𝑛 <𝜎 < 2 𝑛 ⟺ <𝜎 < ⟺ 0.0465 < 𝜎 2 < 0.1198
𝜒𝛼/2 𝜒1−𝛼/2 37.6525 14.6114

Vậy khoảng tin cậy cho phương sai: (0.0465, 0.1198)


Vậy khoảng tin cậy cho độ lệch chuẩn: (0.2156, 0.3461)
Khối lượng nguyên liệu hao phí (gam) 19.5 20.0 20.5
Ví dụ 5: Số sản phẩm 5 18 2
b) Không biết mức hao phí nguyên liệu trung bình trên tổng thể.
3

𝑛 = 25, 𝑥ҧ = 19.94, 𝑛 − 1 𝑆 2 = ෍ 𝑋𝑖 − 𝑋ത 2 . 𝑓𝑖 = 1.66, 𝛼 = 0.1


𝑖=1
2 24 2 24
𝜒0.05 = 36.4150, 𝜒0.95 = 13.8484
𝑛𝑆 2 2 𝑛𝑆 2 1.66 2 1.66
2 𝑛−1 <𝜎 < 2 𝑛−1 ⟺ <𝜎 < ⟺ 0.0456 < 𝜎 2 <
𝜒𝛼/2 𝜒1−𝛼/2 36.4150 13.8484
0.1199
Vậy khoảng tin cậy cho phương sai: (0.0456, 0.1199)
Vậy khoảng tin cậy cho độ lệch chuẩn: (0.2135, 0.3463)
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng tần suất (tỷ lệ) tổng thể (p)
• Ví dụ 6: Kiểm tra ngẫu nhiên 400 sản phẩm của một nhà máy sản xuất
thấy có 92 sản phẩm đạt chất lượng loại I. Với độ tin cậy 95%.
a) Tỉ lệ sản phẩm loại I của nhà máy nằm trong khoảng nào?
b) Nếu muốn độ dài khoảng tin cậy đối xứng không quá 8% thì cần
kiểm tra ít nhất bao nhiêu sản phẩm?
c) Nếu nhà máy sản xuất tổng cộng 100 nghìn sản phẩm thì số sản
phẩm loại I chiểm khoảng bao nhiêu?
Ví dụ 6:
92
𝑛 = 400, 𝑋𝐴 = 92 ⇒ 𝑓 = = 0.23
400
a) 𝛼 = 0.5 ⇒ 𝑧𝛼/2 = 1.96
Áp dụng công thức, ta có:
𝑓 1−𝑓 𝑓 1−𝑓
𝑓− 𝑧𝛼 < 𝑝 < 𝑓 + 𝑧𝛼/2
𝑛 2 𝑛
0.23 1 − 0.23 0.23 1 − 0.23
⟺ 0.23 − × 1.96 < 𝑝 < 0.23 + × 1.96
400 400
⟺ 0.1888 < 𝑝 < 0.2712
Tỉ lệ sản phẩm loại I nằm trong khoảng: (0.1888, 0.2712)
Ví dụ 6:
92
𝑛 = 400, 𝑋𝐴 = 92 ⇒ 𝑓 = = 0.23
400
b) 𝛼 = 0.5 ⇒ 𝑧𝛼/2 = 1.96, 𝜀0 = 0.08
Áp dụng công thức, ta có:

𝑓 1−𝑓 2
𝑛 ≥ 2 𝑧𝛼/2
𝜀0

0.23 1 − 0.23 2
⟺𝑛 ≥ × 1.96
0.082

⟺ 𝑛′ ≥ 106.3043 ≈ 107
Cần kiểm tra ít nhất 107 sản phẩm.
Ví dụ 6:
92
𝑛 = 400, 𝑋𝐴 = 92 ⇒ 𝑓 = = 0.23
400
c) Tỉ lệ sản phẩm loại I nằm trong khoảng: (0.1888, 0.2712)
Tỉ lệ 100,000 sản phẩm loại I nằm trong khoảng (18880, 27120)
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng sự khác biệt hai trung bình của hai mẫu độc lập (hiệu
hai trung bình)

Phân phối chuẩn Phân phối chuẩn


4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng sự khác biệt hai trung bình của hai mẫu độc lập (hiệu
hai trung bình)
• Ví dụ: Để biết nam hay nữ học giỏi toán hơn, người ta tiến hành lấy
mẫu điểm trung bình môn toán của 50 học sinh nam và 50 học sinh nữ.
Trong trường hợp này, người ta tiến hành thí nghiệm trên 2 tổng thể
độc lập nhau.
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng sự khác biệt hai trung bình của hai mẫu độc lập (hiệu
hai trung bình)
 Trường hợp 1: Biết phương sai tổng thể.
Công thức ước lượng hiệu hai trung bình:
𝑋ത − 𝑌ത − 𝜀 < 𝜇1 − 𝜇2 < 𝑋ത − 𝑌ത + 𝜀
𝜎12 𝜎22
Với 𝜀 = 𝑧𝛼/2 +
𝑛1 𝑛2
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng sự khác biệt hai trung bình của hai mẫu độc lập (hiệu
hai trung bình)
 Trường hợp 1: Biết phương sai tổng thể.
Ví dụ 7: Để nghiên cứu về độ tuổi của khách hàng đến cửa hàng ở trong
thành phố và vùng ven, ta tiến hành lấy mẫu như sau:
Thành phố Vùng ven
Số lượng cửa hàng 36 49
Trung bình độ tuổi 40 35

Với độ tin cậy 95%, ước lượng sự khác biệt về độ tuổi của khách hàng.
Biết rằng phương sai tổng thể lần lượt là 9 và 10 tuổi.
• Tóm tắt:
𝑛1 = 36 𝑛2 = 49
𝑥ҧ = 40 𝑦ത = 35
𝜎1 = 9 𝜎2 = 10
Công thức ước lượng hiệu hai trung bình:
𝑋ത − 𝑌ത − 𝜀 < 𝜇1 − 𝜇2 < 𝑋ത − 𝑌ത + 𝜀
𝜎12 𝜎22
Với 𝜀 = 𝑧𝛼/2 +
𝑛1 𝑛2
Ta có: độ tin cậy 95% ⇒ 𝛼 = 0.05 ⇒ 𝑧𝛼/2 = 1.96
𝜎12 𝜎22 92 102
⇒ 𝜀 = 𝑧𝛼/2 + = 1.96 + = 4.06
𝑛1 𝑛2 36 49
Vậy khoảng tin cậy 95% cho sự khác biệt hai trung bình là:
40 − 35 − 4.06 < 𝜇1 − 𝜇2 < 40 − 35 + 4.06 ⟺ 0.94 < 𝜇1 − 𝜇2 < 9.06
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng sự khác biệt hai trung bình của hai mẫu độc lập (hiệu
hai trung bình)
 Trường hợp 2: Chưa biết phương sai tổng thể và kích thước mẫu
lớn hơn 30 (𝒏𝟏 > 𝟑𝟎 và 𝒏𝟐 > 𝟑𝟎)
Công thức ước lượng hiệu hai trung bình:
𝑋ത − 𝑌ത − 𝜀 < 𝜇1 − 𝜇2 < 𝑋ത − 𝑌ത + 𝜀
𝑆12 𝑆22
Với 𝜀 = 𝑧𝛼/2 +
𝑛1 𝑛2
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng sự khác biệt hai trung bình của hai mẫu độc lập (hiệu
hai trung bình)
 Trường hợp 2: Chưa biết phương sai tổng thể và kích thước mẫu
lớn hơn 30 (𝒏𝟏 > 𝟑𝟎 và 𝒏𝟐 > 𝟑𝟎)
Ví dụ 8: Bộ Giao thông Vận tải Hoa Kỳ cung cấp số dặm mà cư dân
của 75 khu vực đô thị lớn nhất di chuyển mỗi ngày trên ô tô. Giả sử ta
lấy một mẫu ngẫu nhiên gồm 50 cư dân của thành phố A có trung bình
và độ lệch chuẩn lần lượt là 22.5 và 8.4 dặm một ngày. Một mẫu ngẫu
nhiên khác được lấy ở thành phố B gồm 40 cư dân với trung bình là
18.6 dặm một ngày và độ lệch chuẩn là 7.4 dặm một ngày. Hãy tìm
khoảng tin cậy 95% cho sự khác biệt trung bình của hai tổng thể?
• Tóm tắt:
𝑛1 = 50 𝑛2 = 40
𝑥ҧ = 22.5 𝑦ത = 18.6
𝑠1 = 8.4 𝑠2 = 7.4
Công thức ước lượng hiệu hai trung bình:
𝑋ത − 𝑌ത − 𝜀 < 𝜇1 − 𝜇2 < 𝑋ത − 𝑌ത + 𝜀
𝑆12 𝑆22
Với 𝜀 = 𝑧𝛼/2 +
𝑛1 𝑛2
Ta có: độ tin cậy 95% ⇒ 𝛼 = 0.05 ⇒ 𝑧0.025 = 1.96
𝑆12 𝑆22 8.42 7.42
⇒ 𝜀 = 𝑧𝛼/2 + = 1.96 + = 3.268
𝑛1 𝑛2 50 40
Vậy khoảng tin cậy 95% cho sự khác biệt hai trung bình là:
22.5 − 18.6 − 3.268 < 𝜇1 − 𝜇2 < 22.5 − 18.6 + 3.268
⟺ 0.632 < 𝜇1 − 𝜇2 < 7.168
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng sự khác biệt hai trung bình của hai mẫu độc lập (hiệu
hai trung bình)
 Trường hợp 3: Chưa biết phương sai tổng thể nhưng biết chúng
bằng nhau (𝝈𝟐𝟏 = 𝝈𝟐𝟐 ) và kích thước mẫu nhỏ hơn 30 (𝒏𝟏 < 𝟑𝟎
hoặc 𝒏𝟐 < 𝟑𝟎)
Công thức ước lượng hiệu hai trung bình:
𝑋ത − 𝑌ത − 𝜀 < 𝜇1 − 𝜇2 < 𝑋ത − 𝑌ത + 𝜀
𝑘 1 1 𝑛1 −1 𝑆12 + 𝑛2 −1 𝑆22
Với 𝜀 = 𝑡𝛼 𝑆𝑃 + , 𝑆𝑃2 = , 𝑘 = 𝑛1 − 𝑛2 − 2
𝑛1 𝑛2 𝑛1 −𝑛2 −2
2
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng sự khác biệt hai trung bình của hai mẫu độc lập (hiệu
hai trung bình)
 Trường hợp 3: Chưa biết phương sai tổng thể nhưng biết chúng
bằng nhau (𝝈𝟐𝟏 = 𝝈𝟐𝟐 ) và kích thước mẫu nhỏ hơn 30 (𝒏𝟏 < 𝟑𝟎
hoặc 𝒏𝟐 < 𝟑𝟎)
Ví dụ 9: Để xác định hiệu quả của giáo viên đến điểm thi SAT, người ta
lấy ngẫu nhiên mẫu ngẫu nhiên của 2 bang, mỗi bang gồm 4 học sinh và
thu được kết quả: bang thứ nhất có điểm trung bình 330 điểm và độ lệch
chuẩn mẫu 33.67 điểm; bang thứ hai có điểm trung bình 360 điểm và độ
lệch chuẩn mẫu 29.44 điểm. Hãy tìm khoảng tin cậy 95% cho hiệu
điểm thi của hai bang. Biết rằng điểm thi của mỗi bạn có phân phối
chuẩn và giả sử phương sai của hai bang này là bằng nhau.
• Tóm tắt: 𝜎12 = 𝜎22 𝑛1 = 4 𝑛2 = 4
𝑥ҧ = 330 𝑦ത = 360
𝑠1 = 33.67 𝑠2 = 29.44
Công thức ước lượng hiệu hai trung bình:
𝑋ത − 𝑌ത − 𝜀 < 𝜇1 − 𝜇2 < 𝑋ത − 𝑌ത + 𝜀
𝑘 1 1 𝑛1 −1 𝑆12 + 𝑛2 −1 𝑆22
Với 𝜀 = 𝑡𝛼 𝑆𝑃 𝑛1
+ 𝑛 , 𝑆𝑃2 = 𝑛1 +𝑛2 −2
,𝑘 = 𝑛1 + 𝑛2 − 2
2 2
6
Ta có: độ tin cậy 95% ⇒ 𝛼 = 0.05, 𝑘 = 4 + 4 − 2 = 6 ⇒ 𝑡0.025 = 2.44

2 2 2 2
𝑛1 − 1 𝑆1 + 𝑛 2 − 1 𝑆2 4 − 1 × 33.67 + 4 − 1 × 29.44
𝑆𝑃2 = = = 1000.19125
𝑛1 + 𝑛2 − 2 4+4−2

1 1 1 1
⇒𝜀= 𝑡𝛼𝑘 𝑆𝑃 + = 2.447 × 1000.19125 + = 54.722
2 𝑛1 𝑛2 4 4
Vậy khoảng tin cậy 95% cho sự khác biệt hai trung bình là:
330 − 360 − 54.722 < 𝜇1 − 𝜇2 < 330 − 360 + 54.722
⟺ −84.722 < 𝜇1 − 𝜇2 < 24.722
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng sự khác biệt hai trung bình của hai mẫu độc lập (hiệu hai
trung bình)
 Trường hợp 4: Chưa biết phương sai tổng thể nhưng biết chúng
không bằng nhau (𝝈𝟐𝟏 ≠ 𝝈𝟐𝟐 ) và kích thước mẫu nhỏ hơn 30 (𝒏𝟏 < 𝟑𝟎
hoặc 𝒏𝟐 < 𝟑𝟎)
Công thức ước lượng hiệu hai trung bình:
𝑋ത − 𝑌ത − 𝜀 < 𝜇1 − 𝜇2 < 𝑋ത − 𝑌ത + 𝜀
2 2 2
𝑆1 𝑆2
+
𝑘 𝑆12 𝑆22 𝑛1 𝑛2
Với 𝜀 = 𝑡𝛼 + ,𝑘 = 2 2 2
2
𝑛1 𝑛2 𝑆2
1 𝑆 2
𝑛1 𝑛2
+
𝑛1 −1 𝑛2 −1
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng sự khác biệt hai trung bình của hai mẫu độc lập (hiệu hai
trung bình)
Trường hợp 4: Chưa biết phương sai tổng thể nhưng biết chúng
không bằng nhau (𝝈𝟐𝟏 ≠ 𝝈𝟐𝟐 ) và kích thước mẫu nhỏ hơn 30 (𝒏𝟏 < 𝟑𝟎
hoặc 𝒏𝟐 < 𝟑𝟎)
Ví dụ 10: Để cung cấp sự khác biệt về trung bình tổng thể số dư tài khoản
của một ngân hàng, ta tiến hành lấy mẫu.
Ở chi nhánh A, 𝑛1 = 28, 𝑥1ҧ = $1025, 𝑠1 = $150.
Ở chi nhánh B, 𝑛2 = 22, 𝑥ҧ2 = $910, 𝑠2 = $125.
Tìm khoảng tin cậy 95% cho sự khác biệt về trung bình của hai chi nhánh
này.
• Tóm tắt: 𝜎12 ≠ 𝜎22 𝑛1 = 28 𝑛2 = 22
𝑥ҧ = 1025 𝑦ത = 910
𝑠1 = 150 𝑠2 = 125
Công thức ước lượng hiệu hai trung bình:
𝑋ത − 𝑌ത − 𝜀 < 𝜇1 − 𝜇2 < 𝑋ത − 𝑌ത + 𝜀
𝑆2 𝑆2 2
1+ 2
𝑘 𝑆12 𝑆22 𝑛1 𝑛2
Với 𝜀 = 𝑡𝛼 + ,𝑘 = 2 2 2
𝑛1 𝑛2 𝑆2
1 𝑆2
2
𝑛1 𝑛2
+
𝑛1 −1 𝑛2 −1

2 2 2 2 2
𝑆1 𝑆2 1502
125
𝑛1 + 𝑛2 28 + 22
𝑘= = = 47.805 ≈ 47
2 2 2 2 1502 2
1252 2
𝑆1 𝑆2
𝑛1 𝑛2 28 22
28 − 1 + 22 − 1
𝑛1 − 1 + 𝑛2 − 1
47
Ta có: độ tin cậy 95% ⇒ 𝛼 = 0.05, 𝑘 = 4 + 4 − 2 = 6 ⇒ 𝑡0.025 = 2.012 (Ex𝑐𝑒𝑙)
• Tóm tắt: 𝜎12 ≠ 𝜎22 𝑛1 = 28 𝑛2 = 22
𝑥ҧ1 = 1025 𝑥ҧ2 = 910
𝑠1 = 150 𝑠2 = 125
Công thức ước lượng hiệu hai trung bình:
𝑋ത − 𝑌ത − 𝜀 < 𝜇1 − 𝜇2 < 𝑋ത − 𝑌ത + 𝜀
𝑆2 𝑆2 2
1+ 2
𝑘 𝑆12 𝑆22 𝑛1 𝑛2 47
Với 𝜀 = 𝑡𝛼 + ,𝑘 = 2 2 , 𝑡0.025 = 2.012.
𝑛1 𝑛2 𝑆2
1 𝑆2
2
2
𝑛1 𝑛2
+
𝑛1 −1 𝑛2 −1

𝑘 𝑆12 𝑆22 1502 1252


𝜀 = 𝑡𝛼 + = 2.012 × + = 78.282
2 𝑛1 𝑛2 28 22
Vậy khoảng tin cậy 95% cho sự khác biệt hai trung bình là:
1025 − 910 − 78.282 < 𝜇1 − 𝜇2 < 1025 − 910 + 78.282
⟺ 36.718 < 𝜇1 − 𝜇2 < 193.282
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng sự khác biệt hai trung bình của hai mẫu không độc lập
(hiệu hai trung bình)
Sample
Mean: 𝑥ҧ1
S.d.: 𝑠1
Sample Method 1
Population Sample size: n
Mean: 𝑥ҧ
Mean: 𝜇
S.d.: 𝑠
S.d.: 𝜎 Sample
Sample size: n Method 2
Mean: 𝑥ҧ2
S.d.: 𝑠2
Sample size: n
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng sự khác biệt hai trung bình của hai mẫu không độc lập
(hiệu hai trung bình)
• Ví dụ: Để đo hiệu quả của một phương pháp giảng dạy toán mới,
người ta tiến hành thí nghiệm như sau: tiến hành kiểm tra điểm trung
bình Toán của 50 học sinh với phương pháp giảng dạy cũ sau đó áp
dụng phương pháp giảng dạy mới cho nhóm học sinh này rồi kiểm tra
điểm trung bình Toán một lần nữa để xem liệu phương pháp giảng dạy
mới có mang lại hiệu quả. Trong trường hợp này, người ta tiến hành
thí nghiệm trên cùng một tổng thể.
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng sự khác biệt hai trung bình của hai mẫu không độc lập
(hiệu hai trung bình)
• Công thức khoảng tin cậy cho sự khác biệt trung bình:
ҧ 𝑛−1 𝑠𝑑 ҧ 𝑛−1 𝑠𝑑
𝑑 − 𝑡𝛼 ≤ 𝜇1 − 𝜇2 ≤ 𝑑 + 𝑡𝛼
2 𝑛 2 𝑛
Với 𝑑:ҧ trung bình sự khác biệt của từng cặp dữ liệu; 𝑠𝑑 : độ lệch chuẩn
hiệu chỉnh của sự khác biệt cho từng cặp dữ liệu.
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng sự khác biệt hai trung bình của hai mẫu không độc lập (hiệu hai
trung bình)
• Ví dụ: Thời gian hoàn tất của 6 công nhân thực hiện theo 2 phương pháp được thể
hiện qua bảng bên dưới. Hãy tính khoảng ước lượng 95% cho sự khác biệt về
trung bình thời gian hoàn tất của hai phương pháp này.
Công nhân Thời gian hoàn tất phương pháp 1 (phút) Thời gian hoàn tất phương pháp 2 (phút)
1 6.0 5.4
2 5.0 5.2
3 7.0 6.5
4 6.2 5.9
5 6.0 6.0
6 6.4 5.8
• GIẢI:
Thời gian hoàn tất Thời gian hoàn tất
Công nhân Sự khác biệt 𝑑𝑖
phương pháp 1 (phút) phương pháp 2 (phút)
1 6.0 5.4 0.6
2 5.0 5.2 -0.2
3 7.0 6.5 0.5
4 6.2 5.9 0.3
5 6.0 6.0 0.0
6 6.4 5.8 0.6

• 𝑑ҧ = 0.3, 𝑠𝑑 = 0.335
• GIẢI:
𝑑ҧ = 0.3, 𝑠𝑑 = 0.335, 𝑛 = 6
Công thức khoảng tin cậy cho sự khác biệt trung bình:
𝑛−1 𝑠𝑑 𝑛−1 𝑠𝑑
𝑑ҧ − 𝑡𝛼 ≤ 𝜇1 − 𝜇2 ≤ 𝑑ҧ + 𝑡𝛼
2 𝑛 2 𝑛
Với độ tin cậy 95%, 𝛼 = 0.05, n = 6 ⇒ t 50.025 = 2.571

0.335 0.335
0.3 − 2.571 × ≤ 𝜇1 − 𝜇2 ≤ 0.3 + 2.571 ×
6 6
⟺ −0.052 ≤ 𝜇1 − 𝜇2 ≤ 0.652
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng sự khác biệt giữa hai tỷ lệ tổng thể
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng sự khác biệt giữa hai tỷ lệ tổng thể
Công thức ước lượng hiệu hai tỷ lệ tổng thể:
𝑓1 − 𝑓2 − 𝜀 < 𝑝1 − 𝑝2 < 𝑓1 − 𝑓2 + 𝜀
𝑓1 1−𝑓1 𝑓2 1−𝑓2
Với 𝜀 = 𝑧𝛼/2 +
𝑛1 𝑛2
1 1 𝑛1 𝑓1 +𝑛2 𝑓2
Hoặc 𝜀 = 𝑧𝛼/2 𝑓ҧ 1 − 𝑓ҧ + ҧ
với 𝑓 =
𝑛1 𝑛2 𝑛1 +𝑛2
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng sự khác biệt giữa hai tỷ lệ tổng thể
Ví dụ 11: Thông tin khai thuế của hai văn phòng được ghi nhận như
sau:
Văn phòng 1 Văn phòng 2
Tổng số tờ khai 250 300
Số lượng tờ khai sai 35 27

Tìm khoảng tin cậy 90% cho sự khác biệt tỷ lệ tờ khai thuế sai giữa hai
văn phòng này.
• Tóm tắt: 𝑛1 = 250 𝑛2 = 300
𝑥1 = 35 𝑥2 = 27
𝑥1 35 𝑥2 27
𝑓1 = = = 0.14 𝑓2 = = = 0.09
𝑛1 250 𝑛2 300
Công thức ước lượng hiệu hai tỷ lệ tổng thể:
𝑓1 − 𝑓2 − 𝜀 < 𝑝1 − 𝑝2 < 𝑓1 − 𝑓2 + 𝜀
𝑓1 1−𝑓1 𝑓2 1−𝑓2
Với 𝜀 = 𝑧𝛼/2 +
𝑛1 𝑛2

Ta có: độ tin cậy 90% ⇒ 𝛼 = 0.1, 𝑧0.05 = 1.645

𝑓1 1 − 𝑓1 𝑓2 1 − 𝑓2 0.14 1 − 0.14 0.09 1 − 0.09


⇒ 𝜀 = 𝑧𝛼/2 + = 1.645 × + = 0.045
𝑛1 𝑛2 250 300
Vậy khoảng tin cậy 95% cho sự khác biệt hai trung bình là:
0.14 − 0.09 − 0.045 < 𝑝1 − 𝑝2 < 0.14 − 0.09 + 0.045
⟺ 0.005 < 𝜇1 − 𝜇2 < 0.095
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng tỉ số hai phương sai từ phân phối chuẩn

Phân phối chuẩn Phân phối chuẩn


4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng tỉ số hai phương sai từ phân phối chuẩn
Thống kê
𝑛1 − 1 𝑆12 𝜎22 𝑛1 −1,𝑛2 −1
𝐹= . ~𝐹
𝑛2 − 1 𝑆22 𝜎12
Khoảng tin cậy cho tỉ số hai phương sai:
𝑆22 𝑛1 −1,𝑛2 −1 𝜎22 𝑆22 𝑛1 −1,𝑛2 −1
2 𝐹1−𝛼 ≤ 2 ≤ 2 𝐹𝛼
𝑆1 2 𝜎1 𝑆1 2
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng tỉ số hai phương sai từ phân phối chuẩn
𝑛1 −1,𝑛2 −1 𝑛1 −1,𝑛2 −1
• Tìm giá trị 𝐹1−𝛼 và 𝐹𝛼 biết rằng 𝛼 = 0.05, 𝑛1 =
10, 𝑛2 = 8.
𝑛 ,𝑛 1
• Nhận xét: 𝐹1−𝛼1 2 = 𝑛 ,𝑛
𝐹𝛼 2 1
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng tỉ số hai phương sai từ phân phối chuẩn
𝑛1 ,𝑛2 𝑛1 ,𝑛2
• Tìm giá trị 𝐹𝛼 và 𝐹1−𝛼 biết rằng 𝛼 = 0.05, 𝑛1 = 10, 𝑛2 = 8.
𝑛1 ,𝑛2 1
• Nhận xét: 𝐹1−𝛼 = 𝑛 ,𝑛
𝐹𝛼 2 1
• Tra bảng cho phân phối Fisher:
10,8
• 𝐹0.05 = 3.347
10,8 1 1
• 𝐹0.95 = 8,10 = = 0.326
𝐹0.05 3.072
4. Ước lượng khoảng cho tham số tổng thể
phân phối chuẩn.
• Ước lượng tỉ số hai phương sai từ phân phối chuẩn
Ví dụ 12: Giá cổ phiếu của hai công ty A và B là các biến ngẫu nhiên
phân phối chuẩn. Theo dõi giá cổ phiếu của hai công ty đó trong 1 tháng
(30 ngày), ta tính được phương sai mẫu lần lượt là 0.5 và 0.3. Với độ tin
cậy 95%, hãy ước lượng tỉ số của hai phương sai giá cổ phiếu của hai
công ty đó.
• Tóm tắt: 𝑛1 = 30 𝑛2 = 30
𝑠1 = 0.5 𝑠2 = 0.3
Khoảng tin cậy cho tỉ số hai phương sai:
𝑆22 𝑛1 −1,𝑛2 −1 𝜎22 𝑆22 𝑛1 −1,𝑛2 −1
2 𝐹1−𝛼 ≤ 2 ≤ 2 𝐹𝛼
𝑆1 2 𝜎1 𝑆1 2
Ta có: độ tin cậy 95% ⇒ 𝛼 = 0.05
30−1,30−1 29,29 1 1
𝐹 0.05 = 𝐹0.975 = 29,29 = = 0.482
⇒ 1− 2 𝐹0.025 2.074
29,29
𝐹0.025 = 2.074
Vậy khoảng tin cậy 95% cho tỉ số hai phương sai:
0.32 𝜎22 0.32 𝜎22
2
× 0.482 ≤ 2 ≤ 2
× 2.074 ⟺ 0.174 ≤ 2 ≤ 0.747
0.5 𝜎1 0.5 𝜎1

You might also like