You are on page 1of 37

ĐẠI HỌC KIẾN TRÚC HÀ NỘI

BÀI GIẢNG TOÁN CAO CẤP

CHƯƠNG 3 : MẪU THỐNG KÊ VÀ


ƯỚC LƯỢNG THAM SỐ
(PHẦN 2)

Giảng viên: ThS. Nguyễn Xuân Quý

Email: quynx2705@gmail.com
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

NỘI DUNG CHÍNH

1. Đặt vấn đề

2. Ước lượng điểm và Ước lượng khoảng

3. Ước lượng khoảng cho một kỳ vọng:

• Khi biết σ 2 hoặc n ≥ 30

• Khi mẫu nhỏ (n < 30)

2
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

ĐẶT VẤN ĐỀ

− Như chúng ta đã biết, lý thuyết về suy luận thống kê bao

gồm phương pháp đưa ra những kết luận, khái quát về tổng

thể thông qua việc phân tích những thông tin thu được từ

mẫu ngẫu nhiên được chọn từ tổng thể đó.

− Suy luận thống kê được chia thành hai mảng chính: ước

lượng và kiểm định giả thuyết.

3
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

− Để phân biệt hai phần này ta xét ví dụ sau đây:

Một ứng cử viên tổng thống muốn ước lượng tỉ lệ cử tri ủng hộ ông

ta trong cả nước bằng cách lấy ý kiến của 200 cử tri, được chọn ngẫu

nhiên và độc lập từ các nơi khác nhau. Tỉ lệ trong mẫu ủng hộ ông ta

làm cơ sở để đưa ra ước lượng về tỉ lệ ủng hộ ông ta trong cả nước.

F Các kiến thức về phân phối của tỉ lệ sẽ giúp ta xác định

được độ chính xác của ước lượng.

Bài toán này là bài toán ước lượng tham số.

4
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

FF Khi ông ta tuyên bố tỉ lệ ủng hộ ông ta trên cả nước là

65%, thì vấn đề đặt ra đối với ứng cử viên đối lập là cần tìm

hiểu xem lời phát biểu trên có cơ sở hay không. Lúc này, ta

không ước lượng tham số mà phải đưa ra quyết định chấp

nhận hay không chấp nhận lời tuyên bố trên. Lại phải dựa

vào lý thuyết về mẫu và các số liệu thực nghiệm để đưa ra

quyết định với độ chính xác có thể xác định được.

Bài toán này là bài toán kiểm định giả thuyết.

5
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

Bài giảng này chủ yếu trình bày về phương pháp ước lượng

truyền thống để ước lượng cho

• giá trị trung bình

• tỷ lệ

• phương sai.

6
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

I. CÁC PHƯƠNG PHÁP ƯỚC LƯỢNG TRUYỀN THỐNG

1. Ước lượng điểm

Định nghĩa 1

Ước lượng điểm về một tham số chung của tổng thể η nào đó

là một giá trị đơn θ̂ của một thống kê Θ̂.

− Ví dụ:

• giá trị x là một ƯL điểm của trung bình tổng thể µ


nA
• giá trị f = là một ƯL điểm của tỷ lệ p của tổng thể.
n

7
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

Rất khó để thống kê Θ̂ dùng ước lượng tham số tổng thể θ

đạt độ chính xác tuyệt đối, nhưng ta cũng có thể hy vọng rằng

θ̂ không quá xa θ.

Định nghĩa 2

Thống kê Θ̂ được gọi là ước lượng không chệch của tham số

θ nếu thỏa mãn:


h i
E Θ̂ = θ.

8
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

− Nếu Θ̂1 và Θ̂2 là hai ước lượng không chệch của tham số

θ, thì ta sẽ chọn thống kê với phương sai nhỏ hơn.

− Khi s2 < s2 ta nói Θ̂1 là ước lượng hiệu quả hơn Θ̂2.
Θ̂1 Θ̂2

Định nghĩa 3

Xét tất cả các ước lượng không chệch của tham số θ, ước

lượng có phương sai nhỏ nhất được gọi là ước lượng hiệu

quả của θ.

9
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

10
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

Chú ý

F Ước lượng điểm cho kỳ vọng µ là x.


nA
F Ước lượng điểm cho tỉ lệ p là tần số f = .
n
F Ước lượng điểm cho phương sai σ 2 là phương sai hiệu

chỉnh s02.

Cả ba ước lượng điểm trên đều là Ước lượng không chệch.

11
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

??? ƯL điểm có nhược điểm gì?

2. Ước lượng khoảng

Giả sử cần ước lượng cho tham số θ.

− Ý tưởng: Cho trước độ tin cậy 1 − α (với α bé). Cần tìm một

khoảng (a, b) sao cho

P(a < θ < b) = 1 − α.

− Thường chọn KTC đối xứng (θ̄ − ε; θ̄ + ε) cho tham số θ.

→ Số ε gọi là độ chính xác.

12
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

II. ƯỚC LƯỢNG KHOẢNG CHO MỘT KỲ VỌNG

1. Khi biết σ 2

− Giả sử có một mẫu ngẫu nhiên gồm n phần tử được chọn

ra từ tổng thể có phân phối chuẩn với phương sai σ 2 đã biết.


X−µ
− Khi đó Z = √ ∼ N(0, 1) ⇒ P [Z > zα] = α.
σ/ n
h i h i
Do đó P Z > zα/2 = α/2 ⇒ P Z < −zα/2 = α/2,
x−µ
 
 
tức là P −zα/2 < Z < zα/2 = 1 − α
 
hay P −zα/2 <

√ < zα/2 = 1 − α.

σ/ n
 
 σ σ 
Suy ra P x − zα/2 √ < µ < x + zα/2 √  = 1 − α.
n n
13
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

Định lý

Nếu X là trung bình của một mẫu ngẫu nhiên cỡ n được lấy từ tổng

thể với σ 2 đã biết, thì khoảng tin cậy (1 − α)100% cho trung bình µ

xác định như sau


σ σ
x − zα/2 √ < µ < x + zα/2 √ ,
n n
trong đó zα/2 là giá trị z tạo nên một diện tích α/2 về bên phải của

nó, tức là P[Z > zα/2] = α/2.


σ σ
− Có thể viết đơn giản: µ = x ∓ zα/2 √ và ε = zα/2 √ gọi
n n
là độ chính xác.
14
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

Chú ý

Để tính giá trị zα/2 ta tra bảng ở Phụ lục, với giá trị diện tích

1 − α/2.

α
Chú ý: zα/2 = uγ với γ = 1 −
2

15
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

VD 1. Hàm lượng kẽm trung bình thu được khi đo ở 36 địa

điểm khác nhau trên một dòng sông là 2, 6 gam/mi-li-lít. Biết

rằng độ lệch chuẩn của tổng thể là 0, 3. Hãy tìm các khoảng tin

cậy 95% cho hàm lượng kẽm trung bình trong dòng sông đó.

16
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

Giải. − Từ giả thiết: n = 36; x = 2, 6; σ = 0, 3 và α = 0, 05.

− Đây là bài toán ước lượng cho 1 kỳ vọng khi σ 2 đã biết.


σ σ
− Khoảng tin cậy 95% cho µ là x − uγ √ < µ < x + uγ √
n n
α
− Do γ = 1 − = 0, 975 nên uγ = 1, 96 (tra bảng thì biết !)
2
0, 3 0, 3
− Thay số được: 2, 6 − (1, 96) √ < µ < 2, 6 + (1, 96) √
36 36
hay 2, 5 < µ < 2, 7.

Vậy KTC cần tìm là (2, 5; 2, 7).

17
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

VD 2. Một mẫu ngẫu nhiên gồm 16 quan sát có giá trị trung

bình mẫu là 25 được lấy ra từ tổng thể tuân theo phân phối

chuẩn có độ lệch chuẩn bằng 6.

Hãy tìm khoảng ước lượng cho tham số trung bình tổng thể

với độ tin cậy 90%.

18
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

Giải. − Bài toán là ước lượng giá trị trung bình khi biết phương sai

tổng thể. Theo giả thiết có x = 25, σ = 6, n = 16.

− Với độ tin cậy 90% thì


α
α = 0, 1 ⇒ γ = 1 − = 0, 95 ⇒ uγ = 1, 645.
2
− Thay số ta được
1, 645.6 1, 645.6
25 − √ < µ < 25 + √
16 16
hay

22, 5325 < µ < 27, 4675.

Vậy khoảng tin cậy cần tìm là (22, 53 ; 27, 47).


19
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

VD 3. Hàm lượng kẽm trung bình thu được khi đo ở 36 địa

điểm khác nhau trên một dòng sông là 2, 6 gam/mi-li-lít. Biết

rằng độ lệch chuẩn của tổng thể là 0, 3.

a) Khi ước lượng khoảng với độ tin cậy 95% thì sai số là bao

nhiêu?

b) Muôn sai số của ước lượng không vượt quá 0, 05 thì cỡ

mẫu tối thiểu là bao nhiêu?

20
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

Giải. a) Bài toán ước lượng cho 1 kỳ vọng khi σ 2 đã biết.

Từ giả thiết có n = 36; X = 2, 6; σ = 0, 3 và α = 0, 05.

− Do α/2 = 0, 025 ⇒ zα/2 = uγ = 1, 96.

− Sai số hiện tại là:


σ 0, 3
ε = uγ. √ = 1, 96. √ = 0, 098.
n 36
σ u γ .σ !2
b) Từ ε = uγ. √ ⇒ n = .
n ε
!2
1, 96.0, 3
Do đó ε ≤ 0, 05 ⇔ n ≥ = 138, 3.
0, 05
Tức là cần lấy ở ít nhất n = ... địa điểm.
21
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

Chú ý

Trường hợp σ 2 chưa biết, nhưng cỡ mẫu n ≥ 30, ta vẫn làm

tương tự như trên, chỉ thay độ lệch chuẩn σ bằng độ lệch

chuẩn mẫu điều chỉnh s0. Tức là khi đó


s0
µ = x ∓ uγ √ .
n

22
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

VD 4. Thống kê tuổi thọ của 256 bóng đèn do một nhà sản
xuất, ta có bảng thống kê:
Tuổi thọ (giờ) Số bóng Tuổi thọ (giờ) Số bóng

1000 − 1100 4 1100 − 1200 10

1200 − 1300 16 1300 − 1400 20

1400 − 1500 36 1500 − 1600 48

1600 − 1700 42 1700 − 1800 32

1800 − 1900 26 1900 − 2000 14

2000 − 2100 8

Với độ tin cậy 95, 6%, hãy ước lượng tuổi thọ trung bình của

loại bóng đèn này.


23
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

Giải. Gọi X là tuổi thọ bóng đèn.

Bài toán thuộc dạng ước lượng giá trị trung bình với n = 256 ≥ 30

và σ 2 chưa biết.

Từ mẫu trên tính được x = 1587, 5 và s0 = 226, 83.


α
Với độ tin cậy 1 − α = 95, 6% ⇒ = 0, 022 ⇒ uγ = 2, 014.
2
Khi đó
s0
ε = uγ. √ = 28, 55.
n
Suy ra khoảng tin cậy cần tìm

(x − ε; x + ε) = (1558, 95; 1616, 05).


24
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

2. Khi chưa biết σ 2 (và n < 30)

Phân phối Student T(n)

Bnn liên tục T gọi là phân phối theo qui luật Student với n

bậc tự do nếu có hàm mật độ


 
Γ n2 "
t2
# − n
2
f (x) = √  1+ , ∀t.
n−1

π(n − 1).Γ n−1
2
n
Chú ý • E [T ] = 0, DT = .
n−2
• Khi n ≥ 30 thì phân phối T(n) xấp xỉ với N(0, 1).

25
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

Chú ý

σ2 X−µ
!
• Nếu X ∼ N µ, thì Z = √ ∼ N(0, 1).
n σ/ n
σ2
!
• Nếu X ∼ N µ, mà chưa biết σ thì
n

X−µ
T= √ ∼ T(n − 1),
S0 / n
với S0 là phương sai mẫu điều chỉnh.

• Hàm mật độ của T ∼ T(n) đối xứng qua Oy và xấp xỉ với

hàm mật độ f (x) của phân phối chuẩn tắc khi n đủ lớn.

26
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

Hàm mật độ của phân phối Chuẩn và phân phối Student với n = 1, 4, 10

27
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

Định lý

Giả sử x và s0 là trung bình và độ lệch chuẩn mẫu điều chỉnh của

một mẫu ngẫu nhiên được chọn từ tổng thể có phân phối chuẩn với

σ chưa biết. Khi đó khoảng tin cậy (1 − α)100% cho µ là


s0 s0
x − tγ √ < µ < x + tγ √ ,
n n
trong đó tγ là giá trị của t với n − 1 bậc tự do, sinh ra một diện tích
α α α
về bên phải của nó, tức là P[T > tγ] = γ=1−
2 2 2

28
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

VD 5. Một mẫu được lấy từ tổng thể có phân phối chuẩn với

số liệu:

9, 8 10, 2 10, 4 9, 8 10, 0 10, 2 9, 6.

Tìm khoảng tin cậy 95% cho giá trị trung bình của tổng thể.

29
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

VD 5. Một mẫu được lấy từ tổng thể có phân phối chuẩn với

số liệu:

9, 8 10, 2 10, 4 9, 8 10, 0 10, 2 9, 6.

Tìm khoảng tin cậy 95% cho giá trị trung bình của tổng thể.

Giải. − Đặt X là bnn với số liệu đã cho.

− Từ giả thiết có n = 7 α = 0, 05 và tính được


7 7
1X 1 X
x= xi = 10, 0 s0 = (xi − x)2 = 0, 283.
7 n−1
i=1 i=1

− Bài toán ƯL cho µ = E[X] khi chưa biết σ và cỡ mẫu n < 30.

30
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

α
− Từ α = 1 − 0, 95 = 0, 05 ⇒ γ = 1 − = 0, 975.
2
Tra bảng ta tìm được t0,975(6) = 2, 447 (số bậc tự do là 6).

− Do đó khoảng tin cậy 95% cho µ là


s0 s0
x − tγ √ < µ < x + tγ √
n n
thay số
0, 283 0, 283
10, 0 − (2, 447). √ < µ < 10, 0 + (2, 447). √
7 7
hay 9, 74 < µ < 10, 26.

31
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

Sinh viên tự giải

1. Điều tra năng suất lúa trên 100ha trồng lúa của một vùng, thu được
bảng số liệu:

Năng suất (tạ/ha) 41 44 45 46 48 52 54

Diện tích (ha) 10 20 30 15 10 10 5

a) Tìm ƯL không chệch của năng suất lúa trung bình.

b) Những thửa rộng có năng suất lúa từ 48 tạ/ha trở lên gọi là

những thửa ruộng năng suất cao. Tìm ƯL không chệch của tỉ

lệ diện tích lúa có năng suất cao trong vùng.

c) Với độ tin cậy 95%, hãy ước lượng năng suất trung bình của

toàn bộ vùng này.


32
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

2. Một mẫu ngẫu nhiên gồm 6 chiếc ô tô cùng loại có mức

tiêu thụ xăng (dặm/ga-lông) như sau:

18, 6 18, 4 19, 2 10, 8 19, 4 20, 5.

Hãy ước lượng khoảng tin cậy 90% cho mức tiêu thụ

xăng trung bình của loại ô tô trên với giả thiết là tổng

thể có phân phối chuẩn.

33
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

3. Thống kê tuổi thọ của một loại pin ta có bảng thống kê:
Tuổi thọ (h) Số pin Tuổi thọ (h) Số pin Tuổi thọ (h) Số pin

1000 − 1100 4 1100 − 1200 10 1200 − 1300 16

1300 − 1400 20 1400 − 1500 36 1500 − 1600 48

1600 − 1700 40 1700 − 1800 30 1800 − 1900 26

1900 − 2000 14 2000 − 2100 8 2100 − 2200 4

a) ƯL tuổi thọ trung bình của loại pin này với độ tin cậy 95%.

b) Qui ước pin có tuổi thọ trên 1700h là pin loại I. Hãy tìm ước

lượng không chệch của tỉ lệ pin loại I.

c) Ước lượng tuổi thọ trung bình của pin loại I với độ tin cậy

γ = 99%.

34
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

4. Để xác định trọng lượng trung bình của các bao bột

trong kho, người ta đem cân ngẫu nhiên 15 bao của kho

đó và tính được x = 39, 8kg và s02 = 0, 144. Hãy tìm

khoảng tin cậy đối xứng của trọng lượng trung bình các

bao bột trong kho với độ tin cậy 99%.

35
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

5. Một giống lúa mới được gieo trong 10 miếng đất thí

nghiệm có các điều kiện giống nhau thu được sản lượng

tính theo cùng một đơn vị như sau:

25, 4 28, 0 20, 1 27, 4 25, 6

23, 9 24, 8 26, 4 27, 0 25, 4.

Biết rằng sản lượng lúa là biến ngẫu nhiên có phân phối

chuẩn N(µ, σ 2). Tìm khoảng tin cậy 90% cho µ.

36
ThS. Nguyễn Xuân Quý TOÁN CAO CẤP

BÀI TẬP VỀ NHÀ

Mỗi SV về sưu tầm 3 bài tập (gồm Đề bài và Lời giải), mỗi

bài một dạng Ước lượng Khoảng cho trung bình µ:

• khi biết σ

• khi chưa biết σ và n > 30

• khi chưa biết σ và n < 30

(Yêu cầu: 3 bài với 3 độ tin cậy khác nhau)

37

You might also like