You are on page 1of 40

LÝ THUYẾT MẪU

&
ƯỚC LƯỢNG THAM SỐ

ThS. Nguyễn Đức Bằng


NỘI DUNG

⚫ LÝ THUYẾT MẪU
⚫ ƯỚC LƯỢNG ĐIỂM.
⚫ ƯỚC LƯỢNG KHOẢNG.
➢ƯỚC LƯỢNG TRUNG BÌNH.
➢ƯỚC LƯỢNG TỈ LỆ.
➢ƯỚC LƯỢNG PHƯƠNG SAI
ĐÁM ĐÔNG VÀ CÁC ĐẶC TRƯNG
3

Đám đông có N phần tử,


Phần tử mỗi phần tử có đặc điểm X
đánh dấu
(M) Phần tử thứ i
với đặc điểm xi
N
1
Trung bình đám đông :  =
N
x
i =1
i

N N
1 1
Phương sai đám đông :  =
2

N

i =1
(x i −  ) =
2

N
 i
(x
i =1
)2
−  2

Độ lệch chuẩn đám đông :  =  2

M
Tỉ lệ đám đông : p =
N
MẪU NGẪU NHIÊN & MẪU CỤ THỂ
4

chọn có giá trị cụ thể


Đám đông hoàn lại
X1 x1

X2 x2
Mẫu xi
Xi

Xn xn

Mẫu ngẫu nhiên Mẫu cụ thể


WX = (X1,X2,…,Xn) wx = (x1,x2,…,xn)
Mẫu cụ thể là bảng số liệu dạng thô :

x1 x2 … …. …
… … … xn-1 xn

Mẫu cụ thể là bảng số liệu dạng tần số:

Giá trị của xi x1 x2 … xk


Tần số ni n1 n2 … nk

Mẫu cụ thể là bảng số liệu dạng khoảng:

Giá trị của xi [1;2) [2;3) … [k-1;k)


Tần số ni n1 n2 … nk

5 Lưu ý: n1 + n2 +…+ nk = n
CÁC ĐẶC TRƯNG MẪU
6

Trên mẫu ngẫu nhiên :


1 n
Trung bình mẫu: X =  Xi
n i =1
Phương sai mẫu (hiệu chỉnh):
1 n
 ( Xi − X )
2
S =
2

n − 1 i =1
Độ lệch chuẩn mẫu (hiệu chỉnh): S = S 2

Tỉ lệ mẫu:

Trên mẫu cụ thể : x ; s 2 ; s; f


TÍNH CHẤT CỦA CÁC ĐẶC TRƯNG
MẪU NGẪU NHIÊN
7

Giả sử đám đông có trung bình đám đông là ;


phương sai đám đông là 2; tỉ lệ đám đông là p. Khi đó:

2
( )
E X = ; D X = ( ) n

E (S2 ) =  2

p (1 − p )
E ( F ) = p; D ( F ) =
n
QUY LUẬT PHÂN PHỐI XÁC SUẤT CỦA CÁC ĐẶC
TRƯNG MẪU NGẪU NHIÊN
8

Nếu X tuân theo luật phân phối chuẩn thì :

X − X −
n  N (0;1) n  Tn-1  St (n − 1)
 S

Nếu cỡ mẫu n lớn (n > 30) thì :

X − F−p
n  N (0;1) n  N (0;1)
S p. (1 − p )
BÀI TẬP 1
9

Chiều cao X(cm) của thanh niên trong một vùng có


phân phối chuẩn N(165cm,100cm2). Người ta đo ngẫu
nhiên chiều cao của 120 thanh niên ở vùng đó.
a) Tính xác suất để chiều cao trung bình của số thanh
niên đó sai lệch so với chiều cao trung bình của thanh niên
toàn vùng không quá 2cm?
b) Tính xác suất để chiều cao trung bình của số thanh
niên đó vượt quá 168cm?
BÀI TẬP 2
10

Giả sử một lô hàng chứa rất nhiều sản phẩm, với tỉ lệ


sản phẩm loại I của một lô hàng là 80%. Từ lô hàng đó,
người ta chọn mẫu ngẫu nhiên 100 sản phẩm.
a) Tính xác suất để tỉ lệ mẫu không nhỏ hơn 70%?
b) Với xác suất 95%, hãy cho biết trong 100 sản
phẩm đó có khoảng bao nhiêu sản phẩm loại I?
HƯỚNG DẪN BT2
11

p = 80%; n = 100.
a) Tính xác suất để tỉ lệ mẫu không nhỏ hơn 70%?
P(F0.7) = ?
b) Với xác suất 95%, hãy cho biết trong 100 sản phẩm
đó có khoảng bao nhiêu sản phẩm loại I?
P(Ff0) = 0.95 → f0 = ? → Số sản phẩm loại I
ƯỚC LƯỢNG ĐIỂM
Gọi  là tham số của đám đông cần ước lượng.

Từ đám đông, chọn mẫu ngẫu nhiên WX = (X1,X2,…,Xn)

Xây dựng hàm ước lượng:


ˆ = f ( X1 , X 2 ,..., X n )
Chọn mẫu cụ thể wX = (x1,x2,…,xn) và tính
ˆ = f ( x , x ,..., x )
0 1 2 n

Khi đó, ước lượng điểm của  là: ˆ0

12
CÁC LOẠI ƯỚC LƯỢNG ĐIỂM
13

1) Ước lượng không chệch :


ˆ là ước lượng không chệch của  nếu : ˆ
2) Ước lượng hiệu quả :
ˆ;ˆ là hai ước lượng không chệch của .
1 2

D ˆ1 D ˆ2 → ˆ1 là ước lượng hiệu quả hơn ˆ2

3) Ước lượng vững :


ˆ là ước lượng vững của  nếu :

lim P ˆ 1, 0
n
CÁC LOẠI ƯỚC LƯỢNG ĐIỂM
14

4) Ước lượng hợp lý cực đại :

Giả sử X có hàm mật độ f(x,). Trên mẫu cụ thể wx ta xây


dựng hàm hợp lý của tham số  như sau :

L x1 , x2 ,..., xn , f x1 , . f x2 , ... f xn ,
ˆ là ước lượng hợp lý cực đại của  nếu hàm L đạt CĐ tại đó
ƯỚC LƯỢNG ĐIỂM CHO CÁC THAM SỐ CỦA
ĐÁM ĐÔNG

a) X là ước lượng không chệch, hiệu quả nhất, vững,


hợp lý cực đại của .

b) S2 là ước lượng không chệch, hiệu quả nhất của 2.

c) F là ước lượng không chệch, hiệu quả nhất, vững,


hợp lý cực đại của p.
ƯỚC LƯỢNG KHOẢNG

Khảo sát mẫu → khoảng (1,2) sao cho với 


khá lớn cho trước, ta có:
P(1 <  < 2) = 

trong đó :
➢ (1,2) : khoảng ước lượng (khoảng tin cậy) của .
➢ : độ tin cậy của khoảng ước lượng.
➢  = 1 -  = P[(1,2)] : xác suất mắc sai lầm

16
ƯỚC LƯỢNG GIÁ TRỊ TRUNG BÌNH
Khoảng ước lượng đối xứng :

(
Khảo sát mẫu → khoảng X -  ; X +  sao cho )
P    ( X -  ; X +  )  = 
trong đó :

(X - ; X +  ) : khoảng ước lượng của .


 : độ chính xác hay sai số cho phép của ước lượng.

17
 = 95%

= 2.5%
2

−u0.025 0 u0.025

P (U  u0.025 ) = 0.025   ( u0.025 ) = 1 − 0.025 = 0.975


 u0.025  1.96

X −
U= n  N ( 0;1)


   = 1−    u = ?
2 2


 = u .   ( X −; X +  )
18
2
n


= 2.5%
2

( n −1) 0 ( n −1)
−t0.025 t0.025

P (T  t0.025
(10)
) = 0.025  t0.025  2.228
(10)

X −
T= n  Tn −1
S

   = 1−    t ( n −1) = ?
2 2

  ( X −; X +  )
S
 = t
( n −1)
.
19
2
n
TH1: Giả sử X có phân phối chuẩn và  đã biết.
20

X- 
Do U = n N (0;1) nên :

Với  = 1 -  → giá trị tới hạn chuẩn u/2 sao cho :

     
P  U  u  = 1 −   P  X - u <   X + u =γ
 2   2 n 2 n

Xét trên mẫu cụ thể, ta tìm được khoảng ước lượng là :


 
x − u    x + u
2 n 2 n
TH2: Giả sử X có phân phối chuẩn và  chưa biết.
21

X-
Do T = n Tn −1  St (n − 1) nên :
S
( n −1)
Với độ tin cậy  = 1 -  → giá trị tới hạn t
2

 ( n −1)   ( n −1) S ( n −1) S 


P  T  t  = 1 −   P  X − t    X + t =γ
 2   2 n 2 n

Xét trên mẫu cụ thể, ta tìm được khoảng ước lượng là :


 ( n −1) s s 
 x − t  ; x + t ( n −1) 
 2 n 2 n
Lưu ý: Nếu n > 30 thì St(n-1)  N(0;1)
BÀI TẬP 3
22

Đo đường kính của một chi tiết máy do một máy tiện
tự động sản xuất, ta có số liệu sau :

Đường 12 12,05 12,1 12,15 12,2 12,25 12,3 12,35 12,4


kính
Số chi 2 3 7 9 10 8 6 5 3
tiết máy

Hãy ước lượng đường kính trung bình của chi tiết máy
đó với độ tin cậy 95%
BÀI TẬP 4
23

Đo lượng cholesterol (đơn vị mg%) của một số người


dân trong một vùng, ta thu được kết quả sau :

Lượng 150 – 160 – 170 – 180 – 190 – 200 –


cholesterol 160 170 180 190 200 210

Số người 2 4 5 6 4 3

Giả sử lượng cholesterol tuân theo luật phân phối chuẩn


Hãy ước lượng lượng cholesterol trung bình của dân
trong vùng với độ tin cậy 90%
BÀI TẬP 5
24

Tuổi thọ của một loại bóng đèn được biết tuân theo
quy luật chuẩn với độ lệch chuẩn 100giờ. Chọn ngẫu
nhiên 120 bóng đèn để thử nghiệm, người ta thấy tuổi thọ
trung bình của mẫu này là 1000giờ.
a) Hãy ước lượng tuổi thọ trung bình của toàn bộ số
bóng đèn loại này với độ tin cậy 97%.
b) Nếu muốn sai số không quá 15 giờ và độ tin cậy
97% thì cần thử nghiệm ít nhất bao nhiêu bóng đèn ?
XÁC ĐỊNH ĐỘ TIN CẬY
VÀ KÍCH THƯỚC MẪU NHỎ NHẤT
n
➢Độ tin cậy : u u 2 0 u
2
n 2
2

➢Kích thước mẫu nhỏ nhất :

2
✓ Trường hợp  đã biết n u2 2
2

✓ Trường hợp  chưa biết thì ta thay  bằng s

25
ƯỚC LƯỢNG GIÁ TRỊ TRUNG BÌNH
26

Khoảng ước lượng phía trái:

(
Khảo sát mẫu → −; X +  ) sao cho : P ( < X + ) = 
Khoảng ước lượng phía phải:

(
Khảo sát mẫu → X -  ; + ) sao cho : P (  X - ) = 
TH1: X có phân phối chuẩn; 2 đã biết.

X −
Do U = n N(0;1) nên :

Với độ tin cậy  = 1 -  → giá trị tới hạn chuẩn u sao cho :

  
P  U < u  = 1 −   P    X − u =γ
 n

  
Khoảng ước lượng phía phải  x − u ; + 
 n 
  
Tương tự, khoảng ước lượng phía trái:  −; x + u 
 n
TH2: X có phân phối chuẩn; 2 chưa biết.

X −
Do T = n  St (n − 1) nên :
S
( n −1)
Với độ tin cậy  = 1 -  → giá trị tới hạn 
t
 ( n −1) S 
P T < t
( n −1)

 = 1 −   P    X − t =γ
 n

 ( n −1) s 
Khoảng ước lượng phía phải  x − t ; + 
 n 
 s 
Tương tự, khoảng ước lượng phía trái:  −; x + t( n −1) 
 n
Tóm tắt
29

Phân phối của X Cỡ mẫu Tính  Tính 

X phân phối  
u u
chuẩn, n n
2
 đã biết
X phân phối s s
n  30 ( n −1)
t ( n −1)
t
chuẩn, 2
n n
 chưa biết
X phân phối bất s s
kỳ, n > 30 u u
n n
 chưa biết 2
BÀI TẬP 6
30

Điều tra năng suất giống ngô A ở một vùng, ta có kết


quả như sau :

Năng suất 7 9 11 13 15 17
(tấn/ha)
Số ha 2 7 12 11 3 1

Giả sử năng suất của giống ngô A trong vùng tuân


theo luật phân phối chuẩn. Với độ tin cậy 95%, hãy cho
biết năng suất trung bình của giống ngô A ở vùng này tối
thiểu là bao nhiêu?
BÀI TẬP 7
31

Một công ty bột giặt B muốn thăm dò nhu cầu tiêu thụ
sản phẩm của công ty này tại khu vực A. Công ty tiến hành
điều tra và có kết quả cho ở bảng sau :

Nhu cầu
0,5-1 1-1,5 1,5-2 2-2,5 2,5-3 3-3,5 3,5-4
(kg/tháng)
Số hộ 21 147 192 78 34 16 12

Giả sử khu vực A có 500.000 hộ dân. Với độ tin cậy 97%,


hãy cho biết mỗi tháng khu vực A tiêu thụ tối đa bao nhiêu
tấn bột giặt của công ty B?
ƯỚC LƯỢNG TỈ LỆ
32

Khoảng ước lượng đối xứng : p  ( F −  ; F +  )


Với cỡ mẫu n lớn, f  p :
F−p
Z= n  N (0;1)
F (1 − F )
Với  = 1 -  cho trước ta tìm được u/2 sao cho :
   F (1- F ) F (1- F ) 
P  Z  u  =   P  F − u   p  F + u  =
 2  2 n 2 n 
Xét trên mẫu cụ thể → khoảng ước lượng cho p là :
 f (1 − f ) f (1 − f ) 
 f − u ; f + u 
 2 n 2 n 
XÁC ĐỊNH ĐỘ TIN CẬY
33
VÀ KÍCH THƯỚC MẪU NHỎ NHẤT

n
➢Độ tin cậy : f u
2 f (1 f)
n
➢Kích thước mẫu nhỏ nhất :

f (1- f )
✓ Trường hợp f đã biết n u 2
2
2
f
1
✓ Trường hợp f chưa biết n u2
2
2 4
ƯỚC LƯỢNG TỈ LỆ
34

Khoảng ước lượng không đối xứng :


F−p
Ta có Z = n  N (0;1)
F (1 − F )

Với  = 1 -  cho trước ta tìm được u sao cho :


 F (1- F ) 
P  Z  u  = 1 −   P  p  F − u  =
 n 
 f (1 − f ) 
Khoảng ước lượng phía phải:  f − u ;1
 n 
 f (1 − f ) 
Tương tự, khoảng ước lượng phía trái  0; f + u 
 n 
BÀI TẬP 8
35

Để ước lượng tỉ lệ sinh viên bị cận thị tại một trường Đại
học, người ta chọn ngẫu nhiên 200 sinh viên thì thấy có 118
sinh viên bị cận thị.
a) Với độ tin cậy 90%, hãy ước lượng tỉ lệ sinh viên bị
cận thị của trường Đại học này? Nếu muốn sai số không
quá 0,05 thì cần điều tra thêm bao nhiêu sinh viên nữa?
b) Giả sử trường Đại học có 50.000 sinh viên. Hãy ước
lượng số sinh viên bị cận thị với độ tin cậy 95%?
BÀI TẬP 9
36

Muốn biết số lượng cá có trong hồ lớn, người ta bắt lên


2000 con, đánh dấu xong thì thả trở lại hồ. Sau đó, người
ta bắt lên 400 con thì thấy có 80 con được đánh dấu.
Với độ tin cậy 95%, hãy cho biết số cá có trong hồ tối
đa là bao nhiêu?
BÀI TẬP 10
37

Chọn ngẫu nhiên 100 sản phẩm từ kho hàng chứa


15.000 sản phẩm thì thấy có 9 sản phẩm bị lỗi.
a) Với độ tin cậy 95%, hãy ước lượng số sản phẩm
bị lỗi có trong kho hàng?
b) Với độ tin cậy 95%, hãy ước lượng tỉ lệ sản phẩm
bị lỗi tối đa có trong kho hàng?
ƯỚC LƯỢNG PHƯƠNG SAI
38

TH1 : Giả sử X có phân phối chuẩn,  chưa biết


( n − 1) S 2
Ta có  =
2
  2 (n − 1)
2
Với  cho trước→ giá trị tới hạn  2
 ( n − 1);   ( n − 1)
2
1−
2 2

( n − 1) S 2
( n − 1) S 2
 2  (n − 1)   2   2 (n − 1)  2 2  2
1−
2 2   (n − 1)   (n − 1)
1−
2 2

 
Xét trên mẫu cụ thể:  (n − 1).s
  2
2
2
(n − 1).s 
; 2
2

 ( n − 1)  ( n − 1) 
 
1−
 
 2 2 
ƯỚC LƯỢNG PHƯƠNG SAI
39

TH2 : Giả sử X có phân phối chuẩn,  đã biết


n

 ( X i −  ) 2

Ta có  = i=1
2
 2
( n)
2
σ
Với  cho trước→ giá trị tới hạn 1− (n);   (n)
2 2

2 2
n n

 i
( X −  ) 2
 i
( X −  ) 2

 2  (n)   2   2 (n)  i=1


2  i=1
1−
2 2  2 (n)  2  ( n)
1−
2 2
 n n
2 
 i i −   − 
2
n ( x ) ni ( x i ) 
Xét trên mẫu cụ thể:  i=1 2 ; i=1 2 
   ( n)   ( n) 
 1− 
 2 2

BÀI TẬP 11
40

Mức hao phí nguyên liệu X cho một đơn vị sản phẩm
là ĐLNN tuân theo quy luật chuẩn.
Quan sát 28 sản phẩm ta thu được kết quả sau :

Mức hao phí nguyên liệu (g) 19 19,5 20 20,5


Số sản phẩm 5 6 14 3

Với độ tin cậy 90%, hãy ước lượng phương sai của X

You might also like