You are on page 1of 12

82

CHƯƠNG 5
ƯỚC LƯỢNG THAM SỐ
Mục lục chương 5

5.1. Các tiêu chuẩn ước lượng .............................................................................. 82


5.2. Khoảng tin cậy cho giá trị trung bình .............................................................. 84
5.3. Khoảng tin cậy cho độ lệch hai giá trị trung bình............................................. 86
5.4. Khoảng tin cậy cho giá trị tỷ lệ ....................................................................... 88
5.5. Khoảng tin cậy cho độ lệch hai giá trị tỷ lệ ...................................................... 90
5.6. Khoảng tin cậy cho giá trị phương sai............................................................. 90
5.7. Khoảng tin cậy cho giá trị dự báo ................................................................... 92

5.1. CÁC TIÊU CHUẨN ƯỚC LƯỢNG.


Cho tổng thể đặc trưng bởi biến ngẫu nhiên X , và X 1 , X 2 ,..., X n là các biến ngẫu nhiên quan sát từ
tổng thể có phân phối xác suất với tham số  chưa biết. Thống kê Tn  T  X 1 , X 2 ,..., X n  dùng để
ước lượng cho  gọi là một hàm ước lượng. Với mỗi bộ giá trị quan sát  x1 , x2 ,..., xn  thì giá trị
t  T  x1 , x 2 ,..., x n  gọi là giá trị ước lượng cho tham số 

5.1.1 Ước lượng không chệch.


Cho hàm ước lượng Tn  T  X 1 , X 2 ,..., X n  Tn được gọi là
 Ước lượng không chệch cho  nếu ETn   .
 Nếu ETn   thì ETn   gọi là độ lệch của ước lượng. Tn được gọi là ước lượng tiệm cận không
chệch cho  nếu lim ETn   .
n

Mức độ tốt của một số ước lượng được đánh giá bằng cách quan sát hành vi của nó trong sự chọn
mẫu lặp lại. Chúng ta hãy xem xét sự giống nhau sau đây. Trên nhiều khía cạnh, thì sự ước lượng
điểm là tương tự với việc bắn một khẩu súng vào một mục tiêu.

Ví dụ 5.1 Giả sử rằng một người đàn ông bắn một phát súng duy nhất vào một mục tiêu và phát
súng đó đã trúng ngay điểm đen. Liệu chúng ta có thể kết luận rằng ông ta là một xạ thủ cừ khôi?
Câu trả lời là không - không một ai trong số chúng ta ắt sẽ bằng lòng giữ mục tiêu đó trong khi
phát súng thứ hai được bắn đi. Đến khi nào mà sự chính xác của ông ta đã được quan sát thấy
trong những lần bắn được lặp đi lặp lại, với tất cả phát súng đều trúng vào gần điểm đen, thì chúng
ta ắt mới có thể tuyên bố rằng ông ta là một tay súng giỏi.

Về mặt hình ảnh ta có thể xem xét trường hợp ước lượng chệch và không chệch như sau:
CHƯƠNG 5 : ƯỚC LƯỢNG KHOẢNG 83

Khi ta đã đưa ra một ước lượng không chệch thì đặc trưng thứ hai đáng mong ước của một ước
lượng là khoảng rộng (được đo bằng phương sai) của phân phối mẫu phải càng nhỏ càng tốt. Điều
này đảm bảo rằng, với một xác suất cao, một sự ước lượng riêng lẻ sẽ rơi gần vào giá trị đúng của
tham số. Các phân phối mẫu cho hai ước lượng không bị lệch, một với phương sai nhỏ và ước
lượng kia với một phương sai lớn hơn, đương nhiên là chúng ta sẽ thích ước lượng với phương
sai nhỏ hơn bởi vì những sự ước lượng có xu hướng nằm gần với giá trị đúng của tham số hơn là
với phương sai lớn hơn.

Định lý. Giả sử X 1 , X 2 ,..., X n là các biến ngẫu nhiên lấy từ tổng thể có trung bình là  và độ lệch
chuẩn là  . Khi đó

X 1  X 2  ...  X n
 X là một ước lượng không chệch cho  .
n
n
1 2
 Sˆ 2    X i  X  là một ước lượng tiệm cận không chệch cho  2 .
n i 1
n ˆ2
 S2  S là một ước lượng không chệch cho  2 .
n 1

5.1.2 Khoảng tin cậy.


Khi xây dựng một ước lượng khoảng cho một tham số, chúng ta xác định hai điểm mà bên trong
khoảng đó chúng ta mong đợi giá trị của tham số chưa biết đó rơi vào. Những ước lượng khoảng
được xây dựng để khi chọn mẫu lặp lại thì với một tỷ lệ lớn (gần 1) của các khoảng này sẽ bao
quanh tham số quan tâm. Tỷ lệ này được gọi là hệ số tin cậy, và khoảng tạo ra được gọi là khoảng
tin cậy.

Đối với một cỡ mẫu cố định, bề rộng của khoảng tin cậy tăng lên khi hệ số tin cậy gia tăng, một kết
quả mà đồng ý với trực giác của chúng ta. Chắc hẳn là nếu chúng ta mong muốn hơn rằng khoảng
này sẽ bao quanh µ, thì chúng ta ắt sẽ tăng bề rộng của khoảng. Bởi vì chúng ta chỉ chấp nhận các
khoảng tin cậy hẹp và hệ số tin cậy lớn hơn, nên chúng ta phải chỉ ra được một mối quan hệ giữa
hệ số tin cậy, khoảng tin cậy. Lựa chọn hệ số tin cậy được sử dụng trong một tình huống cho trước
được thực hiện bởi người làm thí nghiệm và tùy thuộc vào mức độ tin cậy mà người làm thí nghiệm
mong muốn đặt ra trong ước lượng này. Hệ số tin cậy phổ biến nhất có lẽ là các khoảng tin cậy
95%. Việc sử dụng các khoảng tin cậy 99% là ít phổ biến hơn bởi vì bề rộng khoảng lớn hơn được
tạo ra. Dĩ nhiên, lúc nào các bạn cũng có thể giảm bớt bề rộng này bằng cách gia tăng cỡ mẫu .

Ngoài các khoảng tin cậy hai phía (mà chúng ta đơn giản gọi là các khoảng tin cậy), chúng ta cũng
có thể xây dựng các khoảng tin cậy một phía cho những tham số.

Theo các tiêu chuẩn ước lượng, khi ta sử dụng bất kỳ hàm ước lượng Tn để ước lượng cho tham
số  thì khoảng ước lượng có dạng Tn   ,Tn    giá trị sai số  gọi là độ chính xác. Ở đây ta
84

không tuyệt đối tin rằng giá trị thật của tham số nằm trong khoảng Tn   ,Tn    , mà ta chỉ tin
rằng
P Tn      Tn     1  

Trong đó 1   là độ tin cậy.

Nhận xét.
 Khi độ chính xác  càng nhỏ thì độ tin cậy càng thấp.
 Khi Tn là ước lượng vững cho  , cố định độ chính xác  thì độ tin cậy 1    tiến đến 1
khi cở mẫu thực nghiệm n tiến đến vô cùng.
 Thông thường ta cố định độ tin cậy 1    rồi tìm khoảng tin cậy tương ứng.

5.2. Khoảng tin cậy cho giá trị trung bình.


5.3.1 Phân tích.
Gọi  là trung bình của tổng thể chưa biết. Từ giá trị quan sát X 1 , X 2 ,..., X n độc lập có cùng phân
phối chuẩn, ta xây dựng khoảng ước lượng cho  với độ tin cậy 1   .

X 1  X 2  ...  X n
Hàm ước lượng Tn  X  , ta xây dựng khoảng ước lượng thỏa:
n
P  X      X     1 

Định lý. Cho X 1 , X 2 ,..., X n là biến ngẫu nhiên có quy luật phân phối chuẩn với kỳ vọng là  và
 2 
phương sai là  2 , thì X có quy luật phân phối chuẩn X ~ N   ,  .
 n 

Định lý. Cho X 1 , X 2 ,..., X n là biến ngẫu nhiên có quy luật phân phối chuẩn với kỳ vọng là  và
phương sai là  2 , với X và S 2 là trung bình mẫu và phương sai mẫu (có hiệu chỉnh) ta có
X  X 
~ N  0;1  và ~ T n 1
 S
n n

 
  X   
Xét P  X      X     1    P       1 
    
 
 n n n
CHƯƠNG 5 : ƯỚC LƯỢNG KHOẢNG 85

 2  X 
Vì X ~ N   ;   Z  ~ N 0,1 
 n  2
n
Vì hàm ước lượng phụ thuộc vào  2 nên khoảng ước lượng cho  chia làm hai trường hợp
 Trường hợp  2 đã biết.
 
Ta có Z ~ N 0;1  P z /2  Z  z /2  1  

 
  X     
Và P       1   nên ta có  z /2    z /2
      n
 
 n n n n
 Trường hợp  2 chưa biết.
Trong thực tế ta thường xuyên không biết phương sai tổng thể  2 , trong trường hợp này ta vẫn
giả định tổng thể có quy luật phân phối chuẩn. Để đưa ra khoảng ước lượng cho  ta cần tham số
để ước lượng cho  2 , ta có:
X  X  1 X  n 1
 .  .
S  S  n  1 S 2
n n  n 2
X   n  1 S 2 ~  2,n1 nên X   n1
Trong đó ~ N 0;1 và Z ~T
 2 S
n n
n1 n1
 n1

Ta có Z ~ T  P t /2  Z  t /2  1   .

 
  X     
Và P       1   nên ta có  tn/21    tn /21 . .
      n
 
 n n n n
5.3.2 Quy tắc thực hành.

Khoảng ước lượng cho giá trị trung bình tổng thể  với độ tin cậy 1    là khoảng X   ; X   
trong đó giá trị độ chính xác  được tính theo công thức:
n  30 n  30
86

 2 đã biết   z /2

  z /2

n n
 2 chưa biết   z /2
S
  tn /21 .
S
n n

Trong đó   z /2 ; z /2 được tính theo phân phối chuẩn.
n
S
  tn /21 . ; tn/21 được tính theo phân phối Student
n

Ví dụ 5.2 Một công ty muốn ước lượng số tài liệu trung bình được chuyển bằng fax trong một
ngày. Kết quả thu được từ 15 ngày cho thấy trung bình một ngày có 267 trang tài liệu được chuyển
bằng fax, và theo kinh nghiệm từ các văn phòng tương tự thì độ lệch chuẩn là 32 trang. Với số tài
liệu chuyển bằng fax trong một một ngày có quy luật phân phối chuẩn, thì với độ tin cậy 95% ta
ước lượng được số tài liệu trung bình chuyển trong ngày nằm trong khoảng:
 
X  z /2 .    X  z /2 .
n n
Trong đó X  267,  32, n  15,1    95%  z /2  1.96
Vậy khoảng ước lượng là 250,8055    283,1945

Ví dụ 5.3 Công ty điện thoại một thành phố muốn ước lượng thời gian trung bình của một cuộc
điện đàm đường dài vào cuối tuần, mẫu ngẫu nhiên 20 cuộc gọi đường dài vào cuối tuần cho thấy
thời gian gọi trung bình là 14,8 phút và độ lệch chuẩn là 5,6 phút. Như vậy với độ tin cậy 95% ta
ước lượng được thời gian gọi trung bình nằm trong khoảng.
S S
X  tn/21 .    X  tn/21 .
n n
n 1
Trong đó X  14,8; S  5,6; n  20;1    95%  t /2  2,093
Vậy khoảng ước lượng là 12,1792    17,4208

5.3. Khoảng tin cậy cho độ lệch hai giá trị trung bình.
5.3.1 Phân tích
Gọi 1 , 2 là trung bình của 2 tổng thể, dựa trên việc khảo sát hai bộ mẫu độc lập của hai tổng thể
ta mong muốn chỉ ra sự khác biết của hai trung bình tổng thể này. Ta xây dựng khoảng ước lượng
cho 1  2 với độ tin cậy 1   .
Hàm ước lượng là Z  X 1  X 2 và khoảng ước lượng thỏa

  
P X 1  X 2    1  2  X 1  X 2    1    
Định lý. Nếu hai mẫu độc lập được lấy ngẫu nhiên từ hai tổng thể có trung bình và phương sai lần
lượt là 1 , 2 ,  12 ,  22 , thì phân phối cho độ lệch của hai giá trị trung bình theo quy luật phân phối
chuẩn với kỳ vọng và phương sai lần lượt là ( n1 , n2 lần lượt là cở mẫu của 2 mẫu 2 tổng thể)
 12  22
X  1  2 và  X  
1  X2 1  X2
n1 n2
5.3.2 Quy tắc thực hành
Trường hợp 1: Hai mẫu dữ liệu lấy độc lập.
Khoảng ước lượng cho độ chênh lệch giữa hai giá trị trung bình tổng thể  1  2  là khoảng
CHƯƠNG 5 : ƯỚC LƯỢNG KHOẢNG 87

X 1  X2   ; X1  X2   
Trong đó độ chính xác được tính theo công thức

n1 ; n2  30 
n1  30; X 1 ~ N 1 ; 12 
n2  30; X2 ~ N   ; 
2
2
2

Biết  12 ; 22  12  22  12  22
  z /2    z /2 
n1 n2 n1 n2
Chưa biết  2 S12 S22 S2 S2
  z /2    tn1/2n2 2 
n1 n2 n1 n2
Trong đó khi cỡ mẫu của hai mẫu đều nhỏ thì phương sai mẫu của kết hợp hai mẫu là
 n1  1 S12   n2  1 S22
S2 
n1  n2  2

 12  22
  z /2  ; z /2 được tính theo phân phối chuẩn.
n1 n2

S 2 S 2 n1 n2 2
  tn1/2n2 2  ; t /2 được tính theo phân phối Student.
n1 n2

Trường hợp 2: Hai mẫu dữ liệu lấy phối hợp từng cặp. (Hai mẫu dữ liệu phụ thuộc).
Giả sử ta có mẫu n cặp quan sát  x , y  lấy từ hai tổng thể X , Y :  x1 , y1  ;  x 2 , y 2  ;...,  x n , yn  , gọi
1 , 2 là trung bình của hai tổng thể. Ta lặp bộ dữ liệu mới là sự chênh lệch của từng cặp giá trị,
và d , d lần lượt là trung bình và độ lệch chuẩn của bộ dữ liệu mới. Với độ tin cậy 1   thì khoảng
ước lượng cho sự chênh lệch hai giá trị trung bình của hai tổng thể là khoảng
d   ;d   
Trong đó độ chính xác tính theo các trường hợp sau

n  30 n  30
2
 d đã biết  d
  z /2 d   z /2
n n
 d 2 chưa biết S Sd
  z /2 d   tn /21 .
n n
d
   z /2 ; z /2 được tính theo phân phối chuẩn.
n
S
   tn /21 . d ; tn /21 được tính theo phân phối Student.
n

Ví dụ 5.4 Công ty điện lực thực hiện các biện pháp khuyến khích tiết kiệm điện. Lượng điện tiêu
thụ ghi nhân ở 12 hộ gia đình trước và sau khi có các biện pháp khuyến khích tiết kiệm điện như
sau

Hộ gia Lượng điện tiêu thụ (kwh) Hộ gia Lượng điện tiêu thụ (kwh)
đình Trước Sau đình Trước Sau
1 73 69 7 74 75
88

2 50 54 8 87 78
3 83 82 9 69 64
4 78 67 10 72 72
5 56 60 11 77 70
6 74 73 12 75 63
Sự thay đổi trung bình về lượng điện tiêu thụ trước và sau khi có các biện pháp tiết kiệm với độ
tin cậy 95% nằm trong khoảng:
S S
d  tn /21 . d  1  2  d  tn/21 . d
n n
n 1
Trong đó d  3,4167; Sd  5,4848; n  12;1    95%  t /2  2,201

Khoảng ước lượng là 0,0682  1  2  6,9016

Ví dụ 5.5 Một công ty đang xem xét kế hoạch tiết giảm chi phí sản xuất thông qua việc xây dựng
dây chuyền sản xuất mới nhằm rút ngắn thời gian sản xuất sản phẩm. Ở dây chuyền sản xuất mới,
40 sản phẩm được sản xuất với thời gian trung bình 46,5 phút, và độ lệch chuẩn 8 phút. Còn dây
chuyền cũ 38 sản phẩm với thời gian trung bình là 51,2 phút, và độ lệch chuẩn 9,5 phút. Với độ tin
cậy 95% thì sự chênh lệch về thời gian trung bình sản xuất 1 sản phẩm nằm trong khoảng

S12 S22 S2 S2
X 1 
 X2  z /2 . 
n1 n2
 
 1  2  X1  X 2  z /2 . 1  2
n1 n2
 X  46,5; S 1  8 ; n1  40
Trong đó  1 và 1    95%  z /2  1,96
 X 2  51,2; S 2  9,5; n2  38
Vậy khoảng ước lượng là 8,6077  1  2  0,7923

5.4. Khoảng tin cậy cho giá trị tỷ lệ.


5.4.1 Phân tích.
Gọi p là giá trị tỷ lệ phần tử loại A trong một tổng thể. Từ giá trị quan sát X 1 , X 2 ,..., X n độc lập có
cùng phân phối nhị thức (trong đó X i  1 cho việc ở lần kiểm tra thứ ta được phần tử loại và
X i  0 khi không được phần tử loại ), ta cần lập khoảng ước lượng cho p với độ tin cậy 1   .
X 1  X 2  ...  X n
Xét hàm ước lượng Tn  f  , ta xây dựng khoảng ước lượng sao cho
n
P  f    p  f     1 
Định lý. Cho X 1 , X 2 ,..., X n là biến ngẫu nhiên có quy luật phân phối nhị thức, thì Tn  f theo quy
 pq 
luật phân phối chuẩn Tn  f ~ N  p; 
 n 

 
  f p  
Ta có P  f    p  f     1    P       1 
 pq pq pq 
 
 n n n 
pq f p  pq
Mà Tn  f ~ N  p;   ~ N  0;1  nên  z /2    z /2
 n  pq pq n
n n
Nhưng trong công thức độ chính xác thì p , q là các tham số tổng thể nên ta sẽ thay bằng tham số
mẫu, ta có:
CHƯƠNG 5 : ƯỚC LƯỢNG KHOẢNG 89

f 1  f 
  z /2
n
5.4.2 Quy tắc thực hành.
Khoảng ước lượng cho giá trị tỷ lệ p là khoảng  f   ; f    .

f 1  f 
Trong đó   z /2 , với z /2 là phân vị của phân phối chuẩn.
n

Ví dụ 5.6 Một nghiên cứu được thực hiện nhằm ước lượng thị phần của sản phẩm nội địa đối
với mặt hàng bánh kẹo. Kết quả điều tra 100 khách hàng cho thấy có 34 người dùng sản phẩm nội
địa. Với độ tin cậy 95%, ta có khoảng ước lượng cho tỷ lệ khách hàng dùng bánh kẹo nội địa là

f 1  f  f 1  f 
f  z /2 .  p  f  z /2 .
n n

34
Trong đó f  ; n  100;1    95%  z /2  1,96
100

Vậy khoảng ước lượng là 24,72%  p  43,28%

Ví dụ 5.7 Trung tâm Quốc gia về Thống kê Giáo dục báo cáo rằng 47% sinh viên cao đẳng làm
việc để trả học phí và chi phí sinh hoạt. Giả sử một mẫu của 450 sinh viên cao đẳng được sử dụng
trong nghiên cứu.
a. Cung cấp một khoảng tin cậy 95% cho tỷ lệ tổng thể sinh viên cao đẳng làm việc để trả cho học
phí và chi phí sinh hoạt.
b. Cung cấp một khoảng tin cậy 99% cho tỷ lệ tổng thể sinh viên cao đẳng làm việc để trả học phí
và chi phí sinh hoạt.
c. Điều gì xảy ra với sai số biên khi độ tin cậy gia tăng từ 95% đến 99%?
Giải.
a. Cung cấp một khoảng tin cậy 95% cho tỷ lệ tổng thể sinh viên cao đẳng làm việc để trả cho học
phí và chi phí sinh hoạt.
Ta có:
f  47%, n  450 , z / 2  1,96

f 1  f  0, 47  1  0, 47 
  z /2  1,96   0, 0461
n 450
 f   ; f      0, 47  0,0461;0, 47  0,0461   0, 4239;0,5161
b. Cung cấp một khoảng tin cậy 99% cho tỷ lệ tổng thể sinh viên cao đẳng làm việc để trả học phí
và chi phí sinh hoạt.
f  47%, n  450 , z /2  2,58

f 1  f  0, 47  1  0, 47 
  z /2  2,58   0, 0607
n 450
 f   ; f      0, 47  0,0607;0, 47  0,0607    0, 4093;0,5307 
c. Điều gì xảy ra với sai số biên khi độ tin cậy gia tăng từ 95% đến 99%?
Sai số biên với độ tin cậy 95%, bằng 0,0461, nhỏ hơn sai số biến với độ tin cậy 99%, bằng 0,0607,
là 0,0146.
90

5.5. Khoảng tin cậy cho độ lệch hai giá trị tỷ lệ.
5.5.1 Phân tích.
Gọi p1 , p2 lần lượt là tỷ lệ của phần tử loại A trong 2 tổng thể. Khoảng ước lượng cho độ lệch hai
tỷ lệ đối với độ tin cậy 1   thông qua hàm ước lượng Z  f1  f2 (với f1 , f2 lần lượt là tỷ lệ phần
tử loại A trên 2 mẫu độc lập của hai tổng thể) thỏa

P   f1  f2     p1  p2   f1  f2      1  

5.5.2 Quy tắc thực hành


Khoảng ước lượng cho độ lệch giữa hai giá trị tỷ lệ  p1  p2  là khoảng:
 f1  f 2   ; f1  f2   
Trong đó giá trị độ chính xác cho bởi:

f1  1  f1  f2  1  f2 
  z /2 . 
n1 n2

Được tính thông qua z /2 là phân vị của phân phối chuẩn.

Ví dụ 5.8 Kết quả điều tra từ mẫu ngẫu nhiên 1000 người ở mỗi thành phố cho thấy năm 2014
tỷ lệ thất nghiệp ở thành phố Hồ Chí Minh là 7,5%, ở thành phố Phan Thiết là 7,2%; với độ tin cậy
99% thì sự chệnh lệch về tỷ lệ thất nghiệp của 2 thành phố nằm trong khoảng

f1  1  f1  f2  1  f2  f1  1  f1  f2  1  f2 
 f1  f2   z /2 .   p1  p2   f1  f2   z /2 .  Trong đó
n1 n2 n1 n2
 p1  0,075; n1  1000
 và 1    99%  t /2  2,575
 p2  0,072; n2  1000
Vậy khoảng ước lượng là 0,027  p1  p2  0,033
Vì vùng giá trị nằm đều xung quanh 0 nên ta không thể kết luận thành phố nào có tỷ lệ thất nghiệp
cao hơn, ta chỉ có thể kết luận tỷ lệ thất nghiệp của thành phố Hồ Chí Minh trong khoảng từ thấp
hơn 2,7% đến cao hơn 3,3% so với thành phố Phan Thiết.

5.6. Khoảng tin cậy cho giá trị phương sai.


i. Phân tích.
Gọi  2 là phương sai của tổng thể chưa biết. Từ giá trị quan sát X 1 , X 2 ,..., X n độc lập có cùng phân
phối chuẩn, ta cần lập khoảng ước lượng cho  2 với độ tin cậy 1   . Xét hàm ước lượng Tn  S 2
, ta xây dựng khoảng ước lượng sao cho:

 
P A   2  B  1 
Định lý. Cho X 1 , X 2 ,..., X n là biến ngẫu nhiên có quy luật phân phối chuẩn với kỳ vọng là  và
phương sai là  2 , và S 2 là phương sai mẫu (có hiệu chỉnh). Thì ta có
 n  1 S 2 ~  2,n1
2
Là phân phối Chi bình phương với  n  1 bậc tự do.


2,n 1
Ta có P  /2  
2,n1

 12,n/21  1   .
CHƯƠNG 5 : ƯỚC LƯỢNG KHOẢNG 91

 2,n1  n  1 S 2 
P
Nên ta có   /2  ~  2,n1  12,n/2
1
  1   thay vào phương trình ta có
  2
 
  n  1 S 2 2  n  1 S 2 
 P      1 
  2,n1 2,/2n1 
 1 /2
  n  1 S 2  n  1  S 2 
Vậy khoảng ước lượng cho  2 với độ tin cậy 1   là  ; 
  2,n 1 2,/2n1 
 1 /2

ii. Quy tắc thực hành.


2 2

Khoảng tin cậy cho  2 với độ tin cậy 1    100% là S  1 ; S  2 .Khoảng tin cậy có công 
thức

  n  1 S 2  n  1  S 2 
 ; 
2,n 1
  1 /2 2,/2n1 

Trong đó 2,/2
n 1
; 12,n/2
1
tính theo phân vị Chi bình phương.

Đây là khoảng ước lượng hai phía, nghĩa là với giá trị chặn trên và chặn dưới chấp nhận sai số với
mức ý nghĩa  / 2 .100% . Trong trường hợp ước lượng một phía, nghĩa là chặn trên hoặc chặn
dưới sẽ chấp nhận sai số với mức ý nghĩa   100% ta có ước lượng tương ứng:

2
S 2  n  1
 Ước lượng phải (chặn trên) với độ tin cậy 1    100% :   .
2,n 1
S 2  n  1
 Ước lượng trái (chặn dưới) với độ tin cậy 1    100% :  2 .
 12,n1
Ví dụ 5.9 Khảo sát thời gian tự học (giờ) trong 1 tuần của sinh viên một trường cao đẳng, khảo
sát số liệu trên 78 sinh viên ta có bảng số liệu sau

Số giờ 5 6 7 8 9 10
Số sinh viên 2 25 30 15 4 2
Với độ tin cậy 95%, ước lượng cho phương sai thời gian tự học của sinh viên sẽ nằm trong khoảng

 n  1 S 2  n  1 S 2
 2 
12,n/21 2,/2n1
2,77
  0,025  54,62
Trong đó n  78; S 2  1,065 và 1    95%   2,77
  0,975  104,3
Vậy khoảng ước lượng cho phương sai là 0,7946   2  1,5014
92

5.7. Khoảng tin cậy cho dự đoán giá trị quan sát
i. Phân tích
Trong một số trường hợp ta phải dự đoán một giá trị sẽ xảy ra của biến ngẫu nhiên, ta sẽ đưa ra
một phương pháp để thu được khoảng dự đoán cho giá trị tương lai theo quy luật phân phối
chuẩn.Giả sữ X 1 , X 2 ,..., X n là biến ngẫu nhiên có quy luật phân phối chuẩn. Ta cần dự đoán khoảng
giá trị cho biến ngẫu nhiên X n 1 . Điểm dự đoán cho X n1 là trung bình mẫu X , với sai số dự đoán
là X n1  X .
 
Kỳ vọng của sai số dự đoán là E Xn1  X      0 
2  1
Phương sai của sai số dự đoán là Var  Xn1  X    
2
   2 1  
n  n
Vì giá trị quan sát X n 1 và trung bình mẫu hoàn toàn độc lập nên X n1  X có quy luật phân phối
chuẩn, do đó:

Z
X n 1  X  0
~ N  0,1 
1
 1
n
Thay thế  bằng S ta có

T
X n 1  X  0
~ T n 1
1
S 1
n
Ước lượng khoảng cho giá trị X n 1 bằng giá trị trung bình X với độ tin cậy 1    100% :
 
  X n 1  X  
 
P X    Xn1  X    1    P  
 1

1
   1 
1
 S 1 S 1 S 1 
 n n n

n 1 n1
Với T ~ T n1 ta có P t /2  T  t /2  1   
 1
Vậy  tn /21    tn/21 S 1  .
1 n
S 1
n
ii. Quy tắc thực hành.

Khoảng tin cậy cho X n 1 với độ tin cậy 1    100% là X   ; X    


1
Độ chính xác   tn/21 S 1  , tính theo phân vị phân phối Student.
n
 1 1
Khoảng ước lượng là  X  tn/21 S 1  ; X  tn /21 S 1   .
 n n

Ví dụ 5.10 Một bài viết trên tạp chí Vật liệu (năm 1989, Vol. II, số 4, tr. 275-281) mô tả các kết
quả của bài kiểm tra độ bám dính trên 22 mẫu hợp kim U-700. Bộ mẫu thu được như sau (theo
đơn vị megapascals)

19.8 10.1 14.9 7.5 15.4 15.4 15.4 18.5 7.9 12.7 11.9

11.4 11.4 14.1 17.6 16.7 15.8 19.5 8.8 13.6 11.9 11.4

Với độ tin cậy 95%, khoảng ước lượng cho giá trị dự đoán thứ 23 nằm trong khoảng
CHƯƠNG 5 : ƯỚC LƯỢNG KHOẢNG 93

1 1
X  tn/21 .S 1   X23  X  tn/21 .S 1 
n n
Trong đó X  13,71; S  3,55; n  22;1    95%  t 21,25  2,08
Vậy khoảng ước lượng cho dự đoán giá trị thứ 23 là : 6,16  X 23  21,26

You might also like