You are on page 1of 25

THỐNG KÊ SUY DIỄN

(INFERENTIAL STATISTICS)
Tổng thể thống kê của biến gốc X có N quan sát

 là đặc trưng của tổng thể ta


đang quan tâm

chọn n quan sát (x1, x2, …, xn)

là đặc trưng
của mẫu

2
• Thống kê suy diễn là dựa vào các giá trị thống kê từ mẫu
để suy diễn cho các tham số của tổng thể .
• Các tham số tổng thể thường quan tâm :
- Trung bình tổng thể,
- Tỷ lệ mang một tính chất A của tổng thể,
- Phương sai tổng thể.
• Do mẫu được chọn ngẫu nhiên, nên các giá trị thống kê
có thể có của mẫu là một biến ngẫu nhiên tuân theo một
quy luật phân phối xác suất nhất định. VD
• Việc xác định luật phân phối xác suất (phân phối chọn
mẫu) của các thống kê này sẽ hỗ trợ cho việc suy diễn
thống kê. (Bài đọc thêm_Phân phối chọn mẫu)
ƯỚC LƯỢNG
Khái niệm
• Ước lượng là dựa vào giá trị thống kê của một mẫu được
chọn ngẫu nhiên từ một tổng thể để suy diễn cho giá trị
của tham số (chưa biết) của tổng thể.
• Do mẫu được chọn ngẫu nhiên nên giá trị thống kê phản
ánh gần đúng giá trị tham số của tổng thể.
Phương pháp ước lượng
• Ước lượng điểm
• Ước lượng khoảng
ƯỚC LƯỢNG ĐIỂM
Dựa vào giá trị thống kê cụ thể của một mẫu ngẫu nhiên để
ước lượng cho giá trị tham số của tổng thể.

SỐ THỐNG KÊ ƯỚC LƯỢNG THAM SỐ TỔNG THỂ


n

 xi
x  i 1
 μ
n
xA
fA   PA
n
 xi  σ
1 2 2
S 2
  x 
n  1

5
Ví dụ: Giảng viên quan tâm đến điểm thi môn xác suất của các sinh
viên của một lớp. Một mẫu gồm 10 sinh viên được chọn ngẫu nhiên
từ lớp và có kết quả sau:
8 5 4 9 6 5 7 6 10 5
Nếu gọi:
• là điểm trung bình của cả lớp
• PA là tỷ lệ sinh viên giỏi của cả lớp (điểm ≥ 9)
•  Là độ lệch tiêu chuẩn của cả lớp
Từ số liệu thống kê trên, ta tính được:
• Điểm trung bình mẫu = 6,5 điểm
• Tỷ lệ sinh viên giỏi của mẫu fA = 20%
• Độ lệch tiêu chuẩn của mẫu s = 1,96 điểm
Ta có thể ước lượng:
= = 6,5 điểm ; PA = fA = 20% ;  = s = 1,96 điểm
ƯỚC LƯỢNG KHOẢNG
• Gọi  là đặc trưng của tổng thể cần ước lượng .

• Giả sử dựa vào mẫu quan sát , ta tìm được hai


biến ngẫu nhiên A và B sao cho :
P(A <  < B) = 1-  (0<<1)

• Gọi a và b là các giá trị cụ thể của A và B . Khoảng


(a,b) gọi là khoảng ước lượng của ,

• 1-  gọi là độ tin cậy của việc ước lượng.

7
ƯỚC LƯỢNG KHOẢNG CHO TRUNG BÌNH TỔNG THỂ

Trường hợp 1 (Biết phương sai tổng thể 2) :

Xét biến ngẫu nhiên: ~ N(0, 1)

Lúc đó: ) = 1- 

Ta suy ra:

) = 1- 

Hay: = 
8
Ví dụ : Một quy trình sản xuất các bao đường tinh chế. Trọng
lượng đường trong các bao tuân theo phân phối chuẩn với
độ lệch chuẩn của tổng thể σ = 1,2 kg. Một mẫu gồm 25 bao
đường được chọn ngẫu nhiên từ ca sản xuất thấy trọng
lượng trung bình là 19,8kg. Hãy ước lượng trung bình của tất
cả các bao sản xuất trong ngày với độ tin cậy 95%.

9
Gọi µ là trọng lượng trung bình của các bao đường
Ta có: = 19,8 kg ; = 1,2kg ; n = 25 bao ; =0,95
Áp dụng công thức :

Kết luận: Với độ tin cậy 95% , Trọng lượng trung bình của
các bao đường được ước lượng trong khoảng từ 19,33 kg
đến 20,27 kg.
Cách tra hệ số tin cậy Z từ bảng phân phối chuẩn
hóa (bảng Z) :

• Từ độ tin cậy 1 -  ta tính được giá trị (1 - /2)

• Dựa vào bảng Z (trừ cột đầu đầu tiên và hàng đầu
tiên) tìm vị trí giá trị (1 - /2)

• Xem giá trị này nằm ở hàng nào và cột nào

• Giá trị Z/2 sẽ bằng giá trị của hàng cộng với giá
trị của cột tương ừng.

11
Với độ tin cậy 1 -  = 0.95  1 - /2 = 0.975
Nhìn vào bảng ta thấy giá trị 0.975 nằm ở hàng 1.9 và cột 0.06
Do đó giá trị hệ số tin cậy Z/2 = 1.9 + 0.06 = 1.96
12
Trường hợp 2 (Không biết phương sai tổng thể):

Xét biến ngẫu nhiên: ~ t(n-1)

Lúc đó: ) = 1- 

, ,
Ta suy ra:

Hay: = 

13
Ví dụ: Một nghiên cứu nhằm tìm hiểu năng xuất lúa
tại một xã, người ta tiến hành thu thập ngẫu nhiên 25
thửa ruộng (có điều kiện canh tác giống nhau) thì có số
liệu sau : Năng suất trung bình mẫu là 45.5 tạ/ha và độ
lệch chuẩn của mẫu S = 4 tạ/ha. Biết rằng năng suất
của giống lúa đó tuân theo quy luật phân phối chuẩn.
Hãy ước lượng năng suất lúa trung bình của xã với độ
tin cậy 95%.

14
Gọi µ là năng suất lúa trung bình của xã
Ta có: = 45,5 tạ/ha ; s = 4 tạ/ha ; n = 25 bao ; =0,95
Áp dụng công thức:

Kết luận: Với độ tin cậy 95%, năng suất lúa trung bình của
xã được ước lượng trong khoảng từ 43,85 đến 47,15 tạ/ha
Cách tra hệ số tin cậy t từ bảng phân phối student
(bảng t) :

• Từ độ tin cậy 1 -  ta tính được giá trị /2

• Từ số quan sát của mẫu thống kê ta xác định độ


bậc tự do = n -1

• Dựa vào bảng t , hệ số tin cậy t n-1, /2 chính là giá


trị giao bởi hàng n -1 và cột /2

16
Với độ tin cậy 1 -  = 0.95  /2 = 0.025 ; n = 10  n-1 = 9
Nhìn vào bảng ta tìm được hệ số tin cậy t 9 , 0.025 = 2.2622
17
ƯỚC LƯỢNG KHOẢNG CHO TỶ LỆ TỔNG THỂ
Giả sử có:
• 1 mẫu ngẫu nhiên gồm n quan sát
• fA là tỷ lệ các quan sát có tính chất A nào đó trong mẫu.
• Với mẫu lớn (n*fA(1 - fA) > 5 ), khoảng tin cậy (1-)100% của tỷ lệ
pA trong tổng thể , được xác định bởi công thức :

Xét biến ngẫu nhiên: ~ N(0,1)

Lúc đó: ) = 1- 

Ta suy ra:

Hay: PA = fA  18
Ví dụ : Một nghiên cứu được thực hiện nhằm ước
lượng thị phần bánh kẹo nội địa.Kết quả điều tra
mẫu ngẫu nhiên 100 khách hàng cho thấy có 34
khách hàng dùng bánh kẹo nội địa.Với độ tin cậy
95%, hãy ước lượng tỷ lệ khách hàng sử dụng
bánh kẹo nội địa.

19
Gọi PA là tỷ lệ sử dụng bánh kẹo nội địa
Ta có: fA = 0,34 ; n = 100 người ; = 0,95
Áp dụng công thức:
f A (1  f A ) f A (1  f A )
fA  Z α  P  fA  Z α
2 n 2 n

0.34(1  034) 0.34(1  034)


0.34  1.96  P A  0.34  1.96
100 100

0.2472  P A  0.4328  24.72%  P A  43.28%

Kết luận : với độ tin cậy 95%, tỷ lệ sử dụng bánh kẹo


nội địa được ước lượng trong khoảng từ 24,72% đến
43,28% 20
ƯỚC LƯỢNG KHOẢNG CHO PHƯƠNG SAI TỔNG THỂ
Giả sử có :
• Một mẫu ngẫu nhiên gồm n quan sát được chọn từ tổng thể
có phân phối chuẩn.
• Khoảng tin cậy (1-)100% của phương sai tổng thể được
xác định bởi công thức :
Xét biến ngẫu nhiên: = ~
1-

P( < < )=
0 ,
,

Ta suy ra:

21
Ví dụ : Một nhà máy sản xuất quan tâm đến biến
thiên của tỷ lệ tạp chất trong một loại hương liệu
được cung cấp. Chọn ngẫu nhiên 15 mẫu hương
liệu cho thấy : độ lệch chuẩn về tỷ lệ tạp chất S =
2,36%. Hãy ước lượng khoảng phương sai tổng thể
(σ2) về tỷ lệ tạp chất của lô hương liệu với độ tin cậy
95%.

22
Gọi σ2 là phương sai của tổng thể
Ta có: s = 2,36 (%) ; n = 15 mẫu ; = 0,95
Áp dụng công thức:

Kết luận : Với độ tin cậy 95%, phương sai tổng thể được ước
lượng trong khoảng từ 2,98 đến 13,35
23
Cách tra hệ số tin cậy 2 từ bảng phân phối chi-Square

• Từ độ tin cậy 1 -  ta tính được giá trị /2 và 1- /2

• Từ số quan sát của mẫu thống kê ta xác định độ bậc


tự do = n -1

• Dựa vào bảng chi-Square,

- Hệ số tin cậy 2 n-1, /2 chính là giá trị giao bởi hàng
n -1 và cột 2 /2

- Hệ số tin cậy 2 n-1, 1- /2 chính là giá trị giao bởi hàng
n -1 và cột 2 1- /2
24
Với độ tin cậy 1 -  = 0.95  /2 = 0.025 ; 1- /2 = 0.975
n = 15  n-1 = 14
Nhìn vào bảng ta tìm được hệ số tin cậy 2 14 , 0.025 = 26.12
và 2 14 , 0.975 = 5.63 25

You might also like