You are on page 1of 34

CHƯƠNG 8

KIỂM ĐỊNH GIẢ THUYẾT


VỀ THAM SỐ CỦA TỔNG THỂ

Ths. Nguyễn Tiến Dũng


Viện Kinh tế và Quản lý, Trường ĐH Bách khoa Hà Nội
Email: dung.nguyentien3@hust.edu.vn
MỤC TIÊU CỦA CHƯƠNG

● Sau khi học xong chương này, người học sẽ


● Hiểu được kiểm định là gì và biết cách lập cặp giả
thuyết KĐ phù hợp với các bài toán KĐ 2 bên, bên
trái và bên phải
● Nắm được quy trình KĐGT tổng quát
● Kể tên được các chỉ tiêu KĐ với bài toán KĐGT
trên một tổng thể (trung bình, tỷ lệ, phương sai)
● Biết cách xác định xác suất tới hạn để bác bỏ H0
p-value
● Phát biểu và nêu được chỉ tiêu KĐ với các bài toán
KĐGT trên hai tổng thể (trung bình, tỷ lệ, phương
sai)
© Nguyễn Tiến Dũng Thống kê ứng dụng 2
CÁC NỘI DUNG CHÍNH

8.1 Các vấn đề chung về kiểm định


8.2 KĐ giả thuyết trên một tổng thể
8.3 KĐ giả thuyết trên hai tổng thể

© Nguyễn Tiến Dũng Thống kê ứng dụng 3


8.1 CÁC VẤN ĐỀ CHUNG VỀ KIỂM ĐỊNH

● 8.1.1 Đặt giả thuyết về tham số tổng thể


● Cặp giả thuyết H0 (giả thuyết không) và H1(Ha) (giả
thuyết đối)
● TD1: Một nghiên cứu muốn tìm hiểu mối liên hệ
giữa thời gian tự học và KQ học tập (GPA)
● Giả thuyết NC (nghi vấn khoa học): Giữa thời gian tự học
và GPA có mối liên hệ
● H0: Giữa thời gian tự học và GPA KHÔNG có mối liên hệ
● H1: Giữa thời gian tự học và GPA có mối liên hệ
● Để chứng minh nghi vấn của người NC là đúng, thì
người NC sẽ phải: thu thập DL  bác bỏ H0.

© Nguyễn Tiến Dũng Thống kê ứng dụng 4


● 8.1.2 Một số nguyên tắc liên quan đến việc
đặt giả thuyết
● H0:
● trạng thái bình thường; trạng thái gốc, không có dữ liệu
chứng minh
● phải có dấu bằng, không có liên hệ;
● H1:
● trạng thái ngược lại H0, không có dấu bằng, có liên hệ,
thể hiện nghi vấn của người nghiên cứu
● đòi hỏi dữ liệu, bằng chứng để chứng minh
● Bác bỏ H0 tức chấp nhận H1 là đúng
● TD: Khối lượng gói ngũ cốc µ = 368g

© Nguyễn Tiến Dũng Thống kê ứng dụng 5


8.1.3 Logic của bài toán kiểm định

● Nếu TB mẫu rất khác so với giá trị cần KĐ thì bằng
trực giác có thể bác bỏ H0 mà không cần KĐ
● Nếu TB mẫu gần với giá trị cần KĐ, cần một quy
tắc nhất quán để bác bỏ H0.

© Nguyễn Tiến Dũng Thống kê ứng dụng 6


8.1.4 Sai lầm Kiểu I và Sai lầm Kiểu II

● Sai lầm Kiểu I ● Sai lầm Kiểu II


● Sai lầm alpha ● Sai lầm beta
● Alpha = P(Bác bỏ ● Beta = P(Chấp nhận
H0/H0 đúng) H0/H0 sai)
● <Bắt nhầm> ● <Bỏ sót>
● Giảm alpha  Giảm ● Hiệu lực của KĐ
Sai lầm Kiểu I  ● Chấp nhận H0 ->
Tăng nguy cơ mắc nguy mắc sai lầm
Sai lầm Kiểu II kiểu II
● Bác bỏ được H0, chỉ
mắc Sai lầm Kiểu I

© Nguyễn Tiến Dũng Thống kê ứng dụng 7


8.1.5 Mức ý nghĩa của KĐ

● 8.1.5 Mức ý nghĩa của KĐ (Significance level)


● Alpha: sai lầm phạm phải khi bác bỏ H0
● CL = (1 – α).100% là độ tin cậy của KĐ
● Giá trị thường dùng: CL = 95% hay α = 0,05

© Nguyễn Tiến Dũng Thống kê ứng dụng 8


8.1.6 Xác suất tới hạn (p-value)

● Khi giảm α, khoảng ước lượng rộng ra  khả


năng bác bỏ H0 giảm
● Xác suất tới hạn p-value = giá trị nhỏ nhất của
α mà tại đó không thể bác bỏ H0 được nữa
● TD: n=100; s=10  H 0 :   368

● α1 = 0,1 (90%)  z α1/2= 1,645  H 1 :   368
● α2 = 0,05 (95%)  z α2/2= 1,96 x  366, 3

© Nguyễn Tiến Dũng Thống kê ứng dụng 9


8.1.7 KĐ một bên và KĐ hai bên

 H 0 :   0  H 0 :   0  H 0 :   0
  
 H1 :   0  H1 :   0  H1 :   0

Kiểm định bên trái Kiểm định hai bên Kiểm định bên phải

© Nguyễn Tiến Dũng Thống kê ứng dụng 10


8.2 KIỂM ĐỊNH GIẢ THUYẾT TRÊN MỘT TỔNG THỂ

● 8.2.1 KĐGT về TB tổng thể


● 8.2.2 KĐGT về tỷ lệ tổng thể
● 8.2.3 KĐGT về phương sai tổng thể

© Nguyễn Tiến Dũng Thống kê ứng dụng 11


8.2.1 KĐGT về TB tổng thể
● Quy trình KĐ
1. Lập cặp giả thuyết KĐ H0 và H1 và nhận diện bài toán KĐ
là hai bên, bên trái hay bên phải
2. Chọn mức ý nghĩa a
3. XĐ giá trị tính toán (giá trị thống kê) của chỉ tiêu KĐ: zStat,
tStat … (SGK: ztt, ttt …)
4. Có 2 cách tiếp cận:
● Cách 1 (Cách tiếp cận giá trị tới hạn): XĐ giá trị tra bảng chỉ tiêu
KĐ: za, za/2, ta, ta/2 ...
● Cách 2 (Cách tiếp cận xác suất tới hạn hay p-value): từ chỉ tiêu KĐ
tính -> tính ra p-value.
5. Áp dụng quy tắc bác bỏ H0 để ra quyết định về việc bác
bỏ hay chấp chận H0
● Cách 1: So sánh giá trị tính toán với giá trị tra bảng của chỉ tiêu KĐ
● Cách 2: So sánh p-value và a
6. Kết luận
© Nguyễn Tiến Dũng Thống kê ứng dụng 12
8.2.1.1 Trường hợp biết phương sai tổng thể
x  0
● Chỉ tiêu KĐ zStat z Stat 
/ n
● Quy tắc bác bỏ H0 (theo giá trị tới
hạn)

 H 0 :   0  H 0 :   0  H 0 :   0
  
 H1 :   0  H1 :   0  H1 :   0
z Stat   za  z Stat   za / 2 z Stat  za

 z Stat  za / 2

© Nguyễn Tiến Dũng Thống kê ứng dụng 13


8.2.1.2 Trường hợp không biết phương sai tổng thể, cỡ
mẫu lớn (n≥30)
● Chỉ tiêu KĐ chính xác cần là tStat
● Do cỡ mẫu lớn, xấp xỉ t bằng z cho đơn
giản -> cChỉ tiêu KĐ zStat x  0
z Stat 
● Thay PS tổng thể bằng PS mẫu s/ n
● Quy tắc bác bỏ H0

 H 0 :   0  H 0 :   0  H 0 :   0
  
 H1 :   0  H1 :   0  H1 :   0
Baùc boû H 0 neáu Baùc boû H 0 neáu Baùc boû H 0 neáu
z Stat   za  z Stat   za / 2 z Stat  za

 z Stat  za / 2

© Nguyễn Tiến Dũng Thống kê ứng dụng 14


8.2.1.3 Trường hợp không biết phương sai tổng thể, cỡ
mẫu nhỏ (n< 30)
● Chỉ tiêu KĐ tStat x  0
t Stat 
● Quy tắc bác bỏ H0 s/ n

 H 0 :   0  H 0 :   0  H 0 :   0
  
 H1 :   0  H1 :   0  H1 :   0
t  t n 1;a t  tn 1;a / 2 t  tn 1;a

t  tn 1;a / 2

© Nguyễn Tiến Dũng Thống kê ứng dụng 15


8.2.1.4 Cách tiếp cận p-value trong việc bác bỏ H0

● Tính chỉ tiêu KĐ zStat hoặc tStat (tính)


● Tìm xác suất P tương ứng với bài toán KĐ
(hai bên, bên trái, bên phải). Đó chính là p-
value
● KĐ hai bên: p-value = 2.P(z ≥ |zStat|)
● KĐ bên trái: p-value = P(z ≤ zStat)
● KĐ bên phải: p-value = P(z ≥ zStat)
● So sánh giá trị p-value với α
● Nếu p-value < α thì bác bỏ H0
● Nếu p-value ≥ α thì chấp nhận H0
© Nguyễn Tiến Dũng Thống kê ứng dụng 16
8.2.2 KĐGT về tỷ lệ tổng thể
● Điều kiện cỡ mẫu đủ lớn:
● np ≥ 5 p  p0
● n(1-p) ≥ 5 z Stat 
p 0 (1  p0 ) / n
● Chỉ tiêu KĐ
● Quy tắc bác bỏ H0

 H 0 : pˆ  p0  H 0 : pˆ  p0  H 0 : pˆ  p0
  
 H 1 : pˆ  p0  H 1 : pˆ  p0  H 1 : pˆ  p0
z Stat   za  z Stat   za / 2 z Stat  za

 z Stat  za / 2

© Nguyễn Tiến Dũng Thống kê ứng dụng 17


8.2.3 KĐGT về phương sai tổng thể
( n  1) s 2
● Chỉ tiêu KĐ  Stat
2

 2
● Quy tắc bác bỏ H0 0

KĐ bên trái KĐ hai bên KĐ bên phải

 2   02  2   02  2   02


 2  2  2
   0
2
   0
2
   0
2

 2
Stat  2
n 1;1a   
2
Stat
2
n 1;a / 2
 2
Stat  2
n 1;a
 2

 Stat   2
n 1;1a / 2

© Nguyễn Tiến Dũng Thống kê ứng dụng 18


Phân phối Chi bình phương

© Nguyễn Tiến Dũng Thống kê ứng dụng 19


KĐ Chi bình phương
KĐ bên trái KĐ hai bên KĐ bên phải

© Nguyễn Tiến Dũng Thống kê ứng dụng 20


© Nguyễn Tiến Dũng Thống kê ứng dụng 21
8.3 KĐGT TRÊN HAI TỔNG THỂ

● 8.3.1 KĐGT về chênh lệch của 2 TB tổng thể


● 8.3.2 KĐGT về chênh lệch của 2 tỷ lệ tổng thể
● 8.3.3 KĐGT về tính bằng nhau của 2 phương
sai tổng thể

© Nguyễn Tiến Dũng Thống kê ứng dụng 22


8.3.1 KĐGT về chênh lệch của hai TB tổng thể

● 8.3.1.1 Trường hợp 2


( x1  x2 )  d 0
mẫu độc lập, biết PS z
 12  22
● Giả thuyết KĐ 
n1 n2
● Chỉ tiêu KĐ
● Quy tắc bác bỏ H0

 H 0 : 1   2  d 0  H 0 : 1   2  d 0  H 0 : 1   2  d 0
  
 H 1 : 1   2  d 0  H 1 : 1   2  d 0  H 1 : 1   2  d 0
z   za  z   za /2 z  za
z  z
 a /2

© Nguyễn Tiến Dũng Thống kê ứng dụng 23


8.3.1.2 Trường hợp 2 mẫu độc lập, không biết PS, cỡ
mẫu lớn
● Thay PS tổng thể bằng PS mẫu

( x1  x2 )  d 0
z
s12 s22

n1 n2

 H 0 : 1   2  d 0  H 0 : 1   2  d 0  H 0 : 1   2  d 0
  
 H 1 : 1   2  d 0  H 1 : 1   2  d 0  H 1 : 1   2  d 0
z   za  z   za /2 z  za
z  z
 a /2

© Nguyễn Tiến Dũng Thống kê ứng dụng 24


8.3.1.3 Trường hợp 2 mẫu độc lập, không biết phương
sai, cỡ mẫu nhỏ
● Giả định 2 tổng thể có phân phối normal
● Trường hợp A: PS 2 tổng thể bằng nhau 
thay 2 PS mẫu bằng 1 PS chung
( n1  1) s  ( n2  1) s
2 2
s 
2 1 2

n1  n2  2
p

( x1  x2 )  d 0
tStat 
1 1
sp 
n1 n2

© Nguyễn Tiến Dũng Thống kê ứng dụng 25


● Quy tắc bác bỏ H0
 H 0 : 1   2  d 0  H 0 : 1   2  d 0  H 0 : 1   2  d 0
  
 H 1 : 1   2  d 0  H 1 : 1   2  d 0  H 1 : 1   2  d 0
t   tn1  n2  2;a  t   tn1  n2  2;a /2 t  tn1  n2  2;a

 t  tn1  n2  2;a /2

© Nguyễn Tiến Dũng Thống kê ứng dụng 26


8.3.1.3 Trường hợp 2 mẫu độc lập, không biết PS tổng
thể, cỡ mẫu nhỏ (tiếp)
● Trường hợp B: 2 PS tổng thể khác nhau
● Chỉ tiêu KĐ t
● Số bậc tự do df
2
s 2
s  2

  
s 
1 2 2
( x1  x2 )  d 0  n1 n2 
2
x1 s 2
x2
t df  2 2

s2
s2
s 
2
s  2 s x41 s x42
1
 2 1
   
2 
n1 n2  n1    n2  n1  1 n2  1
n1  1 n2  1

© Nguyễn Tiến Dũng Thống kê ứng dụng 27


● Quy tắc bác bỏ H0
 H 0 : 1   2  d 0  H 0 : 1   2  d 0  H 0 : 1   2  d 0
  
 H 1 : 1   2  d 0  H 1 : 1   2  d 0  H 1 : 1   2  d 0
t   tdf ;a  t   tdf ;a /2 t  tdf ;a

 t  tdf ;a /2

© Nguyễn Tiến Dũng Thống kê ứng dụng 28


8.1.3.4 Trường hợp 2 mẫu cặp
● Tổng thể 1: x1
● Tổng thể 2: x2
● Tạo biến chênh lệch d = x1 – x2 hay di = x1i – x2i
● Trở về trường hợp KĐGT trên 1 tổng thể d
● Nếu n ≥ 30 thì chỉ tiêu KĐ là z
● Nếu n < 30 thì chỉ tiêu KĐ là t
● TD Trang 236 về so sánh tốc độ xử lý của 2 phần mềm

d  d0 d  d0
z t
hoặc sd / n
sd / n
n
1 n 1
d   di
n i 1
sd2  
n  1 i 1
( d i  d ) 2

© Nguyễn Tiến Dũng Thống kê ứng dụng 29


● Quy tắc bác bỏ H0 (n <30)

 H 0 : 1   2  d 0  H 0 : 1   2  d 0  H 0 : 1   2  d 0
  
 H 1 : 1   2  d 0  H 1 : 1   2  d 0  H 1 : 1   2  d 0

 H 0 : D  d 0  H 0 : D  d 0  H 0 : D  d 0
  
 H1 : D  d 0  H1 : D  d 0  H1 : D  d 0
t   tn 1;a  t  tn 1;a /2 t  tn 1;a

 t   tn 1;a /2

© Nguyễn Tiến Dũng Thống kê ứng dụng 30


8.3.1.5 Ứng dụng Excel

● Data Analysis
● MegaStat

© Nguyễn Tiến Dũng Thống kê ứng dụng 31


8.3.2 KĐGT về chênh lệch giữa 2 tỷ lệ tổng thể

● 8.3.2.1 Phương pháp dùng phân phối Z


● Kiểm tra GT cỡ mẫu đủ lớn
● n1p1 ≥ 5; n1.(1-p1) ≥ 5
● n2p2 ≥ 5; n2.(1-p2) ≥ 5
● Giả thuyết KĐ
● Chỉ tiêu KĐ
● Quy tắc bác bỏ H0

© Nguyễn Tiến Dũng Thống kê ứng dụng 32


 H 0 : pˆ 1  pˆ 2  0  H 0 : pˆ 1  pˆ 2  0  H 0 : pˆ 1  pˆ 2  0
  
 H 1 : pˆ 1  pˆ 2  0  H 1 : pˆ 1  pˆ 2  0  H 1 : pˆ 1  pˆ 2  0
z   za  z   za / 2 z  za

 z  za / 2

p1  p2 1 1
z s  p (1  p )(  )
2

s n1 n2

n1 p1  n2 p2
p
n1  n2
© Nguyễn Tiến Dũng Thống kê ứng dụng 33
8.3.3 KĐGT về tính bằng nhau của 2 PS tổng thể

 H :
 0 1  2
  2
 H
 0 1 :  2
  2
 H :
 0 1  2
  2


2
 
2 2

 H :
 1 1  2
  2
 H :  2
  2
 H :  2
  2
2  1 1 2  1 1 2

F  Fdf1 , df 2 ,1a  F  Fdf1 , df 2 ,1a / 2 F  Fdf1 , df 2 ,a



 F  Fdf1 , df 2 ,a / 2

2
s 1
F 1
2 Fdf1 , df 2 ,1a 
s 2 Fdf 2 , df1 ,a

● Quy tắc thuận tiện: KĐ 2 bên hoặc KĐ bên phải

© Nguyễn Tiến Dũng Thống kê ứng dụng 34

You might also like