You are on page 1of 7

11/21/2022

KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ

1. Khái niệm giả thiết thống kê

Có căn cứ Giả thuyết H0 Đối thuyết (giả thuyết đảo) H1

Góc độ người chế tạo Góc độ người đặt hàng

Sản phẩm đạt yêu cầu Sản phẩm không đạt yêu cầu
KIỂM ĐỊNH GIẢ THUYẾT CHO MỘT MẪU Kết luận thống kê
(Xi=X0) (XiX0)

Chấp nhận giả thiết H0


Bác bỏ giả thiết H0 nhưng
nhưng thực tế H0 sai
thực tế H0 đúng

Sai lầm loại I (α ) Sai lầm loại II ( )


Thừa nhận một sản phẩm Tiếp nhận một sản phẩm thực tế không
thực tế thích hợp là hỏng thích hợp vào loại các sản phẩm có giá trị
PGS.TS. Đặng Đức Vượng
Email: vuong.dangduc@hust.edu.vn α =P (sai lầm loại I) = P(bác bỏ H0H0 đúng)  =P (sai lầm loại II) = P(Chấp nhân H0H0 sai)

One Love. One Future. 11/21/2022 Dang Duc Vuong - SEP - HUST 1 One Love. One Future. 11/21/2022 Dang Duc Vuong - SEP - HUST 2

1 2

1. Kiểm định giá trị trung bình (kỳ vọng) của phân bố chuẩn khi biết phương sai  2

2. Giả thiết một phía và giả thiết hai phía x  0


Đại lượng kiểm định thống kê Z 0  Phân phối tích lũy (Z0 ) =NORMSDIST(Z0)
/ n
Loại giả thuyết H0 mà cho phép ta có thể loại bỏ nó bởi các giá trị giới hạn nằm ở cả 2 phía như vậy được gọi là giả thuyết
2 phía (Two-sided hypothesis)
Hai phía Một phía phải (1-Tail) Một phía trái (1-Tail)

Miền tiêu chuẩn đối với phân phối chuẩn Miền tiêu chuẩn của phép kiểm định t−Student
Loại giả thuyết mà vùng giới hạn chỉ nằm về một phía của đường cong phân phối, được gọi là giả thuyết một phía (One-
sided hypothesis)
Theo 

Miền bác bỏ của phép kiểm định một phía phải Miền bác bỏ của phép kiểm định một phía trái

One Love. One Future. 11/21/2022 Dang Duc Vuong - SEP - HUST 3 One Love. One Future. 11/21/2022 Dang Duc Vuong - SEP - HUST 4

3 4
11/21/2022

Kiểm định theo mức ý nghĩa  https://nghiencuugiaoduc.com.vn/bang-phan-phoi- Kiểm định theo P-value
chuan-z-z-distribution/

Hàm:  = CONFIDENCE.NORM(α,,N) 1. Phát biểu giả thuyết thống kê; x  0


Hai phía Đại lượng kiểm định thống kê Z0 
Khoảng (trung bình -  , trung bình + ) 2. Lựa chọn mức ý nghĩa α; Tính hoặc tra bảng xác suất để tính xác suất cho giá / n
trị trung bình; đó chính là giá trị P.
Với độ tin cậy 1−α kỳ vọng của X sẽ có khoảng tin cậy xác định bởi: Phân phối tích lũy (Z0 ) =NORMSDIST(Z0)
3. So sánh P với α; (Nếu giá trị p nhỏ hơn mức α đã chọn, ta loại bỏ giả thuyết H0)
4. Kết luận

Một phía phải (1-Tail) Hai phía  x  0 


P  2 1  ( Z0 )   2 1 NORMSDIST( )
  / n 
Khoảng tin cậy một phía phải của kỳ vọng (bác bỏ H0):
x  0
Một phía phải (1-Tail) P  1  (Z 0 )  1 NORMSDIST( )
Một phía trái (1-Tail)
/ n

Khoảng tin cậy một phía trái của kỳ vọng (bác bỏ H0): x  0
Một phía trái (1-Tail) P  (Z0 ) NORMSDIST( )
/ n
Với độ tin cậy 1−α: tìm u/2 = NORMSINV(1- /2)

One Love. One Future. 11/21/2022 Dang Duc Vuong - SEP - HUST 5 One Love. One Future. 11/21/2022 Dang Duc Vuong - SEP - HUST 6

5 6

Sai lầm loại II và chọn kích cỡ mẫu Trường hợp đã biết phương sai  2

Sai lầm loại II  sẽ phụ thuộc vào kích cỡ mẫu n


Cho biết độ lệch giữa giá trị đúng  và kỳ vọng 0 là  = - 0

Hai phía Hai phía

 n  n
   (z  / 2  )  (  z  / 2  )
  Hàm:  = CONFIDENCE.NORM(α,,N)
 n Khoảng (trung bình -  , trung bình + )
Nếu  = - 0 >0 (dương)   (z  /2  )
 2

Từ  ta có z    ( z  )   z  z  /2 
 n
n
 z / 2  z  2
 2 Với độ tin cậy 1−α kỳ vọng của X sẽ có khoảng tin cậy xác định bởi:
2

Một phía n
z   z 
2
https://nghiencuugiaoduc.com.vn/b
2 ang-phan-phoi-chuan-z-z-
distribution/

ta sẽ chấp nhận giả thuyết nếu μ0 là một điểm nằm trong khoảng trên và bác bỏ giả thuyết nếu μ0 không thuộc
khoảng đó.

One Love. One Future. 11/21/2022 Dang Duc Vuong - SEP - HUST 7 One Love. One Future. 11/21/2022 Dang Duc Vuong - SEP - HUST 8

7 8
11/21/2022

VD1: Theo tiêu chuẩn thì trọng lượng các gói mì chính được đóng trên một máy tự động là 453 g. Kiểm tra ngẫu nhiên 81 Phân phối chuẩn u
Một phía phải (1-Tail)
gói ta thấy trọng lượng trung bình là 448 g. Với mức ý nghĩa 0,05 có thể cho rằng trọng lượng các gói mì chính không đạt
tiêu chuẩn hay không, biết rằng trọng lượng gói mì chính là biến ngẫu nhiên có phân phối chuẩn với độ lệch chuẩn là 36g?
khoảng tin cậy một phía phải của kỳ vọng được xác định là
Gọi X là trọng lượng gói mì chính
Độ lệch chuẩn σ= 36g
Số mẫu N =81 Với độ tin cậy 1−α kỳ vọng của X sẽ có khoảng tin cậy xác định bởi:
Miền bác bỏ của phép kiểm định một phía phải
Mức ý nghĩa α = 0.05
Tham số cần kiểm định là μ nếu μ0 thuộc vào khoảng trên thì ta chấp nhận giả thuyết, ngược lại thì ta bác bỏ giả thuyết.
VD 2: Năng suất trung bình của một giống lúa ở các năm trước là 32,5 (tạ/ha). Năm nay người ta đưa vào phương
Ta xây dựng bài toán kiểm định: Hàm:  = CONFIDENCE.NORM(α,,N) pháp chăm sóc mới và hy vọng năng suất cao hơn năm truớc. Điều tra trên 15 thửa ruộng thu được kết quả sau:
Khoảng (trung bình -  , trung bình + )
Với mức ý nghĩa α =0,05 , tra bảng phân phối chuẩn ta có u0,025=1,96
Nếu sử dụng ước khoảng, ta thấy khoảng tin cậy 95% của trung bình trọng lượng các gói mì chính sẽ là: Với mức ý nghĩa 1% có thể chấp nhận niềm hy vọng đó hay không, biết rằng năng suất lúa là một biến ngẫu nhiên có phân
phối chuẩn với phương sai là 10 (tạ/ha).
Khoảng tin cậy 99% một phía phải của kỳ vọng được tính như sau:
Giả thiết:
Bác bỏ giả thuyết và kết luận năng
Có 453 ∈ (440,16;455,84) Ta phải chấp nhận giả thuyết, coi các gói mì chính đạt tiêu chuẩn về mặt trọng lượng. suất lúa thực sự có tăng lên.

One Love. One Future. 11/21/2022 Dang Duc Vuong - SEP - HUST 9 One Love. One Future. 11/21/2022 Dang Duc Vuong - SEP - HUST 10

9 10

Phân phối chuẩn u


VD 2: Năng suất trung bình của một giống lúa ở các năm trước là 32,5 (tạ/ha). Năm nay người ta đưa vào phương Một phía trái (1-Tail)
pháp chăm sóc mới và hy vọng năng suất cao hơn năm truớc. Điều tra trên 15 thửa ruộng thu được kết quả sau:
Hàm:  = CONFIDENCE.NORM(2α,,N) khoảng tin cậy một phía trái của kỳ vọng được xác định là nửa đường
Khoảng (trung bình -  , +ꝏ) thẳng:
Với mức ý nghĩa 1% có thể chấp nhận niềm hy vọng đó hay không, biết rằng năng suất lúa là một biến ngẫu nhiên có phân
phối chuẩn với phương sai là 10 (tạ/ha). Miền bác bỏ của phép kiểm định một phía trái
nếu μ0 thuộc vào khoảng trên thì ta chấp nhận giả thuyết, ngược lại thì ta bác bỏ giả thuyết.
VD 3: Theo tiêu chuẩn thì trọng lượng các bao gạo do một máy tự động đóng là 50 kg. Sau một thời gian hoạt động người ta
nghi ngờ máy hoạt động không bình thường làm cho trọng lượng các bao gạo giảm đi. Lấy ngẫu nhiên 90 bao và cân thử thì
thu được trọng lượng trung bình là 48,5 kg. Với mức ý nghĩa 5% có thể kết luận gì về điều nghi ngờ trên, biết rằng trọng
lượng bao gạo là biến ngẫu nhiên có phân phối chuẩn với độ lệch chuẩn là 2 kg?
Giả thiết:
Với mức ý nghĩa α = 5%
Bác bỏ giả thuyết và kết luận năng
suất lúa thực sự có tăng lên.
Khoảng tin cậy 95% một phía trái của kỳ vọng được tính như sau:
Bác bỏ giả thuyết và kết luận các
bao bị đóng gói thiếu trọng lượng.

One Love. One Future. 11/21/2022 Dang Duc Vuong - SEP - HUST 11 One Love. One Future. 11/21/2022 Dang Duc Vuong - SEP - HUST 12

11 12
11/21/2022

2. Kiểm định giá trị trung bình (kỳ vọng) của phân bố chuẩn, chưa biết phương sai  2

Chưa biết phương sai  Phân bố student


VD 3: Theo tiêu chuẩn thì trọng lượng các bao gạo do một máy tự động đóng là 50 kg. Sau một thời gian hoạt động người ta
nghi ngờ máy hoạt động không bình thường làm cho trọng lượng các bao gạo giảm đi. Lấy ngẫu nhiên 90 bao và cân thử thì Phân phối t student (Student-t distribution)
thu được trọng lượng trung bình là 48,5 kg. Với mức ý nghĩa 5% có thể kết luận gì về điều nghi ngờ trên, biết rằng trọng X  0
lượng bao gạo là biến ngẫu nhiên có phân phối chuẩn với độ lệch chuẩn là 2 kg? Thống kê t n
S
Trình tự - Phát biểu giả thuyết thống kê
- Chọn mức ý nghĩa α
- Tính giá trị t theo giả thuyết
- Tính giá trị t tới giới hạn theo mức α
- So sánh t tính toán với t tới hạn
- Kết luận:

Nếu giả thuyết H0 là đúng thì t có quy luật phân phối Student với n−1 bậc tự do
X là ước lượng không chệch cho μ
Với mức ý nghĩa α ta bác bỏ giả thuyết H0 nếu giá trị tuyệt đối của thống kê t đủ lớn, tức là khi t  t n/21
n 1
t /2
tìm từ bảng phân phối Student.

One Love. One Future. 11/21/2022 Dang Duc Vuong - SEP - HUST 13 One Love. One Future. 11/21/2022 Dang Duc Vuong - SEP - HUST 14

13 14

1 2
Phương sai điều chỉnh mẫu (phương sai mẫu) S2    X i  X  .ni
N 1 i Hai phía
Hàm:  = CONFIDENCE.T(α,,N) Khoảng (trung bình -  , trung bình + )
Miền bác bỏ của phép kiểm định
t/2,n-1 = TINV(,n-1) dùng hàm T.INV(probability,deg_freedom) Bác bỏ giả thiết khi:
X  0
t n  t n/21 Miền tiêu chuẩn của phép kiểm định t−Student
S
VD : Trong các năm trước thu nhập trung bình của công nhân là 15 (triệu/năm), năm nay điều tra thu nhập của 25 công nhân
ta có số liệu sau:

Với mức ý nghĩa 5% hãy kiểm định xem thu nhập trung bình của công nhân năm nay có khác so với năm trước hay không,
biết rằng thu nhập của công nhân là biến ngẫu nhiên có phân phối chuẩn.

One Love. One Future. 11/21/2022 Dang Duc Vuong - SEP - HUST 15 One Love. One Future. 11/21/2022 Dang Duc Vuong - SEP - HUST 16

15 16
11/21/2022

VD : Trong các năm trước thu nhập trung bình của công nhân là 15 (triệu/năm), năm nay điều tra thu nhập của 25 công nhân
ta có số liệu sau: Số
Số công Trung bình công
Thu nhập nhân khoảng nhân Cách tính độ lệch chuẩn, phương sai trong Excel (tuvanmaytinh.com)
10 12 2 11 2 =AVERAGE(B4:C4)
12 14 4 13 4
14 16 10 15 10 2.064
Với mức ý nghĩa 5% hãy kiểm định xem thu nhập trung bình của công nhân năm nay có khác so với năm trước hay không, 16 18 6 17 6
biết rằng thu nhập của công nhân là biến ngẫu nhiên có phân phối chuẩn. 18 20 3 19 3

Với mức ý nghĩa 5% hãy kiểm định xem thu nhập trung bình của công nhân năm nay có khác so với năm trước hay không,
Gọi X là thu nhập của công nhân biết rằng thu nhập của công nhân là biến ngẫu nhiên có phân phối chuẩn.

Phương sai mẫu Tính theo độ lệch chuẩn có trọng số Sử dụng các hàm SUM, SUMPRODUCT và SQRT 


Phép kiểm định: Số mẫu 25 =SUM(F4:F8)
=SUMPRODUCT(value_range, weight_range) 383 =SUMPRODUCT(E4:E8,F4:F8)
Giá trị trung bình 15.32
Phương sai 4.893 =SUMPRODUCT((E4:E8-J16)^2,F4:F8)/(SUM(F4:F8)-1)
Mức ý nghĩa α= 0,05
Tìm kiểm định: t n /21  t 0,025
24
 t 24
0,025  2,06
Độ lệch chuẩn
Mức ý nghĩa
2.212
0.05
Bậc tự do là N-1 do số mẫu <30
Cỡ mẫu n = 25
Tính t t 0.723 =(J15-15)*SQRT(25)/J17

X  0 15,32  15 Mức ý nghĩa 5% với cỡ mẫu 25 Giá trị kiểm định


Tính: t n 25  0,723 t(n-1,alpha/2) 2.064 =TINV(0.05,24) TINV(probability,deg_freedom)
S 4,893 2.064 =TINV(J19,J14-1)

So sánh thấy t  0,723  t n/21  2,06 không thể bác bỏ giả thiết H0  Kết luận: thu nhập vẫn giống năm ngoái

One Love. One Future. 11/21/2022 Dang Duc Vuong - SEP - HUST 17 One Love. One Future. 11/21/2022 Dang Duc Vuong - SEP - HUST 18

17 18

VD : Mức xăng hao phí cho một loại xe ôtô chạy trên đoạn đường AB ở các năm trước là 50 lít. Năm nay do đoạn đường
Một phía phải AB đã bị xuống cấp và người ta cho rằng mức xăng hao phí đã tăng lên. Điều tra 30 chuyến xe chạy trên đoạn đường AB ta
có số liệu sau:
Miền bác bỏ của phép kiểm định
Bác bỏ giả thiết khi:
X  0
t n  t n1 Miền tiêu chuẩn của phép kiểm định một phía phải t−Student Với mức ý nghĩa 1% hãy kết luận về điều nghi ngờ trên, biết rằng mức xăng hao phí là biến ngẫu nhiên có phân phối chuẩn.
S
VD : Mức xăng hao phí cho một loại xe ôtô chạy trên đoạn đường AB ở các năm trước là 50 lít. Năm nay do đoạn đường Gọi X là mức xăng hao phí
AB đã bị xuống cấp và người ta cho rằng mức xăng hao phí đã tăng lên. Điều tra 30 chuyến xe chạy trên đoạn đường AB ta
có số liệu sau: Phép kiểm định:

Mức ý nghĩa α= 0,01


Cỡ mẫu n = 29
Tìm kiểm định: t n 1  t 0,01
28
 t 0,01
29
 2,46
Với mức ý nghĩa 1% hãy kết luận về điều nghi ngờ trên, biết rằng mức xăng hao phí là biến ngẫu nhiên có phân phối chuẩn.
X  0 50,133  50
Tính: t  n 30  1, 254
S 0,339

So sánh thấy T  1, 254  t n1  2,46 Không thuộc miền bác bỏ nên không thể bác bỏ giả thiết H0
Không thể khẳng định mức xăng hao phí tăng lên

One Love. One Future. 11/21/2022 Dang Duc Vuong - SEP - HUST 19 One Love. One Future. 11/21/2022 Dang Duc Vuong - SEP - HUST 20

19 20
11/21/2022

Một phía trái

Miền bác bỏ của phép kiểm định


Bác bỏ giả thiết khi:
X  0
t n   t n1 Miền tiêu chuẩn của phép kiểm định một phía phải t−Student
S
VD : Trọng lượng các bao gạo theo tiêu chuẩn là 50 kg. Có nhiều ý kiến khách hàng phảnảnh là trọng lượng gạo bị thiếu.
Nhóm điều tra lấy ngẫu nhiên 25 bao cân thử và thu được kết quả sau:

Với mức ý nghĩa 5% hãy kiểm định ý kiến khách hàng có đúng không, biết rằng trọng lượng bao gạo là biến ngẫu nhiên có
phân phối chuẩn.
So sánh thấy T  1, 254  t n1  2,46 Không thuộc miền bác bỏ nên không thể bác bỏ giả thiết H0
Không thể khẳng định mức xăng hao phí tăng lên

One Love. One Future. 11/21/2022 Dang Duc Vuong - SEP - HUST 21 One Love. One Future. 11/21/2022 Dang Duc Vuong - SEP - HUST 22

21 22

Kiểm định giả thiết phương sai của biến ngẫu nhiên có phân phối chuẩn

Kiểm định phương sai  kiểm định Khi bình phương  2


VD : Trọng lượng các bao gạo theo tiêu chuẩn là 50 kg. Có nhiều ý kiến khách hàng phản ảnh là trọng lượng gạo bị thiếu.
Nhóm điều tra lấy ngẫu nhiên 25 bao cân thử và thu được kết quả sau: Phân phối Khi bình phương  2

Hình dạng của phân phối χ2 phụ thuộc vào số bậc tự do (Degree of freedom, viết tắt là df), tức
là số lượng dữ liệu của tập mẫu trừ đi 1. Phân phối này thường lệch trái và dương, nhưng độ
lệch càng giảm khi số mẫu càng tăng. Khi bậc tự do df lớn hơn 30, phân phối χ2 trở nên cân
Với mức ý nghĩa 5% hãy kiểm định ý kiến khách hàng có đúng không, biết rằng trọng lượng bao gạo là biến ngẫu nhiên có đối gần với phân phối chuẩn.
phân phối chuẩn.
Gọi X là trọng lượng bao gạo Tập mẫu: n phần tử, được lấy ngẫu nhiên từ tập toàn bộ có phương sai là σ2
Phương sai tập mẫu là s2
Phép kiểm định: (n  1)s 2
2
Phân phối  
2
Mức ý nghĩa α= 0,05 2.2. Suy diễn phương sai  2
Cỡ mẫu n = 24
Tìm kiểm định: t n 1  t 0,05
24
 1,71 - Phát biểu giả thuyết thống kê
- Chọn mức ý nghĩa α, xác định giá trị giới hạn 2 ứng với α
X  0 49,21  50
Tính: t  n 25  7, 079 - Tính toán giá trị 2 theo giả thuyết
S 0,311 - So sánh 2 tính được với 2 ứng với giá trị giới hạn α
- Kết luận: 2 tính < 2 (α): Không loại bỏ được giả thuyết H0
So sánh thấy t  7,079  (  ,  t n1 ) Thuộc miền bác bỏ nên bác bỏ giả thiết H0
Ý kiến khách hang phản ánh là đúng

One Love. One Future. 11/21/2022 Dang Duc Vuong - SEP - HUST 23 One Love. One Future. 11/21/2022 Dang Duc Vuong - SEP - HUST 24

23 24
11/21/2022

Hai phía

Miền bác bỏ của phép kiểm định


(n  1)s2
Bác bỏ giả thiết khi:  2   12/ 2,n 1
02

Một phía trái

Miền bác bỏ của phép kiểm định


2
Bác bỏ giả thiết khi:  2  (n  1)s   2
1 ,n 1
02

Một phía phải

Miền bác bỏ của phép kiểm định


(n  1)s 2
Bác bỏ giả thiết khi: 2   2 ,n 1
 20

One Love. One Future. 11/21/2022 Dang Duc Vuong - SEP - HUST 25 One Love. One Future. 11/21/2022 Dang Duc Vuong - SEP - HUST 26

25 26

VD: Cho một tập dữ liệu về độ nhám bề mặt của 25 mẫu lấy ngẫu nhiên
trong một loạt sản phẩm. Phương sai phân phối của tập này là 2. Với độ tin
cậy 95%, xác định xem phương sai của tập toàn bộ có lớn hơn 1
không?
Ký hiệu phương sai của tập toàn bộ là σ2
Phát biểu giả thuyết

Xác định mức ý nghĩa α: Với độ tin cậy 95%, ta có α=1-0,95=0,05.


=36,4
Số lượng mẫu n=25, số bậc tự do df=n-1=25-1=24
Phương sai của tập
Tính giá trị χ2 ứng với giả thuyết đã phát biểu: toàn bộ lớn hơn 1
(chấp nhận giả
So sánh ta thấy , nghĩa là với 95% tin cậy, ta có thể loại bỏ giả thuyết H0. thuyết H1)

So sánh ta thấy , nghĩa là với 95% tin cậy, ta có thể loại bỏ giả thuyết H0.

One Love. One Future. 11/21/2022 Dang Duc Vuong - SEP - HUST 27 One Love. One Future. 11/21/2022 Dang Duc Vuong - SEP - HUST 28

27 28

You might also like