You are on page 1of 49

Bài toán kiểm định

Kiểm định tham số


Kiểm định phi tham số

Nội dung

1 Bài toán kiểm định


Kiểm định gì?

2 Kiểm định tham số

3 Kiểm định phi tham số

Kiểm định 1
Giới thiệu
Bài toán kiểm định
Kiểm định gì?
Kiểm định tham số
Thực hiện kiểm định
Kiểm định phi tham số
Các phân phối của TS dùng trong kiểm định

Bài toán kiểm định giả thuyết thống kê


Giả thuyết thống kê và kiểm định giả thuyết thống kê

+ Kiểm định giả thuyết thống kê là trả lời về tính đúng sai cho một phát
biểu về tổng thể
+ Nhận định về tổng thể gọi là giả thuyết thống kê
Nhìn nhận cái gì của tổng thể?
Giá trị tham số, phân phối tổng thể, khác biệt giữa các tổng thể, ...
Quan điểm đầy đủ: nhận định của A và nhận định ngược lại
+ Thống kê
Thống kê có liên quan với kiểm định có một phân phối cụ thể, biểu
thức có giá trị mẫu và giá trị tổng thể
Khi kiểm định cần đảm bảo các quy tắc để khả năng mắc phải sai
lầm của kết luận là nhỏ.
Kiểm định 2
Giới thiệu
Bài toán kiểm định
Kiểm định gì?
Kiểm định tham số
Thực hiện kiểm định
Kiểm định phi tham số
Các phân phối của TS dùng trong kiểm định

Bài toán kiểm định giả thuyết thống kê

Hướng giải quyết thống kê

+ Giả thuyết H0 và đối thuyết H1


+ Tiêu chuẩn của kiểm định là thống kê TS, test statistic, mà nếu H0
đúng thì TS ∼ D
+ Dựa vào thông tin mẫu, phải đưa ra quyết định bác bỏ hay chấp nhận
H0 . Chú ý đến mức ý nghĩa của kiểm định. Bác bỏ H0 tương đương với
chấp nhận H1 . Chấp nhận H0 tương đương với bác bỏ H1 .

Kiểm định 3
Giới thiệu
Bài toán kiểm định
Kiểm định gì?
Kiểm định tham số
Thực hiện kiểm định
Kiểm định phi tham số
Các phân phối của TS dùng trong kiểm định

Các kiểm định cơ bản

+ Kiểm định tham số: µ, σ2 , p


Một tổng thể của một biến ngẫu nhiên
Khác biệt giữa các tham số của các tổng thể
+ Kiểm định phi tham số:
Sự độc lập của hai dấu hiệu định tính
Quy luật phân phối của biến ngẫu nhiên
...

Kiểm định 4
Giới thiệu
Bài toán kiểm định
Kiểm định gì?
Kiểm định tham số
Thực hiện kiểm định
Kiểm định phi tham số
Các phân phối của TS dùng trong kiểm định

H0 và H1

+ H0 , null hypothesis: không thuyết


Nhận diện: chữ "không", dấu bằng.
+ H1 , hoặc Ha , alternative hypothesis (đối thuyết),
là nhìn nhận ngược lại với H0 .
+ Kiểm định một phía và kiểm định hai phía:
Đến từ nhìn nhận vị trí của tham số trong đối thuyết so
với vị trí của tham số trong không thuyết.
Cũng gọi kiểm định hai phía là bác bỏ hai phía, kiểm
định trái là bác bỏ trái, kiểm định phải là bác bỏ phải.

Kiểm định 5
Giới thiệu
Bài toán kiểm định
Kiểm định gì?
Kiểm định tham số
Thực hiện kiểm định
Kiểm định phi tham số
Các phân phối của TS dùng trong kiểm định

Quyết định từ dữ liệu khi kiểm định


Quyết định đúng:
- H0 sai, bác bỏ H0
- H0 đúng, chấp nhận H0
Quyết định không đúng:
- Sai lầm loại I: bác bỏ H0 khi H0 đúng
- Sai lầm loại II: chấp nhận H0 khi H0 sai

Thực sự
H0 đúng H0 sai
Bác bỏ H0 Sai lầm I Đúng
Quyết định
Chấp nhận H0 Đúng Sai lầm II

Kiểm định 6
Giới thiệu
Bài toán kiểm định
Kiểm định gì?
Kiểm định tham số
Thực hiện kiểm định
Kiểm định phi tham số
Các phân phối của TS dùng trong kiểm định

Quyết định khi kiểm định: mức ý nghĩa α và độ mạnh 1 − β

α = P (gặp sai lầm I) = P (bác bỏ H0 |H0 đúng)


α = mức ý nghĩa của kiểm định
P (chấp nhận H0 |H0 đúng) = 1 − α
Khi dùng thống kê TS để kiểm định, TS ∼ D nếu H0 đúng,
thì P (TS ̸∼ D|H0 đúng) = α và
P (TS ∼ D|H0 đúng) = 1 − α

Kiểm định 7
Giới thiệu
Bài toán kiểm định
Kiểm định gì?
Kiểm định tham số
Thực hiện kiểm định
Kiểm định phi tham số
Các phân phối của TS dùng trong kiểm định

Quyết định khi kiểm định: mức ý nghĩa α và độ mạnh 1 − β

β = P (gặp sai lầm II) = P (chấp nhận H0 |H0 sai)


P (không gặp sai lầm II) = 1 − β = sức mạnh của kiểm định
Nếu dùng thống kê TS để kiểm định, TS ∼ D khi H0 đúng,
thì P (TS ∼ D|H0 sai) = β và P (TS ̸∼ D|H0 sai) = 1 − β

Kiểm định 8
Giới thiệu
Bài toán kiểm định
Kiểm định gì?
Kiểm định tham số
Thực hiện kiểm định
Kiểm định phi tham số
Các phân phối của TS dùng trong kiểm định

Chú ý về α và β

Xuất phát: H0 đúng thì TS ∼ D


Với miền bác bỏ Wα ,
P (TS ∈ Wα |H0 đúng) = α,
và P (TS ∈/ Wα |H0 đúng) = 1 − α.
Với miền bác bỏ Wα ,
P (TS ∈/ Wα |H1 đúng) = β,
và P (TS ∈ Wα |H1 đúng) = 1 − β.
Miền(bác bỏ Wα tốt nhất thỏa
P (TS ∈ Wα |H0 đúng) = α,
P (TS ∈ Wα |H1 đúng) = 1 − β lớn nhất.

Kiểm định 9
Giới thiệu
Bài toán kiểm định
Kiểm định gì?
Kiểm định tham số
Thực hiện kiểm định
Kiểm định phi tham số
Các phân phối của TS dùng trong kiểm định

Các bước kiểm định với α cho trước

Các giả thuyết


Thống kê TS, và giá trị của thống kê dùng cho kiểm định
TStest .
Công cụ: miền bác bỏ của thống kê từ α, mức ý nghĩa chính
xác ứng với TStest , hoặc khoảng tin cậy 1 − α của tham số.
Sử dụng công cụ để ra quyết định với H0 .

Kiểm định 10
Giới thiệu
Bài toán kiểm định
Kiểm định gì?
Kiểm định tham số
Thực hiện kiểm định
Kiểm định phi tham số
Các phân phối của TS dùng trong kiểm định

Kiểm định với α và β cho trước

H0 và H1
Thống kê TS
Từ α và β, tính cỡ mẫu để hai sai lầm không vượt quá mức
cho trước
Về lại α

Kiểm định 11
Giới thiệu
Bài toán kiểm định
Kiểm định gì?
Kiểm định tham số
Thực hiện kiểm định
Kiểm định phi tham số
Các phân phối của TS dùng trong kiểm định

Phân phối của TS dùng trong kiểm định

Tùy thuộc kiểm định và độ lớn của tập giả thiết cho mô hình
Một số phân phối thường dùng: phân phối normal, Chi bình
phương, Student’s t, hay Snedecor’s F
Phân phối của TS có từ thực nghiệm, và luật số lớn

Kiểm định 12
Giới thiệu
Bài toán kiểm định
Kiểm định gì?
Kiểm định tham số
Thực hiện kiểm định
Kiểm định phi tham số
Các phân phối của TS dùng trong kiểm định

Miền tới hạn

Dựa trên mẫu để có giá trị TStest cho tiêu chuẩn TS.
Thiết lập miền tới hạn Wα của TS với điều kiện giả thuyết H0
bị bác bỏ nếu mẫu nằm ngoài miền Wα , H0 được chấp nhận
nếu ngược lại.
- Chấp nhận H0 nếu TStest ∈/ Wα
- Bác bỏ H0 nếu TStest ∈ Wα
Miền tới hạn (critical region) = miền bác bỏ (rejection region)
Miền chấp nhận (acceptance region) = bù của miền bác bỏ

Kiểm định 13
Giới thiệu
Bài toán kiểm định
Kiểm định gì?
Kiểm định tham số
Thực hiện kiểm định
Kiểm định phi tham số
Các phân phối của TS dùng trong kiểm định

Dùng miền tiêu chuẩn = dùng giá trị tới hạn

Mức ý nghĩa α:
P (TS ̸∼ D|H0 đúng) = α và P (TS ∼ D|H0 đúng) = 1 − α
Giá trị tới hạn của TS tính từ phân phối D, tạo ra miền bác
bỏ Wα ,
P (TS ∈ Wα |H0 đúng) = α.
Tới hạn: qua khỏi điểm này thì thay đổi quyết định.
Quyết định từ xem xét vị trí giá trị quan sát TStest của thống
kê TS với Wα :
- Nếu TStest ∈ Wα thì bác bỏ H0 và chấp nhận H1
- Nếu TStest ∈
/ Wα thì chấp nhận H0 và bác bỏ H1

Kiểm định 14
Giới thiệu
Bài toán kiểm định
Kiểm định gì?
Kiểm định tham số
Thực hiện kiểm định
Kiểm định phi tham số
Các phân phối của TS dùng trong kiểm định

Dùng mức ý nghĩa chính xác (p −value)

a) p −value là mức ý nghĩa thấp nhất mà H0 bị bác bỏ ứng với


giá trị quan sát TStest của thống kê TS ∼ D cho kiểm định
b) Dùng p −value: so sánh p và mức ý nghĩa α
Nếu p < α thì bác bỏ H0 và chấp nhận H1
Ngược lại thì chấp nhận H0 và bác bỏ H1
c) Tìm p bằng cách nào? Máy tính

Kiểm định 15
Tham số cơ bản
Các bước chính
Các công cụ kiểm định tham số
Bài toán kiểm định
Kiểm định về kỳ vọng của phân phối normal N (µ, σ2 )
Kiểm định tham số
Kiểm định σ2 của phân phối N (µ, σ2 )
Kiểm định phi tham số
Tham số p của tổng thể Ber (p )
Dùng miền bác bỏ
Kiểm định sự khác nhau về tham số của hai tổng thể

Kiểm định tham số, tham số nào?

Các tham số cơ bản: µ, σ2 , p


- Một tổng thể của một biến ngẫu nhiên:
kỳ vọng, phương sai, tỉ lệ
- Khác biệt tham số giữa các tổng thể:
khác biệt kỳ vọng (hiệu),
khác biệt phương sai (thương),
khác biệt tỉ lệ (hiệu)

Kiểm định 16
Tham số cơ bản
Các bước chính
Các công cụ kiểm định tham số
Bài toán kiểm định
Kiểm định về kỳ vọng của phân phối normal N (µ, σ2 )
Kiểm định tham số
Kiểm định σ2 của phân phối N (µ, σ2 )
Kiểm định phi tham số
Tham số p của tổng thể Ber (p )
Dùng miền bác bỏ
Kiểm định sự khác nhau về tham số của hai tổng thể

Kiểm định tham số, các bước chính

a) Giả thuyết: không thuyết H0 và đối thuyết H1


b) Thống kê TS, TS ∼ D khi H0 đúng
c) Dùng mẫu và mức ý nghĩa α của kiểm định:
miền bác bỏ Wα của thống kê TS,
khoảng tin cậy 1 − α cho tham số,
mức ý nghĩa chính xác
d) Ra quyết định

Kiểm định 17
Tham số cơ bản
Các bước chính
Các công cụ kiểm định tham số
Bài toán kiểm định
Kiểm định về kỳ vọng của phân phối normal N (µ, σ2 )
Kiểm định tham số
Kiểm định σ2 của phân phối N (µ, σ2 )
Kiểm định phi tham số
Tham số p của tổng thể Ber (p )
Dùng miền bác bỏ
Kiểm định sự khác nhau về tham số của hai tổng thể

Các công cụ kiểm định tham số cơ bản

Miền tiêu chuẩn (miền tới hạn, miền bác bỏ) cho tiêu chuẩn
TS của kiểm định: xem slide 13
p −value cho thống kê TS: xem slide 15
Khoảng tin cậy cho tham số: xem slide 19

Kiểm định 18
Tham số cơ bản
Các bước chính
Các công cụ kiểm định tham số
Bài toán kiểm định
Kiểm định về kỳ vọng của phân phối normal N (µ, σ2 )
Kiểm định tham số
Kiểm định σ2 của phân phối N (µ, σ2 )
Kiểm định phi tham số
Tham số p của tổng thể Ber (p )
Dùng miền bác bỏ
Kiểm định sự khác nhau về tham số của hai tổng thể

Dùng khoảng tin cậy

Khoảng tin cậy 1 − α của tham số θ là tập sau


{θ : P (TS ∈ KTC1−α (TS )|H0 đúng) = 1 − α}.
- KTC1−α (TS ) là khoảng tin cậy 1 − α của thống kê TS liên
quan đến tham số θ.
- KTC1−α (TS ) chứa giá trị tới hạn của TS, chú ý kiểm định
một phía hay hai phía.
Sử dụng khoảng tin cậy cho kiểm định
- Nếu θ thuộc khoảng tin cậy 1 − α của θ thì chấp nhận H0
- Ngược lại thì bác bỏ H0

Kiểm định 19
Tham số cơ bản
Các bước chính
Các công cụ kiểm định tham số
Bài toán kiểm định
Kiểm định về kỳ vọng của phân phối normal N (µ, σ2 )
Kiểm định tham số
Kiểm định σ2 của phân phối N (µ, σ2 )
Kiểm định phi tham số
Tham số p của tổng thể Ber (p )
Dùng miền bác bỏ
Kiểm định sự khác nhau về tham số của hai tổng thể

H0 : µ = µ0 , biết σ2 , dùng miền bác bỏ

Mẫu [Xi ] ∼ N (µ, σ2 ) có n quan sát.


X −µ X − µ0
Dùng Z = ∼ N (0, 1) khi X có phân phối normal, Ztest = .
√σ √σ
n n
H1 Wα Quyết định
Bác bỏ H0 nếu |Ztest | > Zc .
µ ̸ = µ0 Wα = {Z : P (|Z | > Zc ) = α}
Chấp nhận H0 nếu ngược lại.
Bác bỏ H0 nếu Ztest > Zc .
µ > µ0 Wα = {Z : P (Z > Zc ) = α}
Chấp nhận H0 nếu ngược lại.
Bác bỏ H0 nếu Ztest < Zc .
µ < µ0 Wα = {Z : P (Z < Zc ) = α}
Chấp nhận H0 nếu ngược lại.

Kiểm định 20
Tham số cơ bản
Các bước chính
Các công cụ kiểm định tham số
Bài toán kiểm định
Kiểm định về kỳ vọng của phân phối normal N (µ, σ2 )
Kiểm định tham số
Kiểm định σ2 của phân phối N (µ, σ2 )
Kiểm định phi tham số
Tham số p của tổng thể Ber (p )
Dùng miền bác bỏ
Kiểm định sự khác nhau về tham số của hai tổng thể

H0 : µ = µ0 , chưa biết σ2 , dùng miền bác bỏ

Mẫu [Xi ] ∼ N (µ, σ2 ) có n quan sát, và S là độ lệch chuẩn mẫu.


X −µ X − µ0
Dùng t = ∼ t (n − 1) nếu X ∼ N (µ, σ2 ), ttest = .
√S √S
n n
H1 Wα Quyết định
Bác bỏ H0 nếu |ttest | > tc .
µ ̸ = µ0 Wα = {t : P (|t | > tc ) = α}
Chấp nhận H0 nếu ngược lại.
Bác bỏ H0 nếu ttest > tc .
µ > µ0 W α = { t : P ( t > tc ) = α }
Chấp nhận H0 nếu ngược lại.
Bác bỏ H0 nếu ttest < tc .
µ < µ0 W α = { t : P ( t < tc ) = α }
Chấp nhận H0 nếu ngược lại.

Kiểm định 21
Tham số cơ bản
Các bước chính
Các công cụ kiểm định tham số
Bài toán kiểm định
Kiểm định về kỳ vọng của phân phối normal N (µ, σ2 )
Kiểm định tham số
Kiểm định σ2 của phân phối N (µ, σ2 )
Kiểm định phi tham số
Tham số p của tổng thể Ber (p )
Dùng miền bác bỏ
Kiểm định sự khác nhau về tham số của hai tổng thể

Mức ý nghĩa chính xác p cho kiểm định về µ, biết σ2

Mẫu [Xi ] ∼ N (µ, σ2 ) có n quan sát.


X −µ X − µ0
Z = ∼ N (0, 1), Ztest = .
√σ √σ
n n

So sánh p và α:
- H0 : µ = µ0 , H1 : µ ̸= µ0 , thì p = P (|Z | > Ztest )
- H0 : µ ⩽ µ0 , H1 : µ > µ0 , thì p = P (Z > Ztest )
- H0 : µ ⩾ µ0 , H1 : µ < µ0 , thì p = P (Z < Ztest )

Kiểm định 22
Tham số cơ bản
Các bước chính
Các công cụ kiểm định tham số
Bài toán kiểm định
Kiểm định về kỳ vọng của phân phối normal N (µ, σ2 )
Kiểm định tham số
Kiểm định σ2 của phân phối N (µ, σ2 )
Kiểm định phi tham số
Tham số p của tổng thể Ber (p )
Dùng miền bác bỏ
Kiểm định sự khác nhau về tham số của hai tổng thể

Mức ý nghĩa chính xác p cho kiểm định về µ, chưa biết σ2

Mẫu [Xi ] ∼ N (µ, σ2 ) có n quan sát.


X −µ
Dùng t = ∼ t (n − 1) nếu X có phân phối normal,
√S
n
X − µ0
ttest = .
√S
n
- H0 : µ = µ0 , H1 : µ ̸= µ0 , thì p = P (|t | > |ttest |)
- H0 : µ ⩽ µ0 , H1 : µ > µ0 , thì p = P (t > ttest )
- H0 : µ ⩾ µ0 , H1 : µ < µ0 , thì p = P (t < ttest )

Kiểm định 23
Tham số cơ bản
Các bước chính
Các công cụ kiểm định tham số
Bài toán kiểm định
Kiểm định về kỳ vọng của phân phối normal N (µ, σ2 )
Kiểm định tham số
Kiểm định σ2 của phân phối N (µ, σ2 )
Kiểm định phi tham số
Tham số p của tổng thể Ber (p )
Dùng miền bác bỏ
Kiểm định sự khác nhau về tham số của hai tổng thể

Khoảng tin cậy cho kiểm định về kỳ vọng, biết σ2


X −µ
Mẫu [Xi ] ∼ N (µ, σ2 ) có n quan sát. Dùng Z = ∼ N (0, 1).
√σ
n
Kiểm µ0 có nằm trong khoảng tin cậy 1 − α của µ không.

P (µ ∈ KTC1−α (µ)) = 1 − α

α kiểm định, H0 : µ= µ0 , H1 : µ ̸= µ0 


Tin cậy 1 − α, µ ∈ X − Zc √σn , X + Zc √σn , P (|Z | > Zc ) = α.

α kiểm định, H0 : µ ⩽ µ0 , H1 : µ > µ0


Tin cậy 1 − α, µ < X − Zc √σn , P (Z > Zc ) = α.

α kiểm định, H0 : µ ⩾ µ0 , H1 : µ < µ0


Tin cậy 1 − α, µ > X − Zc √σn , P (Z < Zc ) = α

Kiểm định 24
Tham số cơ bản
Các bước chính
Các công cụ kiểm định tham số
Bài toán kiểm định
Kiểm định về kỳ vọng của phân phối normal N (µ, σ2 )
Kiểm định tham số
Kiểm định σ2 của phân phối N (µ, σ2 )
Kiểm định phi tham số
Tham số p của tổng thể Ber (p )
Dùng miền bác bỏ
Kiểm định sự khác nhau về tham số của hai tổng thể

Khoảng tin cậy cho kiểm định về kỳ vọng, chưa biết σ2


X −µ
Mẫu [Xi ] ∼ N (µ, σ2 ) có n quan sát. Dùng t = ∼ t (n − 1).
√S
n
Kiểm µ0 có nằm trong khoảng tin cậy 1 − α của µ không.

P (µ ∈ KTC1−α (µ)) = 1 − α

α kiểm định, H0 : µ= µ0 , H1 : µ ̸= µ0 


Tin cậy 1 − α, µ ∈ X − tc √σn , X + tc √σn , P (|t | > tc ) = α.

α kiểm định, H0 : µ ⩽ µ0 , H1 : µ > µ0


Tin cậy 1 − α, µ < X − tc √σn , P (t > tc ) = α.

α kiểm định, H0 : µ ⩾ µ0 , H1 : µ < µ0


Tin cậy 1 − α, µ > X − tc √σn , P (t < tc ) = α

Kiểm định 25
Tham số cơ bản
Các bước chính
Các công cụ kiểm định tham số
Bài toán kiểm định
Kiểm định về kỳ vọng của phân phối normal N (µ, σ2 )
Kiểm định tham số
Kiểm định σ2 của phân phối N (µ, σ2 )
Kiểm định phi tham số
Tham số p của tổng thể Ber (p )
Dùng miền bác bỏ
Kiểm định sự khác nhau về tham số của hai tổng thể

Ví dụ kiểm định, kỳ vọng và tỉ lệ


Có kết quả sau về trọng lượng của một loại trái cây từ một vườn, đơn vị gram.
Mẫu này thực hiện sau một đợt điều chỉnh về dinh dưỡng cho vườn. Trước điều
chỉnh, trọng lượng trung bình là 70g. Lấy mức ý nghĩa 5%.

Trọng lượng Số trái


Trọng lượng Số trái
45-50 2
70-75 43
50-55 11
75-80 16
55-60 25
80-85 2
60-65 74
85-90 1
65-70 187

a) Điều chỉnh dinh dưỡng có làm trọng lượng loại trái này tăng lên không?
b) Trước đó, tỉ lệ trái loại 2 (trọng lượng nhỏ hơn 60g) là 27%. Có ý kiến
rằng tỉ lệ trái loại 2 giờ đã thay đổi. Ý kiến này đúng hay sai?
Kiểm định 26
Tham số cơ bản
Các bước chính
Các công cụ kiểm định tham số
Bài toán kiểm định
Kiểm định về kỳ vọng của phân phối normal N (µ, σ2 )
Kiểm định tham số
Kiểm định σ2 của phân phối N (µ, σ2 )
Kiểm định phi tham số
Tham số p của tổng thể Ber (p )
Dùng miền bác bỏ
Kiểm định sự khác nhau về tham số của hai tổng thể

Ví dụ kiểm định, kỳ vọng và tỉ lệ

Số liệu về doanh thu hằng ngày, đơn vị triệu đồng, của 100 hộ kinh
doanh, cho trong bảng bên dưới. Lấy mức ý nghĩa 5%.

Doanh thu 500 550 600 650 700 750


Số hộ 5 15 20 30 20 10

a) Thời điểm trước, doanh thu trung bình của các hộ là 600.
Doanh thu trung bình của các hộ có thay đổi không?
b) Thời điểm trước, tỉ lệ hộ có doanh thu từ 700 trở lên là 40%.
Tỉ lệ này có giảm đi không?

Kiểm định 27
Tham số cơ bản
Các bước chính
Các công cụ kiểm định tham số
Bài toán kiểm định
Kiểm định về kỳ vọng của phân phối normal N (µ, σ2 )
Kiểm định tham số
Kiểm định σ2 của phân phối N (µ, σ2 )
Kiểm định phi tham số
Tham số p của tổng thể Ber (p )
Dùng miền bác bỏ
Kiểm định sự khác nhau về tham số của hai tổng thể

H0 : σ2 = σ02 , dùng miền bác bỏ


Mẫu [Xi ] ∼ N (µ, σ2 ) có n quan sát.
(n − 1)S 2
Dùng χ2 = ∼ χ2 (n − 1) nếu X có phân phối normal.
σ2

(n − 1)S 2
Xem xét χ2test và Wα , χ2test = khi σ2 = σ02
σ02

H0 : σ2 = σ02 , H1 : σ2 ̸= σ02 , bác bỏ 2 phía


Wα = χ2 : χ2 < χ21 hoặc χ2 > χ22 , P (χ2 < χ21 ) = P (χ2 > χ22 ) = 2α .


H0 : σ2 ⩽ σ02 , H1 : σ2 > σ02 , bác bỏ phải


Wα = χ2 : P (χ2 > χ2c ) = α .


H0 : σ2 ⩾ σ02 , H1 : σ2 < σ02 , bác bỏ trái


Wα = χ2 : P (χ2 < χ2c ) = α .


Kiểm định 28
Tham số cơ bản
Các bước chính
Các công cụ kiểm định tham số
Bài toán kiểm định
Kiểm định về kỳ vọng của phân phối normal N (µ, σ2 )
Kiểm định tham số
Kiểm định σ2 của phân phối N (µ, σ2 )
Kiểm định phi tham số
Tham số p của tổng thể Ber (p )
Dùng miền bác bỏ
Kiểm định sự khác nhau về tham số của hai tổng thể

Ví dụ về kiểm định H0 : σ2 = σ02

VD1. Trọng lượng gà lúc mới nở có phân phối bình thường với
σ2 = 10. Nghi rằng độ đồng đều về trọng lượng gà con đã
giảm, người ta cân thử 12 gà mới nở và có phương sai mẫu
11.41. Nghi ngờ có cơ sở không? α = 0.05.
VD2. Máy hoạt động bình thường thì trọng lượng sản phẩm có
phân phối bình thường với độ lệch chuẩn 1. Máy còn hoạt
động tốt không nếu cân thử 30 sản phẩm của máy thấy độ
lệch chuẩn mẫu là 1.1? α = 1%.

Kiểm định 29
Tham số cơ bản
Các bước chính
Các công cụ kiểm định tham số
Bài toán kiểm định
Kiểm định về kỳ vọng của phân phối normal N (µ, σ2 )
Kiểm định tham số
Kiểm định σ2 của phân phối N (µ, σ2 )
Kiểm định phi tham số
Tham số p của tổng thể Ber (p )
Dùng miền bác bỏ
Kiểm định sự khác nhau về tham số của hai tổng thể

Tham số p của tổng thể Ber (p )

p là xác suất của kết quả Đ của phép thử Bernoulli.


Nếu X là số cá thể Đ trong mẫu cỡ n, thì X ∼ B (n, p ).
Khi n lớn, B (n, p ) được xấp xỉ bởi N (µ = np, σ2 = np (1 − p )).

Kiểm định 30
Tham số cơ bản
Các bước chính
Các công cụ kiểm định tham số
Bài toán kiểm định
Kiểm định về kỳ vọng của phân phối normal N (µ, σ2 )
Kiểm định tham số
Kiểm định σ2 của phân phối N (µ, σ2 )
Kiểm định phi tham số
Tham số p của tổng thể Ber (p )
Dùng miền bác bỏ
Kiểm định sự khác nhau về tham số của hai tổng thể

H0 : p = p0 , dùng miền bác bỏ

Mẫu có n quan sát, và tỉ lệ Đ trong mẫu là f , f = p̂


p̂ − p
Dùng thống kê Z = q ∼ N (0, 1).
p (1−p )
n
f −p
Xét Ztest = q và miền bác bỏ Wα :
p (1−p )
n

- H1 : p ̸= p0 , bác bỏ 2 phía, Wα = {Z : P (|Z | > Zc ) = α}.


- H1 : p > p0 , bác bỏ phải, Wα = {Z : P (Z > Zc ) = α}.
- H1 : p < p0 , bác bỏ trái, Wα = {Z : P (Z < Zc ) = α}.

Kiểm định 31
Tham số cơ bản
Các bước chính
Các công cụ kiểm định tham số
Bài toán kiểm định
Kiểm định về kỳ vọng của phân phối normal N (µ, σ2 )
Kiểm định tham số
Kiểm định σ2 của phân phối N (µ, σ2 )
Kiểm định phi tham số
Tham số p của tổng thể Ber (p )
Dùng miền bác bỏ
Kiểm định sự khác nhau về tham số của hai tổng thể

H0 : µ1 = µ2 , biết các phương sai, dùng miền bác bỏ

Mẫu:
- [X1i ] ∼ N (µ1 , σ12 ) có n1 quan sát,
- [X2i ] ∼ N (µ2 , σ22 ) có n2 quan sát.
(X1 − X2 ) − (µ1 − µ2 )
Dùng thống kê Z = q 2 ∼ N (0, 1).
σ1 σ22
n1 + n2

Xem xét Ztest và miền bác bỏ H0 :


- H1 : µ1 ̸= µ2 , hai phía, thì Wα = {Z : P (|Z | > Zc ) = α}.
- H1 : µ1 > µ2 , bác bỏ phải, thì Wα = {Z : P (Z > Zc ) = α}.
- H1 : µ1 < µ2 , bác bỏ trái, thì Wα = {Z : P (Z < Zc ) = α}.

Kiểm định 32
Tham số cơ bản
Các bước chính
Các công cụ kiểm định tham số
Bài toán kiểm định
Kiểm định về kỳ vọng của phân phối normal N (µ, σ2 )
Kiểm định tham số
Kiểm định σ2 của phân phối N (µ, σ2 )
Kiểm định phi tham số
Tham số p của tổng thể Ber (p )
Dùng miền bác bỏ
Kiểm định sự khác nhau về tham số của hai tổng thể

H0 : µ1 = µ2 , chưa biết phương sai, dùng miền bác bỏ

Mẫu:
- [X1i ] ∼ N (µ1 , σ12 ) có n1 quan sát,
- [X2i ] ∼ N (µ2 , σ22 ) có n2 quan sát.
X1 − X2
Dùng thống kê Z = q 2 .
S1 S22
n1 + n2
Khi n1 và n2 lớn thì Z có phân phối xấp xỉ N (0, 1).
Xem xét Ztest và miền bác bỏ Wα :
+ H1 : µ1 ̸= µ2 , hai phía, thì Wα = {Z : P (|Z | > Zc ) = α}.
+ H1 : µ1 > µ2 , bác bỏ phải, thì Wα = {Z : P (Z > Zc ) = α}.
+ H1 : µ1 < µ2 , bác bỏ trái, thì Wα = {Z : P (Z < Zc ) = α}.

Kiểm định 33
Tham số cơ bản
Các bước chính
Các công cụ kiểm định tham số
Bài toán kiểm định
Kiểm định về kỳ vọng của phân phối normal N (µ, σ2 )
Kiểm định tham số
Kiểm định σ2 của phân phối N (µ, σ2 )
Kiểm định phi tham số
Tham số p của tổng thể Ber (p )
Dùng miền bác bỏ
Kiểm định sự khác nhau về tham số của hai tổng thể

H0 : p1 = p2 , pooled, dùng miền bác bỏ


Hai mẫu có n1 và n2 quan sát, có tỉ lệ mẫu f1 = p̂1 và f2 = p̂2 .
(p̂1 − p̂2 ) − (p1 − p2 )
Dùng thống kê Z = r  ,
1 1
p̂ (1 − p̂ ) n1 + n2
n1 f1 + n2 f2
p̂ là tỉ lệ Đ trong dữ liệu gộp, p̂ = .
n1 + n2
Khi n1 > 30 và n2 > 30 thì Z ∼ N (0, 1).
Xem xét Ztest = r(f1 −f2 )−(
p1 − p2 )
 và miền bác bỏ Wα :
p̂ (1−p̂ ) n1 + n1
1 2

- H1 : p1 ̸= p2 , hai phía, thì Wα = {Z : P (|Z | > Zc ) = α}.


- H1 : p1 > p2 , bác bỏ phải, thì Wα = {Z : P (Z > Zc ) = α}.
- H1 : p1 < p2 , bác bỏ trái, thì Wα = {Z : P (Z < Zc ) = α}.
Kiểm định 34
Tham số cơ bản
Các bước chính
Các công cụ kiểm định tham số
Bài toán kiểm định
Kiểm định về kỳ vọng của phân phối normal N (µ, σ2 )
Kiểm định tham số
Kiểm định σ2 của phân phối N (µ, σ2 )
Kiểm định phi tham số
Tham số p của tổng thể Ber (p )
Dùng miền bác bỏ
Kiểm định sự khác nhau về tham số của hai tổng thể

H0 : p1 = p2 , unpooled, dùng miền bác bỏ

Hai mẫu có n1 và n2 quan sát, tỉ lệ mẫu f1 = p̂1 và f2 = p̂2 .


(p̂1 − p̂2 ) − (p1 − p2 )
Dùng thống kê Z = q .
p̂1 (1−p̂1 )
n1 + p̂2 (1n−2 p̂2 )
Khi n1 , n2 > 30 thì Z ∼ N (0, 1).
(f1 −f2 )−(p1 −p2 )
Xét Ztest = q
f1 (1−f1 ) f (1−f )
và miền bác bỏ Wα :
n +2 n 2
1 2

+ H1 : p1 ̸= p2 , bác bỏ 2 phía, thì


Wα = {Z : P (|Z | > Zc ) = α}.
+ H1 : p1 > p2 , bác bỏ phải, thì Wα = {Z : P (Z > Zc ) = α}.
+ H1 : p1 < p2 , bác bỏ trái, thì Wα = {Z : P (Z < Zc ) = α}.

Kiểm định 35
Tham số cơ bản
Các bước chính
Các công cụ kiểm định tham số
Bài toán kiểm định
Kiểm định về kỳ vọng của phân phối normal N (µ, σ2 )
Kiểm định tham số
Kiểm định σ2 của phân phối N (µ, σ2 )
Kiểm định phi tham số
Tham số p của tổng thể Ber (p )
Dùng miền bác bỏ
Kiểm định sự khác nhau về tham số của hai tổng thể

H0 : σ12 = σ22 , hai tổng thể normal


Mẫu
- Mẫu 1, [X1i ] ∼ N (µ1 , σ12 ), có n1 quan sát
- Mẫu 2, [X2i ] ∼ N (µ2 , σ22 ), có n2 quan sát.
S12
σ12
Dùng thống kê F = ∼ F (n1 − 1, n2 − 1).
S22
σ22
S12
Xét Ftest và miền bác bỏ Wα , Ftest = khi H0 đúng.
S22
- H1 : σ12 ̸= σ22 , hai phía, Wα = {F : F < F1 ∨ F > F2 },
với P (F < F1 ) = P (F > F2 ) = 2α .
- H1 : σ12 > σ22 , bác bỏ phải, thì Wα = {F : P (F > Fc ) = α}.
- H1 : σ12 < σ22 , bác bỏ trái, thì Wα = {F : P (F < Fc ) = α}.
Kiểm định 36
Tham số cơ bản
Các bước chính
Các công cụ kiểm định tham số
Bài toán kiểm định
Kiểm định về kỳ vọng của phân phối normal N (µ, σ2 )
Kiểm định tham số
Kiểm định σ2 của phân phối N (µ, σ2 )
Kiểm định phi tham số
Tham số p của tổng thể Ber (p )
Dùng miền bác bỏ
Kiểm định sự khác nhau về tham số của hai tổng thể

Ví dụ kiểm định σ12 = σ22

VD1. Độ rủi ro trong đầu tư đo bằng phương sai tốc độ thu hồi vốn. Dưới đây
là dữ liệu về tốc độ thu hồi vốn của 2 ngành A và B.
Ngành A: 10 dự án, tốc độ trung bình 10.48, phương sai 1.44.
Ngành B: 15 dự án, tốc độ trung bình 11, phương sai 1.6.
Có thể cho rằng rủi ro đầu tư ngành B cao hơn ngành A không? α = 5%.
VD2. Độ chính xác của các máy tính bởi độ phân tán của kích thước chi tiết
sản phẩm tạo bởi máy.
Lấy 7 sản phẩm của mỗi máy và đo kích thước các sản phẩm, kết quả
như dưới đây.
Máy A: 135. 138, 136, 140, 138, 135, 139
Máy B: 140, 135, 140, 138, 135, 138, 140
Có thể cho rằng độ chính xác hai máy như nhau không? α = 5%.

Kiểm định 37
Bài toán kiểm định
Kiểm định phân phối
Kiểm định tham số
Kiểm định tính độc lập hai biến định tính
Kiểm định phi tham số

Kiểm định về phân phối

H0 : X có luật phân phối đã cho,


H1 : X không có luật phân phối xác suất như lý thuyết.
(n −n P )2
Dùng Q = ∑ki=1 i ni Pi i i ∼ χ2 (k − 1).
Pi = P (X = Xi ) nếu X rời rạc,
Pi = P (Xi −1 ⩽ X ⩽ Xi ) nếu X liên tục,
dùng phân phối cần kiểm định,
k là số nhóm tính chất.
Miền bác bỏ là Wα = {χ2 : P (χ2 > χ2c (k − 1)) = α}.
So sánh Qtest và χ2c (k − 1) để ra quyết định.
Hoặc dùng p −value, p = P (χ2 > Qtest ), χ2 ∼ χ2 (k − 1).
Kiểm định 38
Bài toán kiểm định
Kiểm định phân phối
Kiểm định tham số
Kiểm định tính độc lập hai biến định tính
Kiểm định phi tham số

Ví dụ - Phân phối

Sản phẩm được sản xuất ra trên một dây chuyền tự động được
đóng gói một cách ngẫu nhiên 3 sản phẩm/hộp.
Kết quả sau có được khi kiểm tra 200 hộp.
Số sản phẩm loại I có trong hộp 0 1 2 3
Số hộp 6 14 110 70
Số sản phẩm loại I có trong hộp là đại lượng ngẫu nhiên có quy
luật phân phối nhị thức? α = 5%.

Kiểm định 39
Bài toán kiểm định
Kiểm định phân phối
Kiểm định tham số
Kiểm định tính độc lập hai biến định tính
Kiểm định phi tham số

Ví dụ - Phân phối

Một nhà máy sản xuất máy in nói rằng số lỗi in trong 1 cuốn sách
dày 300 trang của máy in là 1 đại lượng ngẫu nhiên có quy luật
phân phối Poisson với tham số 4.7.
Bảng sau có được khi kiểm tra 300 trang sách in của 50 máy in
cùng loại.
Số lỗi 0 1 2 3 4 5 6 7 8 ⩾9
Số máy 1 1 8 6 13 10 5 5 1 0
Tuyên bố của nhà sản xuất có đúng không, α = 1%?

Kiểm định 40
Bài toán kiểm định
Kiểm định phân phối
Kiểm định tham số
Kiểm định tính độc lập hai biến định tính
Kiểm định phi tham số

Ví dụ - Phân phối

Kết quả thu được khi kiểm tra 100 lô đất trồng cây nông nghiệp như bên
dưới, đơn vị năng suất tấn/ha.
Năng suất 8-9 9-10 10-11 11-12 12-13 13-14 14-15
Số trường hợp 8 15 21 23 16 9 8
Năng suất loại cây này có phân phối chuẩn không, α = 10%?

Kiểm định 41
Bài toán kiểm định
Kiểm định phân phối
Kiểm định tham số
Kiểm định tính độc lập hai biến định tính
Kiểm định phi tham số

Biến định tính và biến định lượng

Biến định lượng (quantitative variables): chỉ mặt lượng của sự


vật hiện tượng, giá trị số, tính toán được, so sánh được
Biến định tính (qualitative variables, categorical variables): chỉ
mặt chất của sự vật hiện tượng, không tính toán được, không
so sánh được

Kiểm định 42
Bài toán kiểm định
Kiểm định phân phối
Kiểm định tham số
Kiểm định tính độc lập hai biến định tính
Kiểm định phi tham số

Kiểm định sự độc lập của hai biến định tính X và Y

Giả
 thuyết
H0 : hai tính chất độc lập,
H1 : hai tính chất phụ thuộc.
Thống kê nào?
(tần số − tần số mong đợi)2
χ2 = ∑
tần số mong đợi
Bậc tự do của phân phối tùy số lượng tham số đã có.

Kiểm định 43
Bài toán kiểm định
Kiểm định phân phối
Kiểm định tham số
Kiểm định tính độc lập hai biến định tính
Kiểm định phi tham số

Mẫu

X và Y là các biến phân loại


a) X có k loại, x1 , x2 , . . . , xk (chú ý, loại),
Y có l loại y1 , y2 , . . . , yl (chú ý, loại).
b) Một quan sát ứng với một bộ (xi , yj ).
c) Ký hiệu cho số lượng các quan sát
Tổng số quan sát của mẫu là N.
Số quan sát ứng với bộ (xi , yj ) là ni,j .
Số quan sát ứng với loại xi của X là ri = ∑j ni,j .
Số quan sát ứng với loại yj của Y là cj = ∑i ni,j .
N = ∑i,j ni,j = ∑i ri = ∑j cj .

Kiểm định 44
Bài toán kiểm định
Kiểm định phân phối
Kiểm định tham số
Kiểm định tính độc lập hai biến định tính
Kiểm định phi tham số

Xử lý
a) Tổng thể: µ(i, j ) = P (X = xi , Y = yj ) là hàm khối lượng xác suất đồng
thời của (X , Y ), p (i ) và q (j ) là hàm khối lượng biên của X và của Y .
b) Ước lượng từ mẫu của các đại lượng này là
ni,j
µ̂(i, j ) =
N
ri
p̂ (i ) =
N
ci
q̂ (j ) =
N
c) Thống kê được sử dụng liên quan đến tần số ở từng ô (xi , yj ).
Khi µ(i, j ) là tần suất (tổng thể) ở ô (xi , yj ), thì mong đợi cho tần số ở ô
(xi , yj ) là Nµ(i, j ), đặt là πi,j :
πi,j = Nµ(i, j ).

Kiểm định 45
Bài toán kiểm định
Kiểm định phân phối
Kiểm định tham số
Kiểm định tính độc lập hai biến định tính
Kiểm định phi tham số

Thống kê

(tần số − tần số mong đợi)2


χ2 = ∑ tần số mong đợi
Nếu X và Y độc lập thì µ(i, j ) = p (i )q (j ), lúc đó tần số πi,j = Nµ(i, j ) có kỳ
vọng là Np (i )q (j ).
(πi,j − N · p (i ) · q (j ))2
χ2 = ∑ ∼ χ2 [(k − 1)(l − 1)].
N · p (i ) · q (j )
 ri · cj 2
( n − N · p̂ ( i ) · q̂ ( j )) 2 nij −
χ2test = ∑ =∑ N
i,j
ri · cj .
N · p̂ (i ) · q̂ (j )
N

Kiểm định 46
Bài toán kiểm định
Kiểm định phân phối
Kiểm định tham số
Kiểm định tính độc lập hai biến định tính
Kiểm định phi tham số

Miền bác bỏ và mức ý nghĩa chính xác

Wα là miền bác bỏ, p là mức ý nghĩa chính xác

Wα = {χ2 : χ2 > χ2c }, P (χ2 > χ2c ) = α, χ2 ∼ χ2 [(k − 1)(l − 1)]


p = P (χ2 > χ2test ), χ2 ∼ χ2 [(k − 1)(l − 1)]

Kiểm định 47
Bài toán kiểm định
Kiểm định phân phối
Kiểm định tham số
Kiểm định tính độc lập hai biến định tính
Kiểm định phi tham số

Ví dụ 1

Chất lượng sản phẩm sản xuất ở ba ca:


Số sản phẩm
Chất lượng
Sáng Chiều Tối
Loại I 30 35 27
Loại II 11 12 7
Loại III 2 3 2
Chất lượng sản phẩm có phụ thuộc vào ca sản xuất không, lấy α = 5%?

Kiểm định 48
Bài toán kiểm định
Kiểm định phân phối
Kiểm định tham số
Kiểm định tính độc lập hai biến định tính
Kiểm định phi tham số

Ví dụ 2

Hiệu quả quảng cáo của công ty và quy mô của công ty:
Hiệu quả quảng cáo
Quy mô
Mạnh Vừa Yếu
Nhỏ 20 52 32
Vừa 53 47 28
Lớn 67 32 25
Quy mô công ty ảnh hưởng đến hiệu quả quảng cáo? α = 5%

Kiểm định 49

You might also like