You are on page 1of 46

NỘI DUNG HỌC PHẦN

 Bài 1. Khái niệm cơ bản


 Bài 2. Thống kê mô tả
 Bài 3. Phân phối Mẫu
 Bài 4. Ước lượng điểm
 Bài 5. Ước lượng khoảng
 Bài 6. Kiểm định giả thuyết một tham số
 Bài 7. Suy diễn trên hai mẫu
 Bài 8. Phân tích phương sai
 Bài 9. Kiểm định phi tham số
 Bài 10. Giới thiệu thống kê Bayes
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 1
Bài 7. SUY DIỄN TRÊN HAI MẪU
 7.1. Mẫu theo cặp và mẫu độc lập
 7.2. Suy diễn trên mẫu theo cặp
 7.3. Suy diễn về hai trung bình trên mẫu độc lập
 7.4. Suy diễn về hai phương sai
 7.5. Suy diễn về hai tỉ lệ
 7.6. Kiểm định rang buộc

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 2


7.1. MẪU THEO CẶP VÀ MẪU ĐỘC LẬP
Mẫu theo cặp: mẫu ngẫu nhiên 2 chiều
 từ biến BNN 2 chiều
 Số quan sát là số cặp

Mẫu độc lập: 2 mẫu ngẫu nhiên 1 chiều độc lập


 rút từ BNN ;
 rút từ BNN ;
 Số quan sát với mỗi mẫu có thể khác nhau

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 3


Ví dụ
 Mẫu theo cặp  Mẫu độc lập
Shop Trước Sau Hãng A Hãng B
 72 76 77 97
 75 79 79 86
 70 77 76 85
 82 80 80 93
 70 75 82 81
 83 89 83 72
Quảng cáo có hiệu quả? 88
90
Về trung bình, hai hãng có khác nhau ? 82
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 4
So sánh hai tổng thể
 Hai tổng thể
Population Variable Mean Variance Proportion


 Hai mẫu từ hai tổng thể


Sample Size Mean Variance Proportion


THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 5


7.2. SUY DIỄN TRÊN MẪU THEO CẶP
 Mẫu theo cặp , so sánh hai trung bình , giả thiết phân
phối Chuẩn
 Đặt

 Bác bỏ

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 6


Khoảng tin cậy cho hiệu hai trung bình
 Với độ tin cậy , khoảng tin cậy đối xứng cho

 Tương tự cho kiểm định và khoảng tin cậy một phía

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 7


Ví dụ
Ví dụ 7.1. Với mức ý nghĩa 5%, cho biết doanh số trung
bình có tăng? Nếu có hãy ước lượng khoảng 95%

Shop Trước Sau


 72 76
 75 79
 70 77
 82 80
 70 75
 83 89

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 8


Bảng kết quả Excel
t-Test: Paired Two Sample for
 Data Analysis Means
  t-Test: Paired Two   Before After
Mean 75.333 79.333
Samples for Mean Variance 34.267 25.867
Observations 6 6
Pearson Cor. 0.842
Hyp. Mean Diff 0
df 5
t Stat -3.098
P(T<=t) one-tail 0.013
t Critical one-tail 2.015
P(T<=t) two-tail 0.027
t Critical two-tail 2.571 

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 9


Ngôn ngữ R
> before <- c(72,75,70,82,70,83)
> after <- c(76,79,77,80,75,89)
> d <- after - before
> t.test(d, mu=0, alternative = "greater")

One Sample t-test


data: d
t = 3.0984, df = 5, p-value = 0.01345
alternative hypothesis: true mean is greater
than 0
95 percent confidence interval:
1.398584 Inf
sample estimates:
mean of x
4
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 10
Kiểm định hệ số tương quan
 Kiểm định về tương quan giữa hai BNN (hoặc hai
thành phần của BNN hai chiều)
:: không tương quan
:: có tương quan
 Thống kê:

 Miền bác bỏ:

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 11


Ví dụ
Ví dụ 7.2. Q là lượng hàng bán được, P là giá bán, X là
giá cửa hàng cạnh tranh.
 Có số liệu sau:
Q 20 25 24 26 28 29 25 26 28 26 27 28 26 25 27 28
P 18 18 17 15 15 12 16 17 14 15 14 13 15 16 16 15
X 15 15 14 14 17 17 15 12 18 13 14 19 12 16 16 18

 Với mức ý nghĩa 5%, kiểm định về tương quan giữa


các cặp biến, và tìm của các kiểm định

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 12


7.3. SUY DIỄN VỀ TRUNG BÌNH TRÊN MẪU ĐỘC LẬP

Tổng thể Mẫu


Biết , Z-Test KTC


Mẫu độc lập,
Chưa biết ,
Hai biến gốc t-Test KTC
Giả sử
phân phối
chuẩn Chưa biết , t-Test KTC
Giả sử
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 13
Kiểm định và , biết
Thống kê Cặp GT MBB H0 P-value

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 14


Khoảng tin cậy của
 Độ tin cậy , khoảng tin cậy đối xứng

 Kiểm định tổng quát

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 15


Chưa biết nhưng giả định
Tiêu chuẩn Cặp GT MBB H0:

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 16


Khoảng tin cậy của
 Độ tin cậy , khoảng tin cậy đối xứng

 Kiểm định tổng quát

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 17


Ví dụ
Hãng Hãng Ví dụ 7.3.
A B
 (a) Kiểm định trung bình bằng nhau,
77 97 giả sử . Mức ý nghĩa 5%.
79 86
 (b) Ước lượng P-value
76 85
80 93  (c) Khoảng tin cậy 95% cho chênh
82 81 lệch hai trung bình
83 72
88
90  5
82

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 18


Excel
 Data Analysis t-Test: Two-Sample Assuming Equal
Variances
  t-Test: Two-Sample
Assuming Equal   A B
Variances Mean 79.5 86
Variance 7.5 53.5
Observations 6 9
Pooled Variance 35.808
Hyp. Mean Differ. 0
df 13
t Stat -2.061
P(T<=t) one-tail 0.030
t Critical one-tail 1.771
P(T<=t) two-tail 0.060
t Critical two-tail 2.160 

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 19


R
> xA <-c(77,79,76, 80,82,83)
> xB <-c(97,86,85,93,81,72,88,90,82)
> t.test(xA,xB, alternative = "two.sided",
var.equal = TRUE)

Two Sample t-test


data: xA and xB
t = -2.061, df = 13, p-value = 0.0599
alternative hypothesis: true difference in
means is not equal to 0
95 percent confidence interval:
-13.3134141 0.3134141
sample estimates:
mean of x mean of y
79.5 86.0
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 20
Chưa biết nhưng giả định
Tiêu chuẩn Cặp GT MBB H0:

 thì

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 21


Khoảng tin cậy của
 Khoảng tin cậy mức cho hiệu hai trung bình

 Kiểm định tổng quát

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 22


Ví dụ
Hãng Hãng Ví dụ 7.4.
A B
 (a) Kiểm định trung bình bằng nhau,
77 97 giả sử . Mức ý nghĩa 5%.
79 86
 (b) Ước lượng P-value
76 85
80 93  (c) Khoảng tin cậy 95% cho chênh
82 81 lệch hai trung bình
83 72
88
90  5
82

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 23


Excel
 Data Analysis t-Test: Two-Sample Assuming Unequal
Variances
  t-Test: Two-Sample
Assuming Unequal   A B
Variances Mean 79.5 86
Variance 7.5 53.5
Observations 6 9
Hyp. Mean Differ. 0
df 11
t Stat -2.423
P(T<=t) one-tail 0.017
t Critical one-tail 1.796
P(T<=t) two-tail 0.034
t Critical two-tail 2.201 

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 24


R
> xA <-c(77,79,76, 80,82,83)
> xB <-c(97,86,85,93,81,72,88,90,82)
> t.test(xA,xB, alternative = "two.sided",
var.equal = FALSE)

Welch Two Sample t-test


data: xA and xB
t = -2.4233, df = 10.944, p-value = 0.03391
alternative hypothesis: true difference in
means is not equal to 0
95 percent confidence interval:
-12.4072744 -0.5927256
sample estimates:
mean of x mean of y
79.5 86
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 25
5.4. SUY DIỄN VỀ HAI PHƯƠNG SAI
 Kiểm định hai phương sai, trước khi kiểm định hai
trung bình
Chưa biết ,

Giả sử
Làm sao biết giả định
Giả sử nào là đúng?

Kiểm định 2 phương sai

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 26


Kiểm định về và
Thống kê Cặp GT

Or

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 27


Kiểm định về và
 Trong thực hành nếu chỉ xét khi
T.kê Cặp GT P-value

 Khoảng tin cậy cho tỉ lệ

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 28


Ví dụ
Hãng Hãng Ví dụ 7.5.
A B
 (a) Kiểm định sự bằng nhau của hai
77 97 phương sai, mức ý nghĩa 5%.
79 86
 (b) Ước lượng P-value
76 85
80 93  (c) Khoảng tin cậy 95% cho tỉ lệ giữa
82 81 hai phương sai
83 72
88
90  5
82

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 29


Excel
 Data Analysis t-Test:
  F-test Two-Sample F-Test Two-Sample for Variances
for variances
  A B
Mean 79.5 86
Variance 7.5 53.5
Observations 6 9
df 5 8
F 0.140
P(F<=f) one-tail 0.022
F Critical one-tail 0.207 

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 30


R
> xA <-c(77,79,76, 80,82,83)
> xB <-c(97,86,85,93,81,72,88,90,82)
> var.test(xA,xB, ratio=1, alternative =
"two.sided")

F test to compare two variances


data: xA and xB
F = 0.14019,
num df = 5, denom df = 8, p-value = 0.04457
alternative hypothesis: true ratio of variances
is not equal to 1
95 percent confidence interval:
0.02910087 0.94726710
sample estimates:
ratio of variances 0.1401869
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 31
Tổng hợp
Firm Firm  F-test for equal variances
A B
• P-value = 0.044
77 97
79 86
76 85
 T-test for equal means (equal variances)
80 93 • P-value = 0.06
82 81
83 72  T-test for equal means (unequal variances)
88 • P-value = 0.034
90
82

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 32


Ví dụ
Ví dụ 7.6. Khảo sát 40 nam thấy chi tiêu trung bình là 250
và độ lệch chuẩn 20; với 50 nữ chi tiêu trung bình 230
và độ lệch chuẩn 30. Với mức ý nghĩa 5%, kiểm định
các câu sau độc lập nhau
(a) Chi tiêu của nữ là phân tán hơn của nam
(b) Mức chi tiêu của nam và nữ đồng đều như nhau
(c) Chi tiêu trung bình của nam khác nữ, giả sử cho rằng
phương sai là không như nhau
(d) Chi tiêu trung bình của nam nhiều hơn nữ, giả sử
phương sai là như nhau.

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 33


Tổng hợp về kiểm định hai trung bình
Variable &
Yes t-Test:
Pair sample?
No
Yes
Known , ? z-Test
No
Yes
=? t-Test:
No
F-Test: = t-Test: ,

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 34


7.5. SUY DIỄN VỀ HAI TỈ LỆ
 Kiểm định về hai tỉ lệ
Thống kê Cặp GT MBB H0:

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 35


Khoảng tin cậy của
 Với độ tin cậy , khoảng tin cậy đối xứng của hiệu hai
tần suất

 Tổng quát cho

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 36


Ví dụ
Ví dụ 7.6. Trong 300 người bệnh chỉ dùng thuốc A có
55% người khỏi; trong 240 người bệnh chỉ dùng thuốc
B có 50% người khỏi. Với mức ý nghĩa 5% có thể nói
thuốc A hiệu quả hơn thuốc B không?
Ví dụ 7.7. Có số liệu về một số khách vào cửa hàng
Ko. mua Mua - hài lòng Mua - ko. hài lòng
Nam 220 110 70
Nữ 240 140 120
Có thể cho rằng tỉ lệ khách nữ có mua hàng là nhiều
hơn so với khách nam; nhưng khách nữ khó hài lòng
hơn hay không? Mức ý nghĩa 5%
THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 37
7.6. KIỂM ĐỊNH RÀNG BUỘC

Ràng buộc: một mối quan hệ đẳng thức


Kiểm định về hơn một số tham số cùng lúc
Kiểm định nhiều tham số (cùng loại) của biến ngẫu
nhiên nhiều chiều
Kiểm định nhiều tham số của một biến ngẫu nhiên
Thường dùng cho mẫu lớn

(Phần sau ví dụ với mẫu nhỏ cho dễ tính toán, không


thực tế)

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 38


7.6.1.Kiểm định Wald về các trung bình

Biến ngẫu nhiên chiều


Nếu các thành phần phân phối chuẩn

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 39


Kiểm định Wald về các trung bình
Kiểm định

Với là tập hợp của hàm tuyến tính trên


Và là vectơ hằng số (cấp )
Gọi là kiểm định ràng buộc (p-restriction)
Với mẫu kích thước
Hàm của trung bình mẫu cũng phân phối chuẩn:

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 40


Kiểm định Wald
 Thống kê Wald

 Với:

 Trong đó là vectơ hệ số ràng buộc


: ràng buộc là đúng
: ít nhất một ràng buộc sai

 Miền bác bỏ:

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 41


Ví dụ
Ví dụ 7.8. Mẫu 3 chiều : X1: Lương, X2: Thưởng, X3:
Chi tiêu, Có các thông tin

Với mức ý nghĩa 5%, kiểm định giả thuyết


(a) Trung bình của ba biến lần lượt là: 110; 50 ; 100
(b) Xét về trung bình thì Lương gấp đôi Thưởng và
Chi tiêu bằng 120.

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 42


7.6.2. Kiểm định bằng tỷ lệ hợp lý
BNN một hoặc nhiều chiều, (hệ) tham số
Có hệ ràng buộc gồm ràng buộc dấu “=”
thỏa mãn ràng hệ ràng buộc
không thỏa mãn ít nhất một ràng buộc
Sử dụng ước lượng hợp lý tối đa (MLE) của
 là MLE của khi không và có ràng buộc

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 43


Kiểm định bằng tỉ lệ hợp lý
 là các hàm hợp lý ứng với mẫu khi không và khi có
ràng buộc
 Tỉ lệ hợp lý

 Nếu đúng và kích thước mẫu đủ lớn thì thống kê


sẽ phân phối
 Miền bác bỏ:

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 44


Ví dụ
Ví dụ 7.9. Cho mẫu quan sát của biến X
7 11 14 10 10 7 11 7 9 10 13 7 14 8 11 9 8 9 7 10

Với mức ý nghĩa 5%, kiểm định các giả thuyết


(a) Nếu biết phân phối chuẩn, kiểm định
(a1) Trung bình bằng 11 và phương sai bằng 6
(a2) Trung bình bằng 10 và phương sai bằng 4
(b) Nếu biết phân phối Poisson, kiểm định giả thuyết
trung bình bằng 10.

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 45


7.6.3. Kiểm định nhân tử Lagrange
Viết tắt là LM (Lagrange Multiplier), còn gọi là kiểm
định điểm hiệu quả
Kiểm định ràng buộc về (các) tham số ,
Giả thuyết:
Cực đại hàm Lagrange:

Miền bác bỏ:

THỐNG KÊ TOÁN – Bui Duong Hai – NEU – www.mfe.edu.vn/buiduonghai 46

You might also like