You are on page 1of 83

CHƯƠNG IV: ĐIỀU TRA CHỌN MẪU

I I II I
I I V
NHỮNG VẤN ĐỀ ƯỚC LƯỢNG KẾT KIỂM ĐỊNH GIẢ ỨNG DỤNG SPSS
VỀ ĐIỀU TRA QUẢ ĐIỀU TRA THUYẾT THỐNG TRONG ƯỚC
CHỌN MẪU KÊ
CHỌN MẪU LƯỢNG VÀ KIỂM
ĐỊNH GIẢ
THUYẾT THỐNG

I. Những vấn đề chung

1 Khái niệm

2 Ưu điểm

3 Hạn chế

4 Trường hợp vận dụng

5 Phân phối mẫu và định lý giới hạn trung tâm


1. Khái niệm

ĐTCM là một loại điều tra không toàn bộ trong


đó người ta chỉ chọn ra một số đơn vị đủ lớn thuộc
đối tượng nghiên cứu để tiến hành điều tra thực tế.
Các đơn vị này được chọn theo những quy tắc
nhất định để đảm bảo tính đại biểu và kết quả của
ĐTCM được dùng để suy rộng cho tổng thể chung
2. Ưu điểm
+ Tiết kiệm (chi phí, nhân lực)
+ Mở rộng nội dung điều tra
+ Tài liệu thu được trên mẫu có độ chính xác cao
+ Nhanh gọn, đảm bảo tính kịp thời
3. Hạn chế
+ Không cho biết thông tin đầy đủ về tổng thể

+ Sai số khi suy rộng

+ Kết quả điều tra không thể tiến hành phân tổ theo
mọi phạm vi nghiên cứu
4. Trường hợp vận dụng

Thay thế cho điều tra toàn bộ


Kết hợp với điều tra toàn bộ
Kiểm định giả thuyết thống kê
5. Phân phối mẫu và định lý giới hạn trung
tâm
Quy luật phân phối xác xuất
Phân phối mẫu
Định lý giới hạn trung tâm
Quy luật phân phối xác suất
Quy luật phân phối xác suất của biến ngẫu nhiên là sự
tương ứng giữa giá trị có thể có của nó và xác suất tương
ứng với giá trị đó.

0
Một số ký hiệu
Phương sai mẫu

Chú ý: Phương sai mẫu  được xác định như sau:


 (giản đơn) (1)
 (gia quyền) (2)
Hoặc:
 =  (3)
Phân phối mẫu

Phân phối trung bình mẫu


Từ mẫu ngẫu nhiên kích thước n (với các quan sát là
x1, x2,….xn với trung bình mẫu là

Trung bình của trung bình mẫu là: =μ


Độ lệch chuẩn của trung bình mẫu:
Phân phối mẫu

Phân phối tỷ lệ mẫu


Từ mẫu ngẫu nhiên kích thước n, x là biến ngẫu nhiên
thỏa mãn tiêu thức nghiên cứu nào đó, với tỷ lệ mẫu

Trung bình của tỷ lệ mẫu là: =p


Độ lệch chuẩn của tỷ lệ mẫu:
Định lý giới hạn trung tâm

- Nếu tổng thể có phân phối chuẩn, thì trung bình/tỷ lệ


mẫu cũng có phân phối chuẩn
Với mẫu ngẫu nhiên kích thước n đủ lớn, phân phối
của trung bình/tỷ lệ mẫu sẽ xấp xỉ phân phối chuẩn
bất kể phân phối tổng thể là gì
II. Ước lượng kết quả điều tra chọn mẫu

1 Cách chọn

2 Ước lượng (suy rộng) kết quả điều tra

3 Xác định kích thước (quy mô) mẫu


1. Cách chọn

Chọn hoàn lại (chọn lặp, chọn nhiều lần): Quy mô


tổng thể không đổi
số mẫu có thể có:

Chọn không hoàn lại (chọn không lặp, chọn một


lần): Quy mô tổng thể giảm
=

𝑁
𝐶
số mẫu có thể có:

𝑛
2. Ước lượng kết quả điều tra
Với mức ý nghĩa α
Ước lượng trung bình
Khi biết phương sai tổng thể chung, mẫu nhỏ (n<30)
Hai phía
Vế trái
Vế phải
Trong trường hợp mẫu lớn (lấy hệ số Z thay cho t)

Hai phía
Vế trái
Vế phải
2. Ước lượng kết quả điều tra

Với mức ý nghĩa α


Ước lượng tỷ lệ
Hai phía
Vế trái
Vế phải
2. Ước lượng kết quả điều tra

Trong đó Z được gọi là hệ số tin cậy (giá trị tới hạn mức α của
phân phối chuẩn hoá)

α – mức ý nghĩa (SAI LẦM LOẠI


I)
Một(1-sốα)giá trịsuđặc
là xác biệt
ất hay của
trình độZtin(với ước lượng 2
phía):
cậ y
z = 1 ứng với xác suất tin cậy = 0,6826 (a=0,3174)
z = 2 ứng với xác suất tin cậy = 0,9544 (a=0,0456)
z = 3 ứng với xác suất tin cậy = 0,9973 (a=0,0027)
 = 1,96 ứng với xác suất tin cậy = 95% (a= 5%)
Sai số bình quân chọn mẫu(độ lệch chuẩn của trung bình mẫu
và tỷ lệ mẫu)

 

Lưu ý: SSBQCM theo cách chọn hoàn lại luôn lớn hơn theo cách chọn không
hoàn lại
Các yếu tố ảnh hưởng tới SSBQCM

Độ phân tán của tổng thể (phương sai tổng thể)


Số lượng đơn vị mẫu (n)
Quy mô tổng thể (trong trường hợp chọn không
hoàn lại)
Cách chọn mẫu
3. Xác định số đơn vị mẫu điều tra

Yêu cầu khi xác định cỡ mẫu:


+ Sai số nhỏ nhất (về mặt khoa học)
+ Chi phí thấp nhất (về kinh tế)
Cách xác định

Z : Hệ số tin cậy (2 phía),


: Phương sai (thường không biết trước)
, : Phạm vi sai số cho phép (mong muốn) khi suy rộng
p: tỷ lệ chung (ở tổng thể)
N: Quy mô tổng thể chung
Các nhân tố ảnh hưởng tới kích
thước mẫu điều tra
+ Hệ số tin cậy (z)/Trình độ tin cậy
+ Phương sai (độ đồng đều) của tổng thể chung (σ2)
+ Phạm vi sai số chọn mẫu (ε)
+ Phương pháp chọn mẫu
Chú ý: Các cách xác định phương sai trong
trường hợp không biết PSai
Lấy phương sai lớn nhất, lấy tỷ lệ gần 0,5 nhất
trong các lần điều tra trước đó.
Lấy phương sai của cuộc điều tra có tính chất tương
tự
Điều tra thí điểm để xác định phương sai
Xác định phương sai dựa vào khoảng biến thiên
(quy tắc 3 xicma)

Chú ý: R = Xmax - Xmin
III. Kiểm định giả thuyết thống kê

1 Những vấn đề chung về kiểm định giả thuyết thống kê

2 Kiểm định giá trị trung bình


Giả thuyết thống kê
Là giả thuyết về một vấn đề nào đó của tổng thể
chung (về các tham số như trung bình, tỷ lệ, phương
sai, dạng phân phối,…)
Giả thuyết thống kê
Giả thuyết mà ta muốn kiểm định (H0)
Giả thuyết đối lập (Ha, H1, H)
Giả thuyết thống kê
Kiểm định 2 phía
Ví dụ:

H 0 : μ = μ0

H1: μ ≠ μ 0
Bác bỏ H0 Bác bỏ H0

0
Giả thuyết thống kê
Kiểm định phía trái
Ví dụ:

H 0 : μ = μ0

H 1 : μ < μ0
Bác bỏ H0

0
Giả thuyết thống kê
Kiểm định phía phải
Ví dụ

H 0 : μ = μ0

H 1 : μ > μ0
Bác bỏ H0

0
Sai lầm và mức ý nghĩa trong kiểm định

-
Sai lầm loại I là bác bỏ H0 khi H0 đúng
-
Sai lầm loại II là chấp nhận H0 khi H0 sai
Sai lầm và mức ý nghĩa trong kiểm định
Sai lầm và mức ý nghĩa trong kiểm định

Mức ý nghĩa của kiểm định (α) là xác suất mắc


sai lầm loại I

α = P(Bác bỏ H0/H0 đúng)


Tiêu chuẩn kiểm định
Tiêu chuẩn kiểm định là quy luật phân phối xác suất
nào đó dùng để kiểm định.
Trong tập hợp các kiểm định thống kê có cùng mức ý
nghĩa α, kiểm định nào có xác suất mắc sai lầm loại 2
nhỏ nhất được xem là “tốt nhất”.
Các bước tiến hành kiểm định
Xây dựng giả thuyết H0 và giả thuyết đối H1

Xác định mức ý nghĩa α


Chọn tiêu chuẩn kiểm định
Tính giá trị của tiêu chuẩn kiểm định từ mẫu quan sát
Kết luận
Kết luận
Quy tắc kiểm định giả thuyết thống kê
Nếu giá trị tiêu chuẩn kiểm định thuộc miền bác bỏ
(Wα), kết luận H0 sai, có cơ sở để bác bỏ H0
Nếu giá trị của tiêu chuẩn kiểm định không thuộc
miền bác bỏ, chưa khẳng định H0 đúng mà kết luận
chưa đủ cơ sở để bác bỏ H0
Phương pháp tiếp cận P-value trong kiểm định
giả thuyết
Rất nhiều phần mềm thống kê tính P-value
(sig) khi thực hiện kiểm định giả thuyết.
P-value là xác suất lớn nhất để có thể
bác bỏ giả thuyết H0. P-value thường
được xem như là mức ý nghĩa quan sát.
Các nguyên tắc ra quyết định để bác bỏ giả
thuyết H0 với P-value là:
Nếu p-value lớn hơn hoặc bằng α, chưa đủ
cơ sở để bác bỏ giả thuyết H0.
Nếu p-value nhỏ hơn α, bác bỏ giả thuyết
H0.
Phương pháp tiếp cận P-value trong kiểm định
giả thuyết

Bác bỏ H0 Bác bỏ H0

α/2 α/2

0
- - tqs tqs
tqs tqs
P value < α => Bác bỏ giả thuyết H0

P value > α => Chưa có cơ sở Bác bỏ giả thuyết H0


2. Kiểm định trung bình

a Kiểm định giả thuyết về giá trị trung bình của một tổng thể chung

b Kiểm định hai giá trị trung bình của hai tổng thể

c Kiểm định trung bình thuộc nhiều tổng thể chung


a. Kiểm định giả thuyết về giá trị trung bình
của một tổng thể chung

- Giả sử nghiên cứu X ∼ N(μ, σ2)

Chưa biết μ song có cơ sở để giả định nó bằng μ0


(H0: μ = μ0)
Để kiểm định giả thuyết trên, lấy ngẫu nhiên n đơn
vị từ đó tính các tham số của mẫu.
Tiêu chuẩn kiểm định
1. Kiểm định giả thuyết về giá trị trung bình
của một tổng thể chung

Tiêu chuẩn kiểm định

Trong đó
1. Kiểm định giả thuyết về giá trị trung
bình của một tổng thể chung

Miền bác bỏ Wα
-
Hai phía: tqs > tα/2(n-1)
- Vế phải: tqs > tα(n-1)
- Vế trái: tqs < -tα(n-1)
Bài tập ở nhà

Làm các bài tập sau trong giáo trình:


Chương 3: Bài 1 (205); 4 (206); 8,9,10(208)
Chương 4: Bài 1 (248); 4 (249); 1 (293); 17 (321)
Bài tập 1: Có kết quả điều tra năng suất lao động của 10% số công nhân của
1 DN
Theo cách chọn không hoàn lại như sau:

1. Với mức tin cậy 68,26% hãy cho biết năng suất lao động trung bình của DN
trong Khoảng nào? BÀI TOÁN ƯỚC LƯỢNG TRUNG BÌNH TỔNG THỂ
2. Xác định tỷ lệ chung số công nhân có mức năng suất từ 50 m trở lên với độ tin
cậy 95,44%. BÀI TOÁN ƯỚC LƯỢNG TỶ LỆ.
3. Gỉa sử DN muốn tiến hành một điều tra chọn mẫu (theo cách chọn không hoàn
lại) để suy rộng về năng suất lao động trung bình của toàn DN; với XS 95,44%,
phạm vi sai số không vượt quá 2m, DN cần điều tra bao nhiêu công nhân. (n =?)
4. Giả sử DN muốn tiến hành ĐTCM mới để suy rộng về tỷ lệ CN có mức NS từ
60m trở lên (cách chọn ko HL) với XS 95,44%, phạm vi sai số không vượt quá
a)

;
Tiếp câu a
Độ tin cậy 95,44% -> mức ý nghĩa là 100% - 95,44% = 4,56%, Nếu 2
vế thì a/2
b. ước lượng tỷ lệ
c. Xác định cỡ mẫu
chọn không hoàn lại


==

(lưu ý: cỡ mẫu làm tròn lên)

Gỉa sử DN muốn tiến hành một điều tra chọn mẫu (theo cách
chọn không hoàn lại) để suy rộng về năng suất lao động trung
bình của toàn DN; với XS 95,44%, phạm vi sai số không vượt
quá 2m, DN cần điều tra bao nhiêu công nhân.
Bài 1
f. Xác định cỡ mẫu

chọn không hoàn lại


Giả sử DN muốn tiến hành ĐTCM mới để suy rộng về tỷ lệ CN có


mức NS từ 60m trở lên với XS 95,44%, phạm vi sai số không vượt
quá 5%, DN cần điều tra tối thiểu bao nhiêu CN.
Trở lại bài tập 1, trả lời 2 câu hỏi sau:

5. Có ý kiến cho rằng năng suất lao động trung bình của DN
này tối đa là 45 m. Với mức ý nghĩa 5 % hãy cho biết ý kiến
đó có đúng ko? KIỂM ĐỊNH TRUNG BÌNH 1 TỔNG THỂ

6. Có ý kiến cho rằng tỷ lệ công nhân có mức năng suất từ 50


m trở lên không quá 40%. Với mức ý nghĩa 5% hãy cho nhận
xét về ý kiến đó. KIỂM ĐINH TỶ LỆ.
Cặp giả thuyết
Ho: 
H1: 
T=
Tqs =  = 1,97
t =  =  = 1,645
Tqs >  : BB Ho
Cặp giả thuyết
Ho: p
H1: p  (vế phải)
Z=
Tỷ lệ CN có mức NS từ 50m+ trong mẫu là: 37/100 = 0,37.
Tqs =  = - 0,61
Ta có:  = 1,645
Zqs < : Chưa đủ cơ sở để BB Ho
(mặc dù chưa đủ cơ sở bác bỏ, nhưng cũng không thể chấp nhận;
-> chưa thể kết luận về giả thuyết này)
b. Kiểm định hai giá trị trung bình
của hai tổng thể
a. Hai mẫu độc lập
b. Hai mẫu phụ thuộc
Hai mẫu độc lập
Giả sử nghiên cứu 2 tổng thể X1 ∼ N(μ1, σ12) và X2 ∼
N(μ2, σ22)
- Chưa biết μ1 và μ2 song có cơ sở để giả định nó bằng nhau
(H0: μ1 = μ2)
Để kiểm định giả thuyết trên, lấy 2 mẫu ngẫu nhiên độc
lập, với kích thước n1 và n2 từ đó tính các tham số của
mẫu.
Tiêu chuẩn kiểm định
Hai mẫu độc lập
Phương sai bằng nhau
Phương sai không bằng nhau
Kiểm định phương sai
H0: σ12 = σ22
H1: σ12 ≠ σ22
-
Tiêu chuẩn kiểm định (Levene)

xij – là giá trị của đơn vị thứ j nhóm thứ i (i=1,k) (j=1,ni)
Nếu H0 đúng, Thống kê F tuân theo quy luật phân phối Fisher với
bậc tự do (k-1;n-k)
Phương sai bằng nhau
Tiêu chuẩn kiểm định

Trong đó

Nếu H0 đúng, Thống kê T tuân theo quy luật phân phối Student với
bậc tự do (n1+n2-2)
Phương sai bằng nhau

Miền bác bỏ Wα
-
Hai phía: Tqs > tα/2 ,(n1+n2-2)
- Vế phải: Tqs > tα (n1+n2-2)
- Vế trái: Tqs < -tα(n1+n2-2)
Phương sai không bằng nhau
Tiêu chuẩn kiểm định

Nếu H0 đúng, Thống kê T tuân theo quy luật phân phối Student với
bậc tự do (v)

Nếu v lẻ thì làm tròn


xuống
Phương sai không bằng nhau

Miền bác bỏ Wα
-
Hai phía: Tqs > tα/2(v)
- Vế phải: Tqs > tα(v)
- Vế trái: Tqs < -tα(v)
Hai mẫu phụ thuộc
Giả sử nghiên cứu 2 tổng thể phụ thuộc
X1 ∼ N(μ1, σ12) và X2 ∼ N(μ2, σ22)
Chưa biết μ1 và μ2 song có cơ sở để giả định nó bằng nhau
(H0: μ1 = μ2)
Để kiểm định giả thuyết trên, lấy mẫu ngẫu nhiên phụ
thuộc được hình thành bởi n cặp quan sát của 2 mẫu, tính
các tham số của mẫu.
Tiêu chuẩn kiểm định
Hai mẫu phụ thuộc
Tiêu chuẩn kiểm định

Nếu H0 đúng, Thống kê T tuân theo quy luật phân phối Student với
bậc tự do (n-1)
Hai mẫu phụ thuộc

Miền bác bỏ Wα
-
Hai phía: Tqs > tα/2(n-1)
- Vế phải: Tqs > tα(n-1)
- Vế trái: Tqs < -tα(n-1)
c. Kiểm định trung bình thuộc nhiều tổng
thể chung (one-way ANOVA)
- Giả sử có k tổng thể đều có có phân phối Xj
∼N(μj,σj2)
- Chưa biết μj song có cơ sở để giả định nó bằng nhau
(H0: μ1 = μ2 = …. = μk)
Để kiểm định giả thuyết trên, lấy k mẫu với kích
thước tương ứng n1, n2, … nk
Tiêu chuẩn kiểm định
c. Kiểm định trung bình thuộc nhiều tổng
thể chung (one-way ANOVA)
- Tiêu chuẩn kiểm định
c. Kiểm định trung bình thuộc nhiều tổng
thể chung (one-way ANOVA)

Total Sum of Squares)

(Sum of Squares for


Factor)

(Sum of Squares for Error)


c. Kiểm định trung bình thuộc nhiều tổng
thể chung (one-way ANOVA)

Nếu H0 đúng, Thống kê F tuân theo quy luật phân phối Fisher với
bậc tự do (k-1;n-k)
Miền bác bỏ Wα: Fqs > fα(k-1; n-k)
c. Kiểm định trung bình thuộc nhiều tổng
thể chung (one-way ANOVA)

Kết quả chạy từ phần mềm SPSS


ANOVA
Mean
Sum of Squares df Square F Sig.
Between SSF k-1 MSF *** ***
Groups
Within SSE n-k MSE
Groups
Total SST n-1
ỨNG DỤNG SPSS
TRONG ƯỚC LƯỢNG VÀ KIỂM ĐỊNH GIẢ
THUYẾT THỐNG KÊ
Ước lượng thống kê

Chọn Analyze > Descriptive Statistics > Explore …


Đưa các biến cần tính toán các
tham số sang Dependent List
Muốn phân tích theo biến nào
đó thì đưa sang biến sang
Factor List
Trong mục Display chọn
Statistics hoặc Both
Kiểm định giả thiết về giá trị
trung bình của một tổng thể
Analyze > Compare Means > One-Sample T Test…

Đưa các biến cần kiểm định giá trị


trung bình vào Test Variable(s)
Nhập giá trị cần kiểm định trung
bình vào Test Value
Nhấn Options...
Kiểm định giả thiết về giá trị
trung bình của một tổng thể
Analyze > Compare Means > One-Sample T Test…

Nhập độ tin cậy của kiểm định vào


Confidence Interval
Chỉ kiểm định đối với các quan sát
có ý nghĩa của biến chọn Exclude
cases analysis by analysis
Chỉ kiểm định đối với các quan sát
có đầy đủ trong các biến chọn
Exclude cases listwise (n như nhau)
Hai mẫu độc lập
Analyze > Compare Means > Independent-Samples T Test…

Đưa các biến cần kiểm định giá trị


trung bình vào Test Variable(s)
Đưa biến phân loại vào Grouping
Variable
Nhấn Define Groups... Để định nghĩa
nhóm
Hai mẫu độc lập
Analyze > Compare Means > Independent-Samples T Test…

Nếu sử dụng biến phân loại lựa


chọn Use specified values và nhập giá
trị tương ứng
Nếu chọn giá trị của biến lớn hơn
hoặc bằng một giá trị nào đó thì
chọn Cut point rồi nhập giá trị phân
chia
Hai mẫu phụ thuộc
Analyze > Compare Means > Paired-Samples T Test…

Đưa các cặp biến cần kiểm định giá


trị trung bình vào Paired Variable(s)
Phân tích phương sai 1 nhân tố
(one-way ANOVA)
Analyze > Compare Means > One-Way ANOVA…

Đưa các biến cần phân tích vào


Dependent List
Đưa biến nhân tố vào Factor
Nếu bác bỏ H0 thì nhấn vào Post
Hoc... Để phân tích sâu nhằm xác
định trung bình của nhóm nào khác
nhóm nào.
Nhấn Options...
Phân tích phương sai 1 nhân tố
(one-way ANOVA)
Analyze > Compare Means > One-Way ANOVA…

Lựa chọn Descriptive để tính toán các


thống kê mô tả
Chọn Homogeneity of variance test để
kiểm định phương sai giữa các nhóm
Phân tích phương sai 1 nhân tố
(one-way ANOVA)
Analyze > Compare Means > One-Way ANOVA…

Lựa chọn các kiểm định tương ứng


Thường chọn tiêu chuẩn:
Bonferroni hay Tukey
Bài tập
Bài tập
Bài tập
Bài tập
Bài tập

You might also like