You are on page 1of 57

CHƯƠNG TÁM

PHÂN TÍCH VÀ DIỄN GIẢI DỮ LIỆU


8
TRONG NGHIÊN CỨU MARKETING

NỘI DUNG CHÍNH

Nội dung chương này bàn đến bao gồm:


- Thế nào là giả thuyết nghiên cứu
- Các loại sai lầm khi thực hiện kiểm định giả thuyết
- Các bước giải quyết một bài toán kiểm định
- Các phương pháp kiểm định tham số
- Các phương pháp kiểm định phi tham số

131
MÔ HÌNH LỰA CHỌN PHƯƠNG PHÁP KIỂM ĐỊNH
Giả thiết thống kê là một giả thiết có liên quan đến một trong ba vấn đề sau:
(1) Tính độc lập hay phụ thuộc của đại lượng ngẫu nhiên cần nghiên cứu.
(2) Dạng của qui luật phân phối xác suất của đại lượng ngẫu nhiên.
(3) Giá trị của tham số của qui luật phân phối xác suất đã biết dạng.
(1) & (2) là giả thiết phi tham số và (3) là giả thiết về tham số.
Trong phần này sẽ giới thiệu phương pháp kiểm định giả thiết về tham số như tham số trung bình
x trong qui luật phân phối chuẩn N(µ,σ2), tham số tỷ lệ p trong qui luật phân phối A(P), tham số
chi bình phương, tham số Fisher… Trong khuôn khổ cuốn sách này, chúng tôi chỉ giới thiệu cách
thức áp dụng những phương pháp kiểm định đó để giải quyết những vấn đề liên quan đến nghiên
cứu tiếp thị, những vấn đề khác liên quan đến việc giải thích bản chất của các công thức có thể
tham khảo thêm trong các giáo trình chuyên môn về thống kê toán.
Các khái niệm cơ bản
Giả thiết cần kiểm định
Giả sử đại lượng ngẫu nhiên X cần nghiên cứu tuân theo một qui luật phân phối xác suất đã biết
dạng, nhưng chưa biết giá trị của tham số θ nào đó của nó. Trên cơ sở những tin tức thu được, ta
có thể giả định rằng θ = θ0, trong đó θ0 là số thực. Tất nhiên điều giả định θ = θ0 này có thể đúng
hoặc có thể sai, do đó cần phải kiểm tra lại giả định đó. Từ đó ta có giả thiết cần kiểm định là
{H0: θ = θ0}.
Các giả thiết đối (đối thiết)
Vì giả thiết H0 cũng có thể đúng và cũng có thể sai với một độ tin cậy nào đó, khi giả thiết H0 sai
thì ta phải bác bỏ nó. Khi đó phải chấp nhận một trong ba giả thiết đối (ký hiệu: H1) sau đây:
- Trong trường hợp kiểm định dạng "hai đuôi" (Two-tail test):
⎧H 0 : θ = θ 0

⎩H1 : θ ≠ θ 0
- Trong trường hợp kiểm định dạng "một đuôi" (One-tail test):
⎧H 0 : θ = θ 0 ⎧H 0 : θ = θ 0
⎨ hoặc ⎨
⎩H 1 : θ > θ 0 ⎩H1 : θ < θ 0
Do vậy trong bài toán kiểm định giả thiết, sau khi đã đề ra giả thiết cần kiểm định H0, ta cần phát
biểu kèm một giả thiết đối H1 để khẳng định rằng nếu như giả thiết H0 bị bác bỏ thì ta chấp nhận
giả thiết đối kèm theo với một mức ý nghĩa α nào đấy (1- α được gọi là độ tin cậy).
Các loại sai lầm
Chú ý rằng, vì mẫu không phải là hình ảnh chính xác của tổng thể, nên mọi mẫu chọn được đều
chứa một sai số ngẫu nhiên nào đó. Do vậy, khi dựa vào mẫu để kiểm định giả thiết có thể gặp
phải hai loại sai lầm sau:
- Sai lầm loại 1: Khi ta bác bỏ một giả thiết đúng.
- Sai lầm loại 2: Khi ta thừa nhận một giả thiết sai.

132
Trong khi tiến hành kiểm định, người ta thường ấn định trước một xác suất mức sai lầm loại 1.
Nếu xác suất này bằng α, thì α được gọi là mức ý nghĩa của kiểm định (thông thường α phải khá
bé, α = 0,05, α = 0,1).

Giả thiết H0 đúng Giả thiết H0 sai

Chấp nhận Quyết định đúng Sai lầm loại 2 (xác suất β)

Bác bỏ Sai lầm loại 1 (xác suất α) Quyết định đúng

Tiêu chuẩn kiểm định và miền bác bỏ


Sau khi đã đề ra giả thuyết H0 cần kiểm định kèm theo giả thiết đối H1 và qui định mức ý nghĩa
α, ta cần phải tìm một thống kê T cùng qui luật phân phối xác suất của nó. Với một mức ý nghĩa
( )
α xác định, ta luôn tìm được mọi miền Wα, thỏa mãn điều kiện P K ∈ Wα H 0 = α (xác suất để
K thuộc miền miền bác bỏ Wα với điều kiện H0 đúng bằng α).
Do α khá bé, nên ta có thể coi biến cố (K∈Wα) là biến cố không thể có (với điều kiện giả thiết H0
đúng). Vì vậy, trong thực tế nếu dựa vào giá trị x của mẫu ngẫu nhiên X, ta tính được giá trị kqs
của thống kê K mà lại thấy giá trị kqs∈Wα, thì điều này sẽ mâu thuẫn với điều kiện nói trên.
Nguyên nhân sinh ra mâu thuẫn giữa lý thuyết và thực tế là do ta giả thiết rằng H0 đúng. Để tránh
mâu thuẫn này ta phải bác bỏ giả thiết, vì thế Wα được gọi là miền bác bỏ và kqs được gọi là tiêu
chuẩn kiểm định.
Chú ý:
- Khi giả thiết H0 đúng thì tiêu chuẩn kiểm định K vẫn có thể nhận giá trị kqs∈Wα với xác suất
xảy ra là α. Vì vậy trong trường hợp kqs∈Wα mà ta bác bỏ giả thiết H0 thì ta có thể mắc sai
lầm loại 1, với xác suất mắc sai lầm loại 1 chính là α.
- Nếu ta ký hiệu P(k qs ∈ Wα H 1 ) = β thì β là xác suất bác bỏ một giả thiết sai. Do đó, xác suất
( )
không bác bỏ một giả thiết sai P K qs ∈ Wα H 1 = 1 − β là xác suất mắc sai lầm loại 2 và β sẽ
được gọi là xác suất không mắc sai lầm loại 2, người ta gọi β là hiệu lực của kiểm định.
- Với kích thước mẫu n xác định thì với mẫu tiêu chuẩn kiểm định ta sẽ có miền bác bỏ Wα thỏa
mãn điều kiện: P(K qs ∈ Wα H 0 ) = α .

Nếu tồn tại một tiêu chuẩn kiểm định kqs với miền bác bỏ Wα sao cho (1-β) là nhỏ nhất và β lớn
nhất. Khi đó kqs được gọi là tiêu chuẩn kiểm định mạnh nhất. Một tiêu chuẩn được coi là mạnh
nhất thì nó đảm bảo 3 yêu cầu:
- Xác suất mắc sai lầm loại 1 là α qui định trước.
- Xác suất mắc sai lầm loại 2 là nhỏ nhất.
- Khi bác bỏ giả thiết H0 thì ta có thể thừa nhận giả thiết đối H1.
Như vậy chúng ta có thể xác định miền bác bỏ và miền chấp nhận trong các trường hợp kiểm
định một đuôi và hai đuôi là:
- Trong kiểm định hai đuôi:

133
Miền bác bỏ Miền chấp nhận Miền bác bỏ
-W1-α/2 W1-α/2

- Trong kiểm định một đuôi:

Miền bác bỏ Miền chấp nhận

-W1-α

Miền chấp nhận Miền bác bỏ

W1-α

Các bước chung để giải bài toán kiểm định


Bước 1: Phát biểu giả thiết và đối thiết
⎧H 0 : θ = θ 0 ⎧H 0 : θ = θ 0 ⎧H 0 : θ = θ 0
⎨ hoặc ⎨ hoặc ⎨
⎩H1 : θ ≠ θ 0 ⎩H 1 : θ > θ 0 ⎩H 1 : θ < θ 0
Bước 2: Xác định mức ý nghĩa và xây dựng miền bác bỏ
+ Mức ý nghĩa α
+ Miền bác bỏ (tùy thuộc vào phương pháp kiểm định, loại phân phối và mức ý nghĩa).
Bước 2: Lựa chọn phương pháp kiểm định và loại phân phối của nó.
Bước 4: Tính giá trị quan sát của tiêu chuẩn kiểm định kqs
Bước 5: So sánh với miền bác bỏ để kết luận:

134
- Nếu kqs∈ Wα ta sẽ bác bỏ giả thiết H0 và thừa nhận giả thiết H1.
- Nếu kqs∉ Wα : Ta kết luận rằng chưa có cơ sở để thừa nhận giả thiết H1.
Có thể tóm tắt các bước để giải bài toán kiểm định theo sơ đồ sau:

B1: Phát biểu giả thiết và đối thiết

B2: Xác định mức ý nghĩa

B3: Lựa chọn phương pháp kiểm định và loại phân phối của nó

B4: Tính giá trị kiểm định (giá trị quan sát) kqs

B5: Tìm miền bác bỏ và kết luận

CÁC PHƯƠNG PHÁP KIỂM ĐỊNH THAM SỐ


Kiểm định giả thiết về tham số trung bình µ của tổng thể
Điều kiện: Biến định lượng và phân phối của biến phải tuân theo quy luật phân phối chuẩn.
Trường hợp đã biết phương sai (σ2) hoặc độ lệch chuẩn của tổng thể
Đối với trường hợp kiểm định giả thiết về tham số trung bình của tổng thể, chúng ta có thể thực
hiện thông qua các bước sau:
B1: Phát biểu giả thiết và đối thiết:

Đối xứng Phải Trái


Giả thiết H0: µ = µ0 H0: µ ≤µ0 H0: µ ≥ µ0
Đối thiết H1: µ ≠ µ0 H1: µ > µ0 H1: µ < µ0

B2: Xác định mức ý nghĩa α


B3: Xác định phương pháp kiểm định: Phương pháp kiểm định tham số trung bình với σ đã biết.
B 4: Tính tiêu chuẩn kiểm định

K qs ≡ U =
(x − µ ) 0 n
, trong đó x là trung bình mẫu.
σ
Bước 3: Xác định miền bác bỏ
Miền bác bỏ Wα là tập hợp những điểm thoả mãn điều kiện:
⎧⎪ (
⎛ x − µ0
Wα = ⎨U = ⎜
) n⎞ ⎫
⎟,U 1−α ⎪⎬
⎪⎩ ⎜ σ ⎟
⎝ ⎠ ⎭⎪
hay U ≥U α kiểm định đối xứng - bác bỏ H0, chấp nhận H1 với µ ≠ µ0.
1−
2
135
U ≥ U 1−α kiểm định phía phải - bác bỏ H0, chấp nhận H1 với µ > µ0.

U ≤ −U 1−α kiểm định phía phải - bác bỏ H0, chấp nhận H1 với µ < µ0.

Chúng ta so sánh kqs với Wα để đưa ra kết luận


Để tiện cho việc theo dõi, có thể tóm lược những bước của bài toán kiểm định tham số trung bình
ở trên như bảng sau:

KIỂM ĐỊNH THAM SỐ TRUNG BÌNH CỦA TỔNG THỂ


(khi σ đã biết)
1. Giả thiết và đối thiết:

Đối xứng Phải Trái


Giả thiết H0: µ = µ0 H0: µ ≤ µ0 H0: µ ≥ µ0
Đối thiết H1: µ ≠ µ0 H1: µ > µ0 H1: µ < µ0
2. Xác định mức ý nghĩa
3. Phương pháp kiểm nghiệm: Tham số trung bình tổng thể
4. Tiểu chuẩn kiểm định:
(khi chưa biết σ thay bằng s’)
(x − µ0 ) n
k qs ≡ U =
5. Điểm tới hạn và miền bác bỏ: σ

Đối xứng Phải Trái


Điểm tới hạn - U1-α/2 và U1-α/2 U1-α - U1-α
Miền bác bỏ U<- U1-α/2 và U>U1-α/2 U>U1-α U<-U1-α

Biểu hiện qua BB CN BB BB BB


hình vẽ
-U1-α/2 U1-α/2 U1-α -U1-α

 Ví dụ: Trọng lượng một loại sản phẩm do nhà máy sản xuất là đại lượng ngẫu nhiên tuân theo
qui luật phân phối chuẩn, có trọng lượng qui định là 20kg và độ lệch chuẩn là 2kg. Có ý kiến cho
rằng: Do thiết bị hoạt động không ổn định nên trọng lượng sản phẩm đã thay đổi, người ta tiến
hành kiểm tra 100 sản phẩm và đo được trọng lượng trung bình là 20,35kg. Với mức ý nghĩa α =
0,05. Hãy kết luận xem trọng lượng của sản phẩm đã thay đổi chưa? Cho biết U0,975=1,96.
Giải: Gọi X là trọng lượng sản phẩm do nhà máy sản xuất. Theo giả thiết X là đại lượng ngẫu
nhiên tuân theo qui luật phân phối chuẩn, trong đó σ = 2(kg), M(X) = 20(kg).
Ta có bài toán kiểm định giả thiết về giá trị tham số µ của qui luật phân phối chuẩn.
B1. Phát biểu giả thiết:
H0 : µ = µ0= 20(kg)
H1: µ ≠ µ0
B2. Mức ý nghĩa α=0,05
B3. Phương pháp kiểm định: Đây là bài toán kiểm định tham số trung bình với độ lệch chuẩn σ
đã biết.
136
B4. Xác định tiêu chuẩn kiểm định: Tiêu chuẩn kiểm định được chọn là:

k qs ≡ U =
(x − µ ) 0 n (20,35 − 20 ) 100 3,5
= = 1,75
σ 2 2
B5. Xác định miền bác bỏ và kết luận:
Với mức ý nghĩa α = 0,05, miền bác bỏ tương ứng trong trường hợp này có dạng:
⎧⎪
Wα = ⎨U =
x − µ0 ( ) n
,U ≥U
⎫⎪
= U 0,975 = 1,96⎬
α
⎪⎩ σ 1−
2 ⎪⎭

Minh họa bằng hình vẽ:


1,75 1,96

Miền bác bỏ Miền bác bỏ

Kết luận: Vì kqs∉ Wα nên chưa có cơ sở để bác bỏ giả thiết H0, tức là ý kiến cho rằng trọng
lượng trung bình của sản phẩm bị thay đổi là chưa có cơ sở.
Trường hợp chưa biết phương sai (σ2):
Đối với trường hợp chưa biết phương sai tổng thể, cần phải xem xét hai trường hợp sau:
a. Trường hợp mẫu nhỏ n<30
Trong trường hợp chưa biết phương sai, các giả thiết và đối thiết cũng giống như trường hợp đã
biết phương sai. Tuy nhiên, để tính toán giá trị kiểm định, cần phải tìm độ lệch chuẩn điều chỉnh
(s’) của mẫu để tiến hành phân tích. Vì mẫu khá nhỏ (n<30), có thể giả định hàm phân phối tuân
theo hàm T-student. Khi đó, tiêu chuẩn kiểm định được chọn là:

k qs ≡ T =
(x − µ ) 0 n
'
s
Với x là trung bình mẫu và s’ là độ chênh lệch chuẩn điều chỉnh của mẫu.
Với mức ý nghĩa α, miền bác bỏ:
⎧⎪
Wα = ⎨T =
x − µ0( ) n ⎫⎪
, Tα(n −1) ⎬
⎪⎩ s' ⎪⎭
Khi đó:
T ≥ Tα(n −1) hoặc P(⏐T⏐)<α Æ bác bỏ H0, chấp nhận H1 (hay µ ≠ µ0).
2

T ≥ Tα(n −1) hoặc P(T)<2α Æ bác bỏ H0, chấp nhận H1 (hay µ > µ0).

T ≤ −Tα(n −1) hoặc P(T)<2α Æ bác bỏ H0, chấp nhận H1 (hay µ < µ0).
 Ví dụ : Một nhà sản xuất một loại bóng đèn cho biết tuổi thọ trung bình thấp nhất của các
bóng đèn là 150 giờ. Kiểm tra một cách ngẫu nhiên 25 bóng đèn, người ta đo được tuổi thọ trung
bình của chúng là 145 giờ. Với độ tin cậy 99%, có thể kết luận gì về lời tuyên bố trên. Cho biết,

137
độ lệch chuẩn hiệu chỉnh mẫu là 6 giờ và tuổi thọ trung bình của loại bóng đèn trên là đại lượng
ngẫu nhiên phân phối chuẩn.
Giải:
Gọi µ là tuổi thọ trung bình của loại bóng đèn trên, theo giả thiết µ là đại lượng ngẫu nhiên phân
phối chuẩn. Ta có bài toán kiểm định giả thiết tham số µ với n ≤ 30.
B1. Phát biểu giả thiết:
H0 : µ ≥ µ0 = 150
H1 : µ <µ0
B2. Xác định mức ý nghĩa α=0,05
B3. Phương pháp kiểm định: Đây là trường hợp kiểm định một đuôi bên trái với mẫu nhỏ, σ
chưa biết.
B4. Tính tiêu chuẩn kiểm định:
Tiêu chuẩn kiểm định là :
(x − µ ) n (145 − 150 ) 25
k qs ≡ T = = = − 4 ,167
s' 6
Với mức ý nghĩa α = 0,01, miền bác bỏ:

W α = ⎨T =
X − µ0 ( ) n ⎫
, T < − T α(n − 1 ) = − T 0 , 01 = − 2 ,49 ⎬
( 24 )

⎩ S′ ⎭
Minh họa bằng hình vẽ
-4,167 -2,49

Miền bác bỏ
Kết luận: Vì kqs∈Wα nên chúng ta bác bỏ giả thiết H0 và chấp nhận đối thuyết H1, nghĩa là lời
tuyên bố rằng tuổi thọ trung bình của loại bóng đèn trên thấp nhất là 150 giờ là sai.
b. Trường hợp mẫu nhỏ n≥30
Nếu kích thước mẫu n ≥ 30, khi đó giá trị Tα(n−1) sẽ tiến đến giá trị Uα/2, khi đó tiêu chuẩn kiểm
2

định trong trường hợp này là: k qs ≡ U =


(x − µ ) 0 n
'
s
 Ví dụ: Công ty thiết bị viễn thông ATC đã tiến hành một cuộc nghiên cứu để tìm hiểu mức độ
hài lòng của khách hàng sau khi thay đổi, cải tiến một số dịch vụ nhằm nâng cao khả năng đáp
ứng yêu cầu khách hàng của họ. Trước khi cải tiến các dịch vụ, mức độ hài lòng của khách hàng
trung bình là 75 (theo thang điểm từ 0 đến 100). Chọn ngẫu nhiên 350 khách hàng để tham khảo
ý kiến của họ sau khi các dịch vụ được cải tiến, mức độ hài lòng trung bình tính được là 82 với
độ lệch điều chỉnh mẫu là 8. Với độ tin cậy 95%, có thể kết luận rằng khách hàng đã được hài
lòng ở mức độ cao hơn không?
Giải:
B1. Phát biểu giả thiết và đối thiết:

138
Vì công ty quan tâm đến việc cải tiến các dịch vụ của công ty thiết bị viễn thông có làm thỏa mãn
khách hàng ở mức độ cao hơn so với trước hay không. Do đó ta đặt giải thiết:
H0: µ ≤ µ0 = 75
H1: µ >µ0 = 75
B2. Chọn mức ý nghĩa α=0,05
B3. Xác định phương pháp kiểm đinh: Đây là bài toán kiểm định tham số trung bình, σ chưa biết,
mẫu lớn hơn 30
B4. Tính giá trị kiểm định

k qs ≡ U =
(x − µ ) 0 n
=
(82 − 75 ) 350
= 6 , 2363
,
s 8
B4. Tính giá trị kiểm định
Với mức ý nghĩa α = 0,05 và đây là bài toán kiểm định một đuôi nên miền bác bỏ tương ứng
trong trường hợp này có dạng:
⎧⎪
W α = ⎨U =
(
x − µ0 ) n ⎫⎪
, U > U 1−α = U 0 , 95 = 1,645 ⎬
⎪⎩ s' ⎪⎭

Với mức ý nghĩa 5%,vì U1-α=1,645


1,645 6,2363

Miền bác bỏ
Kết luận: Vì kqs∈Wα nên giả thiết H0 bị bác bỏ, ta kết luận rằng với việc cải tiến các dịch vụ,
công ty thiết bị viễn thông ATC đã làm cho thỏa mãn khách hàng ở mức độ cao hơn trước
Kiểm định giả thiết tham số tỷ lệ
Trong một số trường hợp, chúng ta cần kiểm định giả thiết về tham số tỷ lệ của các phần tử loại
A (loại phần tử mà chúng ta muốn nghiên cứu) trong tổng thể (P), gọi fn là tỷ lệ của phần tử loại
A có trong mẫu và P0 là một tỷ lệ đã được xác định trước. Quy trình kiểm định như sau:
B1. Phát biểu giả thiết và đối thiết

Đối xứng Phải Trái


Giả thiết H0: P = P0 H0: P ≤ P0 H0: P ≥ P0
Đối thiết H1: P ≠ P0 H1: P > P0 H1: P < P0

B2. Lựa chọn mức ý nghĩa α=0,05


B3. Phương pháp kiểm định: Kiểm định tham số tỷ lệ các phần tử loại A có trong tổng thể.
B4. Tính giá trị kiểm định:
( f n − P0 ) n
k qs ≡ U =
P0 (1 − P0 )
B5. Miền bác bỏ và kết luận:

139
Với α cho trước, ta có miền bác bỏ Wα là:
⎧⎪ ( f − P0 ) n ;U ⎫⎪
Wα = ⎨U = n 1−α ⎬
⎪⎩ P0 (1 − P0 ) ⎪⎭

Khi đó: U ≥ U 1−α kiểm định phía phải - bác bỏ H0 và chấp nhập H1 (hay P > P0).
U ≤ −U 1−α kiểm định phía trái - bác bỏ H0 và chấp nhận H1 (hay P < P0).

U ≥U α kiểm định đối xứng – bác bỏ H0 và chấp nhận H1 (hay P ≠ P0).


1−
2

Chúng ta so sánh kqs với Wα để đưa ra kết luận


Các bước của bài toán kiểm định tham số tỷ lệ các phần tử loại A trong tổng thể được thể hiện
trong bảng sau:
KIỂM ĐỊNH THAM SỐ TỶ LỆ CỦA TỔNG THỂ
1. Giả thiết và đối thiết:
Đối xứng Phải Trái
Giả thiết H0: P = P0 H0: P ≤ P0 H0: P ≥ P0
Đối thiết H1: P ≠ P0 H1: P > P0 H1: P < P0
2. Xác định mức ý nghĩa
3. Phương pháp kiểm nghiệm tham số tỷ lệ tổng thể
4. Tiểu chuẩn kiểm định:
( f n − P0 ) n
P =
P0 (1 − P0 )
5. Điểm tới hạn và miền bác bỏ:
Đối xứng Phải Trái
Điểm tới hạn - U1-α/2 và U1-α/2 U1-α - U1-α
Miền bác bỏ P<- U1-α/2 và P>U1-α/2 P>U1-α P<-U1-α
BB CN BB BB BB
Mô hình
-U1-α/2 U1-α/2 U1-α -U1-α

 Ví dụ: Giả sử một sản phẩm của công ty sản xuất vỏ xe ô tô đã chiếm được 42% thị trường.
Hiện tại, trước sự cạnh tranh của đối thủ và những điều kiện thay dổi của môi trường, ban lãnh
đạo công ty muốn kiểm tra lại xem thị phần của công ty có còn là 42% hay không. Chọn ngẫu
nhiên 550 ô tô trên đường, kết quả cho thấy 219 xe sử dụng vỏ xe của công ty. Có kết luận gì ở
mức ý nghĩa 5%.

Giải: Trường hợp này ta chỉ quan tâm đến thị phần của công ty có còn là 42% hay không. Khi
đó:
B1. Phát biểu giả thiết và đối thiết:
Ho: P = P0 = 0,42
H1: P ≠ P0 = 0,42
B2. Chọn mức ý nghĩa α=0,01
B3. Chọn phương pháp kiểm định: Phương pháp điểm định đối xứng tham số tỉ lệ trong tổng thể.
140
B4. Tính tiêu chuẩn kiểm định
219
− 0,42 ) 550
(
( f n − P0 ) n
k qs ≡ P = = 550 = − 1,037
P0 (1 − P0 ) 0,42 (1 − 0,42 )

Với mức ý nghĩa 5%, ta có thể xác định miền bác bỏ như sau:
⎧⎪ ( f − P0 ) n ⎫⎪
Wα = ⎨U = n , U > U α = U 0 , 975 = 1,96 ⎬
⎪⎩ P0 (1 − P0 ) 1−
2 ⎪⎭

Thể hiện qua hình vẽ

Miền bác bỏ Miền bác bỏ

-1,96 -1,037 -1,96

Vì kqs∈Wα nên chúng ta bác bỏ giả thiết H0 và chấp nhập H1 có nghĩa thị phần của công ty
đã thay đổi so với 42%.
Kiểm định sự khác nhau giữa trung bình của hai tổng thể
Điều kiện ứng dụng: Hai biến nghiên cứu (đại diện đo lường hai mẫu) phải là biến định lượng,
tuân theo quy luật phân phối chuẩn và phương sai bằng nhau.
Kiểm định tham số trung bình dựa trên hai biến (mẫu) độc lập
a.Trường hợp đã biết phương sai σ2 của các mẫu
Điều kiện để thực hiện phương pháp kiểm định sự khác biệt của hai trung bình tổng thể (dựa trên
mẫu ngẫu nhiên độc lập) là dữ liệu mẫu phải theo luật phân phối chuẩn.
B1. Giả thiết và đối thiết:

Đối xứng Phải Trái


Giả thiết H0: µx - µy = D0 H0: µx - µy ≤ D0 H0: µx - µy ≥ D0
Đối thiết H1: µx - µy ≠ D0 H1: µx - µy > D0 H1: µx - µy < D0

B2. Chọn mức ý nghĩa α


B3. Xác định phương pháp kiểm định : Phương pháp kiểm định sự khác biệt tham số trung bình
giữa hai mẫu (độc lập) – Phân phối chuẩn.
B4. Xác định tiêu chuẩn kiểm định :
x − y − D0
k qs ≡ U =
σ x2 σ y2
+
nx ny

B5. Miền bác bỏ và kết luận: Miền bác bỏ với α cho trước :

141
x − y − D0
Nếu H1 đúng tức µx - µy > D0, khi đó Wα: U = > U1−α
σ 2
σ y2
x
+
nx ny

Nếu H1 đúng tức µx - µy < D0, khi đó Wα: U = x − y − D0 < −U


1−α
σ x2 σ y2
+
nx ny

Nếu H1 đúng tức µx - µy < D0, khi đó Wα : U = x − y − D0 ≥ U


α
σ x2 σ y2 1−
2
+
nx ny

Tính hệ số quan sát, so sánh với miền bác bỏ và kết luận.


 Ví dụ: Người ta tiến hành nghiên cứu về thời gian sử dụng trung bình của hai nhãn hiệu pin X
và Y (cùng chủng loại) của hai nhà sản xuất khác nhau. Chọn ngẫu nhiên mỗi nhãn hiệu 100 viên
pin kết quả ghi nhận được như sau: Pin X có thời gian sử dụng trung bình là 308 phút, độ lệch
chuẩn 84 phút, các chỉ số tương tứng của pin Y lần lượt là 254 phút và 67 phút. Với mức ý nghĩa
α = 0,10 ,có thể kết luận thời gian sử dụng trung bình của pin X lớn hơn pin Y ít nhất là 45 phút
được không ? Biết thời gian sử dụng trung bình của hai nhãn hiệu pin trên là các đại lượng ngẫu
nhiên phân phối chuẩn.
Giải: Áp dụng phương pháp kiểm định sự khác biệt giữa hai trung bình tổng thể theo luật phân
phối chuẩn (chưa biết σ và nx, ny <30).
Gọi thời gian sử dụng trung bình của pin X và Y lần lượt là µx ,µy; khi đó µx ,µy là các đại lượng
ngẫu nhiên phân phối chuẩn. Theo đề bài, chúng ta cần quan tâm đến việc thời gian sử dụng
trung bình của pin X có lớn hơn pin Y ít nhất là 45 phút hay không. Do vậy, B1. Giả thiết và đối
thiết:
H0: µx - µy ≤ 45
H1: µx - µy > 45
B2. Chọn mức ý nghĩa α=0.1
B3. Phương pháp kiểm định : Phương pháp kiểm định sự khác biệt giữa hai tham số trung bình
khi σ đa biết
B4. Tiêu chuẩn kiểm định :
x − y − D0 308 − 254 − 45
k qs = = = 0 , 838
σ 2
σ 2
84 2 67 2
x
+ y
+
nx ny 100 100
B5. Miền bác bỏ với α=0,05 cho trước :

Ta có Wα : x − y − D0
U= > U 1−α = U 0,90 = 1,28
σ x2 σ y2
+
nx ny

142
Minh họa bằng vẽ:
0,838 1,28

Miền bác bỏ

Kết luận: vì kqs ∉ Wα nên ta chưa thể bác bỏ H0 và chấp nhận H1, tức là chưa có cơ sở để kết
luận thời gian sử dụng trung bình của pin X có lớn hơn pin Y ít nhất là 45 phút.
b.Trường hợp chưa biết σ2:
• Trường hợp kích thước mẫu lớn (nx, ny ≥30):
Trường hợp kích thước mẫu lớn (nx, ny ≥30) với giả định cả hai tổng thể X và Y phân phối chuẩn,
ta có thể dùng công thức và quy tắc trên để kiểm định và với phương sai hiệu chỉnh mẫu s’2x, s’2y
thay cho phương sai tổng thể kể cả trường hợp phân phối tổng thể không chuẩn.
• Trường hợp kích thước mẫu nhỏ (nx<30; ny< 30):
Phương pháp kiểm định sự khác biệt của hai trung bình tổng thể (dựa trên mẫu ngẫu nhiên độc
lập) theo luật phân phối Student (chưa biết σ):

Trong trường hợp mẫu nhỏ (hoặc nx, hoặc ny <30, hoặc cả nx, ny <30). Chúng ta vẫn dùng s’2x và
s’2y thay cho phương sai tổng thể.
nhưng khi đó tiêu chuẩn kiểm định sẽ theo phân phối Student với số bậc tự do được xác định theo
công thức:
'2
s x' 2 s y
( + ) 2

n x n y
btd =
s '2 s 'y2 2
( x
) 2
( )
n x n y
+
n x − 1 n y − 1

B1. Giả thiết và đối thiết:

Đối xứng Phải Trái


Giả thiết H0: µx - µy = D0 H0: µx - µy ≤ D0 H0: µx - µy ≥ D0
Đối thiết H1: µx - µy ≠ D0 H1: µx - µy > D0 H1: µx - µy < D0

B2. Chọn mức ý nghĩa α


B3. Xác định phương pháp kiểm định : Phương pháp kiểm định sự khác biệt tham số trung bình
giữa hai mẫu (độc lập).
B4. Tiêu chuẩn kiểm định :
x − y − D
K ≡ T = 0
'2
s '2
s y
x
+
n x n y

B5. Miền bác bỏ với α cho trước:


143
Nếu H1 đúng tức µx - µy > D0, khi đó Wα:
x − y − D0 btd
T =
,2 ,2
> Tα
s x
+
s y

nx ny

Nếu H1 đúng tức µx - µy < D0, khi đó Wα: x − y − D0


T = < − Tαbtd
'2 '2
s s
x y
+
nx ny

Nếu H1 đúng tức µx - µy ≠ D0, khi đó Wα: x − y − D0


T = < − T αbtd
'2 '2
s s
x y 2
+
nx ny

Tính hệ số quan sát, so sánh với Wα và kết luận .


 Ví dụ: Kiểm tra chiều dài trung bình của một chi tiết được chế tạo từ hai thiết bị khác nhau
một cách ngẫu nhiên, ta có : mẫu ngẫu nhiên 15 chi tiết của thiết bị thứ nhất có chiều dài trung
bình là 100 cm và độ lệch chuẩn hiệu chỉnh là 5 cm ; mẫu ngẫu nhiên 10 chi tiết của thiết bị thứ
hai có chiều daì trung bình là 110 cm và độ lệch chuẩn hiệu chỉnh là 3cm. Với mức ý nghĩa α =
0,05, hãy kết luận xem kích thước trung bình của chi tiết trên được chế tạo ở hai thiết bị trên có
như nhau hay không. Biết chiều dài trung bình của chi tiết trên là đại lượng ngẫu nhiên phân
phối chuẩn.
Giải: Áp dụng phương pháp kiểm định sự khác biệt giữa hai trung bình tổng thể theo luật phân
phối chuẩn (chưa biết σ và nx, ny <30).
Gọi chiều dài trung bình của chi tiết được chế tạo trên hai thiết bị lần lượt là µx ,µy với µx, µy là
các đại lượng ngẫu nhiên phân phối chuẩn. Theo đề bài, chúng ta cần phải kiểm tra xem kích
thước của chi tiết được chế tạo trên hai thiết bị có như nhau hay không.
B1. Giả thiết và đối thiết:
H0: µx - µy = 0
H1: µx - µy ≠ 0
B2. Chọn mức ý nghĩa α
B3. Xác định phương pháp kiểm định: Phương pháp kiểm định sự khác biệt tham số trung bình
giữa hai mẫu (độc lập), σ chưa biết.
B4. Tiêu chuẩn kiểm định:
x − y − D0
T = ≥ T αbtd = T 022, 025 = 2 , 074
'2 '2
s x s y 2
+
nx ny

Trong đó bậc tự do được xác định theo công thức :

144
25 9 2
( + )
btd = 15 10 = 22 , 84
25 2 9 2
( ) ( )
15 + 10
14 9
Minh họa bằng hình vẽ:
-6,242 -2,074 2,074

Miền bác bỏ Miền bác bỏ

Kết luận: kqs ∈ Wα, ta bác bỏ giả thiết H0 và chấp nhận đối thuyết H1, nghĩa là chiều dài trung
bình của chi tiết được chế tạo ở hai thiết bị trên là khác nhau.
Hai biến (mẫu) phối hợp từng cặp
Điều kiện áp dụng: Khi tiến hình so sánh sự khác nhau giữa trung bình hai tổng thể, hai mẫu cần
thỏa mãn điều kiện là dữ liệu phải tuân theo quy luật phân phối chuẩn và phương sai của hai mẫu
phải bằng nhau.
B1. Giả thuyết và đối thuyết:

Đối xứng Phải Trái


Giả thiết H0: µx - µy = D0 H1: µx - µy ≤ D0 H0: µx - µy ≥ D0
Đối thiết H1: µx - µy ≠ D0 H1: µx - µy > D0 H1: µx - µy < D0

B2. Lựa chọn mức ý nghĩa α


B3. Lựa chọn phương pháp kiểm định: Phương pháp kiểm định sự khác nhau trung bình của hai
tổng thể (mẫu phối hợp từng cặp), chúng ta dùng bảng phân phối chuẩn (nếu mẫu lớn hơn hoặc
bằng 30) hay phân phối T-student (nếu mẫu nhỏ hơn 30)
B4. Tiêu chuẩn kiểm định
( x − D0 ) n
K ≡D = với x và s’d là trung bình và độ lệch chuẩn của n khác biệt.
s'd

B5. Miền bác bỏ với α cho trước:


( x − D0 ) n
Nếu H0 : µx - µy > D0, khi đó Wα: T = > U1-α (hoặc -T(n-1);α nếu n<30)
s 'd

( x − D0 ) n
Nếu H0 : µx - µy < D0, khi đó Wα: T = < U1-α (hoặc -T(n-1);α nếu n<30)
s 'd

( x − D0 ) n
Nếu H0: µx - µy ≠ D0, khi đó Wα: ⏐T⏐ = ≥ U1-α/2 (hoặc T(n-1);α/2 nếu n<30)
s 'd

Tính hệ số quan sát kqs để so sánh với miền bác bỏ và kết luận.
Mô hình của bài toán kiểm định sự khác biệt giữa hai tham số trung bình có thể tóm lược ở biểu
sau:

145
KIỂM ĐỊNH THAM SỰ KHÁC NHAU HAI TRUNG BÌNH TỔNG THỂ
(dựa trên sự phân phối từng cặp)
1. Giả thiết và đối thiết:
Đối xứng Phải Trái
Giả thiết H0: µx - µy =D0 H0: µx - µy ≤ D0 H0: µx - µy ≥ D0
Đối thiết H1: µx - µy ≠ D0 H1: µx - µy > D0 H1: µx - µy < D0
2. Xác định mức ý nghĩa
3. Phương pháp kiểm nghiệm sự khác nhau của hai trung bình tổng thể - Bảng phân
phối chuẩn hoặc T-student (nếu n<30)
(x − D0 ) n
4. Tiểu chuẩn kiểm định T hoặc U: kqs ≡ T =
x và s’d là trung bình và độ lệch chuẩn điều chỉnh của n khác biệt s'd
5. Điểm tới hạn và miền bác bỏ:
Đối xứng Phải Trái
Điểm tới hạn - T(n-1);1-α/2 và T(n-1);1- T(n-1);1-α - T(n-1);1-α
α/2
D<- T(n-1);1-α/2
Miền bác bỏ D>T(n-1);1-α D<-T(n-1);1-α
và D>T(n-1);1-α/2
Mô hình BB CN BB BB BB
-T(n-1);1-α/2 T(n- T(n-1);1-α -T(n-1);1-α

 Ví dụ: Một công ty hóa mỹ phẩm đã tiến hành một chiến dịch khuyến mãi nhằm mục đích tăng
doanh số. Để đánh giá xem việc khuyến mãi có thực sự làm tăng doanh số hay không, công ty đã
chọn ngẫu nhiên 15 cửa hàng trong hệ thống phân phối sản phẩm của mình và khảo sát sự khác
biệt về doanh số bán trong tuần lễ trước và sau chiến dịch khuyến mãi. Số liệu thu thập được thể
hiện trong bảng sau:

Doanh số trong tuần (triệu đồng)


Cửa hàng di=(xi-yi) (di- x )2
Trước khuyến mãi Sau khuyến mãi
1 57 60 -3 3,24
2 61 54 7 67,24
3 12 20 -8 46,24
4 38 35 3 17,64
5 12 21 -9 60,84
6 69 70 -1 0,04
7 5 1 4 27,04
8 69 65 4 27,04
9 88 79 9 104,04
10 9 10 -1 0,04
11 92 90 2 10,24
12 26 32 -6 23,04
13 14 19 -5 14,44
14 70 77 -7 33,64
15 22 29 -7 33,64
-18 468,40
x =-1.2 s’d=5,78
146
Với mức ý nghĩa α=0,05, có thể kết luận chiến dịch khuyến mãi đã làm tăng doanh số hay
không?
Giải:
Gọi µx , µy lần lượt là doanh số trung bình sau và trước khi thực hiện chiến dịch khuyến mãi, µx ,
µy là đại lượng ngẫu nhiên tuân theo quy luật phân phối T-student (vì n=15<30)
B1. Giả thiết và đối thiết:
H0 : µx - µy ≤ 0
H1: µx - µy > 0
B2. Mức ý nghĩa α=0,05.
B3. Phương pháp kiểm định: Kiểm định sự khác nhau giữa hai trung bình của tổng thể (hai mẫu
phối hợp từng cặp).
B4. Tính giá trị kiểm định:
( x − D0 ) n
k qs ≡ D = với x và s’d là trung bình và độ lệch chuẩn của n khác biệt.
s 'd

Từ số liệu trên, ta tính được x =-1,2 và s’d = 5,78. Khi đó Kqs sẽ là:

(x − D0 ) n − 1, 2 15
k qs = '
= = − 0 ,803
sd 5 , 78
B4. Miền bác bỏ và kết luận:
(x − D 0 ) n
Với H1: µx - µy > 0, khi đó Wα : T = >T(n-1);α = T(14),0,05 = 1,761
s' d

Minh họa bằng hình vẽ:


-0,803 1,761

Miền bác bỏ

Kết luận: vì kqs không thuộc Wα nên chưa có cơ sở để bác bỏ giả thiết H0 và chấp nhận giả
thuyết đối H1 ở mức ý nghĩa α=0,05, hay chiến dịch khuyến mãi của công ty vẫn chưa làm
tăng doanh số.
Kiểm định sự khác nhau giữa trung bình từ hai mẫu trở lên – Phân tích ANOVA (Gồm một
biến định lượng và một biến phân loại (biến định tính))
Mục tiêu của phân tích phương sai là so sánh trung bình của nhiều tổng thể dựa trên các trung
bình mẫu, đây là hình thức mở rộng của kiểm định T-student. Trong trường hợp biến phân loại có
nhiều hơn 2, chúng ta thường sử dụng phân tích phương sai (ANOVA – Analysis of variance).
Tại sao vây?, bởi vì khi sử dụng kiểm định t đối với hai mẫu độc lập, trong trường hợp biến phân
loại có 3 hoặc nhiều hơn 3 nhóm, chúng ta phải thực hiện rất nhiều cặp (k) so sánh lẫn nhau từng
đôi một, điều này dẫn đến một tình trạng là sai số của kiểm định sẽ lớn hơn rất nhiều so với mong
muốn ban đầu. Ví dụ, mỗi một kiểm định Z hay t (kiểm định sự khác nhau tham số trung bình
giữa hai mẫu độc lập) chứa đựng một sai số dạng I, tổng sai số của dạng I đối với k đôi giá trị
trung bình bằng I=1-(1 - α)k. Trong một trường hợp cụ thể, giả sử chúng ta có một biến phân loại
147
với 5 giá trị lựa chọn và α = 0,05, khi đó chúng ta sẽ có 10 so sánh nếu chúng ta dùng phương
pháp kiểm định t. Sai số dạng I của kiểm định t khi đó sẽ là:
I =1 – (1- α)k = 1- (1-0,05) = 1-(0,95)10 = 0.40
Trong trường hợp này, sai số để chúng ta bác bỏ giả thuyết H0 về bằng nhau của các giá trị trung
bình ngay cả khi H0 đúng là 40% chứ không phải là 5% như ban đầu.
Các điều kiện sử dụng: Các mẫu được rút ra theo cách ngẫu nhiên và độc lập (điều kiện này phải
được đảm bảo), các tổng thể có phân phối chuẩn (hoặc gần phân phối chuẩn) và các tổng thể có
cùng phương sai.
Phân tích phương sai một chiều: (One-Way Analysis of Variance)
Phân tích phương sai một chiều là phân tích dựa trên ảnh hưởng của một nhân tố định lượng đến
một nhân tố định tính (dạng phân loại).
Giả sử từ một biến phân loại, chúng ta có thể chia tổng thể thành k nhóm tuân theo quy luật phân
phối chuẩn và có phương sai bằng nhau dựa trên k mẫu ngẫu nhiên độc lập gồm n1, n2,..., nk quan
sát.
Gọi xij là giá trị của biến định lượng đang nghiên cứu tại quan sát thứ j của nhóm thứ I, khi đó,
x 1 , x 2 ,…, x k là giá trị trung bình của các nhóm, x là trung bình chung của tất cả các nhóm theo
biến định lượng đang nghiên cứu.
Gọi giá trị trung bình của các nhóm trong tổng thể là µ1, µ2,…, µk thì phương pháp phân tích
phương sai sẽ cho phép chúng ta so sánh sự khác nhau giữa tham số trung bình của 2 hay nhiều
nhóm có trong mẫu để suy rộng lên tổng thể.
B1. Giả thiết và đối thiết trong phân tích phương sai một chiều được phát biểu như sau:
H0: µ1= µ2 =… = µk
H1: Tồn tại ít nhất một giá trị trung bình của nhóm thứ I (µi) khác với ít nhất một giá trị trung
bình của nhóm còn lại.
B2. Lựa chọn mức ý nghĩa α
B3. Bài toán phân tích phương sai một chiều (One-way ANOVA).
B4. Tính tiêu chuẩn kiểm định
Để tính tiêu chuẩn kiểm định trong phân tích phương sai (ANOVA), chúng ta cần tiến hành tính
các chỉ tiêu sau:
- Tổng độ lệch bình phương giữa các nhóm (Sum of squares between groups): phản ánh biến
thiên của biến định lượng đánh nghiên cứu do tác động của biến phân loại đang xem xét
k
SSG = ∑ ( x − x i ) 2
i =1

- Tổng độ lệch bình phương trong nội bộ nhóm (Sum of squares within groups) phản ánh biến
thiên ngẫu nhiên do ảnh hưởng của các yếu tố khác không xem xét ở mẫu.
k ni
SSW = ∑ ∑ ( x ij − x i ) 2
i =1 j =1

- Tổng các độ lệch bình phương toàn bộ (Total sum of squares): phản ánh toàn bộ biến thiên của
biến định lượng đang nghiên cứu.
148
k ni
SST = ∑∑ ( xij − x) 2 hay SST = SSW + SSG.
i =1 j =1

- Phương sai giữa các nhóm (Mean squares between groups):


SSG
MSG =
k −1
- Phương sai trong nội bộ các nhóm (Mean squares within groups):
SSW
MSW =
n−k
Lúc đó tiêu chuẩn kiểm định F (Fisher) được tính bằng:
MSG
F=
MSW
Chúng ta có thể tóm gọn cách tính thông qua bảng sau:
ANOVA
Sum of Squares df Mean Square F Sig.
Between k
SSG MSG
SSG = ∑ ( x − x i ) 2 k-1 MSG = F= P(F)
Groups i =1 k −1 MSW
ni
Within k
SSW
SSW = ∑∑ ( xij − x i ) 2 n-1 MSW =
Groups i =1 j =1 n−k
k ni
SST = ∑ ∑ ( x ij − x ) 2
Total i =1 j =1

(SST=SSG+SSW)
B5. Miền bác bỏ:
Với α cho trước, chúng ta bác bỏ H0 nếu F>Fk-1,n-k,α với k-1 là bậc tự do của tử số và n-k là
bậc tự do của mẫu số.
 Ví dụ: Công ty A là công ty chuyên phân phối bột giặt cho thị trường Thành phố Đà Nẵng,
hiện tại công ty phân phối đến khách hàng thông qua 4 của hàng 1, 2, 3, 4. Để đưa ra những
quyết định marketing phù hợp, công ty muốn xem xét có sự khác nhau trong doanh số bán của
các cửa hàng hay không, số liệu thu thập trong một năm tại các cửa hàng được thể hiện ở bảng
sau:
ĐVT: triệu đồng

Cửa hàng số 1 Cửa hàng số 2 Cửa hàng số 3 Cửa hàng số 4


Tháng 1 120 123 112 119
Tháng 2 123 143 127 134
Tháng 3 134 132 156 245
Tháng 4 123 153 176 256
Tháng 5 132 143 145 364
Tháng 6 111 164 204 373
Tháng 7 176 174 275 367
Tháng 8 192 184 284 283
149
Tháng 9 145 142 195 293
Tháng 10 133 165 143 274
Tháng 11 126 102 134 246
Tháng 12 138 123 127 234
B1. Giả thuyết và đối thiết:
H0: Doanh số bán trung bình hàng tháng của các cửa hàng là bằng nhau (µ1=µ2=µ3=µk)
H1 : Tồn tại ít nhất một cửa hàng có doanh số bán khác với ít nhất một cửa hàng còn lại.
B2. Mức ý nghĩa α=0,05
B3. Phương pháp kiểm định : Thực hiện phương pháp phân tích phương sai một chiều.
B4. Tính tiêu chuẩn kiểm định :
- Doanh số trung bình của cửa hàng số 1: 137,75 triệu
- Doanh số trung bình của cửa hàng số 2: 145,67 triệu
- Doanh số trung bình của cửa hàng số 3: 173,17 triệu
- Doanh số trung bình của cửa hàng số 4: 265,67 triệu
- Doanh số trung bình của hàng tháng của công ty là 180,56 triệu
- Tham số SSG = 124176,56
- Tham số SSW = 121275,25
- Bậc tự do k-1=3
- Bậc tự do n-k = 44
- Tham số MSG = 41392,18
- Tham số MSW= 2756,25
- Hệ số Fisher (F) = 15,01
B5. Miền bác bỏ và kết luận:
- Ta có Fk-1;n-k;α = F 3;47;0,05 = 2,816
- Vì F = 15,01 > 2,816 nên chúng ta bác bỏ H0, chấp nhận H1 có nghĩa là tồn tại ít nhất một của
hàng có doanh số bán khác với doanh số bán của ít nhất một của hàng còn lại.
Hồi quy tương quan (mối quan hệ giữa hai hay nhiều biến định lượng)
Khi nghiên cứu mối quan hệ giữa hai hay nhiều biến định lượng, chúng ta có thể sử dụng phương
pháp hồi quy, trong đói có một biến nguyên nhân (biến độc lập) và một biến kết quả (biến phụ
thuộc). Trong phương pháp này người ta có thể tìm ra được mối quan hệ và mức độ tác động của
biến nguyên nhân đến biến kết quả như thế nào. Giả sử chúng ta kiểm tra mối quan hệ tuyến tính
giữa số năm làm việc trong doanh nghiệp với thu nhập. Khi đó, ta có thể thấy rằng biến phụ thuộc
là biến thu nhập (biến Y) và biến độc lập là biến số năm làm việc (biến X)
Điều kiên ứng dụng
- Giá trị của biến X là hoàn toàn độc lập so với biến Y
- Sai số trong mô hình phải tuân theo quy luật phân phối chuẩn
- Trung bình các sai số của mô hình phải bằng không
150
- Phương sai của sai số là một hằng số và độc lập với giá trị X
Đồ thị
Trước khi xem xét mối quan hệ tương quan giữa hai biến này, chúng ta cần phải xây dựng đồ thị
giữa hai biến số để chúng ta có thể dự đoán hàm số thích hợp để mô tả mối quan hệ.
Qua đồ thị, chúng ta có thể dự đoán được, có thể dùng phương trình đường thẳng để mô tả mối
quan hệ giữa hai biến X, Y. Khi đó, mô hình hồi quy giản đơn trên tổng thể có thể được biểu hiện
như sau:
Yi = β0 + β1Xi + εi (1)
Trong đó: Xi là số năm làm việc của người thứ i
Yi là thu nhập hàng năm của người thứ i
β0 giá trị của mô hình (giá trị của biến Y) khi giá trị của biến độc lập X bằng 0
β1 đo lường mức độ thay đổi của biến Y khi biến X thay đổi một đơn vị
100000

80000

60000
Thu nhap nam (trieu)

40000

20000

0
6 8 10 12 14 16 18 20

Nam lam viec

Kiểm tra sự phù hợp của mô hình


Phân tích phương - ANOVA (kiểm tra sự tồn tại mối quan hệ trong mô hình)
Một mô hình tuyến tính được xây dựng khi nó tồn tại mối quan hệ giữa biến độc lập và biến phụ
thuộc, phân tích phương sai sẽ cho phép kiểm định mối quan hệ tuyến tính giữa hai biến.
- Gọi SST là tổng bình phương các biến động (giữa giá trị thực tế và giá trị trung bình của biến
n
y). Khi đó ta có: SST = ∑ ( y i − y ) 2
i =1

- Gọi SSR là tổng bình phương hồi quy, là đại lượng biến động của giá trị thực tế yi được giải
n
thích bởi giá trị hồi quy, SSR = ∑ ( yˆ i − y ) 2
i =1

151
- Gọi SSE là tổng bình phương biến động giữa giá trị thực tế và giá trị hồi quy, khi đó ta có thể
n
tính được SSE = ∑ ( yi − yˆ i ) 2
i =1

SSR
Khi đó trung bình bình phương hồi quy sẽ là MSR = với k là số biến (trong trường hợp này
k
SSE
k=1) và trung bình bình phương phân dư MSE =
n−k
MSR
Giá trị kiểm định F = có phân phối F (Phân phối Fisherr) dùng để kiểm định ý nghĩa của
MSE
mô hình hồi quy, do vậy, giá trị F càng lớn (hay P(F) càng nhỏ hơn α) thì mô hình càng có ý
nghĩa.
Hệ số R2 (s-square)
Hệ số R2 dùng để đo lường sự phù hợp của mô hình tuyến tính và nó thường gọi là hệ số xác định
(coefficient of determination). Hệ số này biểu hiện tỷ lệ phần trăm biến đội của biến y được giải
SSR SSE
thích bởi các biến x. Khi đó R 2 = = 1− .
SST SST
Tuy nhiên, R2 của mẫu có khuynh hướng là ước lượng lạc quan của thước đo sự phù hợp của mô
hình đối với tổng thể. Do vậy, R2a (gọi là R2 điều chỉnh) được sử dụng để phản ánh chính xác hơn
sự phù hợn của mô hình với tổng thể và:
k (1 − R 2 )
R =R −
2
a
2

n − k −1
Tính các hệ số trong mô hình
Ở phương trình (1) chúng ta quan tâm chú ý đến hai hệ số β0 và β1, yêu cầu của mô hình hồi quy
là làm nhu thế nào để tìm được các hệ số này, chúng ta có thể thể tính toán các giá trị tương ứng
của β0 và β1 là b0 và b1 trên mẫu để ứng lượng lên tổng thể. Đặt (x1, y1), (x2, y2),..., (xn,yn) là mẫu
gồm n cặp quan sát trên đường hồi qui tổng thể có dạng:
yi = b0 + b1xi + ei
Theo phương pháp bình phơng bé nhất, ta có thể ước lượng các hệ số β0 và β1 từ các hệ số b0 và
tham số b1 của mẫu sao cho tổng bình phương sai số của phương trình sau đây là bé nhất:
n n
SSE = ∑ ei2 = ∑ ( yi − b0 − b1 xi ) 2
i =1 i =1

Khi đó các giá trị b0 và b1 được tính như sau:


n n n
n ∑ x i y i − ( ∑ x i )( ∑ y i )
b1 = i =1
n
i =1
n
i =1
và b0 = y − bi x
n ∑ x − (∑ xi )
2
i
2

i =1 i =1

n n

∑ yi ∑x i
Với y= i =1
và x = i =1

n n
152
Hệ số hồi quy chuẩn hóa (standardized regression coefficient)
Hệ số hồi quy chuẩn hóa, kí hiệu là Beta biểu hiện độ dốc của đường thẳng (tìm được theo
phương pháp bình phương bé nhất) khi cả hai biến X và Y được biểu diễn bằng thang đo chuẩn
hóa, nó được tính bằng:
sx
Beta = β 1 với sx và sy là độ lệch chuẩn của biến X và biến Y.
sy
Ước lượng các tham số của tổng thể
Phân tích hồi quy không chỉ mô tả các dữ kiện quan sat được mà công cho phép suy rộng các kết
luận về mối quan hệ trong mẫu lên tổng thể. Suy rộng các kết quả của mẫu cho các giá trị của
tổng thể dựa vào các giả định sau:
- Với bất kì một giá trị X nào thì phân phối chuẩn của biến Y phải là phân phối chuẩn
- Các giá trị Y độc lập đối với nhau tức là quan sát này không bị ảnh hưởng bởi các quan sát
khác.
- Tất cả các trị trung bình µy khi X xảy ra đều nằm trên một đường thẳng – đó là đường hồi quy
tổng thể.
Khi chúng ta biết các giá trị b0 và b1 trên mẫu, chúng ta sẽ suy rộng giá trị này lên tổng thể cho
các giá trị β0 và β1.
Nếu đặt σ2e và s2e là phương sai của sai số của mẫu (e) và tổng thể (ε), ta có:
n

∑e 2
i
SSE
s e2 = i =1
=
n−2 n −1
Nếu đặt β1 là giá trị ước lượng của b1 trên tổng thể thì phương sai của b1 sẽ là:
s e2 se2
s =
2
b1 n
= n

∑ (x ∑x
2
i − x) 2 2
i − nx
i =1 i =1

Khi đó độ lệch chuẩn của sai số sẽ là:

se2
sb1 = s = 2
b1 n

∑x
2
2
i − nx
i =1

Suy ra ước lượng không chệch của σ2b1 sẽ được xác định:
s e2
σ b2 =1 n

∑x
2
2
i − nx
i =1

Giả sử t sai số hồi quy (ei) tuân theo quy luật phân phối chuẩn thì biến ngẫu nhiên (t) là giá trị
dùng để kiểm định:
b1 − β1
T=
sb1
153
Gọi α là mức ý nghĩa thì ta luôn luôn tìm được một khoảng tin cậy của β1, khi đó:
b1 − sb1 t αn −2 ≤ β1 ≤ b1 + sb1 t αn −2
2 2

Kiểm định các tham số của tổng thể


B1. Giả thiết và đối thiết

Đối xứng Phải Trái


Giả thiết H0: β1 = β1o H0: β1 ≤ β1o H0: β1 ≥ β1o
Đối thiết H1: β1 ≠ β1o H1: β1 > β10 H1: β1 < β1o

B2. Xác định mức ý nghĩa α


B3. Phương pháp kiểm định: Kiểm định t-student đối với mối quan hệ giữa hai biến.
B4. Tính tiêu chuẩn kiểm định:
b1 − β10
k qs ≡ T =
sb1

B5. Miền bác bỏ và kết luận: Giả thiết H0 được bác bỏ khi:
T ≥ t αn −1 (kiểm định đối xứng)
2

T ≥ tαn −1 (kiểm định phía phải)

T < −tαn −1 (kiểm định phía trái)


Dự đoán giá trị
Khi chúng ta có các hệ số b0 và b1, chúng ta có thể thành lập được mô hình, thay các giá trị xn+1
vào thì ta có thể tính được giá trị dự đoán của mô hình.
yi = b0 + b1xi + ei
Với mỗi giá trị của xi chúng ta sẽ tìm được các giá trị dự đoán của yi tương ứng luôn này trong
khoảng Ŷ ± s ŷ t n−α2 , với sai của dựa đoán sẽ là:
1−
2

1 ( x n +1 − x) 2
s yˆ = s e +
n (n − 1) s x2

KIỂM ĐỊNH CHI BÌNH PHƯƠNG VỀ TÍNH PHỤ THUỘC HAY ĐỘC LẬP CỦA CÁC
BIẾN
Kiểm định giả thiết về quy luật phân phối của tổng thể
Kiểm định giả thiết về sự phân phối của tổng thể hay có thể gọi là kiểm định sự phù hợp là kiểm
định nhằm xem xét dữ liệu thu thập được phù hợp (thích hợp) đến mức nào với giả định về phân
phối của tổng thể.

154
Giả sử có mẫu ngẫu nhiên n quan sát được chia thành k nhóm khác nhau, mỗi quan sát phải và
chỉ thuộc về một nhóm thứ i nào đó (i=1,2,…,k).

Khi đó Oi là số lượng quan sát ở nhóm thứ i, vấn đề đặt ra là ta sẽ dùng mẫu quan sát này để kiểm
định giả thiết H0 thể hiện các xác suất pi để một quan sát nào đó thuộc về nhóm thứ i. Chúng ta
cần tính:
Tính số lượng quan sát thuộc về nhóm thứ i trong trường hợp giả thiết H0 đúng, nghĩa là tính các
giá trị mong muốn Ei theo công thức: Ei =n*pi

Nhóm 1 2 … k Σ

GT thực tế (Oi) O1 O2 … Ok n
XS theo H0 p1 p2 pk 1
Giá trị mong muốn (Ei) E1 E2 Ek n

k
(Oi − Ei ) 2
χ df2 = ∑
i =1 Ei
Tiêu chuẩn kiểm định:
Trong đó: Oi : tần số quan sát được trong thực tế
Ei : tần số theo lí thuyết
df = k-1: mức độ tự do trong phép kiểm định.
k : số loại tính chất hay số khoảng đã dùng phân loại tính chất
pi : thông số được ước định từ số liệu thu thập được.

KIỂM ĐỊNH CHI BÌNH PHƯƠNG


(kiểm định về sự phân phối tổng thể)
1. Giả thiết và đối thiết:
Giả thiết ……………….là bằng nhau
Đối thiết ………………là khác nhau
2. Xác định mức ý nghĩa
3. Phương pháp kiểm nghiệm Chi bình phương. k
(O − E )2
4. Tính tiêu chuẩn: χ2 = ∑ i i
5. Điểm tới hạn và miền bác bỏ: i=1 Ei
Là kiểm định một đuôi (df=k-1) với:
Điểm tới hạn λ2df;α
Miền bác bỏ λ2 > λ2df;α
Mô hình BB
λ2df;α

155
 Ví dụ 1: Trong một đợt ra đề thi trắc nghiệm môn Kinh tế vi mô, người ta tin tưởng rằng
60% sinh viên tham gia thi sẽ đạt điểm đậu trên bài thi trắc nghiệm này với độ tin cậy 95%.
Chọn một cách ngẫu nhiên 200 sinh viên tham gia thi và tiến hành điều tra. Kết quả thu được có
105 sinh viên đạt và 95 sinh viên không đạt. Hỏi kết quả này có trái với kết quả mong đợi hay
không ?
Giải: Gọi p là tỉ lệ sinh viên đạt điểm đậu, khi đó 1-p là tỉ lệ sinh viên không đạt
B1. Giả thiết và đối thiết
H0: p=0,6
H1: H0 không đúng hay p≠0,6
Chỉ tiêu Lí thuyết Thực tế
Đạt 0,6*200 = 120 105
Không đạt 0,4*200 = 80 95
B3. Chọn phương pháp kiểm định α=0,05.
B3. Xác định phương pháp kiểm định: Phương pháp kiểm định sự phù hợp Chi bình phương. Vì

χ (2df );α = χ (21 ); 0 , 05 = 3 ,843


df= k-1= 2-1= 1 nên với độ tin cậy 95% ta có
B4. Tính tiêu chuẩn kiểm định

(105 − 120 ) 2 ( 95 − 80 ) 2
χ df2 = + = 1,88 + 2 ,81 = 4 , 69
120 80
Minh họa bằng hình vẽ
BB

3,843 4,69
Kết luận: Vì 4,69 > 3,843 nên bác bỏ H0 ở mức ý nghĩa 0,05 và kết quả thi trái với tin tưởng
của nhà soạn câu hỏi.
 Ví dụ 2: Để chọn một bí thư đoàn cho một trường đại học người ta đề cử 3 ứng viên và chúng
ta phải kiểm tra xem tỉ lệ các đoàn viên bỏ phiếu cho mỗi ứng viên có khác nhau hay không. Một
mẫu 150 cử tri hợp lệ được chọn ngẫu nhiên từ danh sách của trường đại học ấy.
Kết quả kiểm phiếu thu được như sau:
- Ứng viên 1: 61
- Ứng viên 2: 53
- Ứng viên 1: 36
Giải:
Gọi p1, p2 ,p3 lần lượt là tỷ lệ phiếu bầu của các đoàn viên cho lần lượt các ứng viên.
B1. Phát biểu giả thiết và đối thiết
Giả thiết H0: p1= p2 =p3 =1/3
Đối thiết H1: Ít nhất một trong các tỷ lệ nhỏ hơn 1/3

156
B2. Mức ý nghĩa α=0,05
B3. Xác định phương pháp kiểm định: Phương pháp kiểm định sự phù hợp Chi bình phương. Vì

χ 2df ,α = χ 22,0,05 = 5,9914


df= k-1= 3-1= 2 nên với độ tin cậy 95% ta có
B4. Tính tiêu chuẩn kiểm định:
Nếu giả thiết H0 đúng thì số cử tri theo lí thuyết bầu cho các ứng viên đều là 50. Khi đó:
B5. Kết luận: Vì 6,52>5,9914 nên chúng ta có thể bác bỏ H0 tức là các đaòn viên đã bỏ phiểu
(61 − 50 ) 2 (53 − 50 ) 2 (36 − 50 ) 2
χ2 = + + = 6,52
50 50 50
cho một ứng viên nhiều hơn ít nhất một ứng viên còn lại.
Kiểm định chi bình phương về tính chất độc lập hay phụ thuộc (kiểm định hàng cột hay
kiểm định mối quan hệ giữa hai biến biểu danh)
Ở trên ta xem xét trường hợp dữ liệu thu thập được xếp theo một tiêu chí hay một yếu tố. Bây giờ
chúng ta xem xét trường hợp dữ liệu được xếp theo hai tiêu chí, nghĩa là được phân theo hai yếu
tố có mối liên hệ hay không. Ví dụ, trong phân tích nghiên cứu tiếp thị, chúng ta thường tìm có
tồn tại hay không mối liên hệ giữa giới tính và hành vi tiêu dùng, giữa giới tính và mức độ hoàn
thành công việc, giữa tuổi tác và giới tính..
Gọi Oij là số lượng quan sát ứng với hàng thứ i và cột thứ j và Eij là số lý thuyết ứng với hàng thứ
i và cột thứ j, khi đó ta có:
(Täøng − haìng − i) x(Täøng − cäüt − j)
E ij =
Täøng − âäü − låïn − cuía − máùu
ri * c j
E ij =
n
Khi đó độ tự do sẽ là df= (số cột -1)*(số hàng-1)

KIỂM ĐỊNH CHI BÌNH PHƯƠNG


(Kiểm định mối liên hệ)
1. Giả thiết và đối thiết:
Giả thiết Không có mối liên hệ giữa hai biến .... trong tổng thể
Đối thiết Có mối liên hệ giữa hai biến ..... trong tổng thể
2. Xác định mức ý nghĩa α
3. Phương pháp kiểm nghiệm Chi bình phương.
4. Tính tiêu chuẩn:
r c
(Oij Eij ) 2
χ = ∑∑
2

i =1 j =1 Eij
5. Điểm tới hạn và miền bác bỏ:
Là kiểm định một đuôi (df=(r-1)*(c-1)) với:
Điểm tới hạn χ2df;α
Miền bác bỏ χ2 > χ2df;α

BB
Mô hình
χ2df;α
157
Ví dụ 1: Một nhà nghiên cứu thị trường muốn xác định mối tương quan có thể có giữa kích cỡ xe
ô tô và hãng sản xuất đối với các xe mới được mua trong thời gian gần đây. Một mẫu 1000 xe
mới mua trong nước đã chọn ngẫu nhiên và phân loại theo kích cỡ và hãng sản xuất. Dữ liệu thu
được:
Hãng chế tạo Tổng cột j
Loại xe
A B C D (cj)
Nhỏ 157 65 181 10 413
Trung bình 126 82 142 46 396
Lớn 58 45 60 28 191
Tổng hàng i (ri) 341 192 383 84 1000
Như vậy các giá trị thực tế quan sát được và giá trị lý thuyết như sau:
Loại xe Hãng chế tạo Tổng cột j
A B C D (cj)
Nhỏ 157 65 181 10 413
(140,833) (79,296) (158,179) (34,692)
Trung bình 126 82 142 46 396
(135,036) (76,032) (151,668) (33,264)
Lớn 58 45 60 28 191
(65,131) (36,672) (73,153) (16,044)
Tổng hàng i (ri) 341 192 383 84 1000

Chúng ta dùng phép kiểm định chi bình phương để so sánh giá trị qua sát được và giá trị lí thuyết
với các bước sau:
B1. Phát biểu giả thiết và đối thiết
Giả thiết H0: Hai yếu tố dùng phân loại độc lập nhau trong tổng thể
Đối thiết H1: Hai yếu tố dùng phân loại phụ thuộc nhau trong tổng thể
B2. Xác định mức ý nghĩa α=0,05.
B3. Phương pháp kiểm định: Phương pháp kiểm định Chi bình phương về mối quan hệ giữa hai
biến.

∑ (O ij − E ij ) 2
χ2 =
ij
= 45 ,81
E ij
B4. Tính tiêu chuẩn kiểm định
B5. Kết luận : Vì df= (r-1)*(c-1)=(3-1)*(4-1)=6 nên
χ (26 ); 0 ,05 = 12 ,5916

χ 2 = 45 ,81 > χ (26 ); 0 , 05 = 12 ,5916


Vậy ta bác bỏ giả thiết H0 tức là kích cỡ xe và hãng sản xuất xe do khách hàng chọn lựa là những
những biến phụ thuộc lẫn nhau chứ không phải độc lập.

158
CÁC PHƯƠNG PHÁP KIỂM ĐỊNH PHI THAM SỐ
Kiểm định phim tham số là các loại kiểm định ít đòi hỏi các giả thiết về phân phối của dữ kiệnn.
Thông thường, kiểm định phí tham số phù hợp nhất trong các trường hợp chúng ta không thể
dùng các kiểm định tham số ví dụ dữ liệu mà chúng ta thu thập là loại dữ liệu định tính (biểu
danh hay thứ tự) hoặc khi các dữ liệu thuộc thang đo lường khoảng cách (interval) nhưng khi
kiểm định phân phối chuẩn không thỏa. Trong những trường hợp như vậy, chúng ta thường sử
dụng phương pháp kiểm định phi tham số. Trong phần này sẽ đề cập đến những kiểm định sau:
Kiểm định hai mẫu phụ thuộc (Dấu, Wilcoxon, Nemar)
Ở phần kiểm định tham số ta đã đề cập đến việc so sánh trung bình của hai tổng thể với giải định
tổng thể phân phối chuẩn và có phương sai bằng nhau. Khi các điều kiện này không thỏa mãn ta
thực hiện kiểm định dấu.
Ứng dụng: Dữ liệu mẫu từng cặp phối hợp, tổng thể không phân phối chuẩn và có thể phương sai
khác nhau. Việc kiểm định dấu thường được dùng khi phân tích dự liệu từ mẫu phối hợp. Tuy
nhiên, người ta ít dùng kiểm định dấu do nói không làm sáng tỏ được giá trị của khác biệt, kết
quả không thuyết phục lắm nên người ta thường thực hiện kiểm định Wilcoxon.
Trường hợp mẫu nhỏ (n<30)
Cách thức thực hiện kiểm định Wilcoxon trong trường hợp mẫu nhỏ như sau:

KIỂM ĐỊNH WILCOXON


(mẫu nhỏ)
1. Giả thiết và đối thiết:
Đối xứng Phải Trái
Giả thiết H0: µ1 = µ2 H0: µ1 ≤ µ2 H0: µ1 ≥ µ2
Đối thiết H1: µ1 ≠ µ2 H1: µ1 > µ2 H1: µ1 < µ2
2. Xác định mức ý nghĩa σ
3. Phương pháp kiểm nghiệm Wilcoxon - Phân phối Wilcoxon.
4. Tính tiêu chuẩn:
D = x1 - x2 (xét dấu)
Tiêu chuẩn W = min [Σ(+), Σ(-)] W = min [Σ(-)] W = min [Σ(+)]
5. Điểm tới hạn và miền bác bỏ:
Đối xứng Phải Trái
Điểm tới hạn W2α Wα Wα
Miền bác bỏ W < W2α W < Wα W < Wα
Mô hình BB BB BB
W2α Wα Wα

B1. Tính các chênh lệch D=x1 - x2


B2. Chọn mức ý nghĩa α
B3. Phương pháp kiểm định : Phương pháp kiểm định Wilcoxon
B4. Tính tiêu chuẩn kiểm định :
- Xếp hạng giá trị tuyết đối các chênh lệch D theo thứ tự tăng dần, các giá trị bằng nhau sẽ nhận
hàng trung bình (bỏ qua các trường hợp chênh lệch bằng 0).

159
- Tính tổng cộng hạng. Giá trị W của kiểm định là: W= min [Σ(+), Σ(-)]
B5. Tham chiếu với giá trị ở bảng Wilconxon trong bảng phân phối, so sánh với giá trị kiểm định
để đưa ra kết luận.

 Ví dụ: Mẫu 9 khách hàng được chọn ngẫu nhiên và yêu cầu họ cho biết sở thích của họ về hai
loại kem đánh răng A, B khác nhau thông qua một thang điểm từ 1 (rất không thích) đến 5 (rất
thích). Kết quả như sau:
KH Kem A Kem B Ch. lệch Hạng TQ Hạng (+) Hạng (-)
1 4 3 1 1,5 1,5
2 5 5 0
3 2 5 -3 5 5
4 3 2 1 1,5 1,5
5 3 5 -2 3 3
6 1 5 -4 7 7
7 3 3 0
8 2 5 -3 5 5
9 2 5 -3 5 5
3 25
Đánh giá xem có hay không mức độ ưa chuộng giữa hai loại kem đánh răng A, B với mức ý
nghĩa 5%.
B1. Giả thiết và đối thiết:
H0: Không có sự khác biệt trong mức độ ưa chuộng giữa A, B trong tổng thể
H1: Có sự khác biệt trong mức độ ưa chuộng giữa A, B trong tổng thể
B2. Lựa chọn mức ý nghĩa α=0,05
B3. Xác định phương pháp kiểm định : Phương pháp kiểm định Wilcoxon
B4. Tính tiêu chuẩn kiểm định: Đây là loại kiểm định dạng hai đuôi (đối xứng). Theo bảng tính ta
có: Kqs = W = min [3,25]=3
Tra bảng phân phối của kiểm định Wilcoxon với mức ý nghĩa 5% ta có
W2α =W2*0,05=W0,1= 4
Miền bác bỏ

W=3 W2α=4

Vì W<W2α nên ta chưa có cơ sở để bác bỏ H0 tức là chưa có cơ sở để chứng minh có sự khác


biệt trong ưa chuộng của người tiêu dùng giữa sản phẩm A, B trong tổng thể
Trường hợp mẫu lớn (n≥30)
Trong trường hợp mẫu lớn, dùng phân phối chuẩn thay thế cho phân phối của kiểm định
Wilcoxon. Giá trị trung bình và phương sai của hai mẫu được tính:

n ( n + 1)
µT =
4
n ( n + 1 )( 2 n + 1 )
σ T
2
=
24
160
KIỂM ĐỊNH WILCOXON
(mẫu lớn)
1. Giả thiết và đối thiết:
Đối xứng Phải Trái
Giả thiết H0: µ1 = µ2 H0: µ1 ≤ µ2 H0: µ1 ≥ µ2
Đối thiết H1: µ1 ≠ µ2 H1: µ1 > µ2 H1: µ1 < µ2
2. Xác định mức ý nghĩa
3. Phương pháp kiểm nghiệm Wilcoxon – Tham chiếu phân phối chuẩn.
4. Tính tiêu chuẩn:
T − µT
k qs ≡ Z =
σT
5. Điểm tới hạn và miền bác bỏ:
Đối xứng Phải Trái
Điểm tới hạn U1-α/2 U1-α U1-α
Miền bác bỏ Z <U1-α/2 Z < -U1-α Z <U1-α
Mô hình BB BB BB
U1-α/2 -U1-α U1-α

 Ví dụ: Công ty sản xuất dầu gội đầu nhãn hiệu P thực hiện một chiến dịch quảng cáo rầm rộ
trong mục tiêu xâm nhập thị trường ở một thành phố. Để kiểm tra xem chiến dịch quảng cáo này
có tạo ra được nhận biết về nhãn hiệu nới khách hàng hay không, trước và sau khi thực hiện
chiến dịch quảng cáo, mẫu 200 người ở mỗi địa bàn trong 50 địa bàn dân cư (phường, xã) của
thành phố được chọn và yêu cầu kể tên 5 loại dầu gội đầu.
Ở từng địa bàn, trước và sau khi thực hiện chiến dịch quảng cáo, số lần dầu gội đầu nhãn hiệu P
được kể tên được ghi nhận lại. Chênh lệch về số lần dầu gội đầu nhãn hiệu P được kể tên giữa
trước và sau khi quảng cáo được tính toán, xếp hạng theo giá trị tuyệt đối của chúng (không có
chênh lệch 0). Tổng cộng hạng của các chênh lệch dương có giá trị nhỏ hơn và bằng 625. Thực
hiện kiểm định Wilcoxon, ta sẽ xem xét xem sau chiến dịch quảng cáo, dầu gội đầu nhãn hiệu P
có được khách hàng biết đến nhiều hơn trước hay không với mức ý nghĩa 5%?
Giải:
B1. Giả thiết và đối thiết
H0: Sự nhận biết nhãn hiệu dầu gội đầu P trước và sau chiến dịch quảng cáo là giống nhau
H1: Sau chiến dịch quảng cáo, dầu gội đầu nhãn hiệu P được khách hàng biết đến nhiều hơn
B2. Lựa chọn mức ý nghĩa α=0,05
B3. Lựa chọn phương pháp kiểm định : Kiểm định Wilcoxon với tham chiếu là tham chiếu phân
phối chuẩn (Z) vì n=50>30
B4. Tính tiêu chuẩn kiểm định
Với mẫu n=50 ta có:

161
n ( n + 1) 50 ( 49 )
µT = = = 673,5
4 4
n ( n + 1)( 2 n + 1) 50 * 51 * 101
σ T2 = = = 10731 , 25
24 24
Áp dung công thức:
T − µT 625 − 637 ,5
Z = = = − 0,1206
σT 103 ,5917
Ta có Z=-0,1206 < U0,95= 1,65 nên chúng ta chưa có cơ sử để bác bỏ giả thiết H0 tức là
chưa có cơ sở để chấp nhận H1
Kiểm định nhiều hơn hai mẫu phụ thuộc (Friedman, Kendall’s W, Cochran’s Q)
Thang đo lương và phương thức thực hiện tương tự như Wilcoxon như mở rộng cho nhiều hơn 2
sản phẩm, tình huống và kết quả được trình bày ở phần hướng dẫn SPSS
Kiểm định cho hai mẫu độc lập (Mann-Whitney U)
Kiểm định không yêu cầu các giả định về hình dạng của phân phối, nó được dùng để các giả thiêt
về hai mẫu độc lập có xuất phát từ hai tổng thể có phân phối có thể không giống nhau. Kiểm định
này gần giống như kiểm định wilconxon vì các biến phải có thể xếp hạng (trong kiểm định
wilcoxon ta phải xét cả dấu và hạng còn trong kiểm định Mann-Whitney U ta chỉ xét thứ hạng mà
không cần xét dấu. Tình huống và kết quả được mô tả ở phần SPSS.
Kiểm định nhiều hơn hai mẫu độc lập (Kruskal-Wallis H)
Giả sử rằng chúng ta có các mẫu ngẫu nhiên độc lập gồm k quan sát, nếu ta sắp xếp các quan sát
này thành từng nhóm mà mỗi nhóm có phân phối tuân theo quy luật phân phối chuẩn và phương
sai của chúng bằng nhau thì chúng ta có thể dùng phương pháp kiểm định tham số (ANOVA) để
phân tích.
Tuy nhiên, có một số trường hợp, mẫu không thoải mãn những điều kiện để sử dụng ANOVA thì
chúng ta sử dụng phương pháp kiểm định phi tham số với phương pháp Kruskal-Wallis.
Từ tổng thể n quan sát ta sắp xếp các hạng một cách liên tục từ nhỏ đến lớn, nếu giá trị quan sát
trùng nhau thì hạng xếp giống nhau bằng cách dùng số trung bình cộng các hạng của chúng.
Gọi R1, R2,..., Rk là tổng của các hạng được xếp theo thứ tự, khi đó từ n quan sát ta có của k
nhóm.
B1. Giả thiết và đối thiết
H0: µ1 = µ2 = ... = µk: Tham số trung bình của k nhóm đều bằng nhau
H1: Tồn tại ít nhất một tham số trung bình của nhóm i khác với ít nhất một tham số trung bình
của nhóm còn lại.
B2. Xác định mức ý nghĩa α
B3. Phương pháp kiểm định Kruskal- Wallis
B4. Tiêu chuẩn kiểm định W được tính bằng
12 k
Ri2
k qs ≡ W = ∑ − 3(n + 1)
n(n + 1) i =1 ni
B5. Miền bác bỏ và kết luận :
162
Trong trường hợp này chúng ta dùng phân phối Chi bình phương với bậc tự do là k-1, khi đó
chúng ta sẽ bác bỏ H0 nếu W > χ k2−1,α .
XỬ LÍ DỮ LIỆU CÙNG SPSS

KIỂM ĐỊNH THAM SỐ


Kiểm định t đối với tham số trung bình mẫu
Như chúng ta đã biết, thu nhập trung bình của các đối tượng phỏng vấn là 33,224 triệu/năm, có
giả thiết cho rằng thu nhập của đối tượng mà chúng ta phỏng vấn trên tổng thể là 32 triệu/năm,
chúng ta cần kết luận nhận định đó có đúng không.
Khi đó, giả thiết của bài toán là:
H0 : µ = µ0= 32 (triệu) và H1: µ ≠ µ0 = 32 (triệu)
& Nhấn Analyze – Compare Means – One sample T test.
& Chọn biến cần phân tích vào ô Test Variable(s), đặt giá trị µ0 vào ô Test Value.

Nhấn Option để thiết đặt độ


tin cậy
(giả sử đ tin cậy là 95%)

& Bấm Continue và bấm OK ở hộp hội thoại ban đầu, kết quả thu được như sau:

Descriptive Statistics

N Minimum Maximum Mean Std. Deviation


Thu nhap nam (trieu) 200 10750 82500 33224.00 12932.72
Valid N (listwise) 200

One-Sample Statistics

N Mean Std. Deviation Std. Error Mean


Thu nhap nam (trieu) 200 33224.00 12932.72 914.48

163
One-Sample Test

Test Value = 32000


95% Confidence Interval of the
Sig. Mean Difference
t df (2-tailed) Difference Lower Upper
Thu nhap nam (trieu) 1.34 199 .182 1224.00 -579.32 3027.32

Giá trị t-student Giá trị p-value


= 1,34 =0,182>0,05

& Tại các biểu trên, ta có thể biết giá trị trung bình, độ lệch chuẩn của mẫu. Ngoài ra t=1,34 nên
p-value=0,182>0,05 nên chúng ta chưa có cơ sở để bác bỏ H0 hay chưa có cơ sở để chấp nhận H1.
Kiểm định tham số trung bình hai mẫu (hai mẫu độc lập)
Giả sử ta muốn so sánh thu nhập trung bình giữa những người có giới tính nam và nữ trên tổng
thể có khác nhau hay không, ta có giả thiết:
H0: Thu nhập trung bình của người nam và người nữ bằng nhau trên tổng thể
H1: Thu nhập trung bình của người nam và người nữ không bằng nhau trên tổng thể
& Nhấn Analyze – Compare Means – Independent sample t-test.
& Chọn biến thunhap vào ô Test Variables và biến gioitinh vào ô Grouping Variable

Nhấn vào Define Groups để


định nghĩa các nhóm với
Nam=1 và Nữ = 0

Nhấn vào Define Groups để


định nghĩa các nhóm với
Nam=1 và Nữ = 0

& Kết quả như sau


164
Group Statistics

Gioi tinh N Mean Std. Deviation Std. Error Mean


Thu nhap nam (trieu) Nam 124 37053.23 13962.42 1253.86
Nu 76 26976.32 7763.42 890.52

Trung bình người có Trung bình người có


giới tính là Nữ giới tính là Nam

Independent Samples Test

Levene's
Test for
Equality of
Variances t-test for Equality of Means
95% Confidence
Sig. Interval of the
(2-ta Mean Std. Error Difference
F Sig. t df iled) Difference Difference Lower Upper
Thu Equal variances
17 .000 5.77 198 .000 10076.91 1747.75 6630 13524
nhap assumed
nam Equal variances
(trieu) 6.55 196.4 .000 10076.91 1537.92 7044 13110
not assumed

Nếu sig. trong kiểm định phương sai<0,05 thì


Giá trị t của p-value của
phương sai giữa hai mẫu không bằng nhau,
kiểm định giá trị t
ta sẽ dùng kết quả kiểm định t ở dòng thứ 2

& Kiểm định Leneve’s (giả thiết H0: phương sai của hai mẫu (biến) bằng nhau, H1: phương sai
của hai mẫu (biến) không bằng nhau) sẽ cho phép kiểm định phương sai hai mẫu có bằng nhau
hay không, trong trường hợp này nếu sig. của F (trong thống kê Leneve’s) < 0,05 ta bác bỏ H0,
chấp nhận H1 nghĩa là phương sai của hai mẫu không bằng nhau, do vậy giá trị t mà ta phải tham
chiếu là giá trị t ở dòng thứ 2. Ngược lại nếu sig. >0,05 thì phương sai của hai mẫu bằng nhau, ta
sẽ dùng kết quả kiểm định t ở dòng thứ nhất.
& Đối với kiểm định t, ta nhận thấy rằng t=6,55 và p-value = 0,000<0,05 năm ta có thể bác bỏ H0
và chấp nhận H1, có nghĩa là thu nhập trung bình giữa người nam và nữ sẽ khác nhau.
Kiểm định tham số trung bình hai mẫu (hai mẫu phụ thuộc)
& Nhấn Analyze – Compare Means – Paired sample t-test. Chọn biến cần phân tích vào ô
Paired Variables.

Nhấn Option để thiết đặt


độ tin cậy
(giả sử độ tin cậy là 95%)

165
& Kết quả:

Paired Samples Statistics

Mean N Std. Deviation Std. Error Mean


Pair TRUOCQC 42.9333 15 30.6419 7.9117
1 SAUQC 44.1333 15 28.1422 7.2663

Paired Samples Test

Paired Differences
95% Confidence
Std. Interval of the
Std. Error Difference Sig.
Mean Deviation Mean Lower Upper t df (2-tailed)
Pair 1 TRUOCQC - SAUQC -1.200 5.7842 1.4935 -4.4032 2.0032 -.803 14 .435

Giá trị ước lượng Giá trị ước lượng Giá trị t-student Giá trị p-value
(giới hạn dưới) (giới hạn trên) = -0,803 =0,435>0,05

& Vì giá trị t=-0,803 và p-value = 0,435>0,05 nên chúng ta chưa có cơ sở để bác bỏ H0 tức là
chưa có cơ sở để chấp nhận H1.
Phân tích phương sai (Analysis of variance – ANOVA)
Giả sử chúng ta muốn so sánh thu nhập trung bình của các đối tượng làm trong những lĩnh vực
dịch vụ - thương mại, xây dựng và công nghiệp có khác nhau hay không. Giả thiết và đối thiết sẽ
là:
H0: Thu nhập trung bình của những người làm trong lĩnh vực dịch vụ - thương mại, xây dựng
và công nghiệp bằng nhau
H1: Thu nhập trung bình của người làm trong lĩnh vực dịch vụ - thương mại, xây dựng và công
nghiệp không bằng nhau (có nghĩa là tồn tại ít nhất một thu nhập trung bình của một ngành
khác với ít nhất một thu nhập trung bình của hai ngành còn lại)
& Nhấn Analyze – Compare Means – One-way ANOVA.
& Chọn biến cần phân tích (định lượng) vào ô Dependent List và biến phân loại vào ô Factor

166
& Nhấn Post Hoc để chọn loại kiểm định nhằm xác định cụ thể sự khác biệt giữa các nhóm
(nhóm nào khác với nhóm nào). Chúng ta có thể chọn Bonferroni hoặc Tukey’s-b (hai thống kê
này đều cho ra cùng một kết quả).
& Nếu phương sai giữa các nhóm cần so sánh không bằng nhau, chúng ta chọn Tamhane’s T2
(ứng dụng cho kiểm định t từng cặp nếu phương sai của chúng không bằng nhau).

& Nhấn Continue, nhấn Option để thiết đặt các lựa chọn.

& Trong đó Homogeneity-of-variance để kiểm định sự bằng nhau phương sai các nhóm, Means
plot để làm cho hình minh họa.

Test of Homogeneity of Variances

Thu nhap nam (trieu)


Levene Statistic df1 df2 Sig.
.414 2 197 .661

& Vì Sig. >0,05 nên ta có thể khẳng định là phương sai của các nhóm là bằng nhau, thỏa mãn
điều kiện của phân tích ANOVA.

167
ANOVA

Thu nhap nam (trieu)


Sum of Squares df Mean Square F Sig.
Between Groups 87185676.623 2 43592838.312 .259 .772
Within Groups 33196619123.377 197 168510756.971
Total 33283804800.000 199

& Với F=0,259 và p-value = 0,772>0,05 nên chưa có cơ sở để bác bỏ H0 hay chưa có cơ sở để
chấp nhập H1
& Trong các trường hợp khác, nếu ta bác bỏ H0 và chấp nhận H1, với thống kê Bonferonni ta có
thể biết được sự khác nhau từng cặp của các tham số trung bình.
& Means plots

35000

34000
Mean of Thu nhap nam (trieu)

33000

32000
Dich vu thuong mai Xay dung Cong nghiep

Loai hinh doanh nghiep

Hồi quy tuyến tính


Giả sử chúng ta mong muốn tìm mối tương quan giữa hai biến năm làm việc (biến độc lập) và thu
nhập hàng năm (biến phụ thuộc) trên tổng thể, chúng ta sẽ thực hiện như thế nào.
& Vẽ sơ đồ, kiểm tra bằng thị giác mối quan hệ
& Vào Graphs, nhấn Scatter

168
& Chọn Simple và bấm Define

& Chọn các biến vào ô Y Axis (biến phụ thuộc) và X Axis (biến độc lập), bấm OK
100000

80000

60000
Thu nhap nam (trieu)

40000

20000

0
6 8 10 12 14 16 18 20

Nam lam viec

& Chúng ta có thể xem đường hồi quy lí thuyết của dãy dữ liệu bằng cách click hai lần vào
chuôt.
& Sau khi một màn hình mới hiện ra, vào Chart – Option, hội hội thoại tiếp theo sẽ hiện ra –
Bấm OK – Hội hội thoại sẽ là:

169
& Bấm Fit Options chọn Linear regression

& Bấm Continue và OK

100000

80000

60000
Thu nhap nam (trieu)

40000

20000

0
6 8 10 12 14 16 18 20

Nam lam viec

170
Rõ ràng trên hình vẽ bên, ta có thể hình dung có mối quan hệ tuyến tính (theo đường thẳng) giữa
số năm làm việc và thu nhập/năm. Để kiểm tra một cách chính xác, ta thực hiện thao tác hồi quy.
& Vào Analyze và Regression chọn các biến vào các ô tương ứng

ANOVAb

Model Sum of Squares df Mean Square F Sig.


1 Regression 449.294 1 449.294 71.115 .000a
Residual 1250.926 198 6.318
Total 1700.220 199
a. Predictors: (Constant), Thu nhap nam (trieu)
b. Dependent Variable: Nam lam viec

Vì F=71,115 và p-value=0,000 nên chúng ta có thể khẳng định tồn tạo mô hình hay tồn tại mối
quan hệ giữa hai biến năm làm việc và thu nhập trên tổng thể.

Model Summary

Model R R Square Adjusted R Square Std. Error of the Estimate


1 .514a .264 .261 2.51
a. Predictors: (Constant), Thu nhap nam (trieu)

Ta có R2 = 0,264 có nghĩa là biến số năm làm việc sẽ giải thích 26,4% thu nhập/ năm của nhân
viên (còn lại là những biến số khác).
Ta có R2a =0,261, ta có thể kết luận mối quah hệ giữa hai biến này rất yếu vì R2a =0,261<0,3.
Chú ý: Nếu R2a <0,3 Mối quan hệ yếu
Nếu 0,3 <= R2a <0,5 Mối quan hệ trung bình (chấp nhận)

171
Nếu 0,5 <= R2a <0,7 Mối quan hệ khá chặt chẽ
2
Nếu 1 <= R a Mối quan hệ rất chặt chẽ
Coefficientsa

Standardized
Unstandardized Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 9.970 .491 20.304 .000
Thu nhap nam (trieu) 1.162E-04 .000 .514 8.433 .000
a. Dependent Variable: Nam lam viec

Bảng coefficient cho phép chúng ta kiểm định các hệ số góc trong mô hình, ta có t1 = 8,433 và p-
value = 0,000<0,05 nên ta khẳng định tồn tại mối quan hệ giữa hai biến với hệ số góc b1=0,00011
có nghĩa là khi tăng mỗi năm làm việc, thu nhập hàng năm tang 110 ngàn đồng.
Ta có thể thành lập được phương trình hồi quy như sau:
yi = 9.870 + 0,00011xi + e

KIỆM ĐỊNH CHI BÌNH PHƯƠNG VỀ TÍNH ĐỘC LẬP HAY PHỤ THUỘC GIỮA HAI
BIẾN (CROSSTABS)
Kiểm định phân phối (kiểm định sự phù hợp)
Tình huống: Trong một nghiên cứu ước tính của bộ Y tế, người ta mong muốn kiểm tra giả thuyết
rằng tần suất sử dụng dịch vụ bệnh viện của các ngày trong tuần là như nhau và giảm 25% vào
cuối tuần. Một mẫu gồm 52 000 bệnh nhân có phân phối sau:

Ngày Số bệnh nhân (quan sát) Số bệnh nhân (lí thuyết)


Thứ hai 8623 8000
Thư ba 8308 8000
Thứ tư 8420 8000
Thứ năm 9032 8000
Thứ sáu 8754 8000
Thứ bảy 4361 6000
Chủ nhật 4502 6000
52000 52000
Khi đó, giả thiết và đối thiết:
H0: Nhu cầu khám chữa bệnh là như nhau ở tất cả các ngày trong tuần và giảm 25% vào cuối
tuần
H1: Nhu cầu này có một dạng phân phối khác

172
Kiểm định chi bình phương về tính chất độc lập hay phụ thuộc (kiểm định hàng cột hay
kiểm định mối quan hệ giữa hai biến biểu danh)
Người ta dùng kiểm định Chi bình phương để kiểm định sự kết hợp giữa bai biến (biểu danh hoặc
thứ tự). Có một số chú ý như sau:
- χ2 được thiết lập để xác định có hay không một mối liên hệ giữa hai biến, nhưng nó không chỉ
ra được cường độ của mối liên hệ đó. Trong trường hợp này, cần sử dụng các đo lường kết
hợp.
- χ2 cho phép tìm ra những mối liên hệ phi tuyến tính giữa hai biến.
- Với kiểm định Chi bình phương, ta thành lập được các bảng chéo. Hệ số V Cramer được áp
dụng cho tất cả các loại bảng chéo với k là chiều bé nhất của bảng chéo. Cường độ của nó biến
động từ 0 đến 1. χ2
V=
n(k − 1)
Giả sử ta chọn phân tích tính độc lập giữa hai biến định tính quy mô doanh nghiệp (quymo) và
loại hình kinh doanh (loaihinh). Các bước tiến hành như sau:
H0: Hai biến quy mô doanh nghiệp và loại hình doanh kinh độc lập với nhau trên tổng thể
H1: Hai biến quy mô doanh nghiệp và loại hình doanh kinh phụ thuộc với nhau trên tổng thể
& Vào Descriptives statistics – Crosstab chọn các biến vào các ô tương ứng
173
& Bấm Statistics để thiết lập các thống kê

Giá trị kiểm định Giá trị kiểm định


Chi bình phương p-value

& Bấm Cells để thiết lập các tỷ lệ phần trăm theo dòng, cột hay tổng cộng
Chi-Square Tests

Value df Asymp. Sig. (2-sided)


Pearson Chi-Square 38.665a 2 .000
Likelihood Ratio 50.910 2 .000
Linear-by-Linear Association
36.280 1 .000
N of Valid Cases 104
a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 12.92.

174
Loai hinh doanh nghiep * Quy mo doanh nghiep Crosstabulation

Quy mo doanh nghiep


vua va nho lon Total
Loai hinh Dich vu thuong mai Count 11 26 37
doanh nghiep Expected Count 22.1 14.9 37.0
% of Total 10.6% 25.0% 35.6%
Xay dung Count 16 16 32
Expected Count 19.1 12.9 32.0
% of Total 15.4% 15.4% 30.8%
Cong nghiep Count 35 0 35
Expected Count 20.9 14.1 35.0
% of Total 33.7% .0% 33.7%
Total Count 62 42 104
Expected Count 62.0 42.0 104.0
% of Total 59.6% 40.4% 100.0%

Symmetric Measures

Value Approx. Sig.


Nominal by Phi .610 .000
Nominal Cramer's V .610 .000
N of Valid Cases 104
a. Not assuming the null hypothesis.
b. Using the asymptotic standard error assuming the null hypothesis.

Trong kiểm này, ta thấy giá trị Chi bình phương = 38,665 và p-value=0,000<0,05 nên ta bác bỏ
H0 và chấp nhận H1 tức hai biến phụ thuộc lẫn nhau trên tổng thể.
Hệ số Phi = 0,61 khẳng định mối quan hệ giữa hai biến này khá chặt chẽ.

KIỂM ĐỊNH PHI THAM SỐ


Kiểm định hai mẫu phụ thuộc (Wilcoxon, kiểm định dấu, kiểm định Nemar)
Với ví dụ về đánh giá hai loại kem ở trên, ta cógiả thiết:
Với giả thiết và đối thiết là:
H0: Không có sự khác biệt trong mức độ ưa chuộng giữa A, B trong tổng thể
H1: Có sự khác biệt trong mức độ ưa chuộng giữa A, B trong tổng thể
Các bước thực hiện như sau:
& Vào Analyze – Nonparametric Tests - 2 Related Samples

175
& Kết quả thu được:

Ranks

N Mean Rank Sum of Ranks


B-A Negative Ranks 2a 1.50 3.00
Positive Ranks 5b 5.00 25.00
Ties 2c
Total 9
a. B < A
b. B > A
c. A = B

Test Statistics b

B-A
Z -1.876a
Asymp. Sig. (2-tailed) .061
a. Based on negative ranks.
b. Wilcoxon Signed Ranks Test

& Nhìn vào bảng trên ta có thể dễ dàng diễn giải dữ liệu, với Z = -1,876 và p-value=0,61>0,05
nên ta chưa có cơ sở để bác bỏ H0 tức chưa có cơ sở để chấp nhận H1 hay chưa có cơ sở để khẳng
định có sự khác biệt trong mức độ ưa chuộng giữa A, B trong tổng thể.
Chú ý: Kiểm địn dấu và Nemar có thể thực hiện tương tự
Kiểm định nhiều hơn hai mẫu phụ thuộc (Friedman, Kendall’s W, Cochran’s Q)
Trong trường hợp giống như ví dụ ở trường hợp kiểm định wilcoxon, nhung bây giờ ta có 3 sản
phẩm A, B, C, khi đó
KH Kem A Kem B Kem C
1 4 3 5
2 5 5 5
3 2 5 5
4 3 2 5
176
5 3 5 5
6 1 5 5
7 3 3 5
8 2 5 5
9 2 5 5
& Vào Analyze – Nonparametric Test – K Related Samples chọn các biến vào phân tích

& Kết quả:

Ranks

Mean Rank
A 1.39
B 2.00
C 2.61

Test Statistics a

N 9
Chi-Square 9.308
df 2
Asymp. Sig. .010
a. Friedman Test

& Với Chi bình phương = 9,308 và p-value=0,01<0,05 nên ta bác bỏ H0 tức chấp nhận H1 hay đã
có sự khác biệt trong mức độ ưa chuộng giữa A, B, C trong tổng thể.
Kiểm định cho hai mẫu độc lập (Mann-Whitney U)
Tình huống: Có hai loại máy nổ Toshiba và Yamaha đang tiêu thụ tại Việt Nam, một nhà phân
phối muốn kiểm tra mức độ tiêu hao nguyên vật liệu của hai loại sản phẩm này.
Nhà phân phối gặp các khách hàng sử dụng hai loại sản phẩm, tiến hành điều tra mức tiêu hao
nguyên vật liệu, tổng số khách hàng điều tra là 18 người trong đó 10 người sử dụng sản phẩm
Toshiba và 10 người sử dụng sản phẩm Yamaha, kết quả thu được như sau:

177
KH Toshiba Yamaha
1 4000 4200
2 3800 4300
3 4600 3400
4 4300 3500
5 5000 3800
6 5300 4200
7 4900 4300
8 4700 3400
9 4000
10 5200
& Vào Analyze – Nonparametric Test – 2 Independent Samples chọn các biến vào phân tích

& Nhấn Grouping Define để định nghĩa các biến

& Kết quả như sau

Ranks

NHANHIEU N Mean Rank Sum of Ranks


TIEUHAO Toshiba 10 12.15 121.50
Yamaha 8 6.19 49.50
Total 18

178
Test Statistics b

TIEUHAO
Mann-Whitney U 13.500
Wilcoxon W 49.500
Z -2.364
Asymp. Sig. (2-tailed) .018
Exact Sig. [2*(1-tailed Sig.)] .016a
a. Not corrected for ties.
b. Grouping Variable: NHANHIEU

Ta thấy giá trị Mann-Whitney U = 13,5, giá trị Z = -2,363 và p-value=0,18 nên ta bác bỏ H0, chấp
nhận H1 tức là có sự khác nhau về mức tiêu hao nhiên liệu trung bình của hai loại sản phẩm là
khác nhau.
Kiểm định nhiều hơn hai mẫu độc lập (Kruskal-Wallis H)
Giả sử như chúng ta có 3 nhóm sản phẩm (thêm một sản phẩm của hãng Sonix), cách thức thực
hiện như sau:
& Vào Analyze – Nonparametric Test – K Independent Samples chọn các biến vào phân tích

& Vào Grouping Variable để định nghĩa biến, hiện tại chúng ta có 3 biến, chúng ta đặt giá trị ở
maximum là 3, nếu chúng ta so sánh 2 biến thì chúng ta định số 2 (giá trị 1, 2, hay 3 phụ thuộc
vào các định nghĩa value label của biến nhanhieu.

179
Ranks

NHANHIEU N Mean Rank


TIEUHAO Toshiba 10 18.55
Yamaha 8 9.63
3 8 11.06
Total 26

Test Statistics a,b

TIEUHAO
Chi-Square 7.318
df 2
Asymp. Sig. .026
a. Kruskal Wallis Test
b. Grouping Variable: NHANHIEU

Ta thấy giá trị Chi bình phương = 7,318 và p-value=0,026 nên ta bác bỏ H0, chấp nhận H1 tức là
có sự khác nhau về mức tiêu hao nhiên liệu trung bình của ba loại sản phẩm là khác nhau.

TÓM TẮT

Trong nghiên cứu marketing, phân tích dữ liệu luôn bao hàm kiểm định giả thuyết. Để thực hiện
một kiểm định người ta phải trình bày hai giả thuyết là giả thuyết không ( thường ký hiệu H0) -
giả thuyết cần kiểm định; và giả thuyết đối ( thường ký hiệu H1) - giả thuyết thay thế cho giả
thuyết không để khi giả thuyết H0 bị bác bỏ thì chấp nhận giả thuyết đối H1 này. Các kỹ thuật
thống kê cho phép chúng ta đi đến quyết định là các giả thuyết đó có được kiểm chứng bằng số
liệu thực tế hay không.

Khi dựa vào mẫu để kiểm định giả thuyết có thể mắc hai loại sai lầm. sai lầm loại một là sai lầm
khi chúng ta bác bỏ một giả thuyết đúng. Sai lầm loại hai là sai lầm khi chúng ta thừa nhận một
giả thuyết sai.

Thực hiện một bài toán kiểm định bao gồm các bước: phát biểu giả thuyết không giả thuyết đối;
xác định mức ý nghĩa; lựa chọn phương pháp kiểm định; tính giá trị kiểm định; xác định miền
bác bỏ; đưa ra kết luận.

Thủ tục kiểm định giả thuyết có thể được sắp xếp theo hai loại chủ yếu: kiểm định tham số và
kiểm định phi tham số- tuỳ thuộc vào thang đo lường của biến liên quan. Các kiểm định tham số
đòi sử dụng các thang đo lường là khoảng hoặc tỷ lệ, trong khi các kiểm định phi tham số phù
hợp với các thang đo lường là định danh và thứ tự. Kiểm định tham số được nghiên cứu bao gồm
kiểm định tham số trung bình của tổng thể, kiểm định tham số tỷ lệ, kiểm định sự khác nhau giữa
hai trung bình hai tổng thể, kiểm định sự khác nhau trung bình của nhiều tổng thể và hồi quy
tương quan. Kiểm định phi tham số chúng ta sẽ nghiên cứu là kiểm định về quy luật phân phói
của tổng thể, kiểm định về tính độc lập hay phụ thuộc, kiểm định dấu, kiểm định Wilcoxon, kiểm
định Mann-Whitney...

Các thủ tục kiểm định đều dễ dàng và đơn giản nhờ vào sự trợ giúp của phân mềm SPSS.

180
CÂU HỎI ÔN TẬP

1. Thế nào là giả thuyết không? Giả thuyết đối? Cho ví dụ?
2. Trong kiểm định giả thuyết thống kê có thể vấp những loại sai lầm nào?
3. Hãy cho biết các bước cơ bản thực hiện bài toán kiểm định?
4. Sự khác nhau cơ bản phân biệt giữa kiểm định tham số và phi tham số.
5.Thời gian hoàn thành một sản phẩm của nhà máy A qua quá trình quan sát 25 công nhân theo
bảng sau:
Thời gian (phút) 40-42 42-44 44-46 46-48 48-50
Số công nhân 2 6 10 4 3
Theo nhận định của nhà máy thời gian hoàn thành một sản phẩm là 44 phút, như vậy nhìn nhận
của nhà máy có đúng không? Giả sử rằng thời gian hoàn thành một sản phẩm của các công nhân
là biến chuẩn.
6. Theo thiết kế kỹ thuật chiều dài sản phẩm A là 20cm. Sau thời gian sản xuất, nghi ngờ chiều
dài sản phẩm không đạt yêu cầu. Tiến hành kiểm tra, người ta chọn ngẫu nhiên 64 sản phẩm để
đo và thu được kết quả như sau chiều dài trung bình 20,5 cm và độ lệch tiêu chuẩn điều chỉnh là
1cm. Biết rằngchiều dài loại chi tiết trên là biến chuẩn N(a,σ). Hãy kiểm định điều nghi ngờ với
mức ý nghĩa α=0,05 ?
7.Trong lượng sản phẩm do nhà máy sản xuất ra (X) là một đại lượng ngẫu nhiên phân phối
chuẩn với độ lệch chuẩn là σ=2 kg và trọng lượng trung bình là 20 kg. Nghi ngờ máy hoạt động
không bình thường làm thay đổi trọng lượng trung bình của sản phẩm, người ta cân thử 100 sản
phẩm và thu được kết qủa sau:
Trọng lượng sản phẩm (kg) 19 20 21 22 23
Số sản phẩm tương ứng 10 60 20 5 5
Với mức ý nghĩa α=0,05 hãy kết luận về nghi ngờ nói trên. Cho U0,95=1,645, U0,975=1,96 hãy ước
lượng trọng lượng sản phẩm do nhà máy sản xuất.
8. Tỉ lệ phế phẩm của một nhà máy theo dự toán là 0,1 và có người cho rằng tỉ lệ đó là tỉ lệ thật
sự của phế phẩm. Chọn ngẫu nhiên 100 sản phẩm của nhà máy có thấy 11 phế phẩm. Hãy kiểm
định nhận xét trên với α=0,05 ?
9. Giám đốc marketing của một công ty sẽ thực hiện chương trình khuyến mãi sản phẩm A ở khu
vực X nếu tỷ lệ những người thường xuyên theo dõi chương trình quảng cáo sản phẩm A của
công ty trên truyền hình là trên 15%. Thực hiện điều tra 2500 người có ti vi ở khu vực có 380
người theo dõi chương trình quảng cáo sản phẩm của công ty. Với mức ý nghĩa α = 0,05, hãy
giúp giám đốc marketing quyết định xem có nên thực hiện chương trình khuyến mãi đó không?
Ước lượng tỷ lệ những người thường xuyên theo dõi chương trình quảng cáo của công ty trên
truyền hình? Tỷ lệ những người có máy thu hình ở khu vực đó là 20%. Cho biết U0,95=1,645,
U0,975=1,96.
10. Định mức thời gian lắp đặt một máy vi tính cá nhân là một đại lượng ngẫu nhiên tuân theo
qui luật phân phối chuẩn có thời gian quy định là 30 phút. Do có thay đổi trong qui trình lắp đặt
loại máy vi tính này, người ta nghĩ rằng điều này có thể dẫn đến việc phải thay đổi định mức thời
gian lắp đặt máy. Tiến hành kiểm tra thử 5o máy vi tính và thu được kết quả sau:

181
Thời gian lắp đặt (phút) Số máy tính
25-27 3
27-29 14
29-31 19
31-33 10
33-35 4
Với mức ý nghĩa α=0,05, hãy kết luận xem có cần thay đổi định mức thời gian lắp đặt máy hay
(24)
không? Ước lượng thời gian lắp đặt trung bình của loại máy vi tính đó? Cho biết T0,95 =1,711,
T0(,24)
975 =2,064.

11. Một công ty sản xuất giấy dùng cho máy vi tính theo kế hoạch cho ra những mẫu giấy có
chiều dài trung bình 11 cm và độ lệch chuẩn 0,02cm. Vào những khoảng thời gian nhất định,
người ta lẫy ngẫu nhiên những mẫu giấy sản xuất, xác định chiều dài trung bình xem có bằng
11cm không để biết máy làm việc bình thường hay có trục trặc gì. Trong một lần kiểm nghiệm,
một mẫu 1000 tờ giấy đã được chọn và chiều daì trung bình đo được 10,998 cm. Nếu độ tin cậy
cho việc ước lượng chiều dài trung bình là 95% thì nhà sản xuất có thể kết luận gì về giấy đã sản
xuất được?
12. Hãng sản xuất xe hơi Mercedes muốn nghiên cứu mức tiêu hao trung bình lượng xăng của
một loại xe tải do hãng này sản xuất. Kết quả đo được như sau:
Tiêu hao (lít/100km) Số xe
16-17 5
17-18 9
18-19 14
19-20 18
20-21 25
21-22 16
22-23 7
23-24 6
a. Ước lượng tham số trung bình với mức ý nghĩa 5%
b. Hãng khẳng định mức xăng tiêu hao trung bình là 19 lít /100km. Hãy kiểm tra lại lời khẳng
định này với mức ý nghĩa 5%?
13. Một doanh nghiệp có số liệu thống kê về doanh thu bán hàng của mình qua ba năm theo các
tháng như sau:
T1 T2 T3 T4 T5 T6 T7 T8 T9 T10 T11 T12
N1 250 240 260 270 280 230 290 180 210 250 270 300
N2 320 330 330 350 360 270 230 230 270 350 350 350
N3 360 380 380 400 410 350 300 300 350 430 430 450
a, Hãy dự đoán doanh thu bán hàng năm thứ 4.
b. Doanh nghiệp dự kiến năm thứ 4 sẽ sử dụng 2% doanh thu để thực hiện chương trình khuyến
mãi. Hãy tính khoản dự kiến này.
c. Dự kiến song song với việc thực hiện khuyến mãi, sản lượng mua của doanh nghiệp tăng lên
3%. Hãy lập bảng báo cáo kết quả.

182
14. Một doanh nghiệp sản xuất thức ăn để nuôi gà công nghiệp muốn kiểm tra trọng lượng của
các bao thức ăn do mình sản xuất. Chọn cân thử ngẫu nhiên 50 bao thức ăn và kết quả thu được
như sau:
20 25 29 32 30
35 21 26 32 33
27 33 22 36 29
27 36 28 23 36
32 25 36 33 24
27 31 30 29 22
26 32 29 36 30
29 31 29 32 31
29 37 38 36 39
28 32 40 30 28
a. Hãy phân kết quả cân được thành 5 lớp.
b. Ước lượng trọng lượng trung bình của các bao thức ăn trên với độ tin cậy 95%?
15. Công ty nước giả khát X có 3 loại sản phẩm là A, B, C với mong muốn số lượng chai tiêu thụ
lần lượt chiếm 25%, 25%, 50%. Với độ tin cậy 95% hãy kiểm nghiệm xem có trái với mong
muốn không nếu kết quả điều tra thu thập như sau:
Sản phẩm A B C
Sản lượng tiêu thụ 70 66 164

16. Trong một lần kiểm tra sơ bộ về tình hình học tập của sinh viên một trường đại học với một
mẫu chọn ngẫu nhiên gồm 400 sinh viên để phân loại giỏi, khá, trung bình, yếu. Với giả thiết
rằng tỷ lệ sinh viên theo các tiêu thức trên lần lượt là: 20%, 50%, 20%, 10%. Kết quả kiểm tra
cho thấy:
Giỏi Khá Trung bình Yếu
Số lượng SV 71 194 89 46
Với mức ý nghĩa 5%, hãy xác định xem giả thuyết trên có đúng không?
17. Hãy thử giả thiết Ho về tính chất độc lập của hai yếu tố phân loại A và B bằng cách dùng
phép kiểm định chi (χ) cho trong bảng sau với mức ý nghĩa 5%?
B
B1 B2 B3
A1 39 75 42
A A2 63 51 70
A3 30 38 29
18. Để nghiên cứu về nhu cầu xem phim ở rạp chiếu bóng của nhân dân các vùng trong thành phố
Đà Nẵng, một nhân viên marketing của công ty chiếu bóng thành phố đã chọn ngẫu nhiên một
mẫu gồm 291 người để điều tra. Họ được phân thành ba vùng: nội thành, ven đô và huyện. Mỗi
người được hỏi để biết có đi xem phim: (1): mỗi ngày một lần
(2): ít nhất một lần/tuần (3): ít nhất một lần/tháng
(4): ít hơn một lần/tháng (5): không đi xem bao giờ
Bảng phân bố trong mẫu theo vùng và mức độ xem phim như sau:
183
Mức độ xem phim (số lần)
Vùng Tổng số
(1) (2) (3) (4) (5)
Nội thành 20 28 23 14 12 97
Ven đô 14 34 21 14 12 95
Huyện 4 12 10 20 53 99
Tổng số 38 74 54 48 77 291
Với độ tin cậy 95% hãy xét xem mối quan hệ người dân giữa các vùng trong thành phố và mức
độ xem phim
19. Người ta muốn điều tra xem giữa loại tai nạn lao động có liên quan đến độ tuổi của người lái
xe không, kết quả thu được:
Loại thương tật
Chân, tay Mình Sọ
Dưới 35 9 17 5
Tuổi
Trên 35 61 13 12
Từ kết quả trên, nhân viên điều tra kết luận có mối tương quan giữa độ tuổi và loại thương tật của
người lao động. Bạn có đồng ý không với độ tin cậy 95%.
20. Một viên thanh tra chi cục thuế muốn nghiên cứu xem có sự khác nhau nào trong việc kê khai
hồ sơ thuế giữa ba nhóm doanh nghiệp khác nhau hay không và đã thu thập được số liệu sau:
Loại doanh nghiệp
A B C
Hồ sơ sai 6 5 9
Kết quả
Hồ sơ đúng 19 20 41
21. Nhân viên marketing của một hãng nước ngọt CBA muốn nghiên cứu xem tỷ lệ người thích
chọn loại nước giải khát A có tăng thêm sau khi chiến dịch quảng cáo được thực hiện hay không.
Một mẫu 200 người uống nước ngọt được chọn ngẫu nhiên và được hỏi họ thích loại nước ngọt A
hay B trước và sau khi thực hiện quảng cáo hoàn tất. Ở mức ý nghĩa 0,05, có bằng chứng nào cho
thấy khách hàng chuộng nước ngọt A hơn sau khi thực hiện quảng cáo không? Cho biết:
Trước khi quảng cáo
A B
Sau khi Loại A 101 9
quảng cáo Loại B 22 68
22. Viên thanh tra chất lượng hàng của một công ty sản xuất ô tô muốn tìm hiểu xem tỉ lệ sản
phẩm hư hỏng có khác nhau trong những ngày khác nhau trong tuần hay không. Mỗi ngày người
ấy chọn ngẫu nhiên một mẫu 100 sản phẩm làm được trong ngày ấy. Kết quả như sau:
Kết quả Thứ hai Thứ ba Thứ tư Thứ năm Thứ sáu
Số bị hỏng 12 7 7 10 14
Số tốt 88 93 93 90 86
Tổng 100 100 100 100 100
Ở mức ý nghĩa 0,05, có bằng chứng nào cho thấy tỷ lệ hàng hư hỏng khác nhau trong ngày khác
nhau trong tuần không?
23. Trong mỗi tình huống sau, cho biết phân tích thống kê nào bạn sẽ thực hiện và các kiểm định
hoặc các biến mà bạn sẽ sử dụng:
184
a. Với một thang đo Likert gồm 9 điểm, người ta đo lường ý kiến của một nhóm khách hàng
đối với xà phòng Camay. Sau đó người ta chiếu một đoạn phim quảng cáo cho những
người tham gia này rồi đo lường lại lần thứ hai ý kiến của họ. Quảng cáo có đạt tới khả
năng làm thay đổi ý kiến của người mua?
b. Ý kiến khách hàng đối với xà phòng Camay có tuân theo qui luật phân phối chuẩn không?
c. Một nghiên cứu dựa vào 1000 hộ gia đình, những người trả lời được sắp xếp theo mức
tiêu thụ của họ về kem (đáng kể, trung bình, yếu hoặc không) và mức thu nhập của họ
(cao, trung bình, thấp). Mức tiêu thụ kem có quan hệ với thu nhập không?
24. Chiến dịch quảng cáo hiện tại sẽ được thay đổi nếu ít nhất 30% người tiêu dùng thích.
a. Xác lập giả thuyết không và giả thuyết đối
b. Kiểm định thống kê nào bạn sẽ sử dụng? tại sao?
c. Một điều tra dựa vào 300 người tiêu dùng chỉ ra rằng 84 người trong số họ thích quảng
cáo. Quảng cáo có phải thay đổi không? tại sao?
25. Trong khuôn khổ một thực nghiệm nhằm đo lường ảnh hưởng của giới tính và mức độ thường
xuyên đi du lịch đối với sở thích du lịch ra nước ngoài, người ta đã thu được kết quả của 30
người trả lời như phần sau. Sở thích được đo lường ởi một thang đo 9 điểm (1= không hề thích,
9= hoàn toàn rất thích). Giới tính được mã hoá 1 đối với nam và 2 đối với nữ. Mức độ thường
xuyên đi du lịch dducmã hoá như sau: 1= yếu, 2= trung bình, 3= cao.
Số thứ tự Giới tính Mức độ thường xuyên đi du lịch Sở thích
1 1 1 2
2 1 1 3
3 1 1 4
4 1 1 4
5 1 1 2
6 1 2 4
7 1 2 5
8 1 2 5
9 1 2 3
10 1 2 3
11 1 3 8
12 1 3 9
13 1 3 8
14 1 3 7
15 1 3 7
16 2 1 6
17 2 1 7
18 2 1 6
19 2 1 5
20 2 1 7
21 2 2 3
22 2 2 4
23 2 2 5
24 2 2 4
25 2 2 5
26 2 3 6
27 2 3 6
28 2 3 6
29 2 3 7
30 2 3 8
185
Với phần mềm SPSS, hãy thực hiện các phân tích sau:
a. Nam và nữ có sở thích khác nhau đối với đi du lịch ra nước ngoài hay không?
b. Những người ít đi du lịch, đi du lịch ở mức trung bình và hay đi du lịch có sở thích khác
nhau đối với việc đi du lịch ra nước ngoài không?
c. Mức độ thường xuyên đi du lịch có khác nhau giữa nam và nữ không?
26. Sau đây là một vài dữ liệu liên quan đến nhà hàng A đã được thu thập từ 45 khách hàng. Các
dữ liệu này liên quan mức độ thường xuyên đến nhà hàng, giới tính của khách hàng, đánh giá của
khách hàng về không gian, thái độ của nhân viên phục vụ, chất lượng các món ăn và giá cả các
món ăn của nhà hàng. Mức độ thường xuyên đến nhà hàng được mã hoá 1,2 và 3 theo ít thường
xuyên, thường xuyên và rất thường xuyên. Giới tính được mã hoá 1 đói với nam và 2 đối với nữ.
Đánh giá về không gian thoáng đẹp nhà hàng, thái độ lịch sự vui vẻ của nhân viên phục vụ, chất
lượng cao của các món ăn và giá cả các món ăn hợp lý của nhà hàng được đánh giá bởi một thang
Likert gồm 7 điểm( 1=Rất không tán thành, 7= rất tán thành). Có 5 người trả lời đã không trả lời
và được mã hoá bằng giá trị khuyết là 9.
Mức độ nhân viên
không gian món ăn giá cả
TT thường Giới tính phục vụ
thoáng đẹp ngon hợp lý
xuyên đến lịch sự
1 3 2 7 6 5 5
2 1 1 2 2 4 6
3 1 1 3 3 6 7
4 3 2 6 5 5 3
5 3 2 5 4 7 4
6 2 2 4 3 5 2
7 2 1 5 4 4 3
8 1 1 2 1 3 4
9 2 2 4 4 3 6
10 1 1 3 1 2 4
11 3 2 6 7 6 4
12 3 2 6 5 6 4
13 1 1 4 3 3 1
14 3 2 6 4 5 3
15 1 2 4 3 4 5
16 1 2 3 4 2 4
17 3 1 7 6 4 5
18 2 1 6 5 4 3
19 1 1 1 1 3 4
20 3 1 5 7 4 1
21 3 2 6 6 7 7
22 2 2 2 3 1 4
23 1 1 1 1 3 2
24 3 1 6 7 6 7
25 1 2 3 2 2 1
26 2 2 5 3 4 4
27 3 2 7 6 6 5
28 2 1 6 4 2 5
29 1 1 9 2 3 1
30 2 2 5 9 4 6

186
31 1 2 1 2 9 3
32 1 2 4 6 5 9
33 2 1 3 4 3 2
34 2 1 4 6 5 7
35 3 1 5 7 7 3
36 3 1 6 5 7 3
37 3 2 6 7 5 3
38 3 2 5 6 4 3
39 3 2 7 7 6 3
40 1 1 4 3 4 6
41 1 1 2 3 4 5
42 1 1 1 3 2 3
43 1 1 2 4 3 6
44 1 1 3 3 4 6
45 1 1 1 1 4 5
a. Thiết lập phân phối tần suất cho mỗi biến.
b. Lập một bảng chéo giữa hai biến: mức độ thường xuyên đến nhà hàng và giới tính ? mức độ thường
xuyên đến nhà hàng có khác nhau giữa nam và nữ không ?
c. Dữ liệu về đánh giá chất lượng các món ăn có tuân theo qui luật chuẩn hay không ?
d. Hãy mã hoá lại dữ liệu đánh giá sự hợp lý về giá cả theo một thang đo lường thứ tự. Biến số này có
thay đổi theo mức độ thường xuyên đến nhà hàng?
26. Để biết được chất lượng, giá cả các mặt hàng đã ảnh hưởng như thế nào đến mức độ ưa thích của
khách hàng đối với các cửa hàng, người ta đã tiến hành nghiên cứu trên 14 cửa hàng. Các cửa hàng này đã
dducđánh giá theo các đặc tính sau : mức độ ưa thích đối với cửa hàng, chất lượng hàng hoá, mức giá. Tất
cả các đánh giá được đo lường bởi một thang điểm 11 trong đó điểm số càng cao biểu thị mức đánh giá
càng tốt.
Số TT cửa hàng Mức độ ưa thích Chất lượng HH Giá
1 6 5 3
2 9 6 11
3 8 6 4
4 3 2 1
5 10 6 11
6 4 3 1
7 5 4 7
8 2 1 4
9 11 9 8
10 9 5 10
11 10 8 8
12 2 1 5
13 9 8 5
14 5 3 2
a. Phân tích thống kê nào là thích hợp để xem xét mối quan hệ giữa biến mức độ ưa thích và chất lượng
hàng hoá? Tại sao ? Sử dụng phần mềm SPSS thực hiện phân tích đó và giải thích kết quả?
b. Phân tích thống kê nào là thích hợp để xem xét mối quan hệ giữa biến mức độ ưa thích với biến chất
lượng hàng hoá và giá cả? Tại sao ? Sử dụng phần mềm SPSS thực hiện phân tích đó và giải thích kết
quả?
TÀI LIỆU THAM KHẢO
Dick R. Wittink, The Application of Regression Analysis (Boston: Allyn & Bacon, 1988), 30–31.
William E. Becker, Statistics for Business and Economics (Cincinnati: South-Western College Publishing,
1995), 502.

187

You might also like