You are on page 1of 70

PHÂN TÍCH DỮ LIỆU

1
NỘI DUNG

1. XỬ LÝ DỮ LIỆU

2. PHÂN TÍCH ĐƠN BIẾN

3. PHÂN TÍCH NHỊ BIẾN

4. PHÂN TÍCH ĐA BIẾN

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 2


1. XỬ LÝ DỮ LIỆU


hóa

DỮ
Hiệu chỉnh Tạo tập tin
LIỆU

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 3


1. XỬ LÝ DỮ LIỆU
Quá trình Hiệu chỉnh:

Hiệu chỉnh sơ bộ (field Hiệu chỉnh cuối cùng


editing): (office editing):

• Thực hiện bởi • Thực hiện bởi editor


interviewer • Sau khi thu thập xong
• Càng sớm càng tốt data
sau khi phỏng vấn • Đòi hỏi người hiệu
xong chỉnh phải có nhiều
kinh nghiệm, kiến
thức.

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 5


1. XỬ LÝ DỮ LIỆU
Mã hóa (coding):

Là quá trình gán mã số (số hoặc


nhãn) cho các biến và các trả lời.

Thang đo của biến tùy thuộc vào


cách hỏi và bản chất của biến được
hỏi.

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 7


1. XỬ LÝ DỮ LIỆU
Nguyên tắc mã hóa:

Tính phù hợp (appropriateness)

Tính toàn diện (exhaustiveness)

Tính loại trừ nhau (mutual exclusivity)

Tính đơn nguyên (unidimensionality)

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 11


2. PHÂN TÍCH ĐƠN BIẾN

Chọn phương pháp phân tích nào?

 Có bao nhiêu biến được phân tích đồng


thời?
 Mục tiêu phân tích chỉ là mô tả mẫu hay suy
đoán cho tổng thể
 Các biến được đo bởi thang đo gì? Chỉ
danh, thứ tự, khoảng, tỉ lệ.

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 12


PHÂN TÍCH DỮ LIỆU
Start

Bao nhiêu biến


được phân tích
đồng thời
1 biến Trên 2 biến
2 biến

Phân tích Phân tích Phân tích


đơn biến nhị biến đa biến

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 13


Phân tích đơn biến

Khoảng Thang đo Chỉ danh


của biến

Thứ tự

MÔ TẢ Trung vị
Trung bình Yếu vị
Khoảng/
Phương sai Tần suất
phần trăm

SUY
ĐOÁN Kolmogorov
Chi – square
Z test/ t test – Smirnov
test
test
Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 14
PHÂN TÍCH ĐƠN BIẾN – THỐNG KÊ MÔ TẢ
Biến chỉ danh, thứ tự
Ví dụ
Response Frequency Percentage Cum.
Category Percentage
Benthanh 1 - -
Foster 3 1 1
Saigon 45 18 19
Heineken 120 46 65
Tiger 92 35 100
261 100%

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 15


PHÂN TÍCH ĐƠN BIẾN – THỐNG KÊ MÔ TẢ

 Lợi ích của biến chỉ danh, thứ tự:


 Trình bày phân phối dữ liệu của một biến
có thang đo nominal hoặc ordinal.
 Phát hiện một số dạng sai sót khi mã hoá.
 So sánh với các phân phối/ dữ liệu có liên
quan.
 Đề nghị những phương pháp biến đổi các
biến
 Kiểm tra sampling.
Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 16
PHÂN TÍCH ĐƠN BIẾN – THỐNG KÊ MÔ TẢ
Biến khoảng
N 215
Minimum 1
Maximum 5
Mean Statistic 2.25
Std. Error 0.06
Std. Deviation Statistic 0.83
Statistic 0.57
Skewness
Std. Error 0.17
Statistic 0.45
Kurtosis
Std. Error 0.33
Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07
Ví dụ 17
PHÂN TÍCH ĐƠN BIẾN –
KIỂM NGHIỆM GIẢ THUYẾT
Kiểm chứng xem những phát biểu nào đó có
thích hợp cho tổng thể nghiên cứu hay
không.
• TD: Bình quân tuổi của 100 SV trong mẫu là
Ā = 24 (s=5). Nhà NC muốn kiểm chứng cho
tổng thể:
• Null hypothesis Ho: µ = 23
• Alternative hypothesis H1: µ ≠ 23

Các phân tích liên quan đến kiểm nghiệm giả


thuyết gọi là phân tích suy luận (inferential
analysis).
Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 18
PHÂN TÍCH ĐƠN BIẾN –
KIỂM NGHIỆM GIẢ THUYẾT
• Thiết lập giả thuyết H0 và H1
B1
• Xác định phương pháp test phù hợp (statistical test).
B2
• Chọn trước mức ý nghĩa α (significance level)
B3
• Tính (tra bảng) giá trị test tới hạn (critical value) ứng với
α (one/ two tailed)
B4
• Tính giá trị kiểm nghiệm thống kê từ tập số liệu
B5
• Nếu giá trị tính được ở B5 lớn hơn giá trị tới hạn 
loại Ho
B6 19
Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07
PHÂN TÍCH ĐƠN BIẾN –
KIỂM NGHIỆM GIẢ THUYẾT
• Biến đo bằng thang khoảng (interval)
– Có thể dùng t Test hoặc Z Test để test giá trị trung bình
của tổng thể khi biết giá trị trung bình của mẫu
Z TEST t TEST
 Biết phương sai σ của tổng  Không biết phương sai σ của
thể và cỡ mẫu bất kỳ. tổng thể và cỡ mẫu bất kỳ.
 Không biết phương sai σ  Khi cỡ mẫu n > 30 thì phân
của tổng thể và cỡ mẫu n >30 phối t = phân phối z
 Lưu ý: khi tra bảng tc thì
dF = n-1 x
t
Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 Sx 20
PHÂN TÍCH ĐƠN BIẾN –
KIỂM NGHIỆM GIẢ THUYẾT
Thí dụ (tiếp theo thí dụ trên)
• Bình quân tuổi của 100 SV trong mẫu là Ā = 24
(s=5). Nhà NC muốn kiểm chứng cho tổng thể:
Null hypothesis Ho: µ = 23
Alternative hypothesis H1: µ ≠ 23
• Do n = 100 > 30 nên dùng Z test
• Chọn mức ý nghĩa α = 0.05 (two tailed)  Zc = 1.96
• Tính Z khi chưa biết σ : Z = (Ā - µ) n1/2/s
= (24 - 23) x 1001/2/5 = 2
• Z = 2 > Zc = 1.96  loại Ho
 Không thể kết luận (với significant 5%) là µ = 23
Lưu ý: Nếu biến tỉ lệ thì Z = (p - π)/ (pq/ n)1/2
Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 21
PHÂN TÍCH ĐƠN BIẾN –
KIỂM NGHIỆM GIẢ THUYẾT
 Biến đo bằng thang thứ tự (ordinal)
◦ Dùng chi-square test để so sánh phân phối các loại
(categories) của mẫu và kỳ vọng của tổng thể

Các bước tiến hành

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 22


B2. Xác định mức
B1. Phát biểu giả B3. Tra bảng Chi-
ý nghĩa  và bậc  2
thuyết H0, H1 Square chuẩn  c
tự do df
df = k – 1 (k là số loại
danh định có thể chọn
trong biến thứ tự)
B5. Bác bỏ/chấp nhận
B4. Tính giá trị kiểm H0 dựa trên tiêu chuẩn
nghiệm theo công thức “Bác bỏ H0 nếu (tính
được) > (tới hạn)”.
k
( O i  E i ) 2 Oi: Số lần xuất hiện loại i trong mẫu
χ2  
i 1 Ei Ei: Giá trị kỳ vọng của số lần xuất hiện

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 23


PHÂN TÍCH ĐƠN BIẾN –
KIỂM NGHIỆM GIẢ THUYẾT
 Biến đo bằng thang thứ tự (ordinal)
◦ Dùng chi-square test để so sánh phân phối các loại
(categories) của mẫu và kỳ vọng của tổng thể

Các bước tiến hành

◦ Nghĩa là có sự khác biệt giữa phân phối của mẫu và


phân phối của tổng thể.
◦ Kiểm định Chi-Square không có ý nghĩa khi số lần
xuất hiện kỳ vọng cho mỗi lựa chọn < 5.
Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 24
PHÂN TÍCH ĐƠN BIẾN –
KIỂM NGHIỆM GIẢ THUYẾT
• Thí dụ: Khảo sát 100 người đang sử dụng
internet ở HCMC
Nghề nghiệp Oi Ei Oi - Ei (Oi - Ei)2 (Oi - Ei)2/ Ei
Lao động 15 25 -10 100 4
Nhân viên VP 20 25 -5 25 1
Quản lý 30 25 5 25 1
Sinh viên 35 25 10 100 4
Total 100 100  2 =10

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 25


PHÂN TÍCH ĐƠN BIẾN –
KIỂM NGHIỆM GIẢ THUYẾT
Thí dụ: Khảo sát 100 người đang sử dụng
internet ở HCMC (n = 100)
 Cột 1: Phân bố nghề nghiệp của những người
sử dụng internet.
 Cột 2: Phân bố kỳ vọng (bằng nhau cho các
nhóm)
 Ho: Không có sự khác nhau về nghề nghiệp
của những người sử dụng internet
 K = 4 loại nghề nghiệp  Df = k - 1 = 3
 c2 = 6.25 ( với  = 10%)
 2
 2
 Vì = 10 > c = 6.25  loại bỏ H0

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 26


2. PHÂN TÍCH NHỊ BIẾN

Bảng 2 chiều (Two – way Tabulation)

 Khảo sát mức độ và các mối liên hệ (có thể có)


giữa các cặp biến.
 Thích hợp cho các trường hợp số loại trong mỗi
biến không lớn, thang đo nominal hoặc ordinal.
 Chỉ định hướng, không kết luận về mối quan hệ
nhân quả giữa các biến.
 Kết quả có thể bị lệch nếu các ô có giá trị nhỏ.

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 27


Function group Total

Mkt &
Prodct Others
Sales

Count 41 62 41 144

Male % within Gender 28.5% 43.1% 28.5% 100.0%


% within Functgr 74.5% 93.9% 53.2% 72.7%
Gender

% of Total 20.7% 31.3% 20.7% 72.7%


Count 14 4 36 54

Female % within Gender 25.9% 7.4% 66.7% 100.0%


% within Functgr 25.5% 6.1% 46.8% 27.3%
% of Total 7.1% 2.0% 18.2% 27.3%
Count 55 66 77 198
% within Gender 27.8% 33.3% 38.9% 100.0%
Total % within Functgr 100.0% 100.0% 100.0% 100.0%
Bài giảng PPNC trong KD - TS. Nguyễn
28
% of Total 27.8%
Văn Tuấn. Chương 07 33.3% 38.9% 100.0%
PHÂN TÍCH NHỊ BIẾN – CÁC LOẠI TEST
Phương pháp Áp dụng Minh họa
Chi – Square Quan hệ giữa thu nhập
Quan hệ giữa 2 biến
Contingency (hoặc nghề nghiệp) với
chỉ danh.
Test việc chọn nhãn hiệu bia.
Hệ số Quan hệ giữa mức thưởng
Quan hệ giữa 2 biến nhân viên bán hàng (mức
tương quan
thứ tự. 1, 2, 3, 4) và thành tích
Spearman (mức 1, 2, 3, 4, 5).
Hệ số Quan hệ giữa 2 biến Quan hệ giữa tuổi của
tương quan metric khách hàng và chi phí hàng
Pearson (khoảng hay tỉ lệ). tháng cho y tế.
Xây dựng một
Hồi quy hàm tuyến tính giữa Doanh thu (đồng) theo chi
đơn giản 2 biến metric phí khuyến mãi. 29
Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07
(phụ thuộc nhau)
PHÂN TÍCH NHỊ BIẾN – CÁC LOẠI TEST

Chi – Square contingency test


 Mục đích:
 Xác định sự tồn tại mối quan hệ giữa 2 biến danh
định.
 Yêu cầu:
 Không có ô nào có số lần xuất hiện kỳ vọng < 1
 Không quá 1/5 tổng số ô có số lần xuất hiện < 5
 Hạn chế:
 Chỉ xác định có quan hệ hay không, không cho
biết mức độ quan hệ.
Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 30
PHÂN TÍCH NHỊ BIẾN – CÁC LOẠI TEST

Hệ số Contingency thường được bổ sung vào kiểm


nghiệm Chi-Square để biết mức độ quan hệ giữa 2 biến.

 2
C = 0: không có quan hệ
c
n 2 C không có chặn trên  khó diễn dịch

Nên trong thực tế hay dùng hệ số thống kê Cramer

2 V = 0: không có quan hệ
v
n( f  1) V = 1: có quan hệ hoàn hảo

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 31


PHÂN TÍCH NHỊ BIẾN – CÁC LOẠI TEST

Thí dụ: Kết quả khảo sát nhãn hiệu Bia ưa thích
nhất phân theo mức thu nhập.
Nhãn hiệu bia ưa thích nhất
Thu nhập Tổng
Bia A Bia B Bia C
50 200 125
Thấp 375
(109.38) (101.56) (164.06)
200 100 350
Trung bình 650
(189.58) (176.04) (284.38)
100 25 50
Cao 175
(51.04) (47.40) (76.56)
TổngBài giảng PPNC trong KD - TS.
350 325
Nguyễn Văn Tuấn. Chương 07 525 1200
32
PHÂN TÍCH NHỊ BIẾN – CÁC LOẠI TEST

• Ghi chú: Con số trong ngoặc chỉ giá trị kỳ vọng của
mỗi ô trong bảng. Chúng được xác định theo tỉ lệ với
tổng về thu nhập và loại bia ưa thích.
(Ô 1-1 có giá trị kỳ vọng = 350 x 375 / 1200 = 109.38)
k (O  E ) 2
Tính
 
l
χ 
2 ij ij
i 1
j 1 Eij
Kết quả : 
= 252.2
2

Df = (k-1)(l-1) = (3-1)(3-1) = 4
Nếu2 chọn  = 1% thì  C = 13.3 (tra bảng)
2

 = 252.2 >  C2 = 13.3  loại Ho


 Có sự khác biệt đáng kể giữa phân phối của mẫu và
kỳ vọng (tổng thể)
Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 33
PHÂN TÍCH NHỊ BIẾN – CÁC LOẠI TEST

Hệ số tương quan Spearman và Pearson


 Spearman: tương quan giữa 2 biến thứ tự (ordinal)
 Pearson: tương quan giữa các biến khoảng/ tỉ lệ.
Hệ số tương quan r = 0  1 (không kể dấu +/-)
r > 0.8 rất mạnh
r = 0.6 – 0.8 mạnh
r = 0.4 – 0.6 có tương quan
r = 0.2 – 0.4 tương quan yếu
r < 0.2 không tương quan
Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 34
PHÂN TÍCH NHỊ BIẾN – CÁC LOẠI TEST

Lưu ý:
 Hai biến phải có phân phối chuẩn nhị biến.
 Phương sai của 1 biến tại bất kỳ giá trị nào
của biến kia cũng phải bằng nhau.
 Khi r nhỏ không có nghĩa là không tương
quan, mà chỉ không tương quan tuyến tính.
 Khi r lớn chỉ cho thấy mối tương quan, nhưng
không xác định quan hệ nhân quả.

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 35


PHÂN TÍCH NHỊ BIẾN – CÁC LOẠI TEST
• Phân tích hồi quy tuyến tính đơn
– Phân tích 2 biến khoảng/ tỉ lệ: Hồi quy tuyến tính đơn
Y = aX + b
– Sự khác biệt giữa hồi quy và tương quan

Hồi quy tuyến tính Tương quan

Tạo ra một phương Phát hiện ra mức độ


trình toán học liên kết tương quan giữa
các biến lại 2 biến
Tồn tại giả thiết nhân –
Không có giả thiết về
quả: Biến độc lập –
nhân quả
Biến phụ thuộc
Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 36
2. PHÂN TÍCH ĐA BIẾN
Phân tích phụ thuộc
• Xác định được biến nào là phụ thuộc, biến nào là độc lập
• Bao gồm các phương pháp: phân tích hồi quy đa biến,
ANOVA, Conjoint, Discriminant, Canonical analysis...

Phân tích tương tác


• Không xác định trước biến nào là phụ thuộc, biến nào là
độc lập, chủ yếu là tìm kiếm các mô thức tương quan.
• Bao gồm các phương pháp: Factor analaysis, Cluster,
Multi-dimensional Scaling.
Phân tích đa biến giúp giải quyết nhiều bài toán phức
tạp. Tuy nhiên, mỗi phương pháp phân tích đa biến đều
dựa trên một số giả thiết (ngầm)  cần thận trọng.
Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 37
TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN
Các phương pháp phân tích phụ thuộc – Yêu cầu về thang đo

Thang đo của biến


Phương pháp
Phụ thuộc Độc lập
Một biến phụ thuộc

Hồi quy bội Interval Interval

ANOVA Interval Nominal

Hồi quy bội - biến dummy Interval Nominal

Discriminant analysis Nominal Interval

Conjoint analysis
Bài giảng PPNC Ordinal
trong KD - TS. Nguyễn Văn Tuấn. Chương 07 Nominal38
TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN
Các phương pháp phân tích phụ thuộc – Yêu cầu về thang đo

Thang đo của biến


Phương pháp
Phụ thuộc Độc lập
Hai biến phụ thuộc trở lên

Canonical analysis Interval Interval

MANOVA Interval Nominal

Mạng lưới của nhiều biến phụ thuộc và độc lập


Structural Equation Modeling
Interval Interval
(SEM)
Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 39
TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN

 HỒI QUY TUYẾN TÍNH BỘI

y = a1X1 + a2X2 + a3X3 + ... anXn + b


 Dạng mở rộng của hồi quy đơn.
 Một biến phụ thuộc, nhiều biến độc lập.
 Tất cả được đo bằng thang interval (ngoại lệ:
dummy-variable multiple regression)

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 40


TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN
Đánh giá mô hình và kết quả hồi quy theo 3 phần:
 Mức độ phù hợp của phương trình hồi quy:
 Dùng hệ số r2 (coefficient of determination)
 r2 = 0  1  đặc trưng cho % của biến thiên trong
biến phụ thuộc được giải thích do sự biến thiên của
biến độc lập.
 Kiểm nghiệm mức ý nghĩa của r2:
 Dùng F – test, với độ tự do: df = n – k – 1 cho mẫu
số và df = k cho tử số (n: cỡ mẫu, k: số biến độc lập)
 Kiểm nghiệm mức ý nghĩa của các độ dốc ai:
 Dùng t – test với độ tự do df = n – k – 1

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 41
TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN
Kiểm nghiệm các giả thuyết của phương pháp hồi quy

Linearity

Đa cộng tuyến (Multicolinearity)

Phân phối chuẩn (Normality) của sai số và mỗi biến

Sai số hồi quy có variance không đổi

Tính độc lập của các sai số hồi quy

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 42


TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN
Linearity

 Có mối quan hệ tuyến tính giữa biến phụ thuộc và


các biến độc lập.

 Test: quan sát scatter diagram hoặc ma trận tương


quan

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 43


TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN
Đa cộng tuyến (Multicolinearity)

 Giả thuyết: các biến độc lập không có tương quan tuyến
tính với nhau.
 Khi bị vi phạm  Có hiện tượng đa cộng tuyến, nghĩa là
hiện hữu mối tương quan tuyến tính giữa  2 biến độc lập.
 Đa cộng tuyến gây ra:
 Hạn chế giá trị r2
 Sai lệch/ đổi dấu các hệ số hồi quy
 Test đa cộng tuyến: hệ số Tolerance hoặc VIF

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 44


TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN
Một số lưu ý khi sử dụng multiple regression:
 Phân tích hồi quy tuyến tính chỉ có nghĩa khi có tương
quan TUYẾN TÍNH giữa các biến.
 r2 không nói lên được quan hệ nhân quả giữa các biến

 Có thể dự đoán sai nếu nằm ngoài khoản tính toán

 Để đảm bảo độ tin cậy phải có nhiều hơn 10 điểm cho mỗi
biến độc lập đưa vào phương trình ( yêu cầu cỡ mẫu)
 Khoảng dao động (range) các biến có thể ảnh hưởng đến ý
nghĩa phương trình hồi quy.
 Trường hợp biến độc lập là nominal thì có thể sử dụng
dummy-variable. Khi đó:
 Số biến dummy = k-1; với k = số loại của biến nominal

 Mỗi biến dummy chỉ nhận giá trị 0 hoặc 1

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 45


TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN

Thí dụ:
Bài toán tìm các yếu tố quyết định sự thỏa
mãn của nhân viên trong Cty XYZ.
 Biến phụ thuộc: sự thỏa mãn của
nhân viên Cty.
 Biến độc lập: thu nhập, điều kiện làm việc, sự
quan tâm của cấp trên, quan hệ với đồng nghiệp,
cơ hội thăng tiến, cơ hội học tập, v.v..

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 46


Unstandardized

Standardized
Coefficients

Coefficients
Collinearity
Statistics
Biến Std.
B Beta
độc lập Error t Sig. Tolerance VIF

(Constant) .540 .193 2.793 .007


Thu nhập .526 .081 .596 6.491 .000 .793 1.262

Sự
quan tâm/ .205 .061 .310 3.380 .001 .793 1.262
công nhận

r = 0.787 r 2 = 0.619
Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07
F sig. = 0.000
47
TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN

• ANOVA – ANALYSIS OF VARIANCE

Mục đích Đặc điểm Áp dụng

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 48


TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN

• ANOVA – ANALYSIS OF VARIANCE

Mục đích Đặc điểm Áp dụng

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 49


TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN

• ANOVA – ANALYSIS OF VARIANCE

Mục đích Đặc điểm Áp dụng

Khảo sát mối quan hệ


giữa các biến độc lập
và phụ thuộc

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 50


TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN

• ANOVA – ANALYSIS OF VARIANCE

Mục đích Đặc điểm Áp dụng

Tương tự như phân tích hồi quy,


nhưng các biến độc lập là
biến nonmetric (nominal/ ordinal)

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 51


TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN

• ANOVA – ANALYSIS OF VARIANCE

Mục đích Đặc điểm Áp dụng

So sánh giá trị trung bình của một thuộc tính (biến phụ
thuộc/ thang metric) thể hiện ảnh hưởng của một hay
nhiều thuộc tính khác (biến độc lập/thang nonmetric)

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 52


TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN
 ANOVA – ANALYSIS OF VARIANCE
 Nếu có nhiều biến độc lập với thang chỉ danh gọi là
Factorial ANOVA
 Nguyên tắc: Nếu có sự khác biệt đáng kể giữa các
nhóm thì “between-group variance > within-group variance”
 ANCOVA: có xét đến các ảnh hưởng của một hay
nhiều biến ngoại lai (gọi là control variable hoặc covariates
- thang đo metric) và sẽ loại ra khỏi tập biến phụ thuộc
trước khi phân tích ANOVA.
 MANOVA nếu có nhiều biến phụ thuộc
 MANCOVA có nhiều biến phụ thuộc và biến kiểm soát

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 53


TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN

Thí dụ:

 Khảo sát 200 doanh nghiệp thuộc 3 ngành


May mặc, Mỹ phẩm và Nhựa gia dụng về
chi phí dành cho khuyến mãi hằng năm.
 Mục đích phân tích nhằm tìm xem có sự
khác nhau đáng kể/ có ý nghĩa thống kê
giữa 3 ngành này về chi phí khuyến mãi
không?

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 54


TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN

Cty Ngành Chi phí KM


(1000 USD)
Biến độc lập: 1 May 123
ngành (chỉ danh) 2 May 235
(3 treatments) 3 Mỹ phẩm 1346
4 Nhựa 876
Biến phụ thuộc: . . .
chi phí khuyến . . .
mãi (ratio) 199 Nhựa 68
200 May 12

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 55


TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN
 Bài toán này có thể so sánh giá trị trung bình của
chi phí khuyến mãi theo từng cặp ngành (dùng t –
test). Tuy nhiên, khi số treatment lớn  số lượng
so sánh sẽ rất lớn.

 Khi đó nên dùng ANOVA:


◦ H0 : 1 = 2 = ... = k = 
◦ Ha : có ít nhất 1 giá trị i khác những giá trị kia.
Với  là trung bình của tổng thể

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 56


TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN
• DISCRIMINANT ANALYSIS

Mục đích Đặc điểm Nguyên tắc

Nhận ra những Biến độc lập có Hàm phân biệt có dạng:


thuộc tính (các thang metric,
biến độc lập) để Y = v1.X1 + v2.X2 + v3.X3 + …
biến phụ thuộc
phân biệt các có thang Sau khi tính được Y, so
nhóm định trước nonmetric. sánh với giá trị chuẩn Yc
của biến phụ để biết đối tượng thuộc
thuộc nhóm nào.

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 57


TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN
Thí dụ:
Công ty máy tính muốn biết xem thu nhập gia đình (X1)
và số năm học ở trường của chủ hộ (X2) có phải là hữu
ích trong việc phân biệt hộ có mua máy tính PC hay
không. Khảo sát X1 và X2 của 2 nhóm mẫu ngẫu nhiên
(có và không có PC).
 Biến độc lập: X1 – thu nhập,
X2 – số năm học : metric
 Biến phụ thuộc: Có PC, Không có PC: category.
 Kết quả sẽ là hàm phân biệt: Y= v1X1 + v2X2
v1, v2 : trọng số phân biệt (hằng số) Y: điểm phân biệt
So sánh Yi và Yc
 Phần tử i sẽ thuộc nhóm nào trong 2 nhóm mẫu trên.
Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 58
TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN
• CONJOINT ANALYSIS

Mục đích Áp dụng

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 59


TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN
• CONJOINT ANALYSIS

Mục đích

Phân tích ảnh hưởng tổng hợp (joint effects) của 2 hay
nhiều biến độc lập (thang nominal) lên một biến phụ
thuộc (utility score - thang đo ordinal)

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 60


TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN
• CONJOINT ANALYSIS

Áp dụng

Thường dùng trong test sản phẩm với nhiều yếu tố khác
nhau (chất lượng, kiểu dáng, giá bán, nhãn hiệu, v.v.).
Mỗi yếu tố có vài phương án khác nhau. Tìm xem tổ
hợp nào được ưa thích nhất.

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 61


TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN
• CONJOINT ANALYSIS – ÁP DỤNG

 Nhà NC tạo ra một tập các phương án sản phẩm.


Mỗi phương án là 1 tổ hợp của các yếu tố.
 Tập các phương án này được đưa cho đối tượng
chọn/ xếp hạng (hoặc cho điểm thể hiện mức ưa
thích).
 Conjoint analysis sẽ đánh giá ảnh hưởng của các
utility score thành phần (hay part-worths, tượng
trưng cho mức độ quan trọng của mỗi yếu tố) lên
sự ưa thích tổng hợp (utility) đối với một sản
phẩm.

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 62


TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN
• CONJOINT ANALYSIS – ÁP DỤNG
• Có thể dùng kết quả để

Đánh giá thị phần của các nhãn hiệu trên thị trường

Phân khúc thị trường

Nhận dạng cơ hội thị trường cho một sản phẩm với
tổ hợp thuộc tính mới

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 63


TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN

Thí dụ:
Thiết kế sản phẩm mới có 3 thuộc tính:
 Giá : (cao, trung bình, thấp)
 Kiểu dáng : (cao, trung bình, thấp)
 Chức năng : (đơn giản, phức tạp) ...
 Chỉ cần đánh giá 1 nhóm khoảng 8 tổ hợp (thay vì
18 tổ hợp) về tính hấp dẫn của sản phẩm đối với
khách hàng.

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 64


TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN

Thí dụ:

Tầm quan trọng


của mỗi thuộc tính Tạo ra sản
phẩm có độ
vị lợi cao
nhất đối với
Tầm quan trọng người mua.
Nhà nghiên cứu
của mỗi mức độ
trong các thuộc tính

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 65


TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN

Phân tích phụ thuộc

Phân tích tương tác

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 66


TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN
 FACTOR ANALYSIS (PHÂN TÍCH NHÂN TỐ)

Là phép rút gọn dữ liệu và biến bằng cách nhóm


chúng lại với các nhân tố đại diện

Điều kiện: các biến phải có thang đo metric

Ứng dụng

• Xây dựng bộ thang đo Multiple – item


• Xác định cấu trúc bộ dữ liệu
• Giảm thứ nguyên trong tập dữ liệu, rút gọn dữ liệu
Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 67
TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN
Thí dụ:
Case X1 X2 X3 … … Xm
Factor analysis:
gom m biến 1
thành k factor 2
Tùy mục đích bài 3
toán, có thể
dùng: Exploratory …
factor analysis n
(EFA) hoặc
Confirmatory Factor 1 gồm X1 X6 X9 Xm
factor analysis 2 gồm X2 X3 X10 Xm - 1
(CFA) 3 gồm X4 X5 X7 X8 ...

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 68


TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN
• CLUSTER ANALYSIS (PHÂN TÍCH NHÓM)

Phân chia các đối tượng/ người thành


các nhóm với các thành viên trong
nhóm có các đặc trưng tương tự.

Mục tiêu

Thí dụ: Bài toán phân khúc thị trường (Segmentation)


Phân loại hành vi mua (Typology)

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 69


TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN
• CLUSTER ANALYSIS (PHÂN TÍCH NHÓM)
Quá trình thực hiện

Xác định các biến làm cơ sở để phân nhóm

Phần chia các nhóm dựa trên sự tương tự

Đặc tên nhóm dựa theo đặc điểm chung


của các thuộc tính (các biến cơ sở)

Chuẩn định (Validation) và mô tả đặc trưng


(profiling)
Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 70
TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN
Thí dụ: Cluster analysis để phân khúc thị trường
Yêu cầu thang đo: metric
Công ty TICO: Xác định các Nhóm Khách Hàng khác
nhau căn cứ trên hành vi mua.
“Hãy đánh giá mức độ quan trọng của các yếu tố sau đây
trong quyết định mua hàng của Ông/ Bà”
X1 – Chất lượng sản phẩm
X2 – Giá bánX3 – Thời gian giao hàng
X4 – Uy tín nhà sản xuất
X5 – Các dịch vụ đi kèm
Không qtrọng Rất qtrọng

1 2 3 4 5 6 7
Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 71
TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN
Thí dụ: Cluster analysis để phân khúc thị trường
 Hơn 300 khách hàng được khảo sát
 Nhận dạng ra các nhóm khác nhau.
 Trong mỗi nhóm có sự tương tự nhau về tầm quan
trọng của các yếu tố (X1  X5) ảnh hưởng đến quyết
định mua.
Nhóm 1
Nhóm 1: X1, X4, X5 là quan trọng trong
Khách hàng trẻ,
quyết định mua
thu nhập cao, ở
Nhóm 2: X1, X2, X3 là quan trọng. TP...
Nhóm 2
 TICO sẽ có chiến lược tiếp thị đối Khách hàng
với từng nhóm khách hàng khác nhau. công nghiệp –
sản xuất
Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 72
TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN
MULTIDIMENTIONAL SCALING (perceptual mapping)
 Mục đích: Xác định số lượng và bản chất của
các thứ nguyên (dimensions) đặc trưng cho
nhận thức/ đánh giá của khách hàng về các
đối tượng.
 Thang đo: Cả hai loại thang metric/nonmetric
 Trong MR: Thường được sử dụng trong bài
toán xác định vị trí tương đối (relative
position) của các nhãn hiệu cạnh tranh nhau
do phản hồi từ phía khách hàng.
 Xác định những yếu tố đặc trưng cho việc
đánh giá của khách hàng.
 Là phương pháp ngược với Cluster
Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 73
TỔNG QUÁT VỀ PHÂN TÍCH ĐA BIẾN

Multidimentional Cluster
Scaling Analaysis
• Phát hiện các • Gộp các đối
thứ nguyên đặc tượng thành các
trưng nhóm theo 1 số
(Underlying đặc tính tượng
Dimensions) từ tự nhau
các phản hồi

Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 74


Bài giảng PPNC trong KD - TS. Nguyễn Văn Tuấn. Chương 07 75

You might also like