You are on page 1of 27

HỌC THỰC HÀNH SPSS

- Variable view: giao diện để khai báo biến


o Phần bắt đầu vì phải khai báo biến trước mới làm mấy cái khác
o Đặt tên biến english, không có dấu cách trắng, kí tự đầu tiên ko là số
o Không đặt trùng với tên bị cấm: LT, GT
o VD: GioiTinh, Dotuoi, Hoc_Van, ChiPhi1, Giaca_2
o Type: nhiều loại nhưng chỉ quan tâm
 Width: 8 hoặc 10
 Decimal: số thập phân sau dấy phẩy
 Numeric: con số
 String: văn bản/text
 Character: Bao nhiêu
 Label: giải nghĩa cho tên biến
 Value: khai báo giá trị
 VD: Sex
o 1 ---- label: Male --- add
o 2---- Label: Female--- add
 Missing value: Dữ liệu khuyết (ngta ko trả lời)
 Chọn Discrete phòng trương hợp ko có trả lời
 Measure: Ordinal (thứ bật: 18-25, 25-40…, hài lòng: 0---5 tăng
dần/giảm dần), Scale (thang đo mức độ - tuổi/độ hài lòng/chiều cao),
Nominal (định danh, vùng miền, phòng ban --- ko trung lấp, có tính
tách biệt như phòng ban, vùng miền—ko có thứ bậc)
- Data view: nhập liệu vào các biến đã khai báo
- Câu hỏi
o Định tính (chia từng khoảng) 1 trả lời (chọn ở value)
 Giới tính: Nam/ Nữ (nominal)
 Độ Tuổi: từ 18-25; 26-35; 36-45; trên 45 (ordinal)
 Kinh nghiệm: dưới 1 năm, từ 1 đến 5 năm…(ordinal)
o Câu hỏi mở
 Chuyển về dạng câu hỏi đóng (phân loại câu trả lời)
 Đặt tên chung cho các ý nhỏ (tiêu chí theo nhóm)
STT Tiêu chí Nhóm
1 Máy lạnh CSVC
2 Đào tạo NV Đào tạo
3 Thưởng cuối năm Phúc lợi, thưởng
4 Xem lại cách giám Năng lực quản lý
sát quản lý
5 Khác
o Định lượng 1 trả lời
 VD: số thành viên
o Thứ tự sắp hạng
 VD: sắp hạng 3 loại nước ngọt (Coca, Pepsi, Sprite)
 Tạo 3 biến tương ứng với 3 loại
 Coca
 Pep
 Sprite
 Sau đó tạo 3 giá trị xếp hạng cho từng biến (1st, 2nd, 3rd)
- Thống kê tần số (frequency)
o Dùng trong biến định tính (tuổi, thu nhập…)
o Analyze --- descriptive --- frequency
 Chọn biến định tính


 Chart: thường dùng Pie (percentage), Bar (frequency)
-
Sex

Frequency Percent Valid Percent Cumulative


Percent

Male 2 66.7 66.7 66.7

Valid Female 1 33.3 33.3 100.0

Total 3 100.0 100.0


 Để hiển thị % thì double click vào nhấn vào biểu tượng
o Tìm missing
 Chọn cột biến --- Ctrl F gõ dấu chấm là ra giá trị missing
- Thống kê trung bình
o Biết được mức điểm trung bình của biến khảo sát
o Thang đo likert (1:5/1:7)
 1 là rất không đồng ý
 3 là trung lập
 5 là rất đồng ý
o Nguyên tắc làm tròn xuống
o Nhược điểm: biên độ dao động rất lớn
 Giải pháp: chia 5 mức độ bằng nhau (5-1/5 =0.8)
 1+0.8 = 1.8 là mức 1 rất ko đồng ý
 1.8+0.8 =2.6 mức 2…
o Chọn Analyze – Descriptive statistic---Descriptive chọn biến muốn thống

 Sẽ xuất hiện bảng Descriptive Statisti
- Câu trả lời thiên về 5 (4.02) là hài lòng với mức lương được trả
- Std thấp biên độ dao dộng ít
- Nên trình bày lại giải thích các biến cho người đọc dễ nắm
- Muốn tính trung bình của std cho 4 TL thì phải
- Vào Transform ---- Compute valuable
o Đặt tên Mean_TL
o Numeric expression: Mean(TL1,TL2,TL3,TL4) --- ok
o Lúc này sẽ xuất hiện thêm cột biến Mean_TL
o Rồi vào lại Descriptive chọn thêm biến Mean_TL là ra Mean của std chung
cho 4 biến TL
- Thang đo và độ tin cậy của thang đo Cronbach Alpha
o Mô hình nghiên cứu
o Có 6 biến H tác động lên sự hài long của nhân viên trong công việc
o Kiểm tra biến quan sát có thể hiện được đặc điểm của nhân tố mẹ hay ko
o Nếu Alpha càng tiến đến 1 thì thang đo càng tin cậy cao còn 0 thì ngược lại
o Thực hành kiểm định:
 Analyze – Scale --- Reliability Analysis (Cronbach)
o Thực hiện phân tích Cronbach cho thang đo TL, đưa các biến quan sát TL
vào mục chọn Statistics tích Scale if item deleted --- continue --- ok

Reliability Statistics

Cronbach's N of Items
Alpha

.795 4

Item-Total Statistics

Scale Mean if Scale Variance Corrected Item- Cronbach's


Item Deleted if Item Deleted Total Correlation Alpha if Item
Deleted

TL1 10.72 5.360 .585 .754


TL2 11.34 5.319 .621 .736
TL3 11.39 5.287 .631 .731
TL4 10.78 5.351 .585 .754
Kết quả kiểm định cho thấy: (1) hệ số độ tin cậy thang đo Cronbach's Alpha của TN
bằng 0.790 > 0.6 và (2) các biến quan sát đều có tương quan biến - tổng (Corrected
Item – Total Correlation) lớn hơn 0.3. Như vậy thang đo đạt độ tin cậy, các biến quan
sát đều có ý nghĩa giải thích tốt cho nhân tố TN.
Cronbach’s Alpha if item deleted nghĩa là khi loại bỏ biến đó thì Cronbach’s Alpha chung
sẽ là số đó ví dụ ở đây TL1 có Alpha item deleted là 0.754 thì sau khi loại TL1
Cronbach’s Alpha chung sẽ là 0.754

 Cronbach's Alpha: Hệ số Cronbach's Alpha


 N of Items: Số lượng biến quan sát
 Scale Mean if Item Deleted: Trung bình thang đo nếu loại biến
 Scale Variance if Item Deleted: Phương sai thang đo nếu loại biến
 Corrected Item-Total Correlation: Tương quan biến tổng
 Cronbach's Alpha if Item Deleted: Hệ số Cronbach's Alpha nếu loại biến

 Trường hợp 2: Thang đo đạt độ tin cậy, có biến quan sát không có ý nghĩa
 Thực hiện phân tích Cronbach's Alpha cho thang đo DT tương tự như thang đo
TN, kết quả có được như sau:


 → Kết quả kiểm định cho thấy: (1) hệ số độ tin cậy thang đo Cronbach's Alpha
của DT bằng 0.684 > 0.6 và (2) biến quan sát DT1 có tương quan biến - tổng
(Corrected Item – Total Correlation) bằng 0.283 < 0.3. Biến quan sát DT1 giải
thích ý nghĩa rất yếu cho nhân tố DT nên sẽ được loại bỏ khỏi thang đo. Phân
tích Cronbach's Alpha lần hai.

 → Kết quả kiểm định cho thấy: (1) hệ số độ tin cậy thang đo Cronbach's Alpha
của DT bằng 0.790 > 0.6 và (2) các biến quan sát đều có tương quan biến - tổng
(Corrected Item – Total Correlation) lớn hơn 0.3. Như vậy thang đo đạt độ tin
cậy, các biến quan sát đều có ý nghĩa giải thích tốt cho nhân tố TN.

Trường hợp 3: Thang đo đạt độ tin cậy, biến quan sát có ý nghĩa, có hệ
số Cronbach's Alpha if Item Deleted lớn hơn Cronbach's Alpha của
thang đo

Thực hiện phân tích Cronbach's Alpha cho thang đo LD, kết quả có được như sau:
→ Biến quan sát LD3 có hệ số Cronbach's Alpha if Item Deleted bằng 0.768 lớn hơn hệ
số Cronbach's Alpha của thang đo LD là 0.749. Tuy nhiên, hệ số tương quan biến tổng
của biến là 0.342 > 0.3 và Cronbach's Alpha của thang đo đã trên 0.6, thậm chí còn
trên cả 0.7 rồi. Do vậy chúng ta không cần loại biến LD3 trong trường hợp này.

Trường hợp 4: Thang đo đạt độ tin cậy, biến quan sát có ý nghĩa, có hệ số
Cronbach's Alpha if Item Deleted lớn hơn Cronbach's Alpha của thang đo

Thực hiện phân tích Cronbach's Alpha cho thang đo DK, kết quả có được như sau:

→ Kết quả kiểm định cho thấy: (1) hệ số độ tin cậy thang đo Cronbach's Alpha của DK
bằng 0.435 < 0.6 và (2) hệ số Cronbach's Alpha if Item Deleted của tất cả các biến
quan sát đều nhỏ hơn 0.6. Thang đo DK không đạt được độ tin cậy tối thiểu nên sẽ
được loại bỏ khỏi các phân tích sau đó.

Trường hợp này chúng ta xét đến hệ số Cronbach's Alpha if Item Deleted bởi vì độ tin
cậy của thang đo chỉ là 0.435, dưới mức 0.6. Chúng ta không vội kết luận là thang đo
không đạt được độ tin cậy mà sẽ tiếp tục nhìn vào Cronbach's Alpha if Item Deleted.
Bởi Cronbach's Alpha if Item Deleted là giá trị Cronbach's Alpha mới của thang đo nếu
biến quan sát đó được loại bỏ đi. Giả sử trong tình huống này biến quan sát DK3 có
Cronbach's Alpha if Item Deleted lớn hơn 0.6, chúng ta sẽ loại bỏ biến quan sát DK3 và
phân tích lại Cronbach's Alpha lần hai. Khi đó, hệ số Cronbach's Alpha của thang đo
DK ở lần hai sẽ nhận giá trị mới đúng bằng giá trị Cronbach's Alpha if Item Deleted của
biến DK3 và đạt điều kiện trên 0.6, thang đo đảm bảo độ tin cậy. Nhưng trong ví dụ trên
thì toàn bộ các biến quan sát đều có Cronbach's Alpha if Item Deleted nhỏ hơn 0.6 nên
dù có loại biến quan sát đi thì thang đo vẫn không đảm bảo độ tin cậy.

** LƯU Ý:

 Nếu thang đo có hệ số Cronbach's Alpha dưới 0.6, chúng ta chưa vội kết luận
thang đo không có độ tin cậy mà cần kiểm tra và loại hết biến quan sát có giá trị
Cronbach's Alpha if Item Deleted cao hơn mức 0.6. Đến khi loại hết rồi mà hệ số
Cronbach's Alpha vẫn dưới 0.6 thì mới kết luận.
 Nếu hệ số Cronbach's Alpha của nhóm đã đủ tiêu chuẩn thì việc xuất hiện biến
quan sát có Cronbach's Alpha if Item Deleted lớn hơn Cronbach's Alpha của
nhóm nhưng tương quan biến tổng lớn hơn 0.3 thì chúng ta không cần loại biến
quan sát đó đi.
 Nếu hệ số Cronbach's Alpha của nhóm chưa đủ tiêu chuẩn thì việc xuất hiện
biến quan sát có Cronbach's Alpha if Item Deleted lớn hơn Cronbach's Alpha của
nhóm nhưng tương quan biến tổng lớn hơn 0.3 thì chúng ta nên loại biến quan
sát đó đi để cải thiện độ tin cậy thang đo cho tới khi hệ số Cronbach's Alpha của
nhóm đạt tiêu chuẩn.
 Nếu hệ số Cronbach's Alpha của nhóm chưa đủ tiêu chuẩn, chúng ta đã loại các
biến quan sát có Cronbach's Alpha if Item Deleted lớn hơn Cronbach's Alpha của
nhóm nhưng thang đo vẫn không đủ tiêu chuẩn. Khi đó, thang đo không đảm
bảo độ tin cậy cho nghiên cứu, cần loại bỏ cả thang đo này.
 Nếu sự chênh lệch giữa Cronbach's Alpha của nhóm với Cronbach's Alpha if
Item Deleted của biến quan sát là đáng kể từ 0.3 trở lên. Chúng ta sẽ loại biến
quan sát đó để tăng thêm độ tin cậy của thang đo.
 https://www.phamlocblog.com/2017/03/kiem-dinh-do-tin-cay-cronbach-alpha-
spss.html
 Nếu Alpha cao trên 0.95 thì cẩn thận có biến trùng lặp
 1. Hệ số Cronbach's Alpha của thang đo cần trên 0.6 (hoặc 0.7 nếu bạn đánh giá gắt
hơn).
2. Hệ số Corrected Item – Total Correlation của từng biến quan sát càng cao càng tốt.
 Loại biến rác giúp Alpha nhóm sẽ tăng lên ---- thang đo có ý nghĩa
- Bao nhiêu biến quan sát là hợp lý?
o 1 thang đo phải có tối thiểu 3 biến trở lên thì mới đạt được tin cậy cao,
tuy nhiên nên hạn chế dưới 8 nhân tố (tránh bị trùng)
o Nếu nhân tố chỉ 1 biến quan sát không thực hiện được Cronbach’s Alpha
(VD: chất lượng dịch vụ)
- Lỗi thực hiện Cronbach’s Alpha cho toàn bộ biến quan sát trong bài
o Phải chạy riêng cho từng thang đo
 VD: Thu nhập, đào tạo, lãnh đạo …
o Làm như vậy có thể bị loại bỏ các biến tốt
o Chỉ chạy Cronbach’s Alpha cho từng thang đo
- Phân tích nhân tố khám phá EFA trên SPSS
o https://www.phamlocblog.com/2018/07/phan-tich-nhan-to-kham-pha-
efa.html
o Là phương thức rút gọn một tập hợp k biến quan sát thành một tập F (F<k)
các nhân tố có ý nghĩa, tìm được các biến (đặc điệm chung) có sự tương
quan giúp tiết kiệm thời gian và chi phí cho người nghiên cứu, định hình
thang đo (tính hội tụ hay phân biệt)
o Thực hành
 Analyze – Dimension reduction --- Factor
 Đưa các biến độc lập vào --- chọn Descriptives
 Chọn KMO & Barllet test – continue --- Method: principal
component
 Chỉ số KMO phải đạt từ 0.5 (0.5—1_ trở lên mới đạt điều kiện đủ
để phân tích nhân tố phù hợp
 Chỉ số Sig của Barlet (trong KMO & Barlett Test) phải nhỏ hơn
0.05
 Bảng Communalities: trong bảng này nếu Extraction của các biến >
0.5 thì nhân tố được giữ lại, nếu biến nhỏ 0.5 thì xem xét loại bỏ
 Trị số Eigenvalue: Xác định số lượng nhân tố phù hợp nhất được
trích ra trong bảng kết quả ma trận xoay EFA, với tiêu chí này chỉ có
nhân tố nào có eigenvalue lớn hơn bằng 1 mới được giữ lại trong mô
hình phân tích
 Tổng phương sai trích (Total variance Explained) lớn hơn bằng
50% cho thấy mô hình EFA là phù hợp
 Hệ số tải nhân tố (Factor loading): trọng số nhân tố, giá trị này
biểu thị mối quan hệ tương quan giữa biến quan sát với nhân tố. Hẹ
số tải nhân số càng cao, nghĩa là tương quan giữa biến quan sát đó
với nhân tố càng lớn và ngược lại (trong bảng Rotated Component
Matrix)
 Chọn Rotation ---- Varimax ---- Continue
 Chọn thẻ option – chọn Sorted by size (để ma trận xoay sắp xếp
thành từng cột dạng bậc thang để dễ độc kết quả hơn) + suppress
small coefficients
 Absolute value below: 0.5 ---- continue---OK
- Kết quả
Kết quả lần EFA đầu tiên: KMO = 0.887 > 0.5, sig Bartlett’s Test = 0.000 < 0.05, như
vậy phân tích nhân tố khám phá EFA là phù hợp. Có 6 nhân tố được trích với tiêu chí
eigenvalue lớn hơn 1 với tổng phương sai tích lũy là 63.109%. Tác giả mong muốn
chọn ra các biến quan sát chất lượng nên sẽ sử dụng ngưỡng hệ số tải là 0.5 thay vì
chọn hệ số tải tương ứng theo cỡ mẫu. So sánh ngưỡng này với kết quả ở ma trận
xoay, có hai biến xấu là DN4 và LD5 cần xem xét loại bỏ:

 Biến DN4 tải lên ở cả hai nhân tố là Component 4 và Component 6 với hệ số tải
lần lượt là 0.612 và 0.530, mức chênh lệch hệ số tải bằng 0.612 – 0.530 = 0.082
< 0.2.
 Biến LD5 có hệ số tải ở tất cả các nhân tố đều nhỏ 0.5.
Tác giả sử dụng phương thức loại một lượt các biến xấu trong một lần phân tích EFA. Từ
28 biến quan sát ở lần phân tích EFA thứ nhất, loại bỏ DN4 và LD5 và đưa 26 biến quan sát
còn lại vào phân tích EFA lần thứ hai.
- Phân tích EFA biến phụ thuộc
o Thao tác tương tự
o Nếu bảng matrix xoay ko hiện thì lúc này là đúng
- Quy tắc loại biến xấu trong EFA
o https://www.phamlocblog.com/2015/07/quy-tac-loai-bien-xau-trong-
efa.html
o 3 loại biến xấu
 Loại 1: hệ số tải factor loading nhỏ hơn hệ số tải tiêu chuẩn (0.5)
 Loại 2: Tải lên 2 hay nhìu nhóm nhân tố và chênh lệch hệ số tải nhỏ
hơn 0.3
 Loại 3: Nằm tách biệt duy nhất ở một nhân tố
o Cách loại biến
 Cách 1: loại lần lượt từng biến
 Loại biến xấu loại 1 trước tiên (<0.5)
 Bảng matrix mới nếu ko còn biến xấu loại 1 thì loại tiếp biến
xấu loại 2
 Sau đó nếu ko còn loại 2 thì tiếp tục loại biến xấu loại 3
 Sau khi loại biến xấu, kết quả ko còn biến xấu ta sử dụng kết
quả cuối cùng
 Cách 2:Loại một lượt các biến xấu trong cùng một lần phân tích
EFA
 Ưu điểm: Có thể chỉ phải loại ít biến hơn cách 1, nghiên cứu
có ít biến loại thì nghiên cứu đó sẽ giá trị hơn
- Tạo biến đại diện trong SPSS
o https://www.phamlocblog.com/2015/11/tao-nhan-to-dai-dien-trong-
spss.html
o Tìm ra tính chất chung thông qua Rotated Component matrix
o Khi sử dụng biến đại diện sẽ giảm lại các biến quan sát, giúp vận hành hồi
quy…

o Cách 1: Biến đại diện bằng trung bình cộng (Mean) của các biến trong
cùng 1 cột
 Ưu: cách tạo dễ dàng, dễ hiểu --- thể hiện được tính chất chung, cách
tạo này khi thực hiện hồi quy sẽ giúp mình kiểm định vi phạm
 Nhược: Dùng cho thang đo dương (>0) cho thang đo likert
 Nhưng thang đo -3—3; -5-5 (âm) không sử dụng được
o Thực hành:
 Vào Transform --- Compute Variable
 Nhập tên biến đại diện theo kí hiệu chung (VD: DT)
 Hàm: Mean(DT1,DT2,DT3,DT4) --- OK
 Làm tương tự cho các biến còn lại
 Cũng phải tạo biến đại diện của biến phụ thuộc nếu có
o Cách 2: Factor scores
 Ưu: thể hiện được vai trò đóng góp theo trọng số Factor loading,
không cần nhập hàm
 Nhược: Công thức rất phức tạp, khó hiểu, không xác định được đa
cộng tuyến hay ko vì VIF lun bằng 1, với giá trị âm thì ko mang đi
phân tích ANOVA được
o Thực hành
 Analyze --- Dimension Reduction --- Factor
 Cho biến độc lập vào trước
 Mục scores: chọn Save as Variables --- Regression --- continue
 Tạo ra các biến Fact mới, nên đặt lại tên cho các biến
o Thực hiện mẫu hồi quy
o Analyze ---- Regression – Linear
 Dependent (phụ thuộc): HL
 Independent (độc lập): các biến (DT,TN, LD,DN)
 Statistic: chọn Coficient, estimate, model, dubin watson
- Phân tích tương quan Pearson trên SPSS
o https://www.phamlocblog.com/2015/11/phan-tich-tuong-quan-pearson-
trong-spss.html
o Kiểm tra mối quan hệ tương quan tuyến tính (các biến định lượng)
o 2 chỉ số : Sig (<0.05 – có tương quan còn lớn hơn 0.05 thì ko có tương
quan) và R (-1:1 càng tiến về 1 thì tương quan càng mạnh)
o Thực hành:
 Analyze ---- Correlate --- Pivariate
 Cho các biến định lượng vào phân tích tương quan (nên đưa biến
phụ thuộc lên trên cùng) --- OK

o So sánh mối liên hệ tương quan giữa biến phụ thuộc HL với các biến độc
lập còn lại nếu Sig mà nhỏ hơn 0.05 thì có tương quan
o Pearson Correlation mà > 0.4 thì có mức độ tương quan cao
o Xem xét nếu biến ko liên quan thì loại ra trước khi chạy hồi quy
o Pearson giúp mình check sớm đa cộng tuyến giữa các biến độc lập (VIF)
o Sau khi chạy hồi quy xem xét VIF để loại biến đa cộng tuyến
- Phân tích hồi quy tuyến tính bội trên SPSS
o https://www.phamlocblog.com/2016/11/cach-chay-hoi-quy-trong-
spss.html
o Thực hành
o Analyze ---- Regression --- Linear
 Dependent: HL
 Independent: độc lập TN, CV, LD, DN, MT, DT
 Statistics chọn collinear diagnostics và Dubin watson --- Continue
 Vào mục Plots
 Y : ZRESID
 X: ZPRED
 Tích chọn Histogram và Normal probability plot
 Continue ---- ok
o Các tiêu chí trong phân tích hồi quy đa biến
 Giá trị R square và R square hiệu chỉnh ( phản ánh mức độ giải
thích biến phụ thuốc của các biến độc lập trong mô hình hôi quy,
Rsquare hiệu chỉnh phản ánh sát hơn so với R2 (thường lớn 0.5 mới
có ý nghĩa)
 Giá trị sig của kiểm định (nằm trong ANOVA): Sig nhỏ hơn 0.05
kết luận mô hình hồi quy tuyến tính bội phù hợp với tập dữ liệu và
có thể sử dụng được
 Trị số Durbin Watson: dùng để kiểm tra hiện tượng tương quan
chuỗi bậc nhất (kiểm định tương quan của các sai số kề nhau) [0:4],
nếu các phần sai số không có tương quan chuỗi bậc nhất với nhâu thì
giá trị sẽ gần bằng 2, giá trị càng nhỏ càng về 0 thì các phần sai số có
tương quan thuận, nếu các lớn thì các phần sai số có tương quan
nghịch
 Giá trị Sig của kiểm định t: được sử dụng để kiểm định ý nghĩa của
hệ số hồi quy. Nếu sig kiểm định t của hệ số hồi quy của một biến
độc lập nhỏ hơn 0.05, ta kết luận biến độc lập đó có tác động đến
biến phụ thuộc. Nếu sig kiểm định t của biến độc lập lớn hơn 0.05,
kết luận biến độc lập đó không có sự tác động lên biến phụ thuộc,
không cần loại biến mà nhận xét là biến đó không có tác động lên
biến phụ thuộc
 Hệ số VIF: Dùng để kiểm định hiện tượng đa cộng tuyến. Nếu VIF
lớn hơn 10 nghĩa là đang có hiện tượng đa cộng tuyến xảy ra với
biến độc lập đó. Khi đó biến này sẽ không có giá trị giải thích biến
thiên của biến phụ
o Lập mô hình hồi quy dựa vào hệ số bảng Coefficients

o Lấy hệ số cột unstandardized (chưa chuẩn hóa)


o Y = Po + P1X1 + P2X2 + … + PiXi + u
o Y = -0.475 + 0.267F_LD+0.009F_DN + 0.259F_CV +
0.084F_TL+0.066F_DT + 0.393F_DK
o Sử dụng trị tuyệt đối ở cột Beta để xem hệ số nào lớn nhất, nếu lớn nhất thì
nó sẽ tác động lên biến phụ thuộc mạnh nhất (0.421 lớn nhất nên biến
F_DK
o Nếu quá trình khảo sát mà nhìu câu thuộc định tính (thang đo likert) thì nên
dùng hệ số ở cột Beta để viết phương trình hồi quy, sắp xếp các biến theo
thứ tự hồi quy chuẩn hóa giảm dần để tiện đọc kết quả
- Kiểm tra phân phối chuẩn của phần dư (residual)và liên hệ tuyến tính giữa biến
phụ thuộc với độc lập
o Check biểu đồ Histogram của Dependent variable HL, nếu giá trị trung bình
Mean gần bằng 0, độ lệch chuẩn gần bằng 1, đường cong phân phối có
dạng hình chuông ta có thể khẳng định phân phối là xắp xỉ chuẩn, giả định
phân phối chuẩn của phần dư không bị vi phạm
o Kiểm tra biểu đồ Normal P-P Plot of Regression Standardized Residual
(Dependent Variable:HL)
 Nếu các điểm phân vị bám sát đường chéo là có PPC
o Liên hệ tuyến tính giữa biến độc lập và biến phụ thuộc Biểu đồ tiếp theo là
Regression Standardized Predicted Value: nếu các điểm phân tán tập trung
xung quanh đường 0 thì liên hệ tuyến tính giữa biến đọc lập và biến phụ
thuộc không vi phạm
- Kiểm định Independent Sample T-test trên SPSS (for 2 options)
o https://www.phamlocblog.com/2017/07/kiem-dinh-independent-
sample-t-test-SPSS.html
o VD: Sự hài lòng của khách hàng, kiểm định có sự khác nhau giữa nhóm
người theo độ tuôi, giới tinh..
o Xem biến HL với Giới Tinh (định tính)
o Thực hành: Analyze ---- Compare Means ---- Independent Sample T Test
 Grouping Variable (Định tính)
 Test Variable ( Định lượng)
 Define group:
 Group1: 1 (male)
 Group2: 2 (female)
 Dùng bảng Independent Samples Test để xem
 2 kiểm định cần được thực hiện là Levene’s Test ( so sánh giữa 2
nhóm giá trị có đồng nhất hay không) và T-test (kiểm định trung
bình giữa 2 nhóm giá trị có bằng nhau hay không)
 Nếu mà Sig Levene test nhỏ hơn 0.05 thì phương sai giữa 2 giới
tính khác nhau, chúng ta sử dụng sig T-test màu hồng ở hàng Equal
variances not assumed
 Nếu giá trị T-test <0.05 chúng ta kết luận có sự khác biệt có ý nghĩa
thông kê mức độ hài lòng của những nhân viên có giới tính khác
nhau
 Nếu T-test lớn hơn bằng 0.05 thì không có sự khác biệt có ý nghĩa
thống kê về mức hài lòng giữa nam và nữ
 Trường hợp sig Levene’s test lơn hơn hoặc bằng 0.05
 Trường hợp này thì phương sai giữa 2 giới tính là không khác nhau,
chúng ta sẽ sử dụng giá trị Sig T-test ở Equal Variances assumed
 Nếu giá trị Sig T-test <0.05 chúng ta kết luận có sự khác biệt có ý
nghĩa thống kê mức độ hài lòng của những nhân viên co giới tính
khách nhau
 Nếu Sig T-test >=0.05 thì chúng ta kết luận ko có sự khác biệt có ý
nghĩa thống kê về mức độ hài lòng của nhưng nhân viên có giới tính
khác nhau.
 Phân tích tương tự cho yếu tố khác như Hôn nhân
 Vẽ biểu đồ
 Analyze ---- compare Means --- One-way ANOVA
 Dependent list là HL (Định lượng)
 Factor (định tính) : Hôn Nhân
 Option : chọn mean plot
 Có biểu đồ
-

- Nhận xết khi trục hoành tăng dần nghĩa là có tình trạng kết hôn thì mức độ hài
lòng cũng tăng theo (khi có sự khác biệt về trung bình mới đi vẽ biểu đồ)
- Phân tích One-way ANOVA trong SPSS
- https://www.phamlocblog.com/2016/03/phan-tich-anova-trong-spss.html
- Xem có sự khác biệt về trung bình của biến định lượng với những giá trị khác
nhau của biến định tính hay ko?
- VD: Sự hài lòng của nhân viên (Định lượng), tuổi , giới tính
- Xem HL có khác nhau giữa các nhóm hay ko? Nam nữ, tuổi….
- Biến định tính có 3 giá trị trở lên

-
- Thực hành:
- Analyze – compare means – one-way anova
o Dependent list (định lượng) – option: tích 4 mục: descriptive; homogently,
welch, means plot – OK
o Sig Levene’s Test nằm trong bảng Test of Homogenetly of Variance (Based
on Mean)
o Nếu Sig < 0.05 thì phương sai các nhóm giá trị không đồng nhất
o Dùng bảng Robust Test
o Sig welch > 0.05 là không có sự khác biệt về trung bình
o Làm tương tự cho các biến còn lại học vấn, tuổi, vùng miền
o Nếu có sự khác biệt thì phân tích kĩ hơn ở bảng thống kê mô tả Descriptives
(thâm niên), ví dụ mức độ hài lòng tăng dần theo mức thâm niên (theo dõi
thêm biểu đồ)
- Phân tích hồi quy nhì phân Binary Logistic trên SPSS
- https://www.phamlocblog.com/2019/02/hoi-quy-nhi-phan-binary-logistic-
spss.html
- Đặc trưng của hồi quy nhị phân là biến phụ thuộc chỉ có 2 giá trị 0 (ko xảy ra sự
kiện) và 1 (có xảy ra)
o VD: NH điều tra người vay có khả năng trả nợ hay không ? hoặc là Khả
năng mua hàng có hay ko?
- Không thể phân tích với dạng hồi quy tuyến tính thông thường vì mô hình sẽ vi
phạm các giả định hồi quy
- Ước lượng xác suất xảy ra sự kiện Y khi biết giá trị X
o Nếu XS dự đoán > 0.5 là xảy ra sự kiện

-
- VD: khả năng trả nợ
- Trano: biến phụ thược dạng nhị phân, 1 là có khả năng trả nợ, 0 là ko có khả năng
- HocVan: Biến độc lập định lượng, biểu thị số năm đi học. Số năm đi học càng cao,
học vấn càng cao
- Tuoi: Biến độc lập định lượng, biểu thị số tuổi hiện tại
- Thunhap: Biến độc lập định lượng, biệu thị mức thu nhập hàng tháng của gia đình
(trđ)
- Thực hành: Analyze - Regression – Binary Logistic
o Đưa biến phụ thuộc vào dependent (Trano)
o Biến dộng lặp vào ộ Blog (Hocvan, tuoi, thunhap)
o Option: Interation history (likelihood)
o Method: Enter –OK
- Quan tâm vào Blog 1: đánh giá độ phù hợp mô hình
o Sig Chi –Square nếu nhỏ hơn 0.05 thì mô hình hồi quy là phù hợp
o Xem bảng Interation history, phần -2likehood(giá trị ban đầu, khi chưa đưa
bất kì biết độc lập vào hồi quy) (A)
o So sánh với giá trị -2loglikehood khi đã đưa biến (model summary) (B)
o Nếu B < A thì mô hình của chúng ta là phù hợp
- Quan tâm Rsquare (Rsquare giả để xem mức độ phù hợp)
o Càng tiến về 1 càng phù hợp
- Bảng phân loại giá trị (Classification Table)
Variables in the Equation

B S.E. Wald df Sig. Exp(B)

HocVan -.112 .068 2.731 1 .098 .894

Tuoi .460 .053 76.052 1 .000 1.583


Step 1a
ThuNhap .421 .063 44.044 1 .000 1.523

Constant -21.196 2.631 64.895 1 .000 .000

a. Variable(s) entered on step 1: HocVan, Tuoi, ThuNhap.


_ Khả năng dự báo của HQ nhị phân

- Tính xác suất khả năng trả nợ theo độ tuổi


- Nhập dữ liệu vào Excel tự động
- để chạy theo tuổi
-

You might also like