You are on page 1of 4

MỞ RỘNG: MÃ HÓA LẠI BIẾN

LÀM SẠCH DỮ LIỆU


Tình huống

- Chất lượng của việc khảo sát


- Lỗi nhập liệu

Các biện pháp ngăn ngừa:

- Thiết kế bảng khảo sát rõ ràng, tham khảo qua sự đánh giá của các chuyên gia, giảng viên
hướng dẫn.
- Thiết kế bảng khảo sát nên sử dụng “câu hỏi gài” và “câu hỏi đảo ngược đáp án”
- Các câu hỏi khảo sát cần phải dễ hiểu để người trả lời có thể đưa ra đánh giá, câu trả lời
chính xác vấn đề được hỏi.
- Thực hiện khảo sát sơ bộ để đưa ra các điều chỉnh cần thiết trước khi đi vào khảo sát chính
thức quy mô lớn.
- Lựa chọn người trả lời một cách chọn lọc
- Cần phải được rà soát lỗi, chỉnh sửa trước khi tiến hành nhập liệu

Câu hỏi gài: sử dụng các câu hỏi cùng chung câu trả lời. VD: Hỏi mức độ hài lòng từ 1 đến 5, sau đó
hỏi thêm bạn đã hài lòng với dịch vụ chưa(có hoặc không). (lưu ý phải cách nhau để ng làm khảo sát
không nhận ra)

Câu hỏi đảo ngược đáp án: từ tiêu cực thành tích cực chủ yếu trong likert

- trường hợp có sẵn 2 biến quan sát tương đồng


- trường hợp bổ sung biến quan sát ảo( khi đưa vào bài nghiên cứu phải bỏ biến ảo)

Phương pháp làm sạch dữ liệu

- Dùng bảng tần số

- Dùng bảng kết hợp


- Tiếp đến là lọc dữ liệu mà mình tìm ra được.

ĐỀ TÀI NGHIÊN CỨU


- Tìm ra các biến để cho vô trong bài: giới tính, độ tuổi, ...

Vd bài mình định làm:


- Biến phụ thuộc là hài lòng với các hoạt động khi thuê Airbnb
- Biến độc lập: CSVC, giải trí, tiện ích, thoải mái,...
Kích thước mẫu
Mục tiêu 200 khảo sát nên là tối thiểu 30 biến trong phân tích likert và không và mỗi biến lớn
không ít hơn 3

THỐNG KÊ MÔ TẢ
Bảng tần số

- Valid cho biết số quan sát có giá trị hợp lệ (số người có trả lời).
- Missing cho biết số quan sát bị thiếu dữ liệu

Bảng mô tả
Bảng kết hợp: Sử dụng bảng kết hợp giúp chúng ta mô tả được đặc điểm của dữ liệu của nhiều
biến cùng một lúc, thấy được sự liên quan giữa các biến mà các thống kê đơn như Tần số và Mô
tả không thể hiện được.

Đồ thị, biểu đồ (nên vẽ trên excel)

KIỂM ĐỊNH ĐỘ TIN CẬY THANG ĐO CRONBACH’S ALPHA


Nghiên cứu phải xây dựng một thang đo chất lượng, có độ tin cậy.

Hệ số Cronbach’s Alpha có giá trị biến thiên trong đoạn [0,1]

Mức giá trị hệ số Cronbach’s Alpha:

- Từ 0.8 đến gần bằng 1: thang đo lường rất tốt.


- Từ 0.7 đến gần bằng 0.8: thang đo lường sử dụng tốt.
- Từ 0.6 trở lên: thang đo lường đủ điều kiện.

Không có cột if item deleted do chi có 2 biến mất 1 biến thì độ tin cậy cái kia 100% như vậy là hợp lý.

Giá trị Cronbach’s Alpha của nhóm bị âm: do người khảo sát đánh tầm bậy

PHÂN TÍCH NHÂN TỐ KHÁM PHÁ EFA


- Thỏa mãn "Giá trị hội tụ": Các biến quan sát hội tụ về cùng một nhân tố.
- Đảm bảo "Giá trị phân biệt": Các biến quan sát thuộc về nhân tố này và phải phân biệt với
nhân tố khác.

Các tiêu chí trong phân tích EFA:

- Hệ số KMO (Kaiser-Meyer-Olkin) là một chỉ số dùng để xem xét sự thích hợp của phân tích
nhân tố.
- Kiểm định Bartlett (Bartlett’s test of sphericity) dùng để xem xét các biến quan sát trong
nhân tố có tương quan với nhau hay không.
- Trị số Eigenvalue là một tiêu chí sử dụng phổ biến để xác định số lượng nhân tố trong phân
tích EFA.
- Tổng phương sai trích (Total Variance Explained) ≥ 50% cho biết số nhân tố được trích đại
diện tốt cho dữ liệu.
- Hệ số tải nhân tố (Factor Loading) hay còn gọi là trọng số nhân tố, giá trị này biểu thị mối
quan hệ tương quan giữa biến quan sát với nhân tố. (Hệ số tải 0.45 hoặc 0.5 làm mức tiêu
chuẩn với cỡ mẫu từ 120 đến dưới 350)

Tạo biến đại diện


Tạo biến đại diện là giá trị trung bình của nhóm biến quan sát trong bảng kết quả ma trận xoay
lần cuối.

You might also like