You are on page 1of 33

Chuẩn bị và mã hoá dữ liệu

Chuẩn bị, mã hoá, và nhập dữ liệu vào SPSS


Nội dung
1) Tổng quan
2) Quá trình Chuẩn bị Dữ liệu
3) Kiểm tra Bản câu hỏi
4) Điều chỉnh
i. Xử lý những câu trả lời không đạt
5) Mã hoá (Coding)
ii. Mã hoá câu hỏi
iii. Danh sách mã
iv. Mã hoá bản câu hỏi
Nội dung (tt)
6) Nhập dữ liệu(Transcribing)
7) Làm sạch dữ liệu (Data Cleaning)
i. Kiểm tra sự nhất quán
ii. Xử lý những câu trả lời bị thiếu (Treatment of Adjusting
Missing Responses) the
Data

8) Điều chỉnh dữ liệu bằng thống kê


iii. Xem xét tầm quan trọng (Weighting)
iv. Xác định lại biến số
v. Chuyển đổi thang đo
9) Lựa chọn chiến lược phân tích dữ liệu
Quá trình Chuẩn bị Dữ liệu
Hình 14.1 Chuẩn bị kế hoạch phân tích dữ liệu ban đầu

Kiểm tra bản câu hỏi

Điều chỉnh

Mã hoá

Nhập dữ liệu

Làm sạch dữ liệu

Điều chỉnh dữ liệu bằng thống kê

Lựa chọn chiến lược phân tích dữ liệu


Kiểm tra Bản câu hỏi
Những lý do mà một bản câu hỏi (đã được đáp viên trả lời) không đạt
chuẩn:
• Đáp viên không trả lời một số phần của bản câu hỏi.
• Cách trả lời của đáp viên cho thấy rằng đáp viên không hiểu hoặc không
theo hướng dẫn của bản câu hỏi.
• Câu trả lời của đáp viên chỉ theo một chiều hướng, ít có sự khác nhau.
• Đáp viên không trả lời một hoặc nhiều trang của bản câu hỏi.
• Bản câu hỏi được gửi về sau deadline.
• Bản câu hỏi được trả lời bởi đáp viên không đủ tiêu chuẩn.
Điều chỉnh
Xử lý Kết quả Không đạt
• Thu thập dữ liệu lại – Với những bản câu hỏi với những câu trả lời
không đạt, phỏng vấn viên có thể phải liên lạc lại với đáp viên để làm rõ.
• Chỉ định/gán đó là những giá trị bị thiếu/khuyết (Missing Values) –
Nếu không thể liên lạc lại với đáp viên, người xử lý dữ liệu có thể chỉ
định/gán những câu trả lời đó là những giá trị bị thiếu.
• Loại bỏ những bản câu hỏi không đạt – Với cách này, những bản câu
hỏi với câu trả lời không đạt sẽ bị loại bỏ, không được sử dụng nữa.
Nhập dữ liệu và mã hoá
• Phân biệt các khái niêm quan trọng:
• Biến số (variable): là một đặc tính, đặc điểm của hiện tượng nghiên cứu, thay
đổi theo các điều kiện khác nhau. Một biến số thường có nhiều trá trị khác nhau.
• Giá trị của biến số (value): là con số hoặc sự phân biệt loại hình đại diện cho
mỗi trường hợp xảy ra đối với biến số được đo lường.
• Thang đo (scale): thang đo của biến số phù hợp với đặc tính biến số được hỏi

• Ví dụ:
Biến số: Giới tính
Giá trị của biến số giới tính: nam, nữ
Thang đo: định danh (nominal)
Mã hoá

Mã hoá có nghĩa là gán một mã, thường là một con số


hoặc nhãn, cho mỗi câu trả lời của câu hỏi (cho các biến
và các giá trị của biến số).

Ví dụ:
Biến số: giới tính
Mã hoá: (1) nam; (2) nữ
Các bước mã hoá
• Đặt tên biến cho các câu hỏi
• Câu hỏi 1 lựa chọn
• Câu hỏi nhiều lựa chọn
• Chuyển tập các chọn lựa trả lời của mỗi câu hỏi thành tập các số/nhãn
phù hợp, có ý nghĩa.
• Câu hỏi đóng
• Câu hỏi mở
• Câu hỏi có chọn lựa: “Khác”
Nguyên tắc khi mã hoá

• Tính phù hợp (appropriateness): Cách phân loại/nhóm phải phù hợp với vấn đề/mục

tiêu nghiên cứu.

• Tính toàn diện (exhaustiveness): Các mã số cần thể hiện các loại cần NC.

Loại “trả lời khác” nên chiếm tỉ lệ nhỏ nhất.

• Tính loại trừ nhau (mutual exclusivity): Mỗi trả lời chỉ tương ứng với một mã số.
Ví dụ về danh sách mã (coding book)
Số/ Khái Tên của Nội dung của biến Thứ tự/số của câu Hướng dẫn mã hóa (Coding guide)
thứ niệm biến số số (Label) hỏi (Question in
tự nghiên (Name) the questionnaire)
của cứu (Con-
biến struct)
số

1 ID Tên của đáp viên Q1 Ghi tên

2 Tình yêu Q2_1 Cảm thấy yêu mến Q2 Nhập số cho lựa chọn mà đáp viên chọn
thương thương hiệu 1= Rất không đồng ý, 2 = Không đồng ý, 3 =
hiệu Trung lập, 4 = Đồng ý, 5 = Rất đồng ý
3 Q2_2 Cảm thấy đam mê Q2 Nhập số cho lựa chọn mà đáp viên chọn
với thương hiệu 1= Rất không đồng ý, 2 = Không đồng ý, 3 =
Trung lập, 4 = Đồng ý, 5 = Rất đồng ý
4 Q3 Giới tính Q3 1 = Nam
2 = Nữ
3 = Khác
BÀI TẬP NHÓM: Xây dựng bảng mã hóa cho dự án của nhóm
Giao diện SPSS

• Data view
• Nơi nhập dữ liệu
• Columns (cột dọc): variables (biến số)
• Rows (dòng): dữ liệu cho của từng đáp viên
• Variable view
• Nơi nhập biến số (variable)
• Danh sách tất cả các biến số
• Đặc điểm của tất cả các biến số

13
Nhập dữ liệu vào SPSS

14
Columns (cột):
variables (biến
số)

Rows (hàng):
cases (đáp
viên)

Trong Data
View

15
Nhập biến số (variables)
1. Click Variable View
2. Điền tên của biến sô vào
cột Nam (ví dụ: tuổi).
CHÚ Ý: tên của biến số dài
2. Điền tên của 4. Điền mô tả
biến số
khoàng 64 bytes, và ký tự
biến số
đầu tiên phải là một chữ
3. Chọn:
numeric hay
cái hoặc một trong những
string ký tự sau @, #, hoặc $.
3. Type (loại biến số):
Numeric, string, v.v.
4. Label (nhãn): mô tả biến
1. Click vào số
Window

16
Missing
• Định nghĩa những giá trị bị thiếu/trống (missing values)
• Những giá trị này bị loại ra khỏi phân tích
• Lựa chọn:
• Lựa chọn một số tới 3 chữ số cho giá trị thiếu/trống
• Một khoảng các giá trị cộng với giá trị 3 chữ số
Ví dụ: Click cột Missing Values. Nhập 999 cho biến số Tuổi.
Missing values
Measure (Đo lường)
• Cấp độ đo lường (Levels of measurement):
• Nominal (định danh)
• Ordinal (thứ tự)
• Interval (khoảng)
• Ratio (tỉ lệ)
• In SPSS, interval (khoảng) và ratio (tỉ lệ) được thiết kế là
Scale
• Định dạng cho những biến số định tính/chuỗi (string
variables) là Nominal
• Định dạng cho những biến số định lượng là Scale
Nhập biến số (variables)

Dựa vào danh


sách mã hoá!

21
Nhập dữ liệu của đáp viên

22
Làm sạch dữ liệu sau khi nhập liệu
• Chạy cases summaries cho tất cả các biến số
• Chạy frequency cho những biến số định tính và Descriptives
cho những biến số định lượng
• Kiểm tra kết quả để xem nếu có biến số nào bạn nhập sai giá
trị không.
• Kiểm tra giá trị trống (missing values) và bản câu hỏi giấy
xem thử có đúng là đáp viên không điền câu trả lời cho câu
hỏi đó không.
• Đôi khi, bạn cần phải mã hoá lại cho những biến số định tính
(string variable) sang biến số định lượng (numeric variables).

23
cases summaries

24
Phân tích thống kê cơ bản
(Basic Statistical Analysis)

• Thống kê mô tả (Descriptive statistics):


1. Tìm ra những dữ liệu bị nhập sai
2. Có cái nhìn cơ bản về mẫu (sample) và
những biến số nghiên cứu.
3. Tóm tắt dữ liệu.

25
Đối với biến số định tính (Qualitative Variables)

Analyze Descriptive statistics Frequency

26
27
28
Đối với biến số định lượng (Quantitative Variables)

Analyze Descriptive statistics Descriptives

29
AGE
Histogram Box-Plot

30
Phân loại kỹ thuật phân tích đơn biến (univariate analysis)
Fig. 14.6
Univariate Techniques

Metric Data Non-numeric Data

One Sample Two or More One Sample Two or More


Samples Samples
* t test * Frequency
* Z test * Chi-Square
* K-S
* Runs
* Binomial
Independent Related
Independent Related
* Two- Group test * Paired
* Z test t test * Chi-Square * Sign
* One-Way * Mann-Whitney * Wilcoxon
ANOVA * Median * McNemar
* K-S * Chi-Square
* K-W ANOVA
Phân loại kỹ thuật phân tích đơn biến (univariate analysis)
Fig. 14.6
Phân tích đơn biến

Dữ liệu định lượng Dữ liệu định tính

Một mẫu Hai hoặc nhiều Một mẫu Hai hoặc nhiều
mẫu mẫu
* t test * Frequency
* Z test * Chi-Square
* K-S
* Runs
* Binomial
Độc lập Liên quan
Độc lập Liên quan
* Two- Group test * Paired
* Z test t test * Chi-Square * Sign
* One-Way * Mann-Whitney * Wilcoxon
ANOVA * Median * McNemar
* K-S * Chi-Square
* K-W ANOVA
Phân loại kỹ thuật phân tích đa biến (multivariate analysis)
Fig. 14.7
Multivariate Techniques

Dependence Interdependence
Technique Technique

One Dependent More Than One Variable Interobject


Variable Dependent Interdependence Similarity
Variable
* Cross-Tabulation * Multivariate Analysis * Factor Analysis * Cluster Analysis
* Analysis of Variance of Variance * Confirmatory * Multidimensional
and Covariance * Canonical Correlation Factor Analysis Scaling
* Multiple Regression * Multiple Discriminant
* 2-Group Analysis
Discriminant/Logit * Structural Equation
* Conjoint Analysis Modeling
and Path Analysis

You might also like